Министерство науки и высшего образования России объявило о внедрении нового метода анализа социальных сетей, основанного на использовании моделей языкового обучения (LLM). Это новшество уже интегрировано в систему мониторинга, что позволит использовать его в различных сферах, таких как региональное управление, экстренные службы и научные проекты, где критически важны как скорость обработки информации, так и ее достоверность.
Разработчики отметил, что стандартные подходы к использованию LLM часто сталкиваются с проблемой генерации правдоподобной, но недостоверной информации. В связи с этим ученые выделили три последовательности шагов, которые обеспечивают взаимодействие LLM с реальными данными: прямой запрос, конвейер с извлечением ключевых слов и кластерный подход. Прямой запрос представляет собой самый простой вариант, однако он менее стабильный. Второй подход обеспечивает баланс между стабильностью и точностью, а кластерный метод продемонстрировал наилучшие результаты на больших наборах данных.
Исследования проводились на основе данных из домовых чатов, и результаты показали, что кластерный подход обеспечивает 100% стабильность и 94% прослеживаемости. Это подчеркивает важность архитектуры обработки данных для повышения эффективности LLM при мониторинге социальных сетей. Ведомство также отметило, что использование соцсетей в качестве источника информации для изучения общественных настроений может стать надежным инструментом, если будет применяться корректный подход к анализу.