Ученые лаборатории искусственного интеллекта Сбербанка разработали инновационный подход к распознаванию эмоций в реальных условиях, который был представлен на международном воркшопе Affective Behaviour Analysis in-the-Wild конференции CVPR. В своей работе исследователи показали, как комбинация визуальных, акустических и текстовых данных значительно повышает точность анализа эмоций с использованием моделей искусственного интеллекта.
Современные системы распознавания эмоций часто сталкиваются с такими проблемами, как низкая точность в условиях изменяющегося освещения и фонового шума, а также высокие вычислительные затраты и необходимость больших объемов размеченных данных для обучения. Решение ученых Сбербанка основано на трех ключевых аспектах: использование легковесных нейронных сетей, фильтрация кадров с надежно распознаваемыми эмоциями и комбинирование данных из разных источников через метод «позднего слияния». Применение этих методов позволяет эффективно анализировать эмоции даже на обычных смартфонах.
Благодаря инновационному подходу, точность распознавания эмоций возросла на 1,5–15% по сравнению с базовыми методами. Эта разработка находит широкое применение в различных сферах, таких как виртуальные ассистенты, образовательные платформы и медицинские сервисы. Например, образовательные платформы смогут адаптировать контент под настроение пользователей, а компании — анализировать эмоциональные реакции клиентов на своих продуктах.
Глеб Гусев, директор Лаборатории искусственного интеллекта Сбербанка, отметил, что разработанный метод приближает нас к созданию эмпатичного ИИ, способного точно и быстро распознавать эмоции человека в реальных условиях. Новые технологии помогут создать индивидуальный подход к каждому пользователю и будут более эффективными в решении различных задач.