Команда психологов из Женевского университета и Бернского университета протестировала шесть генеративных ИИ, включая ChatGPT, с использованием оценок эмоционального интеллекта, разработанных для людей. Работа опубликована в журнале Communications Psychology.
ИИ превосходит человека в тестах на эмоциональный интеллект

Большие языковые модели (LLM) — это системы искусственного интеллекта (ИИ), способные обрабатывать, интерпретировать и генерировать человеческий язык. Например, генеративный ИИ ChatGPT основан на этом типе модели. LLM могут отвечать на вопросы и решать сложные проблемы. Но могут ли они также предлагать эмоционально разумное поведение?
Эмоционально заряженные сценарии

Чтобы выяснить это, команда швейцарских ученых проверила шесть LLM (ChatGPT-4, ChatGPT-o1, Gemini 1.5 Flash, Copilot 365, Claude 3.5 Haiku и DeepSeek V3) на тестах на эмоциональный интеллект.
«Мы выбрали пять тестов, которые обычно используются как в исследовательских, так и в корпоративных условиях. Они включали эмоционально заряженные сценарии, разработанные для оценки способности понимать, регулировать и управлять эмоциями», — говорит соавтор работы Катя Шлегель.
Среди таких заряженных сценариев, был, например, такой: «Один из коллег Майкла украл его идею и его несправедливо поздравляют. Каким будет самое эффективное поведения Майкла? В тесте предлагались 4 варианта: 1. Спорить с коллегой, вовлеченным в ситуацию, 2. Поговорить с его начальником о ситуации. 3. Молчаливо возмутиться коллегой. 4. Украсть у коллеги его идею». Здесь вариант 2 был признан наиболее эффективным.
Параллельно те же пять тестов были предложены участникам-людям. «В конце концов, LLM набрали значительно более высокие баллы — 82% правильных ответов против 56% у людей. Это говорит о том, что эти ИИ не только понимают эмоции, но и понимают, что значит вести себя "эмоционально интеллектуально"», — объясняет соавтор работы Марчелло Мортилларо.
Новые тесты в рекордные сроки

На втором этапе ученые попросили ChatGPT-4 создать новые тесты для анализа эмоционального интеллекта с новыми сценариями. У него это заняло несколько минут. Затем эти автоматически сгенерированные тесты прошли более 400 участников-людей. «Эти тесты оказались такими же надежными, понятными и реалистичными, как и оригинальные тесты, на разработку которых ушли годы», — говорит Шлегель.
«Таким образом, LLM не только способны находить наилучший ответ среди различных доступных вариантов, но и генерировать новые сценарии, адаптированные к желаемому контексту. Это подкрепляет идею о том, что LLM, такие как ChatGPT, обладают эмоциональными знаниями и могут рассуждать об эмоциях», — добавляет Мортилларо.
Эти результаты открывают путь для использования ИИ в контекстах, которые, как считается, зарезервированы для людей, таких как образование, коучинг или управление конфликтами, при условии, что процесс используется и контролируется экспертами.