Эксперты: мозг человека может работать почти как ИИ

Ученые сравнили, как мозг «собирает» смысл из речи, и как это делают современные языковые модели. Неожиданно оказалось: понимание тоже выстраивается слоями — от простого к сложному, шаг за шагом.
Юрий Гандрабура
Юрий Гандрабура
Журналист-переводчик
Эксперты: мозг человека может работать почти как ИИ
Unsplash

Команда ученых под руководством Ариэля Голдстайна (Еврейский университет в Иерусалиме) вместе с исследователями из Google Research и Принстона записывала активность мозга людей, пока те слушали длинный аудиорассказ. Затем эту динамику сопоставили с тем, как обрабатывают текст ИИ-модели вроде GPT-2 и Llama 2.

Новую научную статью опубликовали в журнале Nature Communications.
Unsplash
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Мозг понимает речь «слоями», как ИИ

Исследователи использовали электрокортикографию — метод, при котором сигналы снимают прямо с поверхности коры.

Участники слушали примерно 30-минутный подкаст, а исследователи отслеживали, где и когда в мозге возникают ответы на речь. Ключевая идея такая: смысл не «включается» мгновенно.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
  1. Сначала мозг реагирует на более простые характеристики речи и слов, затем — на контекст, интонацию и общую картину высказывания.
  2. В языковых ИИ-моделях устроено похоже: ранние слои кодируют базовые признаки, а более глубокие объединяют информацию в связное значение.
  3. В данных человека нашлось похожее совпадение по времени: ранние нейронные ответы лучше соответствовали «ранним» слоям моделей, а более поздние — «глубоким».
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Особенно заметно это было в известных языковых зонах, включая область Брока: там пик ответа приходился позже и сильнее «стыковался» с более высокоуровневым представлением смысла.

  • Ученые трактуют это как аргумент против представления, будто понимание речи опирается прежде всего на жесткие правила и фиксированные «кирпичики» языка.

В их анализе традиционные единицы вроде фонем и морфем объясняли мозговую динамику хуже, чем контекстные представления, которые дают языковые модели.

  • Проще говоря: мозг, похоже, больше «считывает поток контекста», чем раскладывает речь по строгой схеме.

Отдельно исследователи выложили открытый набор данных: записи нейронной активности и языковые признаки.

Это может стать базой для новых работ — и для проверки конкурирующих теорий о том, как рождается смысл.