Исследователи разработали специальную задачу для изучения того, как люди и искусственный интеллект представляют предложения. В эксперименте участвовали 372 человека — носители китайского, английского языков и билингвы, а также ChatGPT. Участникам показывали один пример, после чего они должны были вывести правило и применить его к тестовому предложению, удаляя из него определенные слова. Результаты опубликованы в журнале Nature Human Behavior.
Человек и ИИ одинаково понимают структуру предложения


ChatGPT работает с синтаксисом предложений, также как и человек
Как показали ученые, и люди, и ChatGPT склонны удалять целые грамматические единицы — так называемые конституенты, а не случайные последовательности слов. При этом выбор удаляемых фрагментов зависел от языка задания и следовал специфическим правилам китайского или английского языка. «Участники и большие языковые модели склонны удалять конституенты, а не случайные цепочки слов, следуя правилам, специфичным для китайского и английского языков соответственно», — отмечают авторы работы.

Если бы ChatGPT опирался только на свойства слов и их позиции, результат был бы иным. Но он действует в полном соответствии с синтаксической структурой. Важно то, что на основе удаленных фрагментов можно было успешно реконструировать скрытую древовидную структуру предложения. Это говорит о том, что при обработке языка и люди, и нейросети руководствуются неявными синтаксическими представлениями. Полученные данные подтверждают, что внутренние языковые представления LLM согласуются с лингвистической теорией.
