ИИ научился языку, глядя на мир глазами ребенка и слушая, что ему говорят взрослые

Модель искусственного интеллекта, не имевшая языкового опыта, анализировала записи с головной камеры короткого промежутка жизни одного ребенка и научилась распознавать многие слова, сопоставляя изображение и озвученные слова. Ученые Университета Нью-Йорка, считают, что опыт поможет понять, как человек учится языку.
ИИ научился языку, глядя на мир глазами ребенка и слушая, что ему говорят взрослые
Главный герой эксперимента мальчик Сэм в возрасте 18 месяцев. Wai Keen Vong
Большие языковые модели, такие как ChatGPT, обучаются на миллиардах отрезков текста, а это несопоставимо с реальным опытом младенца. Но как-то ведь мы все научились говорить.

ИИ, не имея языкового опыта, анализировал записи с головной камеры короткого промежутка жизни одного ребенка. Ученые Университета Нью-Йорка считают, что опыт поможет понять, как дети учат язык.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

ИИ учился только путем создания ассоциаций между изображениями и словами, которые он воспринимал одновременно. В ИИ не было заложено никаких других знаний о языке. Это бросает вызов некоторым теориям языка, согласно которым, чтобы придавать значение словам, младенцам необходимы некоторые врожденные знания о том, как работает язык.

Взгляд ребенка

Картинки и слова
Картинки и слова
Unsplash
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Ученые использовали 61 час записей с камеры, установленной на шлеме мальчика по имени Сэм. Он живет недалеко от Аделаиды в Австралии. Мальчик носил камеру примерно по часу два раза в неделю (примерно 1% времени бодрствования) в возрасте от шести месяцев до примерно двух лет.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Исследователи обучили свою нейронную сеть на кадрах видео и словах, которые Сэму говорили взрослые. Модель получила в итоге около 200 000 слов и сопутствующих изображений, снятых во время игры, чтения и еды. В модели использовалось так называемое контрастивное обучением (Contrastive learning), чтобы она смогла понять, какие изображения и слова сочетаются друг с другом, а какие нет.

Чтобы протестировать ИИ, исследователи попросили модель сопоставить слово с одним из четырех изображений-кандидатов. Этот тест также используется для оценки языковых способностей детей. ИИ успешно классифицировал объект в 62% случаев — это намного лучше, чем ожидаемые случайные 25%. Это сравнимо с аналогичной моделью ИИ, которая обучалась на 400 миллионах пар изображение-текст.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Некоторые слова, такие как «яблоко» и «собака», модель смогла правильно связать с предметами, которых она прежде не видела. Например, она обучалась в основном на зеленых яблоках, но красное яблоко она тоже назвала «яблоком». Но это удавалось не всегда. В среднем успешно применить слово к неизвестному предмету ИИ сумел в 35% случаев. ИИ лучше распознавал объекты вне контекста, когда они часто встречались в обучающих данных. Слова, которые могут относиться к самым разным предметам, например, «игрушка», выучить оказалось труднее.

Неврожденный язык

Во время эксперимента взрослые много говорили с ребенком и читали ему книги
Во время эксперимента взрослые много говорили с ребенком и читали ему книги
Unsplash
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

По словам Хизер Бортфельд, ученого-когнитивиста из Калифорнийского университета в Мерседе, опора исследования на данные только одного ребенка может вызвать вопросы о возможности обобщения полученных результатов, поскольку опыт и окружающая среда детей сильно различаются.

Но этот опыт показал, как многому может научиться ребенок, формируя ассоциации между различными источниками сенсорных ощущений. Полученные результаты бросают серьезный вызов ученым, таким как американский лингвист Ноам Хомский, которые утверждают, что язык слишком сложен, а входная информация слишком скудна, чтобы овладение языком могло происходить посредством общих процессов обучения. Холмский и его последователи убеждены, что существуют врожденные специальные механизмы, позволяющие освоить язык.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

«Это один из самых убедительных опытов, которые я когда-либо видела, который показывает, что никакие "специальные" механизмы не нужны», — говорит Хизер Бортфельд.

Процесс изучение языков в реальном мире гораздо богаче и разнообразнее, чем опыт, который получил ИИ. Исследователи говорят, что, поскольку ИИ ограничен обучением на неподвижных изображениях и письменном тексте, он не может испытывать взаимодействия с предметами, обязательно присутствующие в жизни реального ребенка. Например, ИИ изо всех сил пытался выучить слово «рука», которое младенец обычно узнает очень рано. «У малышей есть свои руки, у них большой опыт работы с ними. Это определенно недостающий компонент нашей модели, но мы это понимаем и будем двигаться дальше».