Любой язык сперва строится из слов, затем из словосочетаний и предложений. Каждый уровень добавляет свой смысл, и в итоге рождается понятная мысль. Но если задуматься, эта система кажется довольно сложной. Потому ученые из Калифорнийского и Университета Саарланда задались вопросом, не проще бы было использовать двоичный код, последовательность из нулей и единиц. Исследование было опубликовано в журнале Nature Human Behavior.
Ученые выяснили, почему мозгу легче понимать фразы, а не сжатый код

Хотя передача информации в виде кода выглядит эффективнее на бумаге, для мозга — это сложно. Декодирование такого кода потребовало бы огромных вычислительных затрат. А так несколько слов и предлогов преподносят человеку понятную мысль.

Естественный язык постоянно взаимодействует с жизненным опытом. Люди говорят не произвольными символами, а словами, которые связаны с реальными вещами, действиями и ощущениями. И эти слова складываются в привычные, предсказуемые последовательности.
Как это работает
Ученые сравнивают это с дорогой на работу. Когда человек едет по привычному пути, мозг работает почти на автопилоте. Он знает каждый поворот и светофор, а потому энергозатраты минимальны.
А вот если он выберет другую дорогу, то придется все время быть начеку: смотреть на знаки, сверяться с картой. Это все гораздо более утомительно.
Естественный язык — это и есть тот самый знакомый маршрут для мозга. За годы жизни человек тысячи раз слышит и использует одни и те же грамматические конструкции и сочетания слов.

Ученые смогли описать все эти механизмы математически, а потому их открытие важно не только для лингвистики, но и для разработки искусственного интеллекта.
В частности большим языковым моделям нужно не просто запоминать триллионы слов, а научиться чувствовать знакомые паттерны и контекстные связи, которые мозг человека усваивает с детства.
