Что такое «модель мира» в искусственном интеллекте

Многие научные центры и стартапы исследуют новую технологию ИИ, получившую название «модели мира», которая преодолевает ограничения сегодняшнего генеративного ИИ. В отличие от систем, получивших сегодня широкое распространение, модели мира обучаются на реальных данных и симуляциях, позволяя безопасно и быстро обучать роботов, автономных агентов и беспилотники в интерактивной среде.
Владимир Губайловский
Владимир Губайловский
Что такое «модель мира» в искусственном интеллекте
ИИ и мир. liulolo. https://www.scientificamerican.com/
Генеративный ИИ и модели мира. Разница между генеративным ИИ и «моделями мира» заключается в том, как система обрабатывает реальность. В то время как классический генеративный ИИ пытается воссоздать каждый пиксель следующего кадра, модель мира использует концептуальное представление объектов и их состояний. Например, для предсказания движения Юпитера через сто лет не нужно обрабатывать терабайты видео, достаточно всего шести переменных. Это делает подход более энергоэффективным и пригодным для управления роботами.

Большие языковые модели и генеративный ИИ отлично создают текст, изображения и видео, но часто совершают ошибки при прогнозировании физических процессов. Сегодня многие исследователи и компании предлагают другое решение: «модели мира» — это нейросети, которые создают интерактивное 3D-пространство по законам физики. 

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Робот-водопроводчик. Но до него даже моделям мира, пока очень далеко.
Робот-водопроводчик. Но до него даже моделям мира, пока очень далеко. https://www.dreamstime.com/

Такие модели обучаются на тысячах часов видео реального мира и точных физических симуляциях. Исследователи отмечают, что такие среды открывают путь для эффективного обучения робототехники и автономных лабораторий перед их использованием в реальности.

Особенности моделей мира

Компания AMI Labs, которую возглавляет Ян Лекун, один из самых авторитетных сегодня исследователей ИИ, разработала архитектуру модели мира, получившую название JEPA.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Робот-сантехник.
Робот-сантехник. https://a2zconstructionsservice.com/

Это модель предсказывает на концептуальном уровне движение объектов, например, планет. Как отмечают ученые, это позволяет точнее моделировать процессы с меньшими затратами вычислительных ресурсов. Но некоторые эксперты считают, что традиционный ИИ также способен справиться с такими задачами за счет его масштабирования.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

В конце 2025 года в своей лекции в Гарвардском университете Ян Лекун заявил, что JEPA можно использовать для точного прогнозирования движения планет на основе меньшего количества переменных, чем используют модели, работающие «пиксель за пикселем». «Чтобы предсказать положение Юпитера через 100 лет, не нужно знать всех деталей... достаточно всего шести чисел», — сказал Лекун.

Техническая реализация моделей мира и JEPA, в том числе, отличается от работы обычных LLM тем, что модели мира работают с внутренними скрытыми представлениями пространства, а не просто предсказывают следующее слово или пиксель. Традиционные модели пытаются смоделировать весь мир в мельчайших деталях, из-за чего накапливают ошибки в физике. В то же время JEPA сжимает информацию, выделяя концептуальные переменные — такие как положение и ориентация.