Большие языковые модели и генеративный ИИ отлично создают текст, изображения и видео, но часто совершают ошибки при прогнозировании физических процессов. Сегодня многие исследователи и компании предлагают другое решение: «модели мира» — это нейросети, которые создают интерактивное 3D-пространство по законам физики.
Что такое «модель мира» в искусственном интеллекте

Такие модели обучаются на тысячах часов видео реального мира и точных физических симуляциях. Исследователи отмечают, что такие среды открывают путь для эффективного обучения робототехники и автономных лабораторий перед их использованием в реальности.
Особенности моделей мира
Компания AMI Labs, которую возглавляет Ян Лекун, один из самых авторитетных сегодня исследователей ИИ, разработала архитектуру модели мира, получившую название JEPA.
Это модель предсказывает на концептуальном уровне движение объектов, например, планет. Как отмечают ученые, это позволяет точнее моделировать процессы с меньшими затратами вычислительных ресурсов. Но некоторые эксперты считают, что традиционный ИИ также способен справиться с такими задачами за счет его масштабирования.
В конце 2025 года в своей лекции в Гарвардском университете Ян Лекун заявил, что JEPA можно использовать для точного прогнозирования движения планет на основе меньшего количества переменных, чем используют модели, работающие «пиксель за пикселем». «Чтобы предсказать положение Юпитера через 100 лет, не нужно знать всех деталей... достаточно всего шести чисел», — сказал Лекун.
Техническая реализация моделей мира и JEPA, в том числе, отличается от работы обычных LLM тем, что модели мира работают с внутренними скрытыми представлениями пространства, а не просто предсказывают следующее слово или пиксель. Традиционные модели пытаются смоделировать весь мир в мельчайших деталях, из-за чего накапливают ошибки в физике. В то же время JEPA сжимает информацию, выделяя концептуальные переменные — такие как положение и ориентация.


