Сейчас одна из главных проблем при генерации изображений или видео — консистентность персонажей. То есть обеспечение постоянства образа, в частности лица, от картинки к картинке и от кадра к кадру. Эта проблема будет решаться весь год: люди много работают именно с лицами, генерируют персонажей.
Нейросети 2026: прогнозы и инсайды

Лина Кочетова
Не терять лицо
Работа с ракурсом
Еще одна проблема — изменение ракурса. Даже когда виртуальную камеру удается переместить, возникает проблема консистентности объектов. Генеративная сеть от Google Nana Banana с этим уже справляется, но пока неидеально. Я слышала, что готовится релиз второй версии, — ожидается, что там функция смены ракурса будет работать лучше.
Ответы станут точнее
В 2026 году качество текстов планируется улучшить, очищая датасеты, на которых обучается ИИ. Появятся новые архитектуры, начнут отфильтровываться «мусорные» данные. Вероятно создание множества узкоспециализированных нейросетей — например, для врачей, юристов и т.д.
Работа над пониманием
Специалисты учат нейросеть лучше понимать человека даже в тех случаях, когда запрос нельзя назвать качественным. Впрочем, пока и при нормальном запросе я бы оценила понимание как среднее.
Детали на фоне
Еще одна проблема, решение которой хотелось бы увидеть, — детали на фоне при генерации изображений. На переднем плане все может выглядеть прилично, но, например, если на заднем плане есть люди, они по-прежнему будут кривые-косые. Так что создание сцен с большим количеством статистов пока нереально. Я работаю практически со всеми нейросетевыми проектами в области изображений и могу утверждать, что подобные недостатки есть у всех.
Топ нейросетей: картинка и видео
Какие из нейросетей дают сейчас лучшее качество картинки? На первом месте Nana Banana, потом Midjourney, потом Flux. Неплохие художественные изображения создает Reve. Есть, конечно, еще ChatGPT — эта нейросеть отлично понимает промпт, так что мы ждем обещанного на 2026 год обновления, которое подтянет и качество генерации.
Андрей Мурашев
Слово ИИ-агентам
Что обычный человек делает с ChatGPT? Ищет рецепт, просит написать текст или предложить идеи для поста, уточняет значение слова. 95% всех обращений к ИИ ассистентам — одиночные запросы, краткие диалоги. На таких задачах открытые модели уже неотличимы от ChatGPT. Разница проявляется, только когда требуется цепочка рассуждений из 20 шагов или математика олимпиадного уровня. Так что монополии OpenAI для повседневного использования больше нет.
Будущее за ИИ-агентами
Зато ИИ-агенты способны привнести новые бизнес-возможности в индустрию. Поэтому такие компании, как OpenAI, Anthropic и Google, сейчас нацелены на разработку инструментов, способных решать многоступенчатые, протяженные во времени задачи. Например, не просто «напиши письмо», а «найди свободное время в календаре, подбери ресторан, забронируй столик и отправь приглашения». Или «проанализируй документы конкурентов и составь отчет для совета директоров».
Моделям дают инструменты для решения реальных бизнес-задач — в частности, OpenAI заявляла об интеграциях с Booking.com. Но пока нейросеть там используется для простых повторяющихся действий. Думаю, в 2026 году появятся ИИ-агенты, способные как минимум проходить цепочки из 50–100 шагов. Компании начнут специально под них обучать модели, нейросети станут ломаться, позволяя получать тренировочные данные из реальных провалов, — и так по кругу, все больше совершенствуясь.
Секрет галлюцинирования
Будет ли решена проблема галлюцинаций нейросетей в 2026 году? На мой взгляд, крупные вендоры — Google, Anthropic и OpenAI — с ней уже справились. Когда работаешь с их продуктами через API, можно задавать такой параметр, как температура. Если установить его значение равным нулю, модель всегда будет выбирать наиболее релевантный ответ.
Что касается моделей Open Source, то с точки зрения галлюцинаций они отстают на год полтора. Но надо понимать, что способность галлюцинировать приводит к более креативным ответам. Именно поэтому в чат-ботах, в том числе в пользовательских интерфейсах моделей от крупных вендоров, температуру задают сильно выше нуля.
Развитие продуктов no code
В прошлом году появилось множество сервисов для создания сайтов с нуля, например Lovable, Replit и др. Но в данном случае речь идет о сайтах без бэкенда со сложной логикой. Скажем, интернет-магазин сделать получится, а социальную сеть — нет. Думаю, в 2026-м будут активно развиваться инструменты разработки no code, позволяющие продакт-менеджеру самостоятельно начать бизнес, нанимая программистов не через месяц после старта проекта, а через полгода, уже при наличии клиентов и выручки.
Еще больше энергии
Развитие новых архитектур пока идет медленно. Тот же OpenAI явно делает ставку на увеличение расхода энергии: давайте просто накопим электричества и сделаем ChatGPT 6, который еще больше. На рынке появилась огромная модель Grok, которая стоит баснословных денег. Это уже не бизнес, а гениальная исследовательская система, к которой мы шли все предыдущие годы. Обучение такой модели требует колоссальных средств, но ее нельзя выдавать наружу: один запрос к нейросети стоит 150 долларов. Зато она может передать свои знания модели поменьше, которую уже можно предлагать бизнесу. Я уверен, что у OpenAI есть вариант, превосходящий текущую версию ChatGPT, но сначала инженерам компании придется провести большую работу, аккумулируя знания новой гигантской модели в модель поменьше.
Роман Соловьев
Эволюция ИИ-агентов
Явный тренд — развитие ИИ-агентов, в том числе браузерных. Они и сейчас уже есть: Atlas от OpenAI и Comet от Perplexity — и им можно делегировать часть задач. Но пока остаются проблемы с качеством их работы. В 2026 году, вероятно, уже появятся полноценные инструменты такого формата. И не только полноценные, но и безопасные: сейчас у ИИ-агентов есть много уязвимостей, которые используют мошенники.
Думаю, и в научных исследованиях ИИ-агенты могут стать серьезным подспорьем. Раньше нейросети не могли сами совершать открытия: необходимые для этого эксперименты должны были проводить люди. Но сегодня появились ИИ-агенты, способные самостоятельно написать код и запустить тесты в программной среде. Вероятно, вскоре нейросети смогут проводить исследования и во внешних средах. Условно говоря, будут составлять пошаговый план работ на адронном коллайдере.
Локальные нейросети
Еще одно перспективное направление — маленькие модели для локального запуска на консьюмерских GPU. На специфических задачах такие нейросети обходят мощных универсалов, тот же ChatGPT. И такой подход наверняка будет развиваться: скажем, в программировании он позволит не тратить деньги на запросы API к мощным внешним LLM.
Мультимодальность
В 2026 году на новый уровень выйдут мультимодальные нейронные сети, способные воспринимать и выдавать информацию в разных форматах: в виде текста, изображений, видео, звука. Подобных моделей уже немало; в качестве примера разработки открытого типа можно привести Qwen от Alibaba Cloud: ее код выложен на GitHub, а веса — на Hugging Face. Пока такие нейронки не со всеми задачами справляются одинаково хорошо, но в 2026 году, скорее всего, появится более бесшовная мультимодальность. Возможно, продвинется создание и редактирование музыки — пока это одно из наименее развитых направлений.
Удешевление тренировки
Также ожидается очередное снижение стоимости тренировки ИИ. Не секрет, что OpenAI тратит на обучение моделей каждого нового уровня ChatGPT примерно 60–80 млн долларов. Разработчикам DeepSeek хватило, по максимальным оценкам, 5 млн — и результат получился сравнимым по качеству. Так что сейчас все трудятся над удешевлением процесса, в первую очередь за счет улучшения аппаратуры. Уже используются чипы, сделанные по техпроцессу 2 нм: они потребляют меньше энергии, а работают быстрее. Кроме того, появляются новые архитектуры, помогающие оптимизировать работу нейросетей.
Нейросети для роботов
Активно развивается ИИ для антропоморфных роботов. Таких устройств китайские компании выпускают уже довольно много, зачастую их поставляют вместе со средой разработки, позволяющей установить свое ПО. И если раньше моделировать деятельность робота приходилось в виртуальной среде, то при наличии готовых девайсов прогресс пойдет быстрее.
Россия и Китай
В нашей стране основная проблема в области нейросетей заключается в нехватке вычислительных мощностей. В МИЭМ ВШЭ, где я преподаю, учится много толковых студентов, у нас есть суперкомпьютер, но на работу с ним все время очередь. В таких условиях есть риск отставания по компетенциям. Нужно, чтобы по крайней мере у студентов и исследователей был легкий доступ к большим вычислительным мощностям.
Возможно, в 2026 году ситуация начнет меняться: в Китае госпредприятиям рекомендовали не закупать ускорители Nvidia, и Huawei уже разрабатывает свое железо для тренировки нейронных сетей. Но есть сложность: раньше 99% ПО для таких целей производила Nvidia, так что теперь придется переписать практически все. Однако если в итоге появится несколько производителей, то цены на аппаратуру снизятся и она снова станет доступной.









