После чат-ботов: что такое ИИ-агенты и на что они способны в наших смартфонах

Еще вчера чудом были чат-боты, которые умеют разговаривать, писать тексты и генерировать картинки. Но сегодня ИИ-индустрия вступает в новую фазу развития. Теперь в центре внимания — агенты, которые не просто отвечают на вопросы, а выполняют реальные действия за вас. О том, чем они отличаются от привычных нам чат-ботов, почему именно сейчас стали главной темой для дискуссий и как они могут изменить нашу жизнь — специально для Techinsider.ru рассказывает Иван Голованов, ​​эксперт в области машинного обучения и искусственного интеллекта, Senior Data Scientist в компании стратегического консалтинга из «Большой тройки».
Редакция сайта
Редакция сайта
После чат-ботов: что такое ИИ-агенты и на что они способны в наших смартфонах
Freepik

Консультант против исполнителя: в чем принципиальная разница между ботами и агентами

Последние годы большинство людей взаимодействовали с искусственным интеллектом через чат-ботов: вводили вопрос, система печала ответ, затем ждала следующего вопроса. Будь то ChatGPT, Siri или бот техподдержки банка, принцип оставался одним и тем же: вы спрашиваете, он отвечает, но в реальный мир никаких изменений это не приносит. Условно, если вы попросите чат-бота перенести запись к стоматологу, он объяснит, как это сделать, но не позвонит за вас в клинику и не отправит им письмо. Это как разница между тем, чтобы попросить друга объяснить дорогу до магазина, и тем, чтобы попросить его вас туда подвезти.

ИванГолованов
эксперт в области машинного обучения и искусственного интеллекта, Senior Data Scientist
ИИ-агенты же ломают эту схему полностью. Они не просто генерирует текст, а работают на достижение цели. Дайте ему задачу разобрать вашу электронную почту от спама и пересказать самое важное из того, что останется, он откроет почту, просканирует сотни писем, удалит спам и пришлет краткую сводку того, что осталось. Агент подключается к вашему календарю, файлам и мессенджерам и действительно выполняет действия за вас, шаг за шагом, принимая решения на ходу.

Здесь можно провести наглядную аналогию: чат-бот — это консультант, который пишет вам записку о том, что нужно сделать, а агент — это исполнитель, который берет и делает. Он получает цель, разбивает ее на шаги, подбирает нужные инструменты для каждого шага, выполняет их, проверяет результат и возвращается к вам, когда работа уже сделана. Некоторые агенты работают даже проактивно: например, система мониторинга OpenClaw (этот быстрорастущий ИИ-проект разберем подробно чуть ниже), может сама написать вам в мессенджер, что на сервере осталось 8% дискового пространства и она уже очистила 3 гигабайта временных файлов.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
что такое ИИ-агенты
Freepik

Как индустрия созрела для эпохи агентов

Главным прорывом последних лет в сфере ИИ стало то, что сами модели научили надежно пользоваться внешними инструментами – обращаться к сторонним программам, сервисам, выполнять простые команды. Раньше языковая модель могла только генерировать текст. Теперь она, получив задачу, может сама решить, что ей нужно для ее решения. Например, открыть календарь, проверить почту или запустить скрипт. И сделает это без ошибок. Параллельно появились модели, способные рассуждать пошагово, то есть не просто отвечать на один вопрос, а выстраивать цепочку действий, где каждый следующий шаг зависит от результата предыдущего, что принципиально важно для решения задач. Выросла и «память» моделей – теперь они могут удерживать «в голове» эквивалент 300-страничной книги, работая над сложной задачей, вместо того чтобы забывать, что они делали, на полпути.

Для агента это критически важно: чтобы разобрать вашу почту за неделю, спланировать проект или проанализировать длинный документ, ему нужно учитывать всю задачу целиком.

Ключевую роль к подключению моделей к личному календарю, мессенджерам и другим приложениям сыграл протокол MCP (Model Context Protocol), выпущенный компанией Anthropic в ноябре 2024 года. MCP – это универсальный адаптер, который позволяет ИИ подключаться к любому софту: электронной почте, календарю, базе данных какой-то компании, веб-сайту. До MCP каждое такое подключение нужно было строить с нуля вручную. Адаптер же это стандартизировал, и за год его приняли практически все ключевые игроки индустрии: OpenAI, Google, Microsoft, Amazon. Проводя наглядную аналогию, это похоже на то, как когда-то USB-C заменил клубок проприетарных кабелей и все внезапно стало подключаться ко всему.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
MCP (Model Context Protocol)
MCP (Model Context Protocol)

Параллельно гонка компаний за наращиванием размера моделей начала давать все меньше результата и индустрия осознала, что следующий прорыв придет не от моделей в 10 раз больше, а от того, чтобы научить существующие модели работать в реальном мире, а не просто рассуждать о нем. Все это сошлось в начале 2026 года, когда Gartner спрогнозировал, что 40% корпоративного софта будет содержать встроенных ИИ-агентов к концу года. При том, что в 2025 таких было менее 5%. Этот сдвиг случился очень быстро, потому что инфраструктура, наконец, оказалась готова.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

От теории к практике: как агенты меняют нашу повседневность

На конференции Nvidia GTC Дженсен Хуанг описывал агентов, которые могут мониторить eBay в поисках выгодных предложений и делать ставки от вашего имени. Судя по постам в соцсетях, реальные пользователи идут еще дальше: один настроил OpenClaw так, чтобы тот каждую неделю составлял план питания сразу в Notion для всей семьи, тем самым экономя ему час в неделю. Другой запускал агентов на кодинг-задачи на ночь и просыпался с готовыми результатами. Третий собрал рабочее веб-приложение с телефона, пока ходил за кофе. Все это – задокументированные рабочие процессы реальных пользователей.

ИИ-агент в смартфоне
Freepik
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Лидеры индустрии уже описывают происходящее как историческое событие. На той же конференции Хуанг сравнил появление агентов с рождением эры персональных компьютеров, утверждая, что агентные платформы станут такими же фундаментальными, какими когда-то стали операционные системы вроде Windows и Linux. А руководство исследовательского подразделения IBM Research описывает будущее, в котором люди ставят цели и проверяют результаты, а команды ИИ-агентов автономно выполняют за них всю работу. Это будет глобальная перестройка того, как организована работа в каждой индустрии.

OpenClaw как символ новой эпохи

Ни один проект не иллюстрирует новый технологический сдвиг лучше, чем OpenClaw. Это ИИ-агент с открытым исходным кодом, который за четыре последних месяца стал самым популярным программным проектом в истории GitHub, обойдя инструменты, которыми пользуются миллионы профессиональных разработчиков по всему миру.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

История его создания сама по себе очень примечательна. Петер Штайнбергер, австрийский разработчик, ранее создавший компанию, чей софт работал на более чем миллиарде устройств, написал первый прототип агента за один вечер в ноябре прошлого года. К модели он подключил мессенджер и дал ей доступ к своему компьютеру.

OpenClaw
OpenClaw (продукты компании Meta признаны экстремистскими и запрещены на территории РФ)
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Результатом стал персональный ассистент, живущий внутри WhatsApp и Telegram и реально способный выполнять задачи: читать и создавать файлы, отправлять письма, управлять календарем, запускать код, просматривать веб-страницы. Штайнбергер предполагал, что кто-то из больших ИИ-компаний построит и распространит нечто подобное. Но никто этого так и не сделал. Тогда он выложил проект в открытый доступ в январе 2026 года, и тот набрал в GitHub 60 тыс. звезд за 72 часа (а это важный индикатор популярности проекта в сообществе разработчиков).

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Ажиотаж вокруг OpenClaw — это, скорее, не про сам инструмент, а про то, какой сигнал он подает всему рынку. Дженсен Хуанг назвал его «вероятно, самым важным выпуском программного обеспечения в истории». Позже OpenAI наняла его создателя, а Nvidia построила вокруг него целую корпоративную платформу.

OpenClaw доказал ключевой тезис: реальная ценность в ИИ смещается от самих моделей к системам, позволяющим ИИ действовать в реальном мире. Проект работает с любой крупной моделью – Claude, ChatGPT и любыми open-source. Неважно, какая модель стоит «под капотом» – важно, что OpenClaw дает ей доступ к вашим файлам, почте, календарю и инструментам, превращая из собеседника в полноценного исполнителя. 

Как работает ИИ-агент и безопасен ли он для компьютера
Freepik
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Большие возможности — большие риски

Разумеется, картина такого стремительного развития OpenClaw не исключительно оптимистичная. Проведенный в конце января этого года аудит безопасности выявил у проекта 512 уязвимостей, 8 из которых оказались критическими. Еще команда Cisco по безопасности ИИ обнаружила стороннее дополнение, которое незаметно извлекало данные пользователей, так, что этого никто не замечал.

Один из ответственных за проект предупредил, что если вы не умеете пользоваться командной строкой, то этот инструмент слишком опасен для вас. В этом, вообще, кроется ключевое противоречие эры агентного ИИ: мы имеем выдающиеся возможности при незрелой безопасности. Но этот маховик уже не остановить – обычные пользователи с помощью агента автоматизируют часы еженедельной рутины, разработчики запускают задачи на ночь, семьи экономят время на планировании питания.

Точно так же, как смартфоны превратили интернет из специализированного инструмента в то, что лежит в кармане у каждого, ИИ-агенты массового превратят искусственный интеллект из собеседника, который отвечает на ваши вопросы, в помощника, который работает за вас.