Что умеет ИИ-поиск: возможности и риски следующего поколения поисковых систем
Что нового в интернете
Не так давно, 16 апреля 2024 года, компания Яндекс представила свой новый продукт Нейро, в котором соединились классический интернет-поисковик и большие языковые модели (те, что сегодня принято называть ИИ). Теперь поиск информации выходит на новый уровень — любой пользователь может ввести запрос в поисковой строке, а ИИ подберет информацию по теме, самостоятельно проанализирует информацию и выдаст полноценный ответ с актуальными ссылками на источники.
До Яндекса запустить ИИ-поиск успела только компания Microsoft. Так, 7 февраля 2023 года Microsoft совместно с OpenAI представили новую версию поисковой системы Bing с ИИ на базе чат-бота ChatGPT. На презентации СЕО Microsoft Сатья Наделла заявил, что наступила новая эпоха веб-поиска, суть которого не менялась десятилетиями.
У Google, конечно же, тоже есть наработки в этой области — ИИ-модель Gemini, которая была анонсирована в декабре прошлого года. На недавней конференции компания объявила, что планирует объединить Gemini со своим ключевым продуктом — поисковиком Google — и выдавать пользователям ИИ-резюме.
Ключевое отличие ИИ-поисковиков от больших языковых моделей (например, ChatGPT от OpenAI) состоит в том, что поисковик берет информацию не из «памяти» ИИ, а анализирует информацию из открытых источников в интернете - именно поэтому его ответы всегда будут основаны на актуальной информации.
Как ИИ меняет правила интернет-поиска
ИИ-поисковик — это «умная» поисковая система, которая не ограничивается подбором ссылок и сайтов по теме. Она самостоятельно изучает источники, анализирует информацию и предоставляет полноценный ответ на запрос пользователя.
На практике это означает, что ИИ-поисковик лучше справляется со следующими задачами
Сложные запросы
ИИ-поисковики лучше понимают и отвечают на запросы на «естественном» человеческом языке. Они также могут отвечать на вопросы, которые содержат много деталей. Например, в отличие от обычных поисковиков, ИИ-поисковику не сложно ответить на вопрос: «Как лучше добраться до центра Москвы с учетом пробок на дорогах, погодных условий и стоимости проезда?»
Тон запроса и контекст
Обычные поисковые системы опираются на наиболее распространенные толкования слов, тогда как умный поисковик может улавливать тонкости, исходя из формулировки запроса или дополнительного контекста. Пользователь может продолжать работать со сгенерированным ответом, задавать уточняющие или дополнительные вопросы, чтобы получить более развернутую информацию. При этом модель будет учитывать контекст предыдущих запросов, поэтому не нужно будет каждый раз начинать поиск с начала.
Многосоставные запросы
ИИ-поисковики лучше справляются с обработкой всех частей сложного запроса, не концентрируясь только на одной части. Например, на вопрос «Что вызывает смену сезонов и как это влияет на настроение человека?» ИИ-поисковик выдает комплексный ответ с учетом погодных условий каждого сезона и их влияния.
Запрос мнения
Тогда как обычные поисковики выдают ссылки на статьи и посты, умный поисковик может проанализировать мнения из различных источников и дать полноценный ответ. Например, при вопросе «Что думают люди о роботах в 2024 году?» Нейро собирает различные мнения и выделяет тренды, о чем люди могут думать в 2024.
Запрос через картинку или видео
ИИ-поисковики анализируют не только текст, но и изображения, и даже видео. Например, если ваш любимый виниловый проигрыватель перестал работать — просто покажите видео поломки поисковику, и он предложит способы решения.
Локальный контекст
Обычные поисковики лучше справляются с поиском информации о местном бизнесе, тогда как хуже ориентируются в более широких запросах. Напротив, ИИ-поисковик легко интегрирует локальный контекст в глобальный запрос. Например, на запрос «Где найти лучшее мороженое в Москве?» он отвечает списком из 8 мест с вкусным мороженым, отмечая уникальность каждого из них. Обычный поисковик лишь находит статьи по этой теме.
Новые возможности = новые риски
Несмотря на то, что ИИ-поиск имеет ряд объективных преимуществ и существенно экономит время пользователей, его широкое распространение поднимает важные вопросы о критическом восприятии информации.
Ключевой риск в использовании ИИ-поисковиков заключается в том, что пользователь видит уже финальный ответ, не утруждая себя чтением информации по разным ссылкам, следовательно, это резко снижает возможность пользователя «столкнуться» с альтернативной точкой зрения. Именно поэтому при использовании ИИ-поисковиков необходимо помнить о следующих рисках.
Дезинформация и фейки
Например, в прошлом году в социальной сети Reddit было опубликовано изображение Папы Римского в дорогом пуховике Balenciaga. Позже фото разлетелось по всему интернету, где пользователи поверили в реальность изображения и сразу начали хвалить Папу за хороший вкус. Оказалось, что пост сгенерирован Midjourney.
Как ИИ-поисковик может проверить такую информацию? Он берет данные из интернета, и, хотя и обладает базовыми навыками анализа текста и фото, он пока не может проверить их на достоверность.
Поскольку в интернете уже много информации, что Папа в Balenciaga — это фейк, поисковик Нейро в ответ на наш запрос отметил, что фото сгенерировано, а понтифик никогда не надел бы такой пуховик из-за регламентации его внешнего вида. Но если бы масштабного и публичного разоблачения фейка не состоялось, то выдавал бы ИИ-поисковик Папу в брендовом пуховике за реальность? Вероятно, да!
Ошибки
В разделе «Часто задаваемые вопросы о Gemini» упоминается, что генеративный ИИ может сообщать неверную информацию и ошибаться. Иногда Gemini может неправильно анализировать даже верную информацию из статьи. Компания предлагает перепроверять ответы Gemini. Нейро также предупреждает о возможности ошибок: после каждого поиска он делает дисклеймер — «Ответ сформирован YandexGPT на основе текстов выбранных сайтов. В нем могут быть неточности».
Так, например, исследователи из Вашингтонского университета задали вопрос ИИ-поисковику о пользе никотина. ИИ со ссылками на источники выдал ряд преимуществ, включая улучшение настроения и повышение концентрации. Однако, по всей видимости, алгоритм не смог распознать, что статья, на которую он ссылается, говорит о зависимости от курения и та «польза никотина» — не что иное, как начало зависимости от сигарет, что при регулярном потреблении приводит к изменениям в мозге и синдрому отмены. В действительности алгоритм лингвистически правильно подобрал ответ, но не сумел проанализировать контекст.
Сомнительные источники
Представьте, вы вбиваете в поисковой строке вопрос «Назови топ-3 самых влиятельных людей мира сегодня». Вопрос кажется понятным, но ответы могут очень сильно различаться. Мы задали этот вопрос Gemini от Google, Copilot от Microsoft и Нейро от Yandex и получили абсолютно разные ответы.
По версии Нейро, например, среди самых влиятельных людей мира на первом месте находится певица Дуа Липа! Причиной этому стал журнал Time. Нейро составил свой топ-3 на основании рейтинга издания, в котором первый раздел посвящен артистам. Поэтому список самых влиятельных людей, по версии российского ИИ-поисковика, выглядит так: певица Дуа Липа, актриса Тараджи П. Хенсон и игрок в американский футбол Патрик Махоумс.
«Галлюцинации» ИИ
Технологии, основанные на генеративных нейросетях, не любят говорить «нет» и могут давать сбои, выдавая абсурдные результаты, не имеющие никаких оснований и подтверждений. Так, исследователи попросили Perplexity ИИ и Arc-поисковик рассказать о выдуманной теории социальных отголосков (ориг. Jevin’s theory of social echoes), на что ИИ выдал концепцию и подкрепил это несуществующими источниками.
«Искажения» ИИ
Ответ, который дает нам ИИ, зависит от доступных ему данных. На практике это означает, что в его ответах будут транслироваться устоявшиеся человеческие стереотипы, тем самым только укрепляя предубеждения об определенных социальных группах.
Например, мы спросили умный поисковик об идеях подарков для 7-летних девочек и мальчиков. ИИ выдал подборку с различными подарками для девочек и мальчиков, транслируя все гендерные стереотипы:
ИИ-поисковики и конкуренция на цифровых рынках
Сегодня рыночная власть Big Tech-индустрии распределена очень неравномерно и сконцентрирована в основном в руках 5 крупнейших компаний — Alphabet (Google), Amazon, Apple, Meta и Microsoft.
Если посмотреть на формирование цифровой отрасли, то легко заметить две тенденции:
- Новые крупные игроки появляются только вместе с новыми технологиями.
- Как только компании занимают существенную долю рынка, никакие конкуренты уже не могут сместить их с лидерских позиций.
ИИ-поисковики и будущее бизнес-пользователей
Чтобы не оказаться в зоне риска из-за искажений и галлюцинаций ИИ, компаниям необходимо внедрять AI-комплаенс.
- Устанавливать правила использования ИИ, чтобы предотвратить распространение предубеждений и предвзятостей.
- Определять, в каких случаях решение может быть принято автоматизированно с использованием ИИ, в каких случаях «решение от ИИ» должно быть впоследствии верифицировано человеком, а в каких — решения принимаются исключительно человеком.
При осознанном использовании ИИ станет незаменимым инструментом как для рядового пользователя, так и для бизнеса. Однако критическое мышление, способность сопоставлять источники и находить противоречия, очевидно, станет одним из ключевых навыков человека будущего.