11.11.2025, 20:33

Microsoft нашла уязвимость, которая позволяет определить тему разговора с ИИ

Исследователи Microsoft обнаружили уязвимость, которая позволяет определить тему беседы с ChatGPT и другими ИИ-ассистентами без расшифровки переписки. Атака работает с точностью 98% на большинстве протестированных языковых моделей.

Владимир Губайловский

Теги:

Искусственный интеллект

Microsoft нашла уязвимость, которая позволяет определить тему разговора с ИИ

О чем это вы шепчетесь? https://www.amazon.de/

Метаданные — это информация о данных, а не сами данные. В случае сетевого трафика это размер пакетов, время их отправки, частота обмена данными. Даже при использовании шифрования эти параметры остаются видимыми для наблюдателя в сети. Различные темы разговоров с ИИ порождают уникальные паттерны метаданных: например, короткий вопрос о погоде вызовет краткий ответ с малым объемом данных, тогда как запрос о сложной теме породит длинный ответ с характерным ритмом передачи пакетов. Уязвимость Whisper Leak использует машинное обучение для распознавания этих паттернов и определения темы беседы.

Беседы с искусственным интеллектом могут быть гораздо менее приватными, чем кажется пользователям. Специалисты Microsoft выявили серьезную брешь в больших языковых моделях, которые управляют популярными ИИ-сервисами. Проблема получила название Whisper Leak и затронула практически все протестированные системы.

Когда пользователь общается с ИИ-помощниками, встроенными в поисковики или приложения, данные защищены протоколом TLS — той же технологией шифрования, что используется в онлайн-банкинге. Защищенное соединение не дает злоумышленникам прочитать текст сообщений. Но Microsoft обнаружила, что метаданные — информация о том, как сообщения передаются через интернет — остаются видимыми. Whisper Leak не взламывает шифрование, а использует то, что шифрование не может скрыть.

Анализ пакетов позволяет ИИ угадать тему разговора.

https://www.microsoft.com/

ИИ может определить тему разговора по метаданным

В исследовании, опубликованном на сервере препринтов arXiv, ученые описали, как тестировали 28 языковых моделей. Они создали два набора вопросов: один содержал различные формулировки запросов на единственную чувствительную тему вроде отмывания денег, другой включал тысячи обычных повседневных запросов. Затем исследователи записали ритм передачи данных в сети — размер пакетов и задержки между их отправкой и получением.

Последовательность атаки Whisper Leak: пассивный сетевой злоумышленник наблюдает за зашифрованным TLS-трафиком между пользователем и службой LLM, извлекает размер пакетов и временные последовательности и использует обученные классификаторы, чтобы определить, соответствует ли тема разговора категории конфиденциальной информации.

arXiv (2025). DOI: 10.48550/arxiv.2511.03675

После этого они обучили ИИ-программу различать чувствительные и обычные темы исключительно по ритму данных. На большинстве моделей программа правильно угадывала тему разговора с точностью более 98%. Атака выявляла чувствительные беседы в 100% случаев, даже когда они составляли всего 1 из 10 000 разговоров. Три способа защиты, протестированные командой, не смогли полностью остановить атаки.

По словам исследователей, проблема не в самом шифровании, а в способе передачи ответов. «Это не криптографическая уязвимость TLS, а эксплуатация метаданных, которые TLS по своей природе раскрывает о структуре и времени зашифрованного трафика», — пишут ученые.

Учитывая серьезность утечки и простоту выполнения атаки, ученые подчеркивают необходимость защиты будущих систем. Они пишут: «Наши выводы подчеркивают необходимость для поставщиков LLM устранить утечку метаданных, поскольку ИИ-системы способны их использовать для выявления конфиденциальный информации».

Вам может быть интересно:

«Нужен человек, который выберет лучшую идею»: эксперты рассказали о будущем нейросетевого контента Датчик, выдерживающий 1000 градусов и сильную радиацию, сделает будущие АЭС безопаснее Ментальные субтитры: как чтение мыслей становится реальностью