Современные технологии создания дипфейков достигли такого уровня, что человеческий слух практически перестал улавливать разницу между живым голосом и работой нейросети. В исследовании, результаты которого опубликованы в журнале eNeuro, приняли участие 30 добровольцев, которым предлагалось прослушать записи и определить их происхождение.
Мозг способен отличить голос, сгенерированный ИИ, даже когда сознание бессильно

Результаты оказались неутешительными: участники крайне плохо справлялись с задачей, а краткосрочное обучение лишь незначительно улучшило их показатели. Проблема заключается в том, что искусственный интеллект мастерски имитирует просодию — ритм и мелодику речи, которые наше сознание привыкло ассоциировать с эмоциональностью и подлинностью.
Но, несмотря на внешнюю схожесть, на глубинном нейронном уровне ситуация выглядит иначе. Даже если человек на осознанном уровне совершает ошибку, его мозг фиксирует тончайшие акустические несоответствия. Исследование показало, что после тренировки нейронные ответы мозга на человеческую и синтетическую речь становятся более дифференцированными.
Скрытые возможности слуховой системы
Это открытие дает надежду на то, что человечество сможет выработать механизмы защиты от аудиоманипуляций. Как отмечает соавтор работы Сянбинь Тэн: «Слуховая система мозга, по-видимому, начинает улавливать тонкие акустические различия, даже если люди не могут надежно превратить это в поведенческое решение. Это обнадеживает, поскольку предполагает, что обучение может помочь, и является многообещающей отправной точкой для создания более эффективных способов отличить дипфейк от реальной человеческой речи. Люди все еще адаптируются к контенту, созданному ИИ, поэтому плохие результаты не означают отсутствие сигналов — это может означать, что мы еще не используем правильные подсказки».
Ученые считают, что между восприятием звука и принятием окончательного решения существует разрыв. Наш слуховой аппарат уже регистрирует «цифровой след» подделки, но сознание пока не научилось нажимать на кнопку «это фейк». Дальнейшие методики подготовки могут быть направлены именно на то, чтобы научить человека прислушиваться к тем сигналам, которые его слуховая кора уже успешно распознает.


