Мозг способен отличить голос, сгенерированный ИИ, даже когда сознание бессильно

Ученые из Тяньцзиньского университета и Китайского университета Гонконга исследовали способность людей отличать настоящую человеческую речь от сгенерированной искусственным интеллектом. В ходе эксперимента эксперты замеряли поведенческие реакции и активность мозга добровольцев до и после специального обучения.
Владимир Губайловский
Владимир Губайловский
Мозг способен отличить голос, сгенерированный ИИ, даже когда сознание бессильно
Дипфейк. https://www.veritonevoice.com/
Разрыв между восприятием и решением. Феномен, описанный учеными, можно сравнить с едва заметной трещиной в стекле: вы можете слышать специфический звук, но не осознавать, что он означает скорое разрушение объекта, пока не научитесь интерпретировать этот сигнал. В случае с дипфейками наш мозг работает как сверхчувствительный датчик, который видит артефакты цифровой обработки, скрытые под слоем искусственных эмоций. Основная сложность не в отсутствии данных, а в их обработке высшей нервной деятельностью.

Современные технологии создания дипфейков достигли такого уровня, что человеческий слух практически перестал улавливать разницу между живым голосом и работой нейросети. В исследовании, результаты которого опубликованы в журнале eNeuro, приняли участие 30 добровольцев, которым предлагалось прослушать записи и определить их происхождение.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Дипфейк.
Дипфейк. https://www.consumerreports.org/

Результаты оказались неутешительными: участники крайне плохо справлялись с задачей, а краткосрочное обучение лишь незначительно улучшило их показатели. Проблема заключается в том, что искусственный интеллект мастерски имитирует просодию — ритм и мелодику речи, которые наше сознание привыкло ассоциировать с эмоциональностью и подлинностью.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Но, несмотря на внешнюю схожесть, на глубинном нейронном уровне ситуация выглядит иначе. Даже если человек на осознанном уровне совершает ошибку, его мозг фиксирует тончайшие акустические несоответствия. Исследование показало, что после тренировки нейронные ответы мозга на человеческую и синтетическую речь становятся более дифференцированными.

Скрытые возможности слуховой системы

В то время как сознание часто обманывается дипфейками, слуховая система после короткого обучения начинает «отмечать» тонкие акустические различия между речью человека и ИИ, даже прежде чем слушатель может надежно их различить.
В то время как сознание часто обманывается дипфейками, слуховая система после короткого обучения начинает «отмечать» тонкие акустические различия между речью человека и ИИ, даже прежде чем слушатель может надежно их различить. Neuroscience News
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Это открытие дает надежду на то, что человечество сможет выработать механизмы защиты от аудиоманипуляций. Как отмечает соавтор работы Сянбинь Тэн: «Слуховая система мозга, по-видимому, начинает улавливать тонкие акустические различия, даже если люди не могут надежно превратить это в поведенческое решение. Это обнадеживает, поскольку предполагает, что обучение может помочь, и является многообещающей отправной точкой для создания более эффективных способов отличить дипфейк от реальной человеческой речи. Люди все еще адаптируются к контенту, созданному ИИ, поэтому плохие результаты не означают отсутствие сигналов — это может означать, что мы еще не используем правильные подсказки».

Ученые считают, что между восприятием звука и принятием окончательного решения существует разрыв. Наш слуховой аппарат уже регистрирует «цифровой след» подделки, но сознание пока не научилось нажимать на кнопку «это фейк». Дальнейшие методики подготовки могут быть направлены именно на то, чтобы научить человека прислушиваться к тем сигналам, которые его слуховая кора уже успешно распознает.