Как делают дипфейки. Эксперт объяснил принципы создания поддельных изображений
Как создаются дипфейки? Они рождаются из гауссового шума.
Достаточно простой текстовой команды, чтобы искусственный интеллект создал изображение, которое выглядит как настоящая фотография и почти неотличимо от нее для человеческого глаза. Хотя это и увлекательно, но, по сути, ставит под сомнение подлинность любого изображения.
Ученый Рурского университета Бохума Йонас Рикер специализируется на техническом распознавании изображений, созданных различными моделями ИИ. Он ищет способы отличить искусственно созданные фотографии и видео от настоящих. Он объяснил, как делаются дипфейки и как их можно отличить от реальных снимков.
К гауссовскому шуму и обратно
Так называемая диффузионная модель генерации изображений в настоящее время очень популярна благодаря приложению Stable Diffusion. «Принцип, лежащий в ее основе, поначалу может показаться удивительным», — говорит Рикер. — «Реальное изображение "размывается" шаг за шагом путем последовательного добавления гауссовского шума. Через несколько сотен шагов информация об изображенных объектах полностью исчезает, и остается только цветовой хаос. Теперь цель модели — обратить этот процесс вспять, чтобы восстановить исходное изображение».
Модель обрабатывает получившее совершенно абстрактное изображение шаг за шагом, точно так же, как «размывала». Вооружившись достаточным количеством обучающих данных, модель может восстанавливать изображение из хаоса. Через сотни шагов из случайного шума «восстанавливается» совершенно новая картина.
В процессе восстановления изображения из шума можно «подмешать» к изображению новые детали и объекты, и они естественно впишутся в воссозданную картинку. Причем, впишутся так, что отличить новые объекты будет очень трудно.
Разоблачение фальшивых профилей в социальных сетях
«Уже сейчас диффузионная модель дает очень хорошие результаты при создании обманчиво реальных изображений, и в дальнейшем она будет совершенствоваться», — считает Рикер. — «Таким образом, отличить реальные изображения от искусственно созданных будет еще сложнее».
В настоящее время Рикер тестирует различные подходы, которые позволяют отличить изображения, сгенерированных моделью, от реальных фотографий. Различение настоящих и фальшивых изображений важно не только для разоблачения фальшивых новостей, например, но и для разоблачения фальшивых профилей в социальных сетях. Такие профили используются, например, для манипулирования общественным мнением, особенно, по политическим вопросам.
Несмотря на то, что Рикер стремится к тому, чтобы поддельные фотографии можно было определять автоматически, он считает, что в конце концов все сведется к другому: «Я думаю, что в конечном итоге подлинные фотографии придется сертифицировать», — предполагает он. — «Вполне реальным подходом может быть использование криптографических методов, которые должны быть встроены в фотокамеру, что сделает каждое подлинное изображение несомненно проверяемым».
Предположение Рикера может воплотиться в жизнь очень скоро. Мы писали, что компания Adobe уже ведет переговоры с производителями фотокамер Leica и Nikon о встраивании меток, гарантирующих реальность изображения.