Компания Google запустила новую функцию Gemini AI, позволяющую преобразовывать фотографии в восьмисекундные видеоролики. Эта технология основана на модели видео Google Veo 3. Она способна добавлять к изображениям звуковое сопровождение — например, фоновые шумы, звуки окружающей среды и речь.
«Нажми на Play!»: Gemini AI научилась превращать фото в видео


Чтобы воспользоваться функцией, пользователи Gemini должны выбрать опцию «инструменты» в строке подсказок, затем «видео» и загрузить свою фотографию вместе с текстовым описанием желаемого движения.
Можно также включить аудиоописания для диалогов, звуковых эффектов и окружающего шума, которые, по словам Google, будут идеально синхронизированы с визуальными эффектами. Готовые видео предоставляются в формате MP4 с разрешением 720p и соотношением сторон 16:9.

Все сгенерированные видео содержат видимую водяную метку, которая указывает на то, что они созданы с помощью ИИ. Также в роликах будет невидимая цифровая водяная метка SynthID.
Подобная функция уже доступна в Flow, инструменте для создания фильмов с помощью генеративного ИИ, запущенного Google в марте. Теперь пользователи Gemini могут анимировать свои фотографии, не открывая другое приложение. Google сообщает, что Flow теперь также будет запущен в 75 странах.