Gemini Live от Google: ИИ-помощник, который показывает, о чем говорит

Google анонсировал новые функции для своего ИИ-помощника Gemini Live. Теперь он сможет взаимодействовать с камерой, приложениями и даже менять тон голоса в зависимости от темы разговора. Любопытно? Определенно.
Юлия Мискевич
Юлия Мискевич
Редакция
Gemini Live от Google: ИИ-помощник, который показывает, о чем говорит
www.theverge.com

Забудьте о скучных, механических диалогах с роботом, который понимает вас с десятого раза. Эра цифровых помощников, которые тупо выполняют команды, стремительно уходит в прошлое.

Google готовит для своего ИИ-помощника Gemini Live такое обновление, после которого он станет не просто ассистентом, а почти что личным кибер-другом с обостренным чувством эмпатии и возможностью тыкать пальцем в ваш экран. Буквально.

Самое главное новшество — это возможность выделять объекты прямо на экране через камеру телефона. Представьте: вы смотрите на разобранный механизм или заросший сад, и ваш телефон превращается в умную подсказку из будущего. Вам нужно найти подходящий гаечный ключ? Просто наведите камеру на ящик с инструментами, и Gemini Live подсветит нужный.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Google Blog

Функция дебютирует на новых Pixel 10 28 августа, а затем постепенно доберется до других Android-устройств и даже до iOS. Кажется, скоро мы будем просто показывать телефону мир, а он будет нам его объяснять.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Но Google идет дальше простых визуальных уловок. Компания учит Gemini жить внутри ваших приложений. Скоро ассистент сможет взаимодействовать с «Сообщениями», «Телефоном» и «Часами».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Сценарий: вы с Gemini обсуждаете маршрут, понимаете, что опаздываете, и просто говорите: «Ладно, с маршрутом все ясно. А теперь напиши Алисе, что я задержусь минут на десять». И Gemini не просто составит текст, а отправит его, избавив вас от лишних тапов и кликов. Это уже не просто помощник, а ваш личный секретарь.

Самое же забавное и одновременно слегка сюрреалистичное обновление ждет аудиоформат. Google представил новую модель, которая учит Gemini понимать и использовать ключевые элементы человеческой речи: интонацию, ритм и тон.

Теперь ваш цифровой помощник сможет подстраиваться под ситуацию: говорить спокойнее и мягче, если вы спрашиваете о чем-то тревожном, или, наоборот, заражать уверенностью. А еще вы сможете настроить скорость его речи.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
TechRadar

И вишенка на торте — это новая опция драматического пересказа. Попросите Gemini рассказать историю от лица, скажем, Шекспира или капитана Джека Воробья, и он сможет выпасть не просто текст, а целое представление — возможно, даже с подходящим акцентом для «насыщенного и увлекательного повествования».

Выходит, в скором времени Gemini сможет не только организовать вашу жизнь, но и развлечь вас вечером, превратившись в личного актера для одного зрителя. Осталось только предложить ему попкорн.