В Китае набирают популярность ИИ-аватары, работающие в онлайн-магазинах. Они уже серьезно потеснили людей
Пока ученые обсуждают может ли ИИ потеснить людей разных профессий в Китае все уже случилось: ИИ-модели стали популярными ведущими на каналах электронной коммерции.
Если прокрутить видеозаписи, транслируемые в 4 часа утра на Taobao, самой популярной китайской платформе электронной коммерции, то можно обнаружить, что там до странности многолюдно. В то время как большинство людей уже спят, многие старательно демонстрируют товары перед камерами и предлагают скидки в предрассветные часы.
Эти стримеры не настоящие: это сгенерированные ИИ клоны настоящих стримеров. По мере того как технологии, позволяющие создавать реалистичные аватары, голоса и движения, становятся все более совершенными и доступными, популярность таких фейков резко возростает на китайских стриминговых платформах электронной коммерции.
Сегодня прямые трансляции являются доминирующим маркетинговым каналом для традиционных и цифровых брендов в Китае. Самые известные ведущие могут за одну ночь продать товаров более чем на миллиард долларов. Но обучение таких ведущих и их удержание обходятся очень дорого. Гораздо дешевле автоматизировать эту работу.
С 2022 года целый рой китайских стартапов и крупных технологических компаний предлагает услуги по созданию фейковых аватаров для живых трансляций электронной коммерции. За 1000 долларов бренды могут клонировать человека для круглосуточной работы, пишет MIT Technology Review.
От deepfake к электронной коммерции
Китайские компании, занимающиеся разработкой ИИ, нашли новый вариант использования технологии deepfake, который, судя по всему, неплохо себя зарекомендовал.
Основанный в 2017 году в Нанкине стартап Silicon Intelligence специализируется на обработке естественного языка, в частности на технологиях преобразования текста в речь, таких как инструменты для робозвонков. Но Сима Хуапенг, основатель и генеральный директор компании, говорит, что его компания впервые увидела потенциал ИИ в качестве инструмента для проведения прямых трансляций в 2020 году.
Тогда Silicon Intelligence потребовалось 30 минут обучающего видео, чтобы создать цифрового клона, который мог бы говорить и вести себя как человек. В следующем году для этого потребовалось 10 минут, затем три, а сейчас — всего одна минута видео.
По мере совершенствования технологий услуги становятся все дешевле. Сейчас создание базового клона ИИ обходится заказчику примерно в 8000 юаней (1100 долл.). Если заказчик хочет создать более сложного и способного стримера, то цена может возрасти до нескольких тысяч долларов. Помимо генерации, в эту стоимость входит годовое техническое обслуживание.
После создания аватара его рот и тело двигаются в такт с записанным звуком. Если раньше сценарии предварительно писались людьми, то теперь компании используют для их генерации большие языковые модели.
Теперь человеку достаточно ввести основную информацию, такую как название и цена продаваемого продукта, вычитать сгенерированный сценарий и посмотреть, как цифровой агент начинает работать. Более продвинутая версия технологии может распознавать комментарии в прямом эфире и находить подходящие ответы в своей базе данных, чтобы отвечать на них в режиме реального времени, так что создается впечатление, что ИИ-стример активно общается с аудиторией. По словам Симы, аватар даже может корректировать свою маркетинговую стратегию в зависимости от количества зрителей.
По словам Хуанг Вэя, директора по виртуальным трансляциям китайской компании Xiaoice, занимающейся разработкой искусственного интеллекта, эти клоны ИИ обучаются на основе распространенных сценариев и жестов, которые можно увидеть в видеороликах, посвященных электронной коммерции. Компания располагает базой данных, содержащей около сотни заранее разработанных движений.
«Например, когда человек говорит "Добро пожаловать на мой канал". Пошевелите пальцами и нажмите кнопку Follow, он определенно направляет палец вверх, поскольку именно там находится кнопка Follow на экране большинства мобильных приложений для стриминга», — говорит Хуанг. — «Аналогичным образом, когда стримеры представляют новый продукт, они указывают вниз — на корзину, где зрители могут найти все товары». ИИ-стримеры Xiaoice воспроизводят все эти обычные приемы. «Мы хотим убедиться, что разговорный язык и язык тела совпадают».
Дешевая замена человека
По словам Хуанга, эти сгенерированные стримеры не смогут превзойти звездных авторитетов электронной коммерции, но они достаточно хороши для замены стримеров среднего уровня. Создатели-люди, в том числе те, кто использовал свои видеоролики для обучения клонов ИИ, уже в некоторой степени ощущают давление со стороны своих цифровых конкурентов. По данным аналитической компании iiMedia Research, в этом году стало сложнее устроиться на работу в качестве ведущего livestream-трансляций в электронной коммерции, а средняя зарплата ведущих livestream-трансляций в Китае снизилась на 20% по сравнению с 2022 годом.
Потенциальная возможность компаний дополнять работу людей, поддерживая трансляцию в те часы, когда ее смотрит меньшее количество людей, означает, что трудно оправдать затраты на наем настоящих стримеров.
Это уже происходит. В послеполуночные часы многие стриминговые каналы на популярных платформах электронной коммерции, таких как Taobao и JD, содержат стримеров, созданных искусственным интеллектом.
«Если компания нанимает 10 ведущих, то уровень их мастерства будет разным. Возможно, двое или трое будут обеспечивать от 70% до 80% всех продаж», — говорит Чэнь Дань, генеральный директор компании Quantum Planet AI, которая занимается упаковкой технологий, подобных технологии Xiaoice, и продажей их корпоративным клиентам. — «Виртуальный ведущий трансляции не заменит лидеров, но он может заменить остальных — шесть или семь стримеров, которые вносят меньший вклад и имеют более низкие показатели. При этом затраты компании значительно снизятся».
Сейчас у Чена более 100 клиентов, пользующихся услугами Xiaoice, и эти виртуальные стримеры обеспечили продажи на миллионы долларов. Один из стримеров Xiaoice всего за один час принес доход более 10 000 юаней (1370 долл. США).
Взаимодействие с товаром
Если прямая трансляция посвящена какому-то одному продукту, ИИ-стример Xiaoice способен взаимодействовать с ним перед камерой. Но это возможно не всегда. Например, многие из клиентов Чена — это мебельные бренды, и хотя ИИ достаточно умен, чтобы говорить и использовать жесты, он не может сесть на диван или лечь в кровать, поэтому стримы не имеют той привлекательности, которую дают реальные ведущие, тестирующие продукцию.
Помимо небольших стартапов, таких как Silicon Intelligence и Xiaoice, крупные технологические игроки тестируют созданных искусственным интеллектом цифровых аватаров. В этом году Alibaba, Tencent, Baidu и JD запустили несколько разновидностей подобных сервисов, позволяющих брендам на их платформах создавать собственных ИИ-стримеров.
Все-таки это — обман
Растущая популярность «живых» трансляций, создаваемых искусственным интеллектом, привлекла внимание и таких видеоплатформ, как Douyin, китайская версия TikTok, хотя она придерживается иного подхода, чем другие технологические гиганты. Похоже, что ее больше заботит прозрачность, и в майском документе она заявила, что все видеоролики, созданные искусственным интеллектом, должны быть четко обозначены на платформе как таковые, а виртуальными агентами влияния должны управлять реальные люди. Платформа всегда запрещала использовать записанные видеоролики в качестве прямых трансляций. Живые трансляции, созданные искусственным интеллектом, в которых нет записанных видеоматериалов, но также мало человеческого участия в реальном времени, переходят границы этого правила.
За последние два года правительство Китая приняло несколько законов о синтетических медиа и генеративном ИИ, которые будут применяться для регулирования потоковой электронной коммерции. Но пока таких случаев еще не было.
По словам Симы, следующим шагом Silicon Intelligence будет добавление «эмоционального интеллекта» к ИИ-стримерам: «Если есть оскорбительные комментарии, он будет грустить; если товары хорошо продаются, он будет радоваться». Компания также работает над тем, чтобы ИИ-стримеры взаимодействовали и учились друг у друга.
С самого начала своей деятельности компания поставила перед собой интересную и в некотором роде пугающую цель: к 2025 году она хочет создать «100 000 000 рабочих на основе кремния». На данный момент, по словам Симы, компания создала 400 000 виртуальных стримеров. Так что до заявленной цели еще далеко.