С момента появления нейросетей в широком доступе в 2020-х годах они претерпели колоссальные изменения. Особенно прогресс заметен в работе с визуальным контентом: помните, как поначалу генераторы изображений рисовали у людей по шесть пальцев на каждой руке и выдавали результаты, очень далекие от запросов пользователей? Современные модели уже способны уверенно конкурировать с привычными графическими редакторами в ряде повседневных задач.
Альтернатива профессиональным инструментам: тестируем обновленный редактор изображений Kandinsky 6.0

В чем же отличия новой модели Kandinsky 6.0? В первую очередь — в возможностях редактирования: одним текстовым запросом теперь можно добавить новый объект в кадр или убрать лишнее, наложить фильтр или совместить элементы из разных изображений. Модель точнее понимает многосоставные инструкции и аккуратнее делает точечные правки — если попросить поменять персонажу прическу или добавить очки, она выполнит задачу и оставит все остальное нетронутым. Среди новых инструментов — реставрация поврежденных снимков, стилизация под аниме или комикс и создание нейрофотосессий.
Новая модель интегрирована в ГигаЧат — ИИ-помощник, который доступен в веб-версии, приложении и в мессенджерах. Последнее особенно удобно: не нужно совершать лишних действий, достаточно сменить чат и задать необходимый запрос. ИИ-инструмент редактирования профессионального уровня будет работать без ограничений по количеству генераций.
Да, известно, что бесплатный сыр только в мышеловке, поэтому проверяем на собственном опыте, на что способен Kandinsky 6.0 Image.
Удалить лишнее с фото
Пожалуй, это наиболее распространенный запрос среди любителей пофотографироваться. Всегда хочется добиться идеального кадра, где видно только вас и красивый фон. Вот, к примеру, недавно я побывала на Великой Китайской стене; найти там хотя бы крошечный безлюдный участок невозможно, поэтому на большинстве снимков в кадре присутствуют и другие туристы. Проверяем, сможет ли ИИ убрать их с фотографии.
Запрос: удали людей на заднем фоне.
Результат — 10 из 10. Максимально точное восстановление картинки, никакого размытия и «додумывания» не видно.
Теперь попробуем усложнить задачу. Разработчики утверждают, что модель способна понимать сложные многосоставные инструкции и делать точечные правки на фотографии, например, поменять прическу, добавить очки, заменить какой-нибудь объект или поправить макияж. Что ж, посмотрим, насколько уверенно ИИ-помощник справится с ролью виртуального стилиста.
Запрос: измени прическу на легкие волны.
Стилизация
Следующий популярный сценарий — полная смена визуального настроения фотографии. Иногда исходный снимок может быть удачным по композиции, но скучным по подаче. В таких случаях хочется не просто исправить кадр, а полностью преобразить его стиль. ГигаЧат может превратить обычное фото в иллюстрацию в стиле аниме, комикса или мультфильма.
Запрос №1: преврати фотографию в кадр из анимационного фильма Pixar; запрос №2: преврати фотографию в иллюстрацию в стиле комиксов Marvel.
20 секунд на обработку, и картинка готова. Кажется, уже можно запускать новые тренды в соцсетях.
Результат говорит сам за себя, но все же стоит отметить, что нейросеть сохранила композицию, детали и в целом не ушла слишком далеко от оригинала. Это частая проблема стилизации, когда ИИ настолько увлекается новым стилем, что полностью теряет связь с исходной фотографией. Здесь баланс оказался удачным: снимок узнается, но при этом действительно выглядит как переработанная версия.
Режим нейрофотосессии
Вы вообще видели стоимость фотосессий? Хороший фотограф, аренда студии, визажист, подбор образов и последующая обработка кадров легко обойдутся в копеечку. Поэтому неудивительно, что функция нейрофотосессии стала одной из самых обсуждаемых возможностей новых генераторов изображений.
Так, нейросеть на основе одного фото может сгенерировать новые кадры с измененным фоном, одеждой или локацией.
Запрос №1: измени локацию на Лондон; запрос №2: поменяй одежду на светлые джинсы и белую рубашку.
Запросы отработаны на все 100%, но над детализацией еще нужно поработать. Впрочем, с изображением природы нейросеть справляется на ура — для этого теста было выбрано другое фото.
Запрос: перемести лошадь в степь.
Оригинал слева, хотя так сразу и не скажешь!
Реставрация старых фото
Еще один сценарий, который выглядит почти как магия, — работа с архивными изображениями. Здесь ГигаЧат предлагает восстановление старых и поврежденных фотографий: убрать шум, вернуть резкость, «достроить» утраченные фрагменты и попытаться оживить выцветшие снимки.
Запрос: отреставрируй и раскрась фото.
Нейросеть действительно повысила четкость, восстановила контуры объектов и уменьшила количество визуального шума. Стоит также отдать должное за то, что на снимке не появилось никаких новых деталей: обычно ИИ «додумывает» и ловит «галлюцинации», но Kandinsky 6.0 аккуратнее работает с исходным материалом и меньше фантазирует там, где требуется сохранить историческую достоверность.
В целом, работу ИИ-редактора можно оценить на пятерку. Для плюса — поработать над детализацией текста и лиц. В любом случае разработчикам удалось создать инструмент профессионального уровня с широкими возможностями для самых разных задач для тех, кто далек от профессиональных графических редакторов и сложных визуальных инструментов.
Реклама. ПАО СБЕРБАНК, ИНН: 7707083893. Erid: 2W5zFGw61x5











