Шедевры, доступные каждому: тестируем новые нейросети

Давайте начистоту: информации в интернете сегодня тонны — и с каждым днем ее становится только больше. Найти что-то реально полезное в этом бардаке, продираясь сквозь множество ссылок — задачка со звездочкой. А тут еще бум нейросетей случился! Как, черт возьми, во всем этом разобраться и не сойти с ума?! Без паники, рассказываем (пока) человеческим языком, что к чему.
Шедевры, доступные каждому: тестируем новые нейросети
Картинка сделана в Шедевруме

Можно ли избавить себя от этого штудирования кучи источников информации? Хорошая новость: можно! Спасибо нейросетям. Они как препод из универа, даром что зачеты не ставят: обучились на масштабных объемах данных и могут выдавать только то, что интересно нам. Причем в любой форме — хоть «на пальцах», хоть в формате научного доклада.

Такие нейросети есть как у зарубежных, так и у отечественных разработчиков. Этой весной Яндекс запустил Шедеврум. Сначала в приложении было доступно только создание изображений, а недавно добавилась и возможность генерации текстов. Это круто, и вот почему.

Что мы делали раньше, когда нам нужна была симпатичная или просто прикольная картинка? Правильно, шли к профи — художнику или дизайнеру. За хорошим текстом — к продвинутому автору. Эти ребята работают не за спасибо: они долго обучались, чтобы выдавать хороший результат. А нейросети обучаются быстро. И, освоившись с ними, можно в один момент стать, например, блогером и наполнить свой канал крутыми текстами и оригинальными (в смысле нигде раньше не встречавшимися) картинками. Фишка в том, что это потребует минимума усилий!

Фактически вы тоже становитесь авторами и дизайнерами, только вместо специальных инструментов и знаний используете в своей работе нейросеть. Это гораздо проще, потому что с ней можно общаться на обычном русском языке, и она прекрасно все понимает. Кстати, развитие нейросетей уже породило новые профессии. Например, промпт-инженер: специалист, который занимается созданием точных запросов (промптов) для нейросетей.

Приложение можно использовать в разных сценариях. Основной — это, конечно, генерация картинок.

Как это работает?

Эта нейросеть Яндекса применяет диффузионную модель. Звучит жутко, но сейчас объясним все человеческим языком. Сначала картинки, на которых обучается нейросеть, превращают в набор цифровых шумов. На каждом шаге превращения шум добавляется определенным образом — в итоге исходная фотография превращается в набор цветных точек. 

Затем нейросеть учится выполнять обратный процесс. Из этого шума она «собирает» новое изображение. И оно оказывается оригинальным, не похожим на исходное. Бинго! Можно загружать в бложик.

Но нам не так интересно, как именно создают картинку. Скорее, затягивает сам процесс. Все, что нужно, — дать максимально подробные задания. Они называются промптами — это наборы слов и фраз, которые описывают будущую картинку.

Хотите получить ее в максимально реалистичном стиле? Добавьте слово «гиперреализм». Хотите больше деталей? Добавьте «высокая детализация» или «высокая резкость». Если вы не знаете, как правильно выразить свой запрос, можно кликнуть по символу вопросительного знака в верхнем правом углу — вам предложат подсказки.

Если вы бог сарказма или хотите выкрутить юмор на максимум, искусственный интеллект подхватит ваш настрой и предложит неожиданные картинки, которыми можно оформить все что угодно (в рамках приличия). Даже в формате мема. Скажем, как заставить улыбнуться учеников на уроке алгебры? Давайте вот прямо сейчас создадим прикольную картинку с помощью нейросети. Возьмем такой текст:

Заходит римлянин в бар, показывает 2 пальца и говорит: «5 кружек пива, пожалуйста!»

Тут прямо просится картинка: на словах не сразу представляешь, как 2 пальца связаны с 5 кружками. На картинке нагляднее: пальцы сложены в виде римской цифры V, то есть пятерки.

Если просто попросить нейросеть сделать иллюстрацию по самому тексту этой шутки, то ей будет сложно вас понять: слишком мало информации. Поэтому нужно прописать задачу подробнее.

«Древний Рим, бар, гость показывает двумя пальцами символ Victory, реалистично»
Картинка сделана в Шедевруме

Классно? Вот и мы про что! И это только первые эксперименты с бета-версией — любая нейросеть учится в процессе работы, и результаты получаются все лучше.

Продолжим веселиться? Давайте возьмем профильную шутку: например, айтишную. Да, они тоже шутят.

Все люди делятся на 10 типов: на тех,
кто понимает двоичную систему счисления, и тех, кто нет.

В двоичной системе только две цифры: 1 и 0. Вместе они и образуют 10. Допустим, мы сложились пополам от смеха. Но как объяснить это искусственному интеллекту?

«Один человек в футболке с цифрой 1, другой с цифрой 0»
Картинка сделана в Шедевруме

Сложнее с картинками, которые и автору-то сложно визуализировать. Вот, к примеру, шутка, которая когда-то очень понравилась нашему сеошнику.

SEO-специалист заходит в бар, бары, кабак, вечеринка, отдых, ночной клуб, мини-бар, барный стул, таверна, паб, пиво.

Если вы не особо разбираетесь в диджитал-сфере, объясним: SEO-специалисты анализируют, что чаще всего ищут пользователи в интернете. Кто-то ищет ближайший бар, кто-то кафе, кто-то «где поесть» — всем примерно нужно одно и то же, только запросы разные. Вот описать картинку — это тоже запрос. Мы перебрали несколько вариантов и остановились на таком изображении.

«Молодой мужчина в баре, в современной одежде, реализм»
Картинка сделана в Шедевруме

Может, и не очевидно, что это SEO-специалист, но он и правда не отличается от остальных сотрудников нашей редакции.

Ух, нас понесло! Продолжаем развивать барную тему.

Кот Шрёдингера заходит в бар.
И не заходит.

Тут вообще все непросто. Эрвин Шрёдингер — один из создателей квантовой механики. Грузить наукой сейчас не будем, просто знайте — кот Шрёдингера, как и любой предмет, которому приписывают фамилию ученого, совмещает два противоположных состояния. Например, кот одновременно жив и мертв. Поэтому и в бар он может одновременно заходить и не заходить.

Коты вообще удаются нейросети на ура. Можно полистать ленту и обнаружить в ней множество милых котиков в разных цветах и позах. Осталось разобраться с баром. Мы сделали это так.

«Кот с большими глазами, барная стойка, пьет коктейль, улыбается»
Картинка сделана в Шедевруме

Однозначно лайк! Прикол в том, что нейросеть подобрала под цвет коктейля еще и галстук (о чем мы не просили), плюс иллюминацию на фоне добавил. Очень круто, что нейросеть иногда додумывает такие элементы, которые автор и сам себе не представлял. Просто смотришь — и понимаешь, что вау. Экспериментировать можно сколько угодно — ведь Шедеврум бесплатный (по крайней мере пока).

А еще в приложении можно комментировать фотографии и подписываться на авторов, чьи произведения понравились. Его уже скачали более 5 млн человек, так что дефицита общения точно не будет.

Окей, с картинками тема раскрыта. Но приложение можно использовать и как генератор текстов. Его преимущество перед другими генеративными моделями в том, что вы одновременно получаете и текст, и картинку для иллюстрации. Как тебе такое, Илон Маск? Так вести, например, блог или соцсети — проще простого.

Запросы могут быть разными, но эта нейросеть создана не как «отвечалка», а именно как генератор контента. Хотите хардкора? Не вопрос! Например, если вы в целом представляете себе, что электроны вращаются вокруг атомов, но хочется узнать об этом более детально, просто спрашиваете нейросеть. И она излагает ответ как в лучших учебниках физики. Причем если поисковые системы просто ищут подходящий ответ на существующих сайтах, искусственный интеллект может сам сгенерировать его на основе изученной информации.

Тайный элемент проник в периодическую систему химических элементов и навел там беспорядок, объяснительная
Картинка сделана в Шедевруме
Сгенерированный текст:

Тайный элемент, который проник в периодическую таблицу химических элементов, вызвал настоящий хаос и неразбериху. Он изменил свойства многих элементов и создал новые соединения, которые не существовали ранее. Этот элемент оказался очень коварным и хитрым, он умел маскироваться под другие элементы и проникать в различные системы. Он мог изменять свою форму и свойства в зависимости от условий окружающей среды. Когда этот элемент проник в периодическую таблицу, он начал менять свойства элементов, с которыми он вступал в контакт. Некоторые элементы стали более активными, а другие — менее активными. Некоторые элементы начали взаимодействовать друг с другом, образуя новые соединения. Кроме того, этот тайный элемент также мог изменять свойства уже существующих соединений. Например, он мог изменять валентность элементов или изменять структуру молекул. В результате всего этого хаос и неразбериха в периодической таблице химических элементов стали еще более серьезными. Ученые были вынуждены проводить множество экспериментов и исследований, чтобы понять, как этот тайный элемент влияет на свойства элементов и соединений. Однако, несмотря на все трудности, ученые смогли найти способы борьбы с этим элементом. Они разработали новые методы анализа и синтеза элементов, которые позволили им контролировать и управлять свойствами элементов. Таким образом, тайный элемент стал настоящим вызовом для ученых, но благодаря их усилиям и знаниям, периодическая таблица химических элементов была восстановлена и стала более понятной и предсказуемой.

За генерацию текстов в приложении отвечает YandexGPT, и принцип работы этой нейросети немного другой. Сначала ее обучают на качественных примерах. Тут важно позаботиться именно о качестве контента. Условно говоря, научные труды или книги вполне подходят, а форумы в интернете, где часто собираются «диванные эксперты», — не совсем. После сбора знаний из первичного контента нейросеть обучается на сотнях тысяч примеров содержательных и хорошо написанных ответов, подготовленных AI-тренерами. Эти люди создают эталонные тексты для обучения нейросети, чтобы она могла давать полезные и достоверные ответы. Также тренеры проверяют, оценивают и ранжируют ответы нейросети. После прокачивания своих скилов нейросеть может самостоятельно генерировать тексты. Например, ответы на вопросы. Она анализирует все данные, на которых проходило обучение, выявляет закономерности и «вычисляет», каким может быть наиболее вероятный ответ на заданный вопрос. После этого нейросеть генерирует уникальный текстовый ответ.

Приложение тоже может, к примеру, сделать сущности проще. Скажем, вы хотите объяснить своему коту закон сохранения энергии. Как составить формулировку максимально простым языком? Искусственный интеллект знает.

Закон сохранения энергии простым языком
Картинка сделана в Шедевруме
Сгенерированный текст:

Закон сохранения энергии: энергия не создается и не исчезает, но переходит из одной формы в другую

Закон сохранения энергии — это закон природы, который гласит, что энергия не может быть создана или уничтожена, а может только переходить из одной формы в другую. Это означает, что если вы потратите энергию на что-то одно, то она должна быть компенсирована другим процессом, который также использует энергию. Например, если вы двигаете автомобиль, то энергия, затраченная на движение, должна быть компенсирована энергией, которая была получена из топлива.

Уж тем более нейросеть может помочь с более банальными вещами. Например, составить поздравление коллеге или написать текст для открытки на Новый год. Просто объясняете подробно, что хотите получить. Например, мы составили запрос:

«Поздравление робототехников с Новым годом»
Картинка сделана в Шедевруме
Сгенерированный текст:

С Новым годом, роботы!

Привет, роботы! С Новым годом, друзья! Желаю вам, чтобы ваши алгоритмы работали как швейцарские часы, а ваша программа была всегда в тонусе. Пусть каждый ваш проект будет успешным, а каждый день наполнен новыми идеями и возможностями. Мы, люди, очень ценим вашу работу и благодарны за то, что вы делаете для нашего мира. Давайте продолжать двигаться вперед вместе, создавая новые технологии и делая нашу жизнь лучше. Так что, робот-братья и сестры, счастливого Нового года! Пусть ваш искусственный интеллект никогда не затухает.

Окей, скажете вы: это все для развлечения, или есть реальные крутые примеры использования приложения? Да что там далеко ходить! Слышали новую версию трека «Плохая девочка» группы «Винтаж» от екатеринбургского рэпера Травма? Сингл вышел в конце июля 2023-го и сразу попал в топы на многих площадках. Так вот обложку для трека рисовали отнюдь не художники или дизайнеры: это результат работы Шедеврума. Представьте: никаких поисков исполнителя, никаких нудных ТЗ и согласований, да и никаких денег, наконец! Музыкант просто поработал с нейросетью, и получилась улетная картинка.

Картинка сделана в Шедевруме

В общем, как бы банально это ни звучало, но возможности нейросетей безграничны, и Шедеврум не исключение. Вы, конечно, можете по старинке тратить свое время на скрупулезный отбор полезного контента от большого количества интернет-мусора. Но зачем, если есть удобный инструмент? Это как физический поход по магазинам и заказ продуктов на дом. Так что скачивайте и пробуйте сами — не исключено, что у вас получится даже лучше. Ведь нейросети быстро прогрессируют, поэтому и результаты становятся все более близкими к идеалу.