Главное
- Нейросеть — это искусственный интеллект, который работает по принципу человеческого мозга. Нейроны получают, обрабатывают и отдают информацию, а связи передают ее. Главное отличие нейронов компьютерной сети в том, что их нужно постоянно обучать. Человек же расширяет нейросеть, когда сам учится чему-то новому.
- В последние годы компьютерные нейросети получили большое развитие. В основном их используют для задач, где нужно обработать текст, видео, аудио и другую информацию.
- Особую популярность приобрели нейросети, способные быстро генерировать изображения из текстового запроса, совмещать графические объекты или воссоздавать недостающие элементы, в том числе человеческие лица. Они не заменяют работу дизайнеров и художников, но помогают оптимизировать рутинные процессы.
Как нейросети генерируют изображения
Нейросеть — программа, способная к самообучению, однако ее работу нужно «дорабатывать» и совершенствовать в ходе практики. Пользователь нейросети вносит новую в нее информацию о том, как выглядят элементы, добавляет их названия, с помощью определенных алгоритмов «учит» программу находить одинаковые и различные фрагменты. Это похоже на то, как маленькие дети запоминают по картинкам животных, цвета, буквы алфавита.
Например, в поиске Google по изображению тоже задействована нейросеть, которую научили анализировать картинки и определять сходства. После загрузки исходного изображения нейросеть «прогоняет» ее по своей базе, сравнивая с другими, и предлагает похожие.
По подобному принципу нейросети генерируют иллюстрации по текстовому запросу. Вы задаете названия объектов и существ, описываете их, а алгоритм набирает все возможные элементы из своей базы, чтобы выразить ваше сообщение. Некоторые нейросети не распознают текст, но могут применять к готовым решениям визуальные эффекты, стили и элементы других изображений.
Хотя направление нейросетей в последние годы проделало большой путь, и такие программы все более эффективны, сгенерированным изображениям еще далеко до настоящего искусства. Поэтому переживать, что иллюстраторы и художники останутся без работы, пока не приходится. Тем не менее, в публичном доступе уже есть десятки сервисов, которые позволяют сгенерировать изображения онлайн. ForkLog нашел пять таких ресурсов.
DALL-E 2
Нейросеть DALL-E 2 — продукт одной из ведущих компаний по разработке ИИ, OpenAI. Эта программа работает на основе современного и популярного алгоритма GPT-3, также созданного OpenAI. Вторая версия DALL-E способна анализировать текстовые запросы на английском языке и быстро генерировать изображения на их основе.
В октябре 2022 года состоялся публичный релиз сервиса, что позволило свободно регистрироваться в сервисе и пользоваться им. Сейчас система генерирует более 2 млн изображений в день. В то же время, чтобы создать профиль в DALL-E 2, понадобится номер телефона из ограниченного списка стран.
В новой версии нейросети доступна функция Outpanting. С ее помощью пользователь может дорисовать готовое изображение. Программа сохраняет тени, отражения, структуры, цветовые сочетания в крупномасштабной версии картинки.
Регистрация в DALL-E 2 бесплатная. После активации аккаунта у пользователя есть 50 кредитов: кредит списывается при отправке очередного текстового запроса. Со второго месяца количество кредитов уменьшится до 15, и накапливать их будет нельзя, однако можно купить.
Функционалом DALL-E 2 уже пользуются компании и известные бренды. Например, журналы Cosmopolitan и The Economist использовали нейросеть для генерации изображений для своих обложек. Microsoft запустила на базе сервиса собственное приложение Designer, которое может генерировать различный контент: тексты, рекламные баннеры, открытки, логотипы и т.п.
Deep Dream Generator
Deep Dream Generator — платформа не только для создания, но и для редактирования изображений с возможностью бесплатной генерации нескольких картинок после регистрации профиля. На сайте проекта доступно три формата работы.
Text 2 Dream
Генерация картинки из текста. Неоходимо ввести запрос, который описывает желаемое изображение, и нейросеть соберет его по своим алгоритмам. Также доступен список уже готовых запросов, например стиль рисования и имя художника, творчество которого будет использовано в качестве референса.
Хотя в целом режим Text 2 Dream выдает любопытные и художественные результаты, его изображения не дотягивают до уровня DALL-E 2. Это касается и интепретации слов, и качества картинки. Процесс создания занимает немного больше времени.
Deep Dream
Этот инструмент позволяет проводить глубокую обработку исходного изображения с помощью алгоритмов ИИ. Для этого нужно загрузить файл оригинала и задать параметры: начальная глубина проработки, уровень вовлечения ИИ и номер «слоя». Последний означает, насколько сильно найросеть преобразует изображение: изменения могут быть поистине существенными.
Deep Style
Сервис обработки изображений, который использует в качестве графических фильтров направления и жанры искусства. Для использования Deep Style нужно загрузить исходное изображение и выбрать референсную картинку из списка.
Пользоваться Deep Dream Generator можно бесплатно, однако ограниченное время. При регистрации начисляют 30 баллов, которые снимают за использование инструментов: по 5 баллов за один запрос в Deep Style и Text 2 Dream и по 2 балла за Deep Dream. Дополнительные баллы платные: самый дешевый тариф стоит $19 в месяц и дает лимит 120 баллов, который восстанавливается со скоростью 12 баллов в час.
Hotpot
Hotpot — еще один условно бесплатный сервис, в котором есть услуга создания картинокк по текстовому запросу. Кроме самого запроса нужно задать тип визуального эффекта картинки и желаемый размер. Нейросети нужно от 2 до 20 секунд для обработки результата, но, если сайт будет перегружен, ожидание может затянуться до 2 часов и даже целого дня. Минус бесплатной версии — медленная скорость генерации и небольшой размер изображений.
На практике долгое ожидание по обработке начинается после четвертой попытки сгенерировать новую картинку. Чтобы не тратить время на обработку запросов, Hotpot предлагает оплачивать их кредитами. Их можно приобрести пакетом или оформить подписку. Например, 800 кредитов стоят $10, а при ежемесячной оплате 1000 кредитов доступны за $10.
На готовое изображение можно наложить фильтры, добавить текст, отредактировать цветопередачу и др. Есть возможность преобразовать картинку в NFT. Также в Hotpot есть множество услуг, связанных с обработкой изображений: восстановление, колоризация, улучшение лиц, удаление объектов и фона и другие.
Кроме того, скоро в Hotpot будет сервис для помощи в написании текстовых запросов под названием AI Sparkwriter. Для тех, кто хочет генерировать большие объемы изображений, Hotpot предоставляет API.
Hotpot также предлагает платные функции генерации NFT-коллекций, состоящих из множества изображений. Для этого предусмотрено несколько инструментов: Collection Mixer помогает комбинировать разные объекты из загружаемых пользователем изображений, AI NFT Photo Maker накладывает слои на оригинальные изображения. При поштучном создании цифровых предметов требуется также купить лицензию сервиса.
Night Cafe
Популярный генератор картинок, который не просто собирает графические элементы из поисковой системы, а встраивает их относительно выбранного вами стиля.
Основной сервис нейросети — Text To Image. Он рисует различные визуализации Coherent, Artistic или Stable. В ответ на запрос программа генерирует сразу 4 варианта картинки, которые можно скачать без водяного знака и в высоком качестве.
Создавать картинки здесь можно без регистрации. На старте вам присваиют 5 кредитов, стоимость одной генерации — 1 кредит. Как только триал-версия закончится, за каждый новый кредит нужно будет платить по $0,08. Также баллы начисляют за активность в сообществе: публикацию сообщений, комментарии и другие действия.
Несмотря на то, что Night Cafe использует различные готовые графические элементы, все права на владения готовыми изображениями принадлежат пользователю.
Dream by WOMBO
На сайте Dream можно генерировать изображения без регистрации. Также программа доступна в виде мобильного приложения для Android и iOS. Для получения новых изображений достаточно заполнить текстовый запрос, выбрать стиль визуализации и подождать 10-20 секунд. Нейросеть выдает картинки, которые можно скачать или опубликовать в ленте на сайте сервиса.
Кроме того, готовые изображения в Dream можно выпустить в виде NFT в сети Ethereum или Polygon. Для этого нужен Web3-кошелек. Эмиссия токена бесплатная, но нужно заплатить комиссию сети.
Минус сервиса: изображения генерируются в рамке и в невысоком разрешении.
Что еще почитать
Что такое искусственный интеллект?