Нейросети — тренд 2024 года. Сервисы ИИ набирают популярность не только среди обычных пользователей, но и среди арбитражников, дизайнеров и фрилансеров. Обученные алгоритмы могут сгенерировать уникальную картинку, создавать креатив, используя текстовый запрос, написать программный код, составить развернутый ответ на вопрос и др. Команда diasp.pro расскажет о новой нейросети для генерации изображений — Stable Diffusion, выделит её особенности, а также рассмотрит основные функции сервиса.
Содержание
Что такое Stable Diffusion
Stable Diffusion — это бесплатная нейросеть для преобразования текста в уникальное изображение, с открытым исходным кодом, разработанная компанией Stability AI. Программа способна генерировать изображения на основе текстового описания или редактировать исходные картинки, используя алгоритмы искусственного интеллекта и технику скрытой диффузии и прием img2img.
Stable Diffusion (SD) была выпущена 22 августа 2022 года и, на сегодняшний день, является самым доступным искусственным интеллектом, который можно скачать напрямую в компьютер или использовать через онлайн-сервисы. Программа устанавливает некоторые требования, с которыми следует ознакомиться перед использованием:
- Видеокарта с памятью не менее 4 ГБ для стандартных запросов;
- Видеокарта на 100 ГБ оперативной памяти для более сложных запросов и профессионального использования;
- Наличие базовых знаний программирования, при работе с исходным кодом.
Дополнительные функции Stable Diffusion
Популярная нейросеть отличается большим функционалом и набором инструментов для работы с image-файлами. Рассмотрим, какие запросы можно выполнить в Стабильной диффузии, помимо генерации изображений на основе текста:
- Обрабатывать картинки в художественном стиле
Алгоритмы SD обучены стилям и приемам знаменитых художников разных времен (от работ эпохи возрождения до современного NFT-искусства).
Например, по запросу: “Lara Croft, illustration by Alphonse Mucha ” можно получить подборку следующих изображений:
- Генерировать ресурсы для компьютерных игр
В ходе экспериментов, пользователи смогли интегрировать модель в игровую механику. Это позволило создавать предметы по описанию и встраивать их в геймплей.
- Бесплатно создавать картинки для анимаций
ИИ может создать картинки для покадровой анимации, объединенные одной тематикой. Благодаря этой функции, можно сгенерировать подборку картинок, которые можно смонтировать в тематический видеоролик. В Сети можно найти примеры видеороликов, с анимацией от Stable Diffusion. Один из таких роликов можно посмотреть на YouTube по ссылке.
- Конвертировать исходное изображение в другое
Нейросеть способна создать уникальную картинку по готовому файлу. Например, можно изменить персонажа на картинке, но оставить исходный фон или добавить какие-либо детали к фото.
- Дорисовывать детали и фон на картинке
Функция позволяет дополнять фото любыми деталями, которые задает пользователь, и создавать подходящий фон. Таким образом, можно быстро дорисовать набросок какой-либо картины или дополнить ее графическими элементами.
Как пользоваться нейросетью новичкам
Stable Diffusion можно пользоваться разными способами. Мы рассмотрим все способы использования нейросети, которые не предполагают работу с исходным кодом и подойдут новичкам.
Dream Studio
Dream Studio — это сервис, в который интегрирована SD. На сайте можно попробовать упрощенную версию модели без установки программного обеспечения и знаний языка программирования. В базовых настройках можно изменить высоту, ширину, а также количество генерируемых изображений по одному текстовому запросу. Также доступна генерация по другой картинке.
Из преимуществ Dream Studio — быстрая скорость обработки запросов и понятный интерфейс. Из недостатков — не более 500 бесплатных попыток. Каждый следующий запрос платный или можно оформить подписку за 10$ и получить 1000 кредитов (5000 запросов).
Mage.Space
Mage.Space — один из самых простых сервисов, который напрямую связан с основной моделью. Для того, чтобы сгенерировать изображение, достаточно перейти на сайт и ввести запрос на английском языке в поисковую строку.
Приложение не имеет ограничений по количеству запросов, однако, чтобы использовать все функции сервиса, необходимо зарегистрироваться по Email или войти через аккаунт Google, Discord или Twitter.
Кроме того, Mage.Space имеет беспалтную версию и два платных плана:
- Базовый план — 4 доллара в месяц. Позволяет запускать несколько активных сеансов одновременно.
- Профессиональный план — 15 долларов в месяцев. Отключает рекламу и открывает доступ к графическим редакторам премиум-класса.
Avyn
Avyn — это сервис для генерации изображений из текста, работающий на базе ИИ и алгоритмов Стабильной Диффузии. Помимо сервиса генерации, Avyn — библиотека готовых стабильных диффузионных изображений, которая насчитывает более 10 млн различных картинок.
Чтобы ввести свой запрос, необходимо зарегистрироваться по электронной почте и создать аккаунт. Среди недостатков приложения — нельзя задать настройки вручную, однако можно изменить части готовых изображений, например, лицо, фон и др.
Playground AI
Playground AI — простой и бесплатный сервис для создания изображений по текстовым подсказкам, со встроенной галереей работ пользователей. Чтобы получить доступ к инструментам сервиса необходимо авторизоваться на сайте через Google.
Пользователи могут запустить генерацию по тексту или изображению, добавить фильтры и изменить размер картинки. Кроме того, можно создать свою страницу и загружать свои работы в личный альбом, чтобы набирать подписчиков, получать лайки и попадать в рекомендации.
Как установить Stable Diffusion на ПК
Чтобы воспользоваться полной версией нейросети и получить доступ ко всем функциям и возможностям, необходимо обладать навыками программирования. Скачать SD на Windows, Linux или MacOS можно на GitHub.
Подробную инструкцию по установке можно найти по ссылке. После регистрации и установки, вы будете направлены на главную страницу нейросети:
Как ввести запрос в Stable Diffusion
Чтобы сгенерировать изображение, нужно выполнить несколько шагов:
- Запустите SD, заранее установленную на ваш ПК;
- После открытия главного окна, выберите раздел “Prompt ”;
- Установите английскую раскладку на клавиатуре (нейросеть обучена на английском языке, поэтому запросы на других языках могут выдавать ошибки);
- Вводите текстовый запрос, отделяя каждое новое слово запятой. Правильный формат запроса в Stable Diffusion выглядит так:
object, background, style, additional descriptions of image quality and details
- После того, как вы ввели текст, необходимо нажать кнопку “Generate ” и дождаться, пока нейросеть выдаст изображение.
- Вы можете изменить готовый вариант, добавив больше информации в описание или изменив настройки.
Пример текстового запроса для креатива в арбитраже трафика в вертикали Нутра — “Реклама таблеток для потенции ”:
doctor, holding in his hands, pills for potency, on the light background, 4k
Как составить качественный запрос в Stable Diffusion
Мы подготовили несколько советов, как составить запрос, чтобы получить лучший ответ от искусственного интеллекта:
- Подробно опишите то, что хотите увидеть.
Не ограничивайтесь одной фразой, а добавьте информацию о стиле объекта, желаемом фоне, качестве картинки и размере. Это поможет получить результат с высокой детализацией.
- Важные части поместите в начале запроса.
Нейросеть генерирует разные варианты изображений, в зависимости от порядка слов в одном и том же запросе. Например, если вам нужен более качественный персонаж, опишите его в первую очередь.
- Используйте синонимы.
Чтобы нейронная сеть лучше поняла ваш запрос, используйте синонимы, которые могут указать на настроение картинки, фон или стиль. Например, чтобы получить красочную картинку, можно добавить такие слова, как: яркий, пестрый, радужный и т.д.
- Изучите запросы других пользователей.
В Интернете есть специальные сайты, на которых хранится большое количество сгенерированных изображений, с полным описанием запросов. Для этого, можно выбрать сервисы Lexica или Playground AI.
Обзор настроек SD
Рассмотрим главные настройки генератора, которые нужно изучить перед использованием:
- Sampling Steps/Method
Sampling Steps отвечает за количество шагов, которое выполняют алгоритмы в процессе обработки. Чем больше шагов вы устанавливаете, тем дольше будет обрабатываться запрос. Эксперты отмечают, что не всегда большее количество дает качественный результат и советуют экспериментировать с данным параметром. Sampling Method — настройка, отвечающая за скорость и качество создаваемых картинок, а также учитывающая характеристики ПК. Stable Diffusion имеет более 10 алгоритмов на выбор.
- Height/Width.
Здесь можно настроить высоту/ширину изображения. Стандартный размер для большинства картинок — 512×512, однако, пользователи могут задать свои параметры.
- CFG Scale.
Данный параметр регулирует уровень импровизации алгоритмов нейросети. Чтобы получить результат, который будет на 100% соответствовать запросу — пропустите эту настройку. Чтобы сделать случайное фото, задайте максимально большое значение.
Заключение
Таким образом, нейросеть Stable Diffusion — один из лучших генераторов изображений из текста в 2024. Алгоритмы искусственного интеллекта способны не только создавать уникальную картинку, но и обрабатывать ее в разных стилях, редактировать и дополнять новыми деталями уже готовые фото. Модель SD имеет открытый код и доступна для скачивания на ПК. Кроме того, в Интернете можно найти сервисы со встроенной моделью Стабильной Диффузии, чтобы использовать их онлайн.
Удачи и профита!