Stable Diffusion: что нужно знать о популярной нейросети

user
Diasp
news
1 марта 2023 г.
view
comments
0
comments
Stable Diffusion: что нужно знать о популярной нейросети

Нейросети — тренд 2024 года. Сервисы ИИ набирают популярность не только среди обычных пользователей, но и среди арбитражников, дизайнеров и фрилансеров. Обученные алгоритмы могут сгенерировать уникальную картинку, создавать креатив, используя текстовый запрос, написать программный код, составить развернутый ответ на вопрос и др. Команда diasp.pro расскажет о новой нейросети для генерации изображений — Stable Diffusion, выделит её особенности, а также рассмотрит основные функции сервиса.

Что такое Stable Diffusion


Stable Diffusion — это бесплатная нейросеть для преобразования текста в уникальное изображение

Stable Diffusion — это бесплатная нейросеть для преобразования текста в уникальное изображение, с открытым исходным кодом, разработанная компанией Stability AI. Программа способна генерировать изображения на основе текстового описания или редактировать исходные картинки, используя алгоритмы искусственного интеллекта и технику скрытой диффузии и прием img2img.


Stable Diffusion (SD) была выпущена 22 августа 2022 года и, на сегодняшний день, является самым доступным искусственным интеллектом, который можно скачать напрямую в компьютер или использовать через онлайн-сервисы. Программа устанавливает некоторые требования, с которыми следует ознакомиться перед использованием:

  • Видеокарта с памятью не менее 4 ГБ для стандартных запросов;
  • Видеокарта на 100 ГБ оперативной памяти для более сложных запросов и профессионального использования;
  • Наличие базовых знаний программирования, при работе с исходным кодом.
Советуем прочитать: Нейросеть Midjourney: как пользоваться бесплатно и генерировать картинки онлайн"

Дополнительные функции Stable Diffusion

Популярная нейросеть отличается большим функционалом и набором инструментов для работы с image-файлами. Рассмотрим, какие запросы можно выполнить в Стабильной диффузии, помимо генерации изображений на основе текста:

  • Обрабатывать картинки в художественном стиле 

Алгоритмы SD обучены стилям и приемам знаменитых художников разных времен (от работ эпохи возрождения до современного NFT-искусства). 

Например, по запросу: “Lara Croft, illustration by Alphonse Mucha ” можно получить подборку следующих изображений:

Обрабатывать картинки в художественном стиле с помощью нейросетей
  • Генерировать ресурсы для компьютерных игр 

В ходе экспериментов, пользователи смогли интегрировать модель в игровую механику. Это позволило создавать предметы по описанию и встраивать их в геймплей.

  • Бесплатно создавать картинки для анимаций 

ИИ может создать картинки для покадровой анимации, объединенные одной тематикой. Благодаря этой функции, можно сгенерировать подборку картинок, которые можно смонтировать в тематический видеоролик. В Сети можно найти примеры видеороликов, с анимацией от Stable Diffusion. Один из таких роликов можно посмотреть на YouTube по ссылке

  • Конвертировать исходное изображение в другое 
Конвертировать исходное изображение в другое с помощью нейросетей

Нейросеть способна создать уникальную картинку по готовому файлу. Например, можно изменить персонажа на картинке, но оставить исходный фон или добавить какие-либо детали к фото.

  • Дорисовывать детали и фон на картинке 
Дорисовывать детали и фон на картинке с помощью нейросетей

Функция позволяет дополнять фото любыми деталями, которые задает пользователь, и создавать подходящий фон. Таким образом, можно быстро дорисовать набросок какой-либо картины или дополнить ее графическими элементами. 

Как пользоваться нейросетью новичкам

Stable Diffusion можно пользоваться разными способами. Мы рассмотрим все способы использования нейросети, которые не предполагают работу с исходным кодом и подойдут новичкам.

Dream Studio

Dream Studio — это сервис, в который интегрирована SD.

Dream Studio — это сервис, в который интегрирована SD. На сайте можно попробовать упрощенную версию модели без установки программного обеспечения и знаний языка программирования. В базовых настройках можно изменить высоту, ширину, а также количество генерируемых изображений по одному текстовому запросу. Также доступна генерация по другой картинке.

Из преимуществ Dream Studio — быстрая скорость обработки запросов и понятный интерфейс. Из недостатков — не более 500 бесплатных попыток. Каждый следующий запрос платный или можно оформить подписку за 10$ и получить 1000 кредитов (5000 запросов).

Mage.Space

Mage.Space — сервис, чтобы сгенерировать изображение

Mage.Space — один из самых простых сервисов, который напрямую связан с основной моделью. Для того, чтобы сгенерировать изображение, достаточно перейти на сайт и ввести запрос на английском языке в поисковую строку. 

Приложение не имеет ограничений по количеству запросов, однако, чтобы использовать все функции сервиса, необходимо зарегистрироваться по Email или войти через аккаунт Google, Discord или Twitter.

Кроме того, Mage.Space имеет беспалтную версию и два платных плана:

  • Базовый план — 4 доллара в месяц. Позволяет запускать несколько активных сеансов одновременно.
  • Профессиональный план — 15 долларов в месяцев. Отключает рекламу и открывает доступ к графическим редакторам премиум-класса.

Avyn

Avyn — это сервис для генерации изображений из текста, работающий на базе ИИ

Avyn — это сервис для генерации изображений из текста, работающий на базе ИИ и алгоритмов Стабильной Диффузии. Помимо сервиса генерации, Avyn — библиотека готовых стабильных диффузионных изображений, которая насчитывает более 10 млн различных картинок. 

Чтобы ввести свой запрос, необходимо зарегистрироваться по электронной почте и создать аккаунт. Среди недостатков приложения — нельзя задать настройки вручную, однако можно изменить части готовых изображений, например, лицо, фон и др.

Playground AI

Playground AI — простой и бесплатный сервис для создания изображений по текстовым подсказкам

Playground AI — простой и бесплатный сервис для создания изображений по текстовым подсказкам, со встроенной галереей работ пользователей. Чтобы получить доступ к инструментам сервиса необходимо авторизоваться на сайте через Google. 

Пользователи могут запустить генерацию по тексту или изображению, добавить фильтры и изменить размер картинки. Кроме того, можно создать свою страницу и загружать свои работы в личный альбом, чтобы набирать подписчиков, получать лайки и попадать в рекомендации. 

Советуем прочитать: Как заработать на чемпионате Европы 2024 

Как установить Stable Diffusion на ПК

Чтобы воспользоваться полной версией нейросети и получить доступ ко всем функциям и возможностям, необходимо обладать навыками программирования. Скачать SD на Windows, Linux или MacOS можно на GitHub

Подробную инструкцию по установке можно найти по ссылке. После регистрации и установки, вы будете направлены на главную страницу нейросети: 

Как установить Stable Diffusion на ПК

Как ввести запрос в Stable Diffusion

Чтобы сгенерировать изображение, нужно выполнить несколько шагов:

  1. Запустите SD, заранее установленную на ваш ПК;
  1. После открытия главного окна, выберите раздел “Prompt ”;
  1. Установите английскую раскладку на клавиатуре (нейросеть обучена на английском языке, поэтому запросы на других языках могут выдавать ошибки);
  1. Вводите текстовый запрос, отделяя каждое новое слово запятой. Правильный формат запроса в Stable Diffusion выглядит так:

object, background, style, additional descriptions of image quality and details

  1. После того, как вы ввели текст, необходимо нажать кнопку “Generate ” и дождаться, пока нейросеть выдаст изображение. 
  1. Вы можете изменить готовый вариант, добавив больше информации в описание или изменив настройки. 

Пример текстового запроса для креатива в арбитраже трафика в вертикали Нутра — “Реклама таблеток для потенции ”:

doctor, holding in his hands, pills for potency, on the light background, 4k

Пример текстового запроса для креатива в арбитраже трафика в вертикали Нутра — “Реклама таблеток для потенции ”:

Как составить качественный запрос в Stable Diffusion

Мы подготовили несколько советов, как составить запрос, чтобы получить лучший ответ от искусственного интеллекта:

  • Подробно опишите то, что хотите увидеть.

Не ограничивайтесь одной фразой, а добавьте информацию о стиле объекта, желаемом фоне, качестве картинки и размере. Это поможет получить результат с высокой детализацией.

  • Важные части поместите в начале запроса. 

Нейросеть генерирует разные варианты изображений, в зависимости от порядка слов в одном и том же запросе. Например, если вам нужен более качественный персонаж, опишите его в первую очередь.

  • Используйте синонимы. 

Чтобы нейронная сеть лучше поняла ваш запрос, используйте синонимы, которые могут указать на настроение картинки, фон или стиль. Например, чтобы получить красочную картинку, можно добавить такие слова, как: яркий, пестрый, радужный и т.д.

  • Изучите запросы других пользователей

В Интернете есть специальные сайты, на которых хранится большое количество сгенерированных изображений, с полным описанием запросов. Для этого, можно выбрать сервисы Lexica или Playground AI

Обзор настроек SD

Рассмотрим главные настройки генератора, которые нужно изучить перед использованием:

  • Sampling Steps/Method
Sampling Steps/Method

Sampling Steps отвечает за количество шагов, которое выполняют алгоритмы в процессе обработки. Чем больше шагов вы устанавливаете, тем дольше будет обрабатываться запрос. Эксперты отмечают, что не всегда большее количество дает качественный результат и советуют экспериментировать с данным параметром. Sampling Method — настройка, отвечающая за скорость и качество создаваемых картинок, а также учитывающая характеристики ПК. Stable Diffusion имеет более 10 алгоритмов на выбор.

  • Height/Width. 
Height/Width. 

Здесь можно настроить высоту/ширину изображения. Стандартный размер для большинства картинок — 512×512, однако, пользователи могут задать свои параметры.

  • CFG Scale. 
CFG Scale. 

Данный параметр регулирует уровень импровизации алгоритмов нейросети. Чтобы получить результат, который будет на 100% соответствовать запросу — пропустите эту настройку. Чтобы сделать случайное фото, задайте максимально большое значение.

Заключение

Таким образом, нейросеть Stable Diffusion — один из лучших генераторов изображений из текста в 2024. Алгоритмы искусственного интеллекта способны не только создавать уникальную картинку, но и обрабатывать ее в разных стилях, редактировать и дополнять новыми деталями уже готовые фото. Модель SD имеет открытый код и доступна для скачивания на ПК. Кроме того, в Интернете можно найти сервисы со встроенной моделью Стабильной Диффузии, чтобы использовать их онлайн. 

Удачи и профита! 

Советуем прочитать: ChatGPT: главные особенности популярной нейросети"
Ответы на популярные вопросы
Что такое Stable Diffusion?
Какие функции имеет Stable Diffusion?
Как ввести запрос в SD?
Какие сервисы поддерживают модель Stable Diffusion?
Какие настройки можно задать в Стабильной Диффузии?

Комментарии отсутствуют. Будьте первым!

в ответ kakdelakisa

user avatar