Обучение Stable Waifu ✨

March 24, 2025

👋🏻 Добро пожаловать в обучение Stable Waifu! После прочтения этой статьи вы будете знать всё необходимое для эффективного использования каждой возможности сервиса!


1. Первые шаги

Чтобы создать арт, сперва нужно отправить боту описание желаемого результата. Можете создать своё или взять моё строчкой ниже.

🎨 Красивая девушка с белыми волосами и красными глазами в школьной форме стоит возле дерева, на фоне облака

Как мы видим, бот составил из нашего русскоязычного описания теги, понятные моделям ИИ. Если вас что-то в них смущает, можете нажать на финальный ввод бота, чтобы скопировать, затем отредактировать его и отправить свою версию.

На этом этапе доступен широкий выбор настроек. Пройдемся по тем, которые используются часто:

  • ⚙️ Модель – главный компонент, который отвечает за всё: влияние вашего ввода на результат, способность к тем или иным задумкам, качество и стилистику. По-умолчанию, на момент написания, установлена EpicXL. Почитать о ней и ее отличительных особенностях подробнее можно прямо в этом разделе.
  • 🖼️ Портрет / 🏞️ Ландшафт – эта кнопка поворачивает арт в горизонтальный / вертикальный вид соответственно. Влияет только на ориентацию.
  • 📐 Соотношение – определяет разрешение и пропорции арта. Вы можете сгенерировать себе обои, аватарку или что-то особое, выставив подходящее соотношение сторон. Стрелочка рядом говорит об ориентации (вверх – портрет, вправо – ландшафт). Рекомендуем придерживаться соотношений 2:3 (по-умолчанию) и 3:4, если не уверены, какие вам подходят! Мы возьмём 3:4.
  • В самом сообщении имеются полезные ссылки, актуальные для выбранной модели (начинаются с >). Там обычно расположены дополнительные возможности или инструкция к самой модели.
  • Web – открывает мини-приложение с расширенной функциональностью для редактирования ввода. Подробнее о нем в нашем канале.

Наконец, давайте нажмём "🎉 Начать" для запуска создания арта!

Результат генерации

Вот мой результат! Если вы использовали этот же ввод, то можете заметить, что ваш арт наверняка выглядит совершенно иначе. В этом и есть прелесть ИИ-генерации! С каждым запросом и повтором вы получаете нечто новое.

👏 Таким образом, мы научились создавать простые арты на любой вкус :)

Используем стили

Помимо модели, на стилистику результата сильно влияет ввод, а именно – стили аниме-художников. У разных современных моделей свой набор стилей и свои нюансы, которые указаны в описании. В стандартной EpicXL доступна имитация тысяч аниме-художников, которых можно смешивать и детально настраивать их влияние на стилистику результата. Это полезно не только для тех, кто любит конкретных иллюстраторов, но и позволяет каждому создать буквально любую стилистику по вкусу с нуля!

Чтобы показать нагляднее, мы возьмем наш предыдущий ввод и добавим туда смесь (микс) из 3 художников: coco1758, kmgrn и gomzi:

🎨 1girl, solo, beautiful, white hair, red eyes, school uniform, standing, tree, cloud in background, coco1758, kmgrn, gomzi

Новый результат со стилями выше

Спорим, что вы не ожидали такую огромную разницу всего от 3 новых слов во вводе? Теперь можете представить, что таких стилей у модели тысячи, и все имеют свой уникальный почерк, все можно смешивать и открывать для себя безграничные вариации артов!

Подробнее о возможностях EpicXL

Настройки и персонализация

В сервисе есть настройки, которые можно вызвать, отправив боту команду /settings. Она также есть в меню в левом нижнем углу. Там можно настроить поведение Stable Waifu под ваши предпочтения: уменьшить вес файлов с артами, настроить дизайн ввода под файлами и прочие функции сервиса. Если вам что-то не нравится, не забудьте заглянуть туда! :)

Классические модели

Мы увидели, что можно сделать с EpicXL. Это актуальный и сильный представитель линейки моделей XL, которая сейчас является основной. Но помимо них, есть также "классические" модели – те, которые были до XL, и уже технически устаревают.

Понять, какая перед вами модель, можно по названию: если в нём нет "XL", то это классическая модель! Она будет хуже следовать вводу, хуже рисовать людей, для схожей четкости артов нужно будет больше действий, а стилистика и возможности сильно ограничены по сравнению с последними XL моделями.

Тем не менее, некоторые любят классический вид и ощущения от ранних моделей, так что они всё ещё остаются частью сервиса и будут встречаться в этой статье!


2. Копируем арты с помощью 🌱 QuickSeed

❗️ Не всегда арт получится повторить полностью по техническим причинам, особенно старые арты.

Когда генерация завершается, бот отправляет вам документ с итоговым артом, а также выводит для вас его 🌱 Сид. У него есть 2 основных применения в рамках нашего бота:

  • Вы можете передать его своему другу вместе с используемыми настройками и вводом, и тот сможет скопировать ваш результат с нуля.
  • Сравнить поведение одного сида между разными моделями, вводами и настройками, подобрав для себя оптимальный результат с большей надежностью.

Чтобы скопировать арт, помимо сида, все настройки генерации и ввод должны полностью совпадать с оригинальным артом. Утомительно, не так ли?

Именно поэтому, как вы могли заметить, на сид можно нажать – это называется 🌱 QuickSeed, или ссылка, перейдя по которой бот сам подставит все нужные настройки, сид и ввод из оригинальной генерации, после чего вы сможете просто отредактировать нужное. Вот теперь круто!

Давайте попрактикуемся! Сейчас я поделюсь с вами своим первым артом из предыдущей главы и за одно покажу, как это можете сделать вы.

  • Чтобы взять свой 🌱 QuickSeed, я копирую подсвеченную ссылку, которая прячется за цифрами сида. Отмечена красным на скриншоте ниже.
ПКМ на ПК / Зажатием пальца на телефоне
  • Теперь даю эту ссылку вам. Всё, что от вас требуется для получения такого же результата – перейти по ней и запустить генерацию! тык

🪄 Если вы запустите эту генерацию без изменений, у вас будет примерная копия моего первого арта всего в 2 клика. Ну не магия ли это!?

↗️ QuickPass

Помимо 🌱 QuickSeed, пройденного выше, в сервисе есть функция ↗️ QuickPass.
Они похожи и имеют схожие цели, но достигают их разными путями.

Второй сразу копирует полный файл генерации без настроек и необходимости запуска новой генерации. При этом, если кто-то скопирует таким образом чужую генерацию, бот оставит под ней соответствующую пометку.

Есть 3 способа использовать эту функцию в сервисе:

  • В нашем сообществе к генерациям обычно предоставляется именно ↗️ QuickPass ссылка.
  • В статистике профиля ваша первая генерация доступна по ссылке ↗️ QuickPass.
  • Если переслать любой файл генерации боту, он мгновенно создаст ↗️ QuickPass копию. То есть, если вы отправите другу свой файл из бота, тот сможет переслать его себе и сразу же сделать повтор или задействовать другие возможности на вашем результате.

Зачем тогда нужен 🌱 QuickSeed?
Оба варианта имеют свои применения, а иногда полезно отправить ссылку именно на свои настройки генерации, нежели сам файл, особенно если вам не хочется делиться с кем-то полным артом сразу.


3. Продвинутый ввод

❓ В этом разделе используются англоязычные вводы для демонстрации максимальной гибкости и возможностей.

В первых разделах мы узнали про самые основы, и их достаточно для создания крутых артов, но ваши вводы имеют решающую значимость, и от умения правильно их составлять зависит львиная доля успеха!

Основы качественного ввода

Как вы могли заметить, когда мы отправляем ввод на русском языке или любом другом, помимо английского, из него формируются некие теги.
На самом деле они не абсолютно обязательны, и модели прекрасно поймут вас в любом формате – будь то естественный ввод "girl in forest" или теги "1girl, forest". Последнее попросту позволяет достичь наилучшего баланса между качеством арта и эффективностью работы ввода, а мы стремимся к наилучшему!

Но что же это за теги?
Аниме-модели в подавляющем большинстве обучены с использованием "danbooru" тегов. Danbooru – это огромная база данных изображений аниме тематики, в которой каждое из них описывается с помощью тех самых "тегов". Сайт заблокирован в РФ из-за специфических 18+ артов, но есть альтернативная версия без них – Safebooru.

❓ Помимо формата ввода, есть также ряд правил, которых следует придерживаться для оптимальных результатов...

  • Лучший размер ввода – 15-50 слов. Нет ничего критичного, если выйти за эти пределы, но модель может вести себя ощутимо менее предсказуемо при значительном отклонении.
  • Не указывайте слишком много цветов или деталей во вводе. Пытаясь прописывать каждую мелочь, вы увеличиваете вероятность ошибок в описанных деталях. Пока это не абсолютно обязательный критерий арта, оставьте его на волю ИИ, это увеличит стабильность ввода.
  • Упоминание теней, освещения, красоты могут сделать ваши арты атмосфернее и профессиональнее, например "объемные тени, великолепные детали, великолепный пейзаж". Однако, не всегда они идут во благо и только в разумном количестве! Качественный ввод и стили дадут более ощутимый результат.
  • На английском старайтесь писать существительные и прилагательные тегами, а с глаголами использовать более естественный язык. Например, "1girl, smile, sitting on a bed" будет надёжнее, чем "1girl, smile, sitting, bed". Сочетать в одном вводе теги и естественный язык может быть полезно.
  • Если вы не уверены, пишите на родном языке. Бот сам отформатирует ввод в нужном виде, что избавит вас от необходимости беспокоиться над вводом. Мы регулярно вкладываем время для улучшения точности и эффективности перевода.

Управляем весом ввода 𐄷

Порой нам недостаточно просто написать ввод или какое-то слово в нём. Например, может понадобиться возможность повысить или уменьшить влияние какого-то тега или слова на арт. Рассмотрим пример ниже...

🎨 1girl, solo, monochrome, holding balloons, scenery, from side

↗️ QuickPass

⚙️ Модель: BlueXL

Арт в полной мере отражает запрос, но что, если мы захотим сделать на нём больше шариков (balloons)?

Я бы мог менять весь ввод, но расписывать все детали и количество, перефразировать не всегда возможно с должной надежностью. Именно когда мы хотим поднять или снизить значимость определённого элемента ввода, нам поможет prompt weighting – он же "вес ввода".

🎨 1girl, solo, monochrome, holding (balloons:1.3), scenery, from side

↗️ QuickPass

⚙️ Модель: BlueXL, тот же 🌱 Сид

Можно заметить изменения – шарики теперь занимают более внушительную часть арта при использовании тех же настроек и того же сида!

Мы немного подняли вес слова "balloons", поэтому модель уделяет ему больше внимания. По-умолчанию каждый элемент ввода имеет вес 1.0, мы повысили один из них до 1.3, чтобы добиться нужных результатов. Точно так же можно снижать вес ниже 1.0 для получения обратного эффекта.

❗️ Эффективность веса и допустимые значения зависят от выбранной модели и вашего ввода. Не стоит использовать одни и те же значения и подходы во всех ситуациях, в противном случае можно чаще получать плохие результаты!

❓ Теперь памятка о возможных способах написания...

  • (balloons) – увеличит вес слова с 1.0 до 1.1. То есть, он будет чуть-чуть сильнее влиять на результат.
  • ((balloons)) – увеличит вес с 1.0 до 1.21. Чем выше значение или количество скобок, тем сильнее влияние. Таким образом можно ставить ещё больше скобок для увеличения веса по формуле 1.1^n, где n – количество скобок. Если у нас 2 скобки, то получится 1.1^2 = 1.21, отсюда и значение.
  • Мы можем задать значение вручную, как в первом примере – (balloons:<значение>). Используйте только с одной парой скобок.
    (balloons:0.8) – уменьшит вес с 1.0 до 0.8.
  • [balloons] - уменьшит вес с 1.0 до 0.9. Он будет чуть-чуть меньше влиять на результат. (Совсем незначительно меньше)
    С такими квадратными скобками нельзя указывать вес значением. Для уменьшения веса используйте либо только квадратные скобки, либо круглые со значением ниже 1.0.

В одной скобке может быть сразу несколько слов или тегов, например (1girl, white hair, shirt). Но покрывать слишком много слов таким образом на XL моделях может быть более пагубно для результатов и их эстетики.

✅ Теперь мы знаем, что такое вес, как его использовать и какие нюансы стоит учитывать!

"Странные чёрточки?" (\)

Изредка можно увидеть, как бот подставляет к вашим тегам обратные слеши (\), либо встретить их в какой-то статье и у других людей.

Они используются, когда мы хотим сказать модели ИИ, чтобы она воспринимала скобку не как вес, а как скобку. Что это означает?

  • mika (blue archive) – в данном случае сервис повышает вес blue archive, и модель будет видеть тут mika blue archive*1.1, хотя мы просто хотели написать тег со скобкой.
  • mika \(blue archive\) – теперь скобки не повышают вес blue archive, потому что нам нужны обычные скобки во вводе для чистого описания. (Некоторые danbooru теги содержат скобки, это их часть)

Теперь вы понимаете, что они делают, но нужно ли их писать?
В нашем сервисе многое корректируется и дополняется внутренними алгоритмами, так что если эти бэкслеши (\) действительно нужны, мы добавим их сами в процессе ввода или генерации. Поэтому вам не нужно думать об этом, они не окажут значимого влияния на ваши арты, а эта информация для ознакомления.

Мужчины и пейзажи + бонус

Временами может понадобиться показать нашего персонажа с определенных ракурсов. Давайте рассмотрим подходящие приёмы для этого...

  • Вид сверху - from above.
  • Вид сбоку - from side. (Уже использовали выше)
  • Вид сзади - from behind или from back.
  • Вид снизу - from below.
  • Издалека - from afar, также может хорошо сработать full body для отображения человека в полный рост, так как отодвигает его от зрителя.
  • Вблизи - close-up

❗️ Всё это прекрасно работает и при вводе на русском языке, так что служит дополнительной памяткой к примерам в этой статье.

Итак, на этот раз я создам пейзаж с мужчиной с видом сзади и упомяну несколько полезных подробностей, о которых стоит знать. Изначально Stable Waifu включает поддержку самых разных мужчин и многочисленные оптимизации, но в зависимости от модели есть разные подходы к их генерации.

Для мужчины используется тег 1boy, но ничего страшного, если написать как-то иначе. Если хотите сделать его взрослее, добавьте бороду (beard), если уместно, и/или mature male. На классических моделях к тегам зрелости можно добавить вес, чего на XL делать не рекомендуется.

Что касательно пейзажей – если вам нужно сосредоточить на нем внимание модели, добавьте тег scenery. Не советую использовать его, если вам важен человек или другой конкретный объект, в таком случае будет проще просто описать фон или понизить вес на scenery. Некоторые модели, особенно классические, склонны к более живописным пейзажам при наличии этого тега, но не стоит на нём зацикливаться.

🎨 1boy, kimono, sunset, mountains, scenery, beautiful view, from behind, looking away

↗️ QuickPass

⚙️ Модель: Dark Delicacy

👏 Теперь вы можете использовать полученные знания в этом разделе для реализации действительно сложных идей и умеете читать и понимать довольно продвинутые вводы!


4. Управляем несколькими персонажами 🪄

Проблема многих ИИ-сервисов – описание сразу нескольких человек на изображении таким образом, чтобы у каждого из них была своя конкретная внешность, не спутывая их между собой. Мы имеем особую поддержку для таких целей! 🎉

Мы сделали такие вводы предельно интуитивными. Имеется полная поддержка русского языка, а также несколько простых правил для детальной настройки.

🎨 Девушка с кошачьими ушами, в худи и с длинными белыми волосами и красными глазами идёт, держась за руку с девушкой в черном бикини с каштановыми волосами и зелёными глазами

↗️ QuickPass

⚙️ Модель: Vela

Кошачьи уши, белые волосы и красные глаза только у девушки слева, а зеленые глаза и каштановые волосы только у девушки справа, как мы и просили. В этом, когда мы можем уверенно описывать разных людей, и заключается очередная магия Stable Waifu :)

Это был пример на русском языке. Вы уже могли заметить, что бот в этот раз не просто перевёл ввод, но и построил его в непривычной нам форме:

🎨 2girls, walking, holding hands
1girl, cat ears, hoodie, long hair, white hair, red eyes
1girl, black bikini, brown hair, green eyes

  • На первой строчке мы пишем общий ввод, в котором задаём количество персонажей, общую композицию, фон, стили и то, что касается всех персонажей на арте сразу. Он очень важен для успешного результата, так что здесь не должно быть ничего лишнего.
    К примеру, если мы захотим создать сцену с 2 парнями и 1 девушкой на пляже ночью в стиле художника rikuwo, сюда мы напишем "2boys, 1girl, beach, night, rikuwo". Рекомендуем добавить каждому арту связующее действие, например "стоят вместе" (standing together) – так персонажи появятся более равномерно.
  • Далее нам нужно перейти на новую строчку (enter на телефоне или shift+enter на ПК), и на каждой новой строчке описывать по одному персонажу слева направо, как в примере выше.

Как можно заметить, в общем вводе нашего примера "2girls, walking, holding hands" (2 девушки идут, держась за руки), дальше мы переходим на новую строчку и описываем девушку слева, затем девушку справа. Если у вас более 2 персонажей, они описываются по тому же принципу!
Напоследок учтите ряд предупреждений и рекомендаций:

  • Максимальное количество персонажей при использовании этой функции ограничено до 4 для обеспечения стабильности генераций.
  • Выбранное соотношение сторон в настройках генерации должно как можно лучше вмещать всех персонажей. В узкое вертикальное изображение будет очень сложно включить больше 2 персонажей, а в слишком широком может появиться больше необходимого количества, либо их положение станет менее стабильным.
    3:2 будет оптимальным выбором для начала!

❓ Если ваш ввод работает плохо, или вас ограничивает этот подход, просто напишите ввод обычным способом - в одну строчку. В таком случае соответствие внешности персонажей не гарантировано, но это позволяет создать любое количество людей и избежать других проблем.

✨ На этом всё! Просто, не правда ли? Достаточно придумать персонажей своей мечты, остальное сделает наш сервис!


5. Обработка изображений (img2img)

Наконец, мы дошли до обработки ваших картинок в стилистике моделей сервиса. Какие варианты использования?

  • Вы можете нарисовать набросок для арта и отправить его боту, чтобы он дорисовал его в стиле модели, сохранив заложенные вами черты. Круто, не так ли?
  • Преобразовать фото человека в аниме стилистику.
  • Преобразовать любой другой арт в стиль желаемой модели. Это касается и результатов, полученных в боте, с некоторыми оговорками.

Сейчас я проиллюстрирую третий вариант в деле несколькими способами. Для примера возьму работу одного из любимых художников - raemz.

Оригинал из Twitter

Картинка есть, но теперь нужно сделать так, чтобы модель ИИ понимала, как с ней работать. Для этого есть два пути с разным исходом, которые рассмотрим по очереди.

Автоматическое описание

Мы об этом не говорили, но сервис умеет моментально описывать любое изображение, которое мы отправляем боту. Давайте отправим этот арт и посмотрим, что ответит бот.

Ввод, подобранный ботом

Для изображения был составлен оптимальный ввод, который точно его описывает. Если мы запустим генерацию, то на выходе получим максимально похожий на исходник арт, но в стилистике модели.

↗️ QuickPass

⚙️ Модель: BlueXL

Не меняя ничего, мы действительно получили очень похожее изображение, только в стилистике выбранной модели!

❗️ Для реальных фотографий стоит повысить 💪 Силу в настройках генерации, в противном случае стилистика может измениться недостаточно для красивого результата. Подробнее о силе в следующей секции.

⭐️ Бонус: Вы можете скопировать ввод бота нажатием на текст и использовать его в текстовых генерациях. Это отличное описание, которое будет полезно в ваших экспериментах.

Ручное описание + Сила

Теперь мы попробуем выставить своё описание и сделать наш результат интереснее. Пойдем по порядку...

  • Отправим оригинальное изображение боту, но в этот раз добавим к нему в подписи наш ввод.
Блондинка в школьной форме с зелеными глазами, sonomura00, hotatenshi, haru

sonomura00, hotatenshi, haru – стили аниме-художников, о которых мы уже рассказывали в первом разделе. Эти 3 стиля доступны в моделях EpicXL и KanaXL. Тут мы используем их, чтобы придать арту интересный вид.

  • Теперь нам следует повысить 💪 Силу. Это нужно, чтобы наш ввод сильнее менял исходный арт, потому что мы добавили туда цвет волос и глаз, а также свои стили, которых нет на исходнике.
    Я ставлю "Высокую" силу, так как её достаточно для демонстрации.

↗️ QuickPass

⚙️ Модель: KanaXL, 💪 Сила: Высокая

Теперь мы не только добавили наши цвета к исходной картинке, но и установили нужную нам стилистику с помощью ручного ввода и повышенной силы, за одно научились развлекаться с обработкой изображений сразу несколькими способами 🔥


6. Аниме-персонажи

↗️ QuickPass

⚙️ Модель: BlueXL

В Stable Waifu можно создавать огромное количество популярных персонажей из аниме и игр – свыше 11000! Текущим флагманом для создания персонажей является новая модель NekoXL (Eclair) с революционным уровнем поддержки. За ней идут EpicXL и BlueXL с поддержкой более 5000 и 3000 персонажей соответственно. Если же ваш персонаж относится к западной культуре, то шанс воссоздать его будет выше у VersaXL.

Чтобы сделать поддерживаемого персонажа, просто укажите во вводе его полное имя и фандом. Например:

Камисато Аяка из Genshin Impact

kamisato ayaka, genshin impact

Более подробное описание одежды и необходимых деталей внешности: от цвета глаз до волос, всегда будет плюсом, но не обязательно в большинстве случаев!


7. Контент с рейтингом 18+ 🔞

❗ Этот раздел только для лиц, достигших 18 и более лет.

Мы поддерживаем всех пользователей, в том числе заинтересованных в NSFW артах, поэтому не накладываем чрезмерную цензуру на генерацию взрослых персонажей! Мы не ставим такой контент в приоритет, но и не забываем о свободе творчества.

Новейшими решениями для 18+ контента выступают модели VersaXL, а также более новая NekoXL (Eclair и Modern), обладающие феноменальным качеством и гибкостью в этом направлении, и способностью к самым сложным взаимодействиям! Другие модели также поддерживают более простые 18+ сцены.


8. Что ещё интересного?

В Stable Waifu, помимо вышесказанного, есть масса возможностей, скрытых оптимизаций и технологий, не покрытых данной статьёй. Нажимайте интересующие кнопки, потому что везде есть подробное описание!

Для некоторых моделей имеются пресеты (наборы настроек), которые позволяют не просто выбрать модель, но и настроить её поведение под свои предпочтения! Всё подкреплено описанием и иллюстрациями в меню выбора модели.

Если вам нужно больше контроля над генерациями по описанию, загляните в меню ⚡️ Магии, которое содержит ряд полезных заклинаний, включающих:

  • позы (для управления позой и расположением персонажей)
  • референс (чтобы подсказать ИИ, как нужно нарисовать арт)
  • фигуры (замаскированная фигура или текст на арте).

А классические модели поддерживают магические теги ✨, которые дадут вам больше контроля: над мрачностью артов и глубиной теней, детализацией артов, а также количеством одежды на персонажах.

Если же у вас иссякли идеи для вводов, вы можете отправить боту команду /random и получить случайный ввод!

🏷️ Коллекции

Если вы активно придумываете своих персонажей, миксуете стили или часто откладываете себе какие-то вводы, вам будет очень полезна наша система коллекций, благодаря которой можно сохранять целые куски ввода в один удобный тег! Помимо этого, его можно в 1 клик передавать друзьям, которые затем смогут использовать его так же и мгновенно получать любые обновления, которые вы вносите в свою коллекцию.

Подробнее о работе с коллекциями

Наша пост-обработка

Вы могли заметить, что все лица выглядят детализированно и качественно, независимо от расстояния или размера на арте. Это результат нашей системы пост-обработки, которая активна абсолютно во всех генерациях, что делает ваши работы более завершенными и красивыми!
Таких механизмов в сервисе много, и каждый отвечает за предоставление лучшего опыта генерации аниме-артов, так что вы можете создавать полноценные арты, пригодные к публикации или использованию в ваших проектах! ✨


❕ В нашем канале публикуются новости об обновлениях, арты из сообщества, тематические подборки и инсайды, так что не забудьте подписаться, если вам нравится наша работа!
И помните – если что-то отсутствует в этой статье, то найти или прочитать это можно в самом боте.