«Мастер Ин Медиагруппа» перенесла Алису в футуристичную эпоху тотальной монетизации. Здесь миром правит Королева Рекламы, сны забиты баннерами, а мысли звучат как слоганы. Однако Алиса не согласна это терпеть, и вместе со своим татуированным котом, с соркастиной татуировкой NO ADS, она решается бросить вызов системе.
История создания
На разработку и отрисовку комикса ушло около трех недель. Это был наш первый опыт создания полноценного комикса с использованием исключительно нейросетей.
Мы выбрали такую реалистичную киберпанк-стилистику, потому что она позволяет создавать гипердетализированные, атмосферные изображения с драматичным освещением и неоновыми акцентами, что идеально подходит для нашей истории. Стиль кинематографической цифровой живописи придает комиксу глубину и зрелищность.
Что касается героев, они были выбраны и детально проработаны для создания уникальных, запоминающихся образов, которые органично вписываются в мир киберпанка. Каждый персонаж имеет четкие визуальные характеристики, которые мы стремились максимально точно воспроизводить в каждой панели.
Какие ИИ использовали в работе
Для работы мы использовали следующие нейросети:
- GPT (вероятно, имелся в виду ChatGPT или аналогичная модель) — для написания сценариев и диалогов.
- Gemini — для генерации изображений.
Мы пробовали и другие нейросети для генерации изображений, но в итоге именно Gemini показал наилучшие результаты в нашем конкретном случае, хотя и с ним были свои трудности.
Основные моменты и лайфхаки при работе с ИИ
- Детальные и последовательные промты: чтобы добиться стабильности в стиле и внешности героев, крайне важно было максимально детализировать каждый запрос, используя такие приемы, как STYLE LOCK и CHARACTER LOCK. Это позволяло минимизировать отклонения.
- Использование референсов: постоянное обращение к эталонным изображениям персонажей и стилистики помогало сохранять единообразие.
- Итеративный подход: мы делали много попыток и корректировок, прежде чем добивались желаемого результата. Важно быть готовым к тому, что не каждая генерация будет удачной.
- Четкая структура запросов: разбиение запроса на блоки (стиль, персонажи, сцена, негативные промты) значительно улучшало управляемость процессом.
Примеры запросов
Примеры запросов были предоставлены в ходе нашей переписки. Они включали в себя:
- STYLE LOCK с подробным описанием желаемой эстетики (cinematic digital painting, semi-realistic, hyper-detailed, неоновые акценты, холодный общий грейд
и т. д. ). - LOOK LOCK с детальными описаниями каждого персонажа (одежда, прическа, цвет волос, эмоции, татуировки для кота
и т. д. ). - NEGATIVE LOCK для исключения нежелательных элементов (no anime, no toon, no jeans for Alice, no extra tattoos for cat
и т. д. ). - Подробные описания каждой панели комикса (угол камеры, освещение, действия персонажей, текст на AR-баннерах).
Участие человека в создании изображений
В генерации принимала участие Гузикова Ирина. Дизайнерские доработки картинок были минимальными, так как целью было именно создание полностью сгенерированного ИИ комикса. Однако человеческое участие было критически важным на этапе формулирования запросов, выбора лучших кадров, коррекции промтов и обеспечения общей сюжетной и визуальной связности. В некоторых случаях требовалось повторное генерирование части изображения или всей панели, если нейросеть существенно отклонялась от заданных параметров.
Неудачные попытки
Было очень много неудачных кадров. Основные сложности заключались в том, что нейросети постоянно:
- меняли внешность героев: сложнее всего было добиться стабильности в лицах и прическах. Даже при строгом LOOK LOCK ИИ часто рисовал разных персонажей, менял черты лица, цвет волос или их укладку, что требовало повторных генераций;
- меняли стиль рисунка: нейросеть могла «уйти» в менее реалистичный или карикатурный стиль, хотя в STYLE LOCK было указано обратное;
- неправильно интерпретировали детали: например, вместо «короткого изумрудно-зеленого каре» могли появиться длинные волосы или другой оттенок;
- разделяли героев: иногда ИИ не мог правильно скомбинировать элементы сцены, разделяя героев или размещая их некорректно относительно друг друга;
- игнорировали негативные промты: несмотря на NEGATIVE LOCK, иногда появлялись элементы, которые мы хотели исключить (например, неподходящая одежда для Алисы).
Рекомендации тем, кто только хочет начать работать с ИИ
- Будьте готовы к терпению и итерациям: искусственный интеллект не всегда понимает вас с первого раза. Экспериментируйте с промтами.
- Используйте «замки» (locks): STYLE LOCK, CHARACTER LOCK, NEGATIVE LOCK — это мощные инструменты для поддержания консистентности. Детально описывайте, что вы хотите видеть, и что не хотите.
- Разбивайте сложные задачи: если сцена сложная, попробуйте сначала генерировать отдельные элементы, а затем объединять их или использовать для композиции.
- Изучайте лучшие практики: смотрите, как другие пользователи формулируют свои запросы.
- Не бойтесь неудач: неудачные попытки — это часть процесса обучения. Анализируйте, что пошло не так, и корректируйте запросы.
- Четко определитесь с референсами: имейте набор эталонных изображений, к которым вы будете возвращаться.
Это был наш первый полноценный комикс, созданный с помощью нейросетей, и он продемонстрировал как огромный потенциал ИИ, так и его текущие ограничения. Самым сложным оказалось добиться стабильности в генерации одинаковых кадров и сохранении внешности героев. Тем не менее, это был большой прорыв в нашем понимании того, как работать с нейросетями для создания такого рода контента.
Самой большой проблемой, которая мешала достичь желаемого, была неспособность нейросети рисовать одни и те же кадры и сохранять внешность героев. Изначально нейросети постоянно меняли внешность персонажей и стилистику рисунка, что создавало ощущение «плавающих» героев. Мы победили эту проблему, постоянно уточняя и расширяя LOOK LOCK и STYLE LOCK, добавляя в них все больше деталей и негативных промтов.
Мы также поняли, что многократное дублирование ключевых характеристик персонажей и стилистики в каждом запросе, даже если это казалось избыточным, значительно увеличивало вероятность получить консистентный результат. Например, описание «короткое изумрудно-зеленое каре» повторялось в каждом запросе для Алисы. Это, наряду с активным использованием референсов и итерационным подходом, позволило нам в итоге добиться приемлемого уровня единообразия, чего изначально было очень сложно достичь.
