Нейрокомикс от «Мастер Ин Медиагруппы»

«Мастер Ин Медиагруппа» перенесла Алису в футуристичную эпоху тотальной монетизации. Здесь миром правит Королева Рекламы, сны забиты баннерами, а мысли звучат как слоганы. Однако Алиса не согласна это терпеть, и вместе со своим татуированным котом, с соркастиной татуировкой NO ADS, она решается бросить вызов системе.

История создания

На разработку и отрисовку комикса ушло около трех недель. Это был наш первый опыт создания полноценного комикса с использованием исключительно нейросетей.

Мы выбрали такую реалистичную киберпанк-стилистику, потому что она позволяет создавать гипердетализированные, атмосферные изображения с драматичным освещением и неоновыми акцентами, что идеально подходит для нашей истории. Стиль кинематографической цифровой живописи придает комиксу глубину и зрелищность.

Что касается героев, они были выбраны и детально проработаны для создания уникальных, запоминающихся образов, которые органично вписываются в мир киберпанка. Каждый персонаж имеет четкие визуальные характеристики, которые мы стремились максимально точно воспроизводить в каждой панели.

Какие ИИ использовали в работе

Для работы мы использовали следующие нейросети:

GPT (вероятно, имелся в виду ChatGPT или аналогичная модель) — для написания сценариев и диалогов.
Gemini — для генерации изображений.

Мы пробовали и другие нейросети для генерации изображений, но в итоге именно Gemini показал наилучшие результаты в нашем конкретном случае, хотя и с ним были свои трудности.

Основные моменты и лайфхаки при работе с ИИ

Детальные и последовательные промты: чтобы добиться стабильности в стиле и внешности героев, крайне важно было максимально детализировать каждый запрос, используя такие приемы, как STYLE LOCK и CHARACTER LOCK. Это позволяло минимизировать отклонения.
Использование референсов: постоянное обращение к эталонным изображениям персонажей и стилистики помогало сохранять единообразие.
Итеративный подход: мы делали много попыток и корректировок, прежде чем добивались желаемого результата. Важно быть готовым к тому, что не каждая генерация будет удачной.
Четкая структура запросов: разбиение запроса на блоки (стиль, персонажи, сцена, негативные промты) значительно улучшало управляемость процессом.

Примеры запросов

Примеры запросов были предоставлены в ходе нашей переписки. Они включали в себя:

STYLE LOCK с подробным описанием желаемой эстетики (cinematic digital painting, semi-realistic, hyper-detailed, неоновые акценты, холодный общий грейд и т. д.).
LOOK LOCK с детальными описаниями каждого персонажа (одежда, прическа, цвет волос, эмоции, татуировки для кота и т. д.).
NEGATIVE LOCK для исключения нежелательных элементов (no anime, no toon, no jeans for Alice, no extra tattoos for cat и т. д.).
Подробные описания каждой панели комикса (угол камеры, освещение, действия персонажей, текст на AR-баннерах).

Участие человека в создании изображений

В генерации принимала участие Гузикова Ирина. Дизайнерские доработки картинок были минимальными, так как целью было именно создание полностью сгенерированного ИИ комикса. Однако человеческое участие было критически важным на этапе формулирования запросов, выбора лучших кадров, коррекции промтов и обеспечения общей сюжетной и визуальной связности. В некоторых случаях требовалось повторное генерирование части изображения или всей панели, если нейросеть существенно отклонялась от заданных параметров.

Неудачные попытки

Было очень много неудачных кадров. Основные сложности заключались в том, что нейросети постоянно:

меняли внешность героев: сложнее всего было добиться стабильности в лицах и прическах. Даже при строгом LOOK LOCK ИИ часто рисовал разных персонажей, менял черты лица, цвет волос или их укладку, что требовало повторных генераций;
меняли стиль рисунка: нейросеть могла «уйти» в менее реалистичный или карикатурный стиль, хотя в STYLE LOCK было указано обратное;
неправильно интерпретировали детали: например, вместо «короткого изумрудно-зеленого каре» могли появиться длинные волосы или другой оттенок;
разделяли героев: иногда ИИ не мог правильно скомбинировать элементы сцены, разделяя героев или размещая их некорректно относительно друг друга;
игнорировали негативные промты: несмотря на NEGATIVE LOCK, иногда появлялись элементы, которые мы хотели исключить (например, неподходящая одежда для Алисы).