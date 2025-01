Нейросети активно внедряются в бизнес-процессы многих компаний. По данным глобального исследования McKinsey, в 2024 году 65% опрошенных представителей бизнеса заявили, что в их компаниях регулярно используется ИИ. Креативные индустрии не исключение: уже сейчас при правильном использовании нейросетей можно повысить точность референсов или ускорить создание презентаций. Сергей Дунаев, партнер креативного агентства Multiways, рассказал Sostav о том, какие именно инструменты пригодятся продюсеру для оптимизации продакшена с помощью ИИ.

Создание мудбордов

Используемая нейросеть: Midjourney

Раньше поиск референсов происходил на Behance, Pinterest и других подобных платформах, что могло занимать до половины рабочего дня нескольких сотрудников. Сейчас достаточно зайти в Midjourney и сгенерировать необходимый объект. Например, в качестве объекта для дальнейшей работы требуется изображение камня. В Midjourney в качестве промта указываем «камень» на английском языке, поскольку так результаты получаются наиболее точными.

Нейросеть предложит множество вариаций камня. Далее необходимо выбрать наиболее подходящий под задачу объект. Наводим курсор на нужную картинку, кликаем на значок текста, и появляется точный промт именно этого сгенерированного объекта. Этот промт можно скопировать для дальнейшей генерации, и нейросеть будет предлагать варианты уже специализированного объекта. Наращивая промты и используя нужные уточнения, за несколько итераций можно достичь нужного результата.

Подготовка тритментов

Используемые нейросети: Midjourney, Runway, Kling

Режиссерские тритменты, как правило, состоят из картинок и видео. То есть это на 95% визуальная презентация. Раньше написание или разработка тритментов происходило на основе множества рекламных роликов. Все это приходилось искать, соединять, отсматривать. Сейчас достаточно просто генерировать нужные картинки и, если нужно, анимировать их с помощью других нейросетей, например, RunAway или Kling.

Повторюсь, что для лучшего результата лучше формулировать запросы (промты) на английском языке, поскольку нейросеть лучше обрабатывает англоязычные команды. Структурируйте запросы в следующем порядке: объект, окружение или фон, дополнительные параметры (цвет, стиль), технические параметры (пропорции, размер изображения).

Например: «A solitary ancient stone, surrounded by a lush green valley with distant mountains in the background, soft golden sunlight, cinematic atmosphere, ultra-detailed, 16:9 aspect ratio».

Этот промт описывает объект (камень), окружение (зеленая долина с горами), дополнительные параметры (мягкий золотой свет, кинематографичная атмосфера, высокий уровень детализации) и технические (соотношение сторон 16:9).

Учитывайте, что нейросеть может не сразу понять ваш запрос; будьте готовы уточнять и повторять его для достижения желаемого результата.

Концепции застроек для съемок

Используемая нейросеть: Firefly

Ранее процесс создания визуализаций занимал много времени из-за необходимости собирать коллажи из различных изображений. Теперь все предварительные визуализации выполняются более эффективно. Для съемок шоу, подкастов и других проектов традиционно требуются различные референсы. Наиболее сложной задачей здесь является подбор точного реквизита, который позволил бы синхронизироваться с клиентом для обоюдного видения конечного результата. В качестве альтернативы технологии позволяют применить следующий подход: начать с создания простого скетча от руки в Photoshop или Illustrator. Далее этот скетч загружается в качестве референса по композиции. Например, если известно, что в кадре будет стул, расположенный по правому краю, а также определенный фон, то в дальнейшем используются промты и референсы для выбора стилистики.

Использованный для второй картинки промт: A cozy modern interior, a vibrant yellow and red armchair in the foreground, large window with a tropical sunset view, palm trees and distant mountains, soft warm lighting, colorful curtains, minimalistic decor, cinematic and ultra-detailed, 16:9 aspect ratio.

Дополнительным преимуществом является то, что в процессе согласования с клиентом можно оперативно добавлять или изменять элементы студии, такие как лампы или стулья. Это позволит создать у клиента более точное представление финального результата. Однако следует учитывать, что нейросеть зачастую генерирует объекты, которые не существуют в реальности. Поэтому мебель заказывается отдельно, а клиенту следует предлагать ссылки на реальные варианты.

Хотя некоторые элементы могут отличаться от идеала, они помогут клиенту понять атмосферу и цветовую палитру. Изображения можно сделать более фотореалистичными, что также упростит восприятие.

Раскадровка

Используемая нейросеть: Midjourney

Раскадровка для тендеров и презентаций также осуществляется с помощью Midjourney. Ранее при создании раскадровок с помощью нейросети возникали трудности с использованием одних и тех же узнаваемых персонажей или действующих лиц, однако новейшая версия Midjourney позволяет куда более точно сохранять образы героев на протяжении всех кадров в различных сценах. Это облегчает процесс подготовки к тендерам, так как позволяет создать у клиента куда более ясное представление о задумке.

Использованные промты:

Картинка слева: Two young women talking in front of a cozy suburban house, black-and-white sketch style, one facing the viewer with long wavy hair, expressive facial features, casual clothing, natural environment with trees, clean line art, cinematic framing, ultra-detailed, 16:9 aspect ratio.

Картинка справа: A young woman driving a car in the rain, black-and-white sketch style, long wavy hair, expressive facial features, city lights blurred in the background, cinematic atmosphere, clean line art, ultra-detailed, 16:9 aspect ratio.

Чтобы персонажи выглядели одинаково, можно воспользоваться функцией Character ref, который позволяет при редактировании промта сохранять основные элементы персонажа.

Застройка студии

Используемая нейросеть: Firefly

Многообещающий инструмент Generative Fill от Firefly используется для создания интерьеров образовательного контента и лекций. Спикера снимают на нейтральном фоне без реквизита, что особенно актуально для малобюджетных проектов. С помощью генеративной заливки можно добавить окно, создающее ощущение естественной студии. Это окно будет фиксированным источником света, что упрощает монтаж, поскольку вместе с окном создается искусственный свет, который не меняется на протяжении всего видео.

Кроме того, можно добавить атрибуты, такие как ковер или лампа, чтобы создать уютную атмосферу. Таким образом, снимая человека на простом фоне, можно получить стильный интерьер без затрат на его закупку или логистику, а также оптимизировать работу художника и реквизитора. Возможно, в будущем инструмент станет полноценной заменой студийной съемке.

Аниматики для CG

Используемые нейросети: Midjourney, Runway, Kling

Аниматики играют важную роль в процессе создания компьютерной графики. При демонстрации раскадровки клиент получает общее представление о визуальном восприятии проекта и его структуре, однако не всегда понимает, как будет выглядеть конечный продукт в динамике, какие будут переходы и монтаж. На этапе препродакшена критически важно учитывать ожидания клиента, чтобы он имел четкое представление о результате.

При работе с графикой конечный результат показать сразу невозможно; доступны только раскадровка и промежуточные референсы. В съемочном процессе проще: достаточно показать раскадровку и записать аниматик на телефон, чтобы продемонстрировать клиенту приблизительное представление о том, как будет выглядеть примерный монтаж.

С графикой ситуация сложнее, но нейросети позволяют создать визуализацию. Например, сцены маяка на море, используя промты для генерации изображений. Это позволяет получить более четкое представление о будущем результате. В зависимости от сцены и ее динамики можно быстро создавать необходимые кадры и затем дорабатывать их с помощью нейросетей. Однако полученные изображения часто имеют низкое качество и излишнюю художественность, поэтому служат пока исключительно в качестве аниматиков.

Композитинг CG

Используемые нейросети: Midjourney, Runway, Kling

В композитинге также применяются современные инструменты. Например, можно сгенерировать изображение в Midjourney, а затем анимировать его с помощью простых движений. Для добавления элементов, таких как птица, можно использовать промт объекта на хромакее. После анимации зеленый фон удаляется, и выполняется композитинг.

Преимущество композитинга заключается в возможности не создавать всю сцену сразу. При генерации абстрактных сцен в нейросетях часто возникают неточности, которые требуют доработки. Если необходимо создать конкретную сцену с определенными элементами, их можно выделить и генерировать отдельно, разбивая на слои для дальнейшей анимации.

Для получения изображения, соответствующего заданным параметрам, требуется генерировать все отдельные элементы, а затем объединять их в финальную картинку. Так можно добиться большей точности. Показанные в примере изображения являются черновыми, но при желании можно получить высокое качество и реалистичность. Чем больше времени будет уделено работе, тем, разумеется, более качественный будет результат.

Клинап

Используемая нейросеть: Firefly

В процессе постпродакшена значительное внимание уделяется клинапу, который включает в себя удаление людей, машин, точек, пятен и лишних предметов. Ранее этот процесс выполнялся вручную и занимал много времени. Однако с увеличением объема контента стало невозможно тратить на него столько времени. Сроки производства роликов постоянно сокращаются, что требует оперативного выполнения клинапа. С помощью инструмента Firefly можно быстро удалять простые объекты. В то же время удаление сложных элементов может оставлять артефакты в виде тени и других посторонних предметов, которые требуют дополнительной доработки.

Длительность кадра

Используемая нейросеть: Firefly

Впервые появился инструмент для увеличения длительности кадров. Например, если кадр заканчивается на моменте, когда машина доезжает до середины перекрестка, а необходима дополнительная продолжительность, новый инструмент позволяет бесшовно продлить кадр. Это особенно полезно при монтаже, когда требуется небольшое увеличение времени показа определенного элемента.

В тестах на людях также наблюдается успех. Кадры, которые ранее заканчивались на определенном моменте, теперь могут быть дополнены без заметных скачков. Таким образом, новые технологии существенно упрощают и ускоряют процесс постпродакшена, позволяя достигать высококачественных результатов с минимальными затратами времени.

Лукбуки

Используемая нейросеть: Firefly

При создании лукбуков для съемок также наблюдаются изменения. Ранее использовались фотографии моделей с вырезанными элементами одежды, что было длительным процессом. Теперь есть возможность генерировать необходимые элементы одежды с помощью современных технологий. Это позволяет значительно упростить процесс выбора одежды для спикеров, так как они могут сравнить вещи своего гардероба с предложенными вариантами.

Какие еще инструменты будут полезны креативному продюсеру и команде:

Графика:

DALL-E (ChatGPT): Генерация высококачественных изображений по текстовым описаниям, включая функции редактирования и расширения границ.

Stable Diffusion (ComfyUI): Гибкое решение для создания сложных графических сцен с высокой степенью контроля и кастомизации.

Flux (ComfyUI): Инструмент для стилизованных визуализаций, позволяющий создавать уникальные художественные эффекты и работать с текстурами.

Topaz Labs AI: Мощное решение для улучшения качества изображений, увеличения их разрешения и устранения шума с помощью искусственного интеллекта.

Видеопроизводство:

Runway Gen3: генерация видеоконтента на основе текстовых описаний, упрощение процессов раскадровки и предварительного монтажа.

Kling: инструмент для создания коротких анимаций и переходов с акцентом на социальные сети.

MiniMax: оптимизация видеопроцессов для повышения производительности и работы с большими файлами.

Luma Labs Dream Machine: интуитивный инструмент для добавления эффектов, улучшения деталей и тонкой настройки динамики видео.

Pika Labs Effects: удобный редактор эффектов, который делает видео более кинематографичным и добавляет реалистичные спецэффекты.

AnimateDiff (ComfyUI): генерация плавной анимации на основе текстовых запросов, особенно полезно для 2D и 3D контента.

Аудио:

ElevenLabs (голос): генерация естественной синтетической речи с высокой эмоциональной выразительностью.

Steos Voice (голос): создание уникальных голосовых эффектов и тональная настройка для подкастов, фильмов и рекламы.

Suno (музыка): автоматизированное создание музыкальных композиций, идеально подходящих для видео, игр и медиа.

Udio (музыка): генерация музыкальных дорожек с кастомизацией жанра, ритма и темпа.

Текст: