Год назад команда
Big Media Moscow отправилась в экспедицию в Аргентину, чтобы отснять материалы для запуска бренда Cordillero. Конечно, было бы здорово летать на другой конец света каждый сезон, чтобы делать атмосферные фото и видео для новых коллекций, но реальность диктует свои ограничения. Однако когда эти ограничения сталкиваются с желанием команды тестировать современные инструменты — рождаются интересные решения. Агентство Big Media Moscow рассказало Sostav, все ли решения удалось реализовать.
Маршрутная карта
Проект состоял из двух частей: фото и видео. Первоначальной задачей было выработать идеальный пайплайн. Нейросети — только инструмент, а вовсе не универсальная таблетка, поэтому здесь важно грамотно комбинировать возможности AI и кропотливый «ручной» труд.
Фото: тандем человека и искусственного интеллекта
Мы начали с фотографий, а точнее с генерации фонов для будущих снимков. Использовали материалы из прошлой экспедиции и доступные в интернете изображения цветных гор (в том числе Виникунки), ледников Патагонии и других южноамериканских красот. Всего получилось 5 ключевых локаций.
Во время съемок на циклораме мы старались как можно точнее повторить световые схемы и позинг моделей со сгенерированных референсов. Отсняли моделей, а затем отобрали исходники под конкретные фоны.
На следующем этапе нам пришлось перегенерировать фоны под отобранные снимки — работа на площадке внесла свои коррективы. Хотя однородные фоны были подготовлены заранее, теперь их нужно было подогнать под характер освещения, ракурсы и позинг.
На выходе мы получили 6 серий и больше 50 готовых имиджей. Некоторые изображения выглядят довольно цельно, с консистентными героями, но, безусловно, есть и такие, где глаз интуитивно чувствует подвох и видит коллаж — во всем этом присутствует элемент случайности. Проект был реализован летом, еще до всех полезных лончей и обновлений ИИ-продуктов, которые сегодня значительно улучшили бы результат в плане реалистичности.
Видео: доверяем работу AI
Если в работе с фотографиями нейросети были скорее вспомогательным инструментом, то при создании видео мы использовали их почти на всех этапах.
Сначала на циклораме мы сделали 360° фото моделей, одежды, обуви и рюкзаков, а затем по-отдельности обучили лоры для людей и продуктов. На практике такая тренировка может оказаться как совсем легкой, так и довольно трудозатратной. Чем сложнее выглядит товар или объект, тем труднее тренировать нейросеть. А в процессе наложения и смешивания объектов и фонов результат становится все более непредсказуемым — например, могут возникать ненужные артефакты. И даже при наличии качественных фотографий моделей с разными эмоциями, их лица от генерации к генерации все равно немного отличаются.
Мы прибегали к точечным внедрениям объектов через Firefly, где можно заменить одни предметы (в нашем случае — рюкзаки) на другие, прикрепив нужные референсы. Сейчас мы бы решали эту задачу совершенно иначе, например, через Nano Banana. Но на момент создания ролика этой модели еще не было, поэтому мы писали сценарий сразу с поправкой на ограничения ИИ и заранее проговорили вариативность и допустимые отклонения «влево-вправо».
После этого этапа нам оставалось сгенерировать статичные изображения, анимировать их, выполнить композитинг, а в конце свести картинку и звук. На выходе мы получили минутный ролик, который нельзя назвать на сто процентов реалистичным, но именно в этом и заключается его экспериментальная ценность.
P. S. Заметки первопроходцев
Мы пришли к выводу, что на сегодняшний день такой проект не может полноценно заменить экспедиционный выезд. Нейросеть проигрывает классическому видеопродакшну по ряду причин:
- необходимость точечно корректировать сценарий в процессе работы;
- проблемы с однородностью картинки, особенно с объектами, которые повторяются от кадра к кадру;
- фактор случайности и общая непредсказуемость результата.
При этом скорость, с которой развиваются нейросети, очень высока. Еще вчера у вас был пайплайн, в котором вы сначала тренировали лору на продукт и затем пытались сгенерировать его на модели, а сегодня эта задача моментально решается через другие инструменты и сервисы — Nano Banana, Reve. Функция точечной корректировки теперь позволяет легко менять и редактировать ракурсы, мелкие детали и объекты, что значительно упрощает работу. Поэтому важно следить за появлением новых нейросетей, которые можно адаптировать под ваши проекты и задачи.
Так или иначе, этот кейс интересен в первую очередь как подтверждение того, что рынок постепенно и неуклонно разворачивается в сторону нейросетей — и мы движемся вместе с ним.
Артем Субботин, генеральный продюсер, co-founder Big Media Moscow:
Это был один из тех проектов, где сначала ты с воодушевлением тестируешь нейросети, а потом неделями объясняешь ИИ, что у людей, вообще-то, две руки, а у бренда — четкие гайдлайны. Мы хотели все и сразу: реалистичные лица, похожие на настоящих моделей, одежду и обувь, точно соответствующие коллекции, брендинг… и тут началось веселье. Но теперь, с боевыми шрамами и обновленными инструментами, мы точно знаем: уже сегодня все это можно сделать в разы быстрее, реалистичнее и с меньшим количеством боли.
«Спортмастер» (клиент)
Директор по маркетингу эксклюзивных торговых марок: Алена Евсеева
Старший бренд-менеджер: Анастасия Зубкова
Big Media Moscow (агентство)
Генеральный продюсер: Артем Субботин
Режиссер: Дмитрий Дорожкин
AI-lead, AI-супервайзер: Дмитрий Галузинский
Арт-директор: Наталия Хохлова
Линейный продюсер: Елисей Храпов
Креативный директор: Степан Трифонов
Креатор: Анна Япрынцева
AI-художник, Prompt-инженер, SPELLLENS: Слава Карелов
Prompt-инженер, SPELLLENS: Анастасия Карелова
Prompt-инженер, SPELLLENS: Валерия Исакова
AI-продюсер, SPELLLENS: Лев Бахарев
Композитинг: Егор Люциус, Дмитрий Галузинский, Руслан Гумеров
Режиссер монтажа: София Иосько, Лев Груздев
Цвет: Александр Тананов
Аудио-продакшн: Бэклайн
Саунд-директор: Арсений Быков
Саунд-продюсер: Никита Климин
Композитор: Андрей Шатров
Саунд-дизайн/микс: Иван Кузнецов
