Исторические реконструкции — дорогостоящий формат для медиа. Для их создания нужны архивы, съемочные площадки, актеры, костюмы, реквизит и длительная подготовка (то есть оплаченное рабочее время).
При этом аудитория цифровых платформ чаще потребляет вертикальный видеоконтент и ожидает регулярного выхода новых серий. Например, в VK в конце 2025 года рассказали — ежедневно Клипы на их платформе смотрят 3 млрд человек. Количество просмотров историй за год также увеличилось на 35%, а ежемесячная аудитория зрителей достигла 58,6 млн человек.
Команда BAZA решила проверить, можно ли с помощью технологий искусственного интеллекта совместить сложный жанр реконструкций и популярный формат контента.
Команда BAZA:
Это эксперимент и определенный творческий вызов. ИИ активно применяется для решения отдельных задач, но еще никто не делал полностью нейронное художественное произведение. Также нам очень хотелось использовать полную свободу при выборе визуального решения.
Так появился проект «БАЗА ДАННЫХ: КРИМИНАЛ» — цикл из десяти вертикальных фильмов о самых громких криминальных войнах 1990-х годов, полностью созданных с помощью нейросетей.
Цели и задачи
При запуске проекта команда хотела:
- проверить возможности нейросетей в производстве серийного художественно-документального контента;
- разработать масштабируемый процесс создания вертикальных фильмов;
- сохранить историческую достоверность событий и деталей;
- обеспечить единый визуальный стиль на протяжении всего сезона;
- создать продукт, способный заинтересовать массовую цифровую аудиторию.
Бонусом в BAZA увидели, какую роль искусственный интеллект может играть в современном медиапроизводстве и где проходят границы его возможностей. Спойлер: в неожиданных деталях.
Реализация
Работа над проектом началась с подготовки документальной базы. В основу сценариев легли материалы уголовных дел, архивные публикации, воспоминания очевидцев и открытые исторические источники.
Каждый эпизод посвящен отдельной истории из эпохи криминальных войн 1990-х годов. География проекта охватила несколько российских городов — среди них, например, Санкт-Петербург, Екатеринбург, Самара, Рязань, Тольятти.
Следом наступал этап подготовки сценариев будущих серий, а затем к работе подключалась творческая группа: она переводила документальные описания в визуальный язык.
Производство каждого эпизода занимало в среднем от двух до трех недель. За это время команда создавала и отбирала сотни вариантов визуальных и звуковых решений. На одну серию приходилось от 200 до 300 генераций изображений, видеосцен, голосов и звуковых эффектов.
Для каждой серии подбирались десятки вариантов персонажей, локаций и сцен. Не обошли вниманием и историческую достоверность: команда тщательно прорабатывала автомобили, архитектуру, одежду, городскую среду и другие детали эпохи.
Сложнее всего было удержать единый визуальный стиль на протяжении всего сезона. Нейросети хорошо генерируют отдельные изображения и сцены, но когда речь идет о сериале из десяти эпизодов, нужно, чтобы персонажи, локации и атмосфера оставались узнаваемыми от серии к серии. Для этого команда собрала собственную систему референсов и вручную отсматривала материалы на каждом этапе производства.
С помощью ИИ создавались голос диктора, звуковые эффекты и часть аудиосопровождения, но каждый элемент дополнительно дорабатывали и сводили уже вручную. Чтобы получить несколько минут готового материала, приходилось отсматривать сотни вариантов, отбирать лучшие решения, исправлять ошибки и добиваться того, чтобы все элементы сочетались между собой.
Сергей Ватагин, художественный руководитель проекта «БАЗА ДАННЫХ: КРИМИНАЛ»
Искусственный интеллект дал нам новые инструменты, но не отменил необходимости творческой и редакторской работы. С помощью нейросетей мы смогли визуализировать войну между группировками за контроль над рынками, нефтью и целыми городами. Это документальная реконструкция — история о том, как криминал перекроил карту целой страны. Проект фиксирует главные точки кипения десятилетия — убийства авторитетов на глазах у сотен людей, разборки у ресторанов и взрывы в центре города.
Что изменилось
До недавнего времени такие истории можно было рассказывать только через архивную хронику или дорогостоящие реконструкции со съемками, актерами и локациями. Для криминальных событий 1990-х это бросается в глаза: многие эпизоды либо вообще не сохранились на видео, либо существуют лишь в виде нескольких фотографий и газетных публикаций.
Казалось бы, нейросети способны закрыть эту проблему, но оказалось, что технология не заменяет редакцию. За достоверность событий, фактуру эпохи и логику повествования по-прежнему отвечают журналисты, сценаристы и редакторы. Соответственно, трудности в работе проявляются такие же, как и в классическом журналистском подходе — человеку все равно приходится перепроверять факты в разных источниках.
За время работы команда вынесла для себя несколько важных уроков:
- результат зависит не столько от возможностей нейросетей, сколько от качества исходного материала и редакторской работы;
- сотни генераций сами по себе ничего не гарантируют — гораздо важнее отбор, проверка деталей и постоянная доработка;
- если речь идет о длинном сериале, без четких визуальных ориентиров и единых стандартов сохранить целостность проекта практически невозможно.
- создавать нормальный «липсинк» (синхронизацию движения губ с аудиодорожкой фонограммы) на русском языке ИИ не умеет. Со всем остальным справляется без проблем.
Роберт Ключарев, редакционный директор BAZA:
Проект «БАЗА ДАННЫХ: КРИМИНАЛ» доказал всем скептикам, что нейронка в руках мастера творит настоящее искусство. Отрицать это — все равно что продолжать рисовать палкой, когда тебе протягивают кисть. Десятки тысяч генераций, четкая проработка деталей, въедливый фактчекинг, чувство стиля и филигранные промты — и это уже не голимый нейрослоп, а очень качественный и интересный продукт. Все, что видит зритель на экране своего гаджета, — рисунки, видео, графика, голос диктора, звуковые эффекты — создано искусственном интеллектом, но под чутким контролем художественно-журналистской группы.
Результаты
За два месяца проект «БАЗА ДАННЫХ: КРИМИНАЛ» выпустил десять эпизодов и стал первым российским масштабным медиасериалом, полностью созданным с использованием технологий искусственного интеллекта. Контент набрал более 8 млн просмотров. Больше всего редакцию впечатлило понимание нейросетью промпта и процесс корректировки генераций.
Команда BAZA:
При генерации картинок и видео нейронка совершает ошибки, потому что промпт либо неправильно написан, либо неправильно воспринят ИИ, в результате чего он совершает ошибки. Но функция промптоинтерпретации и редактирования с каждым годом становится лучше. При правильной корректировке вероятность достичь желаемого результата — почти что 100%. Раньше приходилось дольше тратить времени на задачу, а сейчас все сильно ускорилось.
Получается, что нейросети уже позволяют собирать сложные медиапродукты, но при этом не снимают ответственности с редакции. Качество результата по-прежнему определяется журналистской экспертизой, редактурой и авторским контролем. И ручной настройкой «липсинков», увы.
