Как сделать трендовое видео с каруселью через ИИ: простая пошаговая инструкция с помощью нейросети

2026-03-27 23:32:36 Время чтения 21 мин 469

Что такое трендовое видео с каруселью

Трендовое видео с каруселью — один из самых громких вирусных форматов начала 2026 года. Суть проста: в кадре появляются два человека, сидящих на детской карусели, — ребёнок и взрослый. Камера зафиксирована прямо на лицах, взгляд направлен в объектив, а фон — деревья, дворик, площадка — стремительно кружится с красивым размытием. Эффект получается одновременно ностальгическим и кинематографичным.


Всего нужны 2 нейросети:

- Nano Banana PRO (для генерации фото)
- Kling (для генерации видео)


Фишка в том, что оба персонажа — это один и тот же человек в разном возрасте. Пользователи берут детскую фотографию и свежий портрет, отдают их нейросети — и получают пару коротких клипов, которые затем склеиваются в единый ролик. Именно этот контраст «тогда и сейчас» цепляет зрителя с первой секунды и заставляет досматривать до конца — а значит, алгоритмы TikTok, Reels и YouTube Shorts охотно продвигают такие видео.

Отдельную роль в успехе тренда сыграла музыка. Звуковой дорожкой стала песня Army Dreamers британской певицы Кейт Буш, написанная в 1980 году. Трек построен на смене женского и мужского вокала, и авторы тренда придумали элегантное решение: под женский голос идёт детская версия, под мужской — взрослая. Этот переход стал настоящей «вишенкой на торте» и во многом объясняет, почему именно этот формат так точно завирусился.

>>> Попробовать сгенерировать тренд видео с каруселью

Что понадобится для создания

Чтобы сделать видео с каруселью через ИИ, не нужны навыки монтажа, профессиональная камера или платные подписки. Весь процесс укладывается в три инструмента и занимает около 20 минут.

Киану Ривз в юности
Киану Ривз сейчас:

Два фото — детское и взрослое. Это главный материал для работы. К фотографиям есть несколько требований: лицо должно быть чётким, хорошо освещённым и занимать большую часть кадра. Идеально подходит фронтальный ракурс — анфас или лёгкий полуоборот. Избегайте снимков в тёмных очках, с сильными тенями или сильным размытием фона: нейросеть должна чётко «считать» черты лица. Минимальное разрешение — 1024 пикселя по длинной стороне.

Аккаунт в Study AI. 

Именно здесь мы будем генерировать изображения и анимировать их в видео — всё в одном интерфейсе, без переключения между разными сервисами. Study AI даёт доступ к лучшим нейросетям в рамках одного сервиса без необходимости покупать несколько подписок, менять IP и принимает любые российские банковские карты! Рекомендуем.

CapCut — для финальной склейки. 

Приложение бесплатное, доступно на iOS, Android и на десктопе. Именно в нём два отдельных клипа объединяются в один ролик, накладывается музыка и выставляется нужный формат для публикации.

Трек Army Dreamers — Кейт Буш. 

Найти его можно прямо в библиотеке CapCut по названию, либо скачать отдельно и импортировать вручную. Это та самая песня из тренда с каруселью, без которой ролик потеряет половину своего эффекта.

Шаг 1 — Генерация изображения в Study AI

Первый шаг — создать стилизованное изображение: человек сидит на карусели, камера смотрит прямо в лицо, фон — советский дворик или парк. Для этого в Study AI используется модель Nano Banana Pro — она лучше всего справляется с сохранением черт лица при переносе персонажа в новую сцену.

Откройте Study AI, выберите Nano Banana Pro, загрузите фото как референс и введите промпт.

Промпт на русском:

Сгенерируй ультрареалистичное фото человека, сидящего на детской карусели советского типа во дворе жилого дома. Черты лица, возраст, причёска и одежда должны максимально точно соответствовать референсному фото с учётом освещения. Камера расположена в центре карусели и направлена прямо на персонажа. Время суток — тёплый летний вечер на закате. Вертикальный формат 9:16.

Промпт на английском:

Create an ultra-realistic photo of a person sitting on a vintage Soviet-style playground carousel in a residential courtyard. The facial features, hairstyle, and clothing must match the provided reference image exactly. The camera is positioned at the center of the carousel, facing directly toward the subject. The setting is a warm summer evening at sunset. Vertical format, 9:16.

Если вас не устраивает окружение в одном из фото (как получилось у меня), загрузите оба фото в Nano Banana и сгенерируйте правильное фото по следующему промту:

Замени персонажа со второго фото на персонаж с первого фото

⚠️ Если русскоязычный промпт не даёт нужный результат — попробуйте английскую версию. Nano Banana Pro, как и большинство современных видеомоделей, значительно лучше интерпретирует англоязычные инструкции и точнее воспроизводит детали сцены.

Советы, если что-то пошло не так:

  1. Лицо искажается или «плывёт» — добавьте в промпт фразу «максимально точно сохранить все черты лица с референсного фото, без искажений» / «preserve all facial features exactly, no face distortion»
  2. Для детской фотографии добавьте: «невинное, спокойное выражение лица» / innocent, calm expression
  3. Для взрослой: «задумчивый, меланхоличный взгляд прямо в камеру» / thoughtful, melancholic expression, looking straight into the camera
  4. Сделайте 2–3 попытки и выберите кадр с наиболее фронтальным ракурсом — это важно для следующего шага с анимацией

Шаг 2 — Анимация изображения в видео через Study AI

Когда оба изображения готовы, их нужно оживить — превратить в короткие видеоклипы, где карусель раскручивается, а фон размывается в круговом движении. Всё это делается прямо в Study AI, без сторонних сервисов.

Перейдите в раздел генерации видео, загрузите готовое изображение и выберите нейронку Клинг.

Рекомендуемая модель — Kling 2.6 или Kling 3.0. Это основной выбор для данного тренда: модель отлично справляется с круговым движением фона, сохраняет стабильность лица в кадре и даёт реалистичное размытие при вращении. Настройки: длина клипа — 5–6 секунд, соотношение сторон — 9:16, количество попыток на каждое фото — минимум 2–3.

Пример генерации видео взрослого персонажа на карусели: https://vkvideo.ru/clip-235524025_456239026

Промпт на русском:

Персонаж неподвижно сидит на быстро вращающейся детской карусели. Средний крупный план. Камера полностью зафиксирована на лице персонажа — лицо остаётся чётким и стабильным, весь фон стремительно кружится по кругу с сильным круговым размытием движения. Серьёзное, меланхоличное выражение, взгляд прямо в камеру. Фотореалистично, кинематографическое освещение, малая глубина резкости, вертикальный формат 9:16, точно сохранить все черты лица с референсного фото, без искажений, без тряски камеры, 24 кадра в секунду.

Промпт на английском:

The character is seated motionless on a rapidly spinning round children's playground carousel. Medium close-up shot. The camera is completely locked and fixed on the character's face, keeping it perfectly sharp and stable while the entire background spins quickly in a circle with strong circular motion blur. Serious, melancholic expression, looks straight into the camera. Photorealistic, cinematic lighting, shallow depth of field, 9:16 vertical format, exactly preserve all facial features from the reference photo, no face distortion, no camera shake, 24 FPS.

⚠️ Если русскоязычный промпт не даёт нужный результат — используйте английскую версию. Kling значительно более благосклонен к англоязычным инструкциям: точнее передаёт движение, лучше удерживает лицо в фокусе и реалистичнее воспроизводит эффект вращения.

>>> Попробовать сгенерировать тренд видео с каруселью

Альтернативные модели в Study AI:

Если слоты Kling заняты или вы хотите сравнить результат — в Study AI доступны два достойных варианта:

  1. Sora 2 — отличается мягкой, кинематографичной картинкой и хорошей работой с освещением. Подойдёт, если хотите более «художественный» результат с тёплой атмосферой заката
  2. Veo 3 — модель от Google, генерирует видео с высокой детализацией и реалистичной физикой движения. Хорошо справляется с круговым размытием фона, результат часто выглядит очень убедительно

Для первой попытки всё же рекомендуем Kling — он наиболее стабильно держит лицо персонажа при вращении фона, что критично именно для этого тренда. Sora 2 и Veo 3 используйте как запасной вариант или для экспериментов.

Шаг 3 — Финальный монтаж в CapCut

Два готовых клипа из Study AI нужно соединить в один ролик, наложить музыку и подготовить к публикации. Для этого используем CapCut — бесплатный редактор, который отлично справляется с задачей и не требует никакого опыта в монтаже.

Пошагово:

  1. Откройте CapCut и создайте новый проект. Формат — вертикальный, 9:16
  2. Импортируйте оба клипа: сначала детская версия, затем взрослая
  3. Обрежьте первые 0,5–1 секунды каждого клипа — в самом начале карусель ещё не раскрутилась, и этот «разгон» смотрится неловко
  4. Поставьте клипы подряд без перехода — резкая склейка здесь работает лучше, чем плавный переход
  5. Добавьте трек Army Dreamers — Кейт Буш: найдите его в библиотеке CapCut по названию или импортируйте вручную
  6. Подгоните момент склейки клипов под переход вокала в треке — детская версия идёт под женский голос, взрослая под мужской. Именно этот момент делает ролик цельным и эффектным
  7. Выровняйте яркость клипов, если они заметно отличаются по тону — используйте базовую цветокоррекцию в CapCut
  8. Экспортируйте: разрешение 1080p, частота кадров 24 FPS, формат MP4

Несколько финальных деталей:

  1. Не добавляйте лишних надписей и стикеров — тренд работает именно на чистоте и минимализме
  2. Если переход между клипами кажется резким по яркости, добавьте однокадровый «флэш» белого цвета на стыке — это популярный приём в этом формате
  3. Оптимальная итоговая длина ролика — 10–14 секунд: этого достаточно, чтобы зритель успел считать оба образа, но недостаточно, чтобы заскучать

>>> Сделать своё тренд видео с каруселью


Вам могут быть интересны эти нейро тренды:

Как сделать танец Токсиса с ИИ?
Как превратиться в знаменитость через нейросеть?
Как сгенерировать трендовый танец под "Гости из будущего"?
Как соединить в одном фото себя ребёнка и себя взрослого?


Советы для лучшего результата

Технически правильно выполненный ролик — это половина успеха. Вторая половина — грамотный выбор материала и понимание того, как именно работает этот формат.

Как выбрать фото:

  1. Детское фото в идеале должно быть от 4 до 10 лет — в этом возрасте черты лица уже достаточно сформированы, чтобы нейросеть правильно перенесла их во взрослый образ
  2. Старайтесь подобрать снимки с похожим освещением: оба светлые или оба в тени. Резкий контраст по тону между клипами будет отвлекать
  3. Избегайте групповых фото — нейросеть может «перепутать» лица или смешать черты нескольких людей
  4. Чем выше разрешение исходника, тем чище результат. Отсканированные старые фотографии работают хорошо — главное, чтобы лицо было в фокусе

Вариации тренда — если хотите выделиться:

  1. Питомцы: щенок и взрослая собака той же породы — формат работает не хуже, чем с людьми, и набирает огромные охваты
  2. Известные персонажи и герои: детские кадры из мультфильмов и их «взрослые» версии — популярный вариант у фанатских аккаунтов
  3. Для брендов и экспертов: основатель компании в детстве и сегодня, «тогда и сейчас» продукта или логотипа — нестандартный способ сделать карусель в TikTok с ИИ и при этом рассказать историю бренда

Типичные ошибки и как их избежать:

  1. Лицо «плывёт» при вращении — скорее всего, референсное фото слишком маленькое или низкого качества. Попробуйте улучшить его через апскейлер перед загрузкой
  2. Карусель почти не крутится — добавьте в промпт rapidly spinning / быстро вращающаяся и увеличьте параметр динамики движения, если модель это позволяет
  3. Два клипа сильно отличаются по стилю — генерируйте оба изображения в одной сессии с одинаковым промптом, меняя только референсное фото
  4. Музыка не синхронизируется с переходом — найдите в треке точную отметку смены вокала (обычно около 14–15 секунды от начала) и подгоняйте склейку именно под неё

>>> Сделать трендовое видео с каруселью

FAQ: Часто Задаваемые Вопросы

Какая песня используется в тренде с каруселью?

Официальная музыка тренда — Army Dreamers британской певицы Кейт Буш, выпущенная в 1980 году. Трек построен на чередовании женского и мужского вокала, что идеально совпало с форматом «ребёнок — взрослый». Найти его можно в библиотеке CapCut по названию или на любой стриминговой платформе.

Можно ли сделать видео бесплатно?

Да, фотографию можно. Study AI предоставляет ежедневные бесплатные генерации — их хватает, чтобы создать оба изображения и оба видеоклипа без оплаты. CapCut также полностью бесплатен для базового монтажа. Единственное ограничение — в пиковые часы бесплатные слоты могут заканчиваться быстрее, поэтому удобнее работать утром или в первой половине дня.

Почему нейросеть искажает лицо — что делать?

Чаще всего причина в низком качестве исходного фото или слишком боковом ракурсе. Попробуйте три вещи: улучшите фото через апскейлер перед загрузкой, добавьте в промпт уточнение «без искажений лица, точно сохранить черты с референса» / no face distortion, preserve all facial features exactly, и переключитесь на английскую версию промпта — это часто решает проблему.

Какой формат видео нужен для TikTok и Reels?

Вертикальный формат 9:16, разрешение 1080×1920, частота кадров 24 FPS, кодек MP4. Именно эти параметры выставляются при экспорте из CapCut. TikTok и Reels одинаково хорошо принимают этот формат без потери качества.

Сколько времени занимает создание одного ролика?

В среднем 15–25 минут при наличии подходящих фото. Генерация одного изображения занимает 1–3 минуты, анимация — 2–5 минут в зависимости от загруженности серверов. Ещё 5–7 минут уйдёт на монтаж в CapCut. Если делаете впервые — заложите 40 минут с учётом нескольких попыток.

Чем Kling лучше Sora 2 и Veo 3 для этого тренда?

Kling точнее всего справляется с ключевой задачей тренда — удержать лицо стабильным при активном движении фона. Sora 2 даёт более мягкую, атмосферную картинку, но иногда «отпускает» лицо при быстром вращении. Veo 3 отличается высокой детализацией и реалистичной физикой, но может интерпретировать сцену слишком буквально и добавлять лишние элементы. Для первого опыта — Kling, для экспериментов — Sora 2 и Veo 3.

Можно ли использовать фото знаменитостей или персонажей?

Технически — да, нейросеть справится. Но важно учитывать: публикация роликов с узнаваемыми реальными людьми без их согласия может нарушать правила платформ и авторские права. Безопаснее использовать вымышленных персонажей, героев мультфильмов или анимационных фильмов — такой контент, как правило, не вызывает проблем и при этом хорошо набирает охваты.

Как набрать просмотры после публикации?

Несколько проверенных приёмов: публикуйте в первые 24–48 часов после того, как тренд начал набирать обороты в вашей стране — алгоритмы активно подхватывают свежий трендовый контент. Используйте оригинальный звук Army Dreamers прямо из библиотеки TikTok или Reels, а не импортированный файл — это помогает системе привязать ваш ролик к трендовому звуку и показывать его в соответствующей ленте. Не перегружайте описание хэштегами — 3–5 точных тегов работают лучше, чем двадцать случайных.