Трендовое видео с каруселью — один из самых громких вирусных форматов начала 2026 года. Суть проста: в кадре появляются два человека, сидящих на детской карусели, — ребёнок и взрослый. Камера зафиксирована прямо на лицах, взгляд направлен в объектив, а фон — деревья, дворик, площадка — стремительно кружится с красивым размытием. Эффект получается одновременно ностальгическим и кинематографичным.
Всего нужны 2 нейросети:
- Nano Banana PRO (для генерации фото)
- Kling (для генерации видео)
Фишка в том, что оба персонажа — это один и тот же человек в разном возрасте. Пользователи берут детскую фотографию и свежий портрет, отдают их нейросети — и получают пару коротких клипов, которые затем склеиваются в единый ролик. Именно этот контраст «тогда и сейчас» цепляет зрителя с первой секунды и заставляет досматривать до конца — а значит, алгоритмы TikTok, Reels и YouTube Shorts охотно продвигают такие видео.
Отдельную роль в успехе тренда сыграла музыка. Звуковой дорожкой стала песня Army Dreamers британской певицы Кейт Буш, написанная в 1980 году. Трек построен на смене женского и мужского вокала, и авторы тренда придумали элегантное решение: под женский голос идёт детская версия, под мужской — взрослая. Этот переход стал настоящей «вишенкой на торте» и во многом объясняет, почему именно этот формат так точно завирусился.
>>> Попробовать сгенерировать тренд видео с каруселью
Чтобы сделать видео с каруселью через ИИ, не нужны навыки монтажа, профессиональная камера или платные подписки. Весь процесс укладывается в три инструмента и занимает около 20 минут.
Два фото — детское и взрослое. Это главный материал для работы. К фотографиям есть несколько требований: лицо должно быть чётким, хорошо освещённым и занимать большую часть кадра. Идеально подходит фронтальный ракурс — анфас или лёгкий полуоборот. Избегайте снимков в тёмных очках, с сильными тенями или сильным размытием фона: нейросеть должна чётко «считать» черты лица. Минимальное разрешение — 1024 пикселя по длинной стороне.
Аккаунт в Study AI.
Именно здесь мы будем генерировать изображения и анимировать их в видео — всё в одном интерфейсе, без переключения между разными сервисами. Study AI даёт доступ к лучшим нейросетям в рамках одного сервиса без необходимости покупать несколько подписок, менять IP и принимает любые российские банковские карты! Рекомендуем.
CapCut — для финальной склейки.
Приложение бесплатное, доступно на iOS, Android и на десктопе. Именно в нём два отдельных клипа объединяются в один ролик, накладывается музыка и выставляется нужный формат для публикации.
Трек Army Dreamers — Кейт Буш.
Найти его можно прямо в библиотеке CapCut по названию, либо скачать отдельно и импортировать вручную. Это та самая песня из тренда с каруселью, без которой ролик потеряет половину своего эффекта.
Первый шаг — создать стилизованное изображение: человек сидит на карусели, камера смотрит прямо в лицо, фон — советский дворик или парк. Для этого в Study AI используется модель Nano Banana Pro — она лучше всего справляется с сохранением черт лица при переносе персонажа в новую сцену.
Откройте Study AI, выберите Nano Banana Pro, загрузите фото как референс и введите промпт.
Сгенерируй ультрареалистичное фото человека, сидящего на детской карусели советского типа во дворе жилого дома. Черты лица, возраст, причёска и одежда должны максимально точно соответствовать референсному фото с учётом освещения. Камера расположена в центре карусели и направлена прямо на персонажа. Время суток — тёплый летний вечер на закате. Вертикальный формат 9:16.
Create an ultra-realistic photo of a person sitting on a vintage Soviet-style playground carousel in a residential courtyard. The facial features, hairstyle, and clothing must match the provided reference image exactly. The camera is positioned at the center of the carousel, facing directly toward the subject. The setting is a warm summer evening at sunset. Vertical format, 9:16.
Если вас не устраивает окружение в одном из фото (как получилось у меня), загрузите оба фото в Nano Banana и сгенерируйте правильное фото по следующему промту:
Замени персонажа со второго фото на персонаж с первого фото
⚠️ Если русскоязычный промпт не даёт нужный результат — попробуйте английскую версию. Nano Banana Pro, как и большинство современных видеомоделей, значительно лучше интерпретирует англоязычные инструкции и точнее воспроизводит детали сцены.
Советы, если что-то пошло не так:
Когда оба изображения готовы, их нужно оживить — превратить в короткие видеоклипы, где карусель раскручивается, а фон размывается в круговом движении. Всё это делается прямо в Study AI, без сторонних сервисов.
Перейдите в раздел генерации видео, загрузите готовое изображение и выберите нейронку Клинг.
Рекомендуемая модель — Kling 2.6 или Kling 3.0. Это основной выбор для данного тренда: модель отлично справляется с круговым движением фона, сохраняет стабильность лица в кадре и даёт реалистичное размытие при вращении. Настройки: длина клипа — 5–6 секунд, соотношение сторон — 9:16, количество попыток на каждое фото — минимум 2–3.
Пример генерации видео взрослого персонажа на карусели: https://vkvideo.ru/clip-235524025_456239026
Персонаж неподвижно сидит на быстро вращающейся детской карусели. Средний крупный план. Камера полностью зафиксирована на лице персонажа — лицо остаётся чётким и стабильным, весь фон стремительно кружится по кругу с сильным круговым размытием движения. Серьёзное, меланхоличное выражение, взгляд прямо в камеру. Фотореалистично, кинематографическое освещение, малая глубина резкости, вертикальный формат 9:16, точно сохранить все черты лица с референсного фото, без искажений, без тряски камеры, 24 кадра в секунду.
The character is seated motionless on a rapidly spinning round children's playground carousel. Medium close-up shot. The camera is completely locked and fixed on the character's face, keeping it perfectly sharp and stable while the entire background spins quickly in a circle with strong circular motion blur. Serious, melancholic expression, looks straight into the camera. Photorealistic, cinematic lighting, shallow depth of field, 9:16 vertical format, exactly preserve all facial features from the reference photo, no face distortion, no camera shake, 24 FPS.
⚠️ Если русскоязычный промпт не даёт нужный результат — используйте английскую версию. Kling значительно более благосклонен к англоязычным инструкциям: точнее передаёт движение, лучше удерживает лицо в фокусе и реалистичнее воспроизводит эффект вращения.
>>> Попробовать сгенерировать тренд видео с каруселью
Если слоты Kling заняты или вы хотите сравнить результат — в Study AI доступны два достойных варианта:
Для первой попытки всё же рекомендуем Kling — он наиболее стабильно держит лицо персонажа при вращении фона, что критично именно для этого тренда. Sora 2 и Veo 3 используйте как запасной вариант или для экспериментов.
Два готовых клипа из Study AI нужно соединить в один ролик, наложить музыку и подготовить к публикации. Для этого используем CapCut — бесплатный редактор, который отлично справляется с задачей и не требует никакого опыта в монтаже.
Пошагово:
Несколько финальных деталей:
>>> Сделать своё тренд видео с каруселью
Вам могут быть интересны эти нейро тренды:
Как сделать танец Токсиса с ИИ?
Как превратиться в знаменитость через нейросеть?
Как сгенерировать трендовый танец под "Гости из будущего"?
Как соединить в одном фото себя ребёнка и себя взрослого?
Технически правильно выполненный ролик — это половина успеха. Вторая половина — грамотный выбор материала и понимание того, как именно работает этот формат.
>>> Сделать трендовое видео с каруселью
Официальная музыка тренда — Army Dreamers британской певицы Кейт Буш, выпущенная в 1980 году. Трек построен на чередовании женского и мужского вокала, что идеально совпало с форматом «ребёнок — взрослый». Найти его можно в библиотеке CapCut по названию или на любой стриминговой платформе.
Да, фотографию можно. Study AI предоставляет ежедневные бесплатные генерации — их хватает, чтобы создать оба изображения и оба видеоклипа без оплаты. CapCut также полностью бесплатен для базового монтажа. Единственное ограничение — в пиковые часы бесплатные слоты могут заканчиваться быстрее, поэтому удобнее работать утром или в первой половине дня.
Чаще всего причина в низком качестве исходного фото или слишком боковом ракурсе. Попробуйте три вещи: улучшите фото через апскейлер перед загрузкой, добавьте в промпт уточнение «без искажений лица, точно сохранить черты с референса» / no face distortion, preserve all facial features exactly, и переключитесь на английскую версию промпта — это часто решает проблему.
Вертикальный формат 9:16, разрешение 1080×1920, частота кадров 24 FPS, кодек MP4. Именно эти параметры выставляются при экспорте из CapCut. TikTok и Reels одинаково хорошо принимают этот формат без потери качества.
В среднем 15–25 минут при наличии подходящих фото. Генерация одного изображения занимает 1–3 минуты, анимация — 2–5 минут в зависимости от загруженности серверов. Ещё 5–7 минут уйдёт на монтаж в CapCut. Если делаете впервые — заложите 40 минут с учётом нескольких попыток.
Kling точнее всего справляется с ключевой задачей тренда — удержать лицо стабильным при активном движении фона. Sora 2 даёт более мягкую, атмосферную картинку, но иногда «отпускает» лицо при быстром вращении. Veo 3 отличается высокой детализацией и реалистичной физикой, но может интерпретировать сцену слишком буквально и добавлять лишние элементы. Для первого опыта — Kling, для экспериментов — Sora 2 и Veo 3.
Технически — да, нейросеть справится. Но важно учитывать: публикация роликов с узнаваемыми реальными людьми без их согласия может нарушать правила платформ и авторские права. Безопаснее использовать вымышленных персонажей, героев мультфильмов или анимационных фильмов — такой контент, как правило, не вызывает проблем и при этом хорошо набирает охваты.
Несколько проверенных приёмов: публикуйте в первые 24–48 часов после того, как тренд начал набирать обороты в вашей стране — алгоритмы активно подхватывают свежий трендовый контент. Используйте оригинальный звук Army Dreamers прямо из библиотеки TikTok или Reels, а не импортированный файл — это помогает системе привязать ваш ролик к трендовому звуку и показывать его в соответствующей ленте. Не перегружайте описание хэштегами — 3–5 точных тегов работают лучше, чем двадцать случайных.