Скетч карандашом, диджитал-иллюстрация, рисованный персонаж из планшета — всё это можно превратить в короткое живое видео. Персонаж моргнёт, плащ на ветру качнётся, глаза оживут. Звучит как сложный анимационный процесс, но с нейросетями это занимает несколько минут и не требует знания After Effects или Blender.
Есть одна важная оговорка: оживить рисунок — технически другая задача, чем оживить фотографию. И если не учитывать эту разницу с самого начала, результат будет предсказуемо плохим. Разберём, почему — и как это обойти.
Большинство Image-to-Video моделей обучены на фотоматериале. Когда на вход подаётся рисунок, модель не всегда понимает, что перед ней авторская работа со своей эстетикой — она пытается «исправить» исходник под своё представление о норме. Выравнивает свет, сглаживает линии, убирает графичность, добавляет фотореалистичную текстуру кожи там, где была штриховка.
В итоге на выходе — не оживший рисунок, а странная полуфотография, которая потеряла всё, что делало иллюстрацию интересной.
Это не баг конкретной модели, а особенность того, как работает генерация. Решается двумя вещами: правильным выбором модели и промптом, который явно объясняет нейросети, что стиль нужно сохранить, а не улучшить.
Не все модели одинаково работают с иллюстративным материалом. Вот что показал тест на одном и том же исходнике — диджитал-портрете с выраженной графичной эстетикой.
Grok справляется лучше остальных именно на рисунках. Модель не форсирует фотореализм и работает с тем стилем, который задан в исходнике: сохраняет линии, характер штриховки, авторскую цветовую обработку. Если в промпте явно указать «сохранить визуальный стиль исходного изображения» — результат стабильно держит эстетику даже на нестандартных иллюстрациях.
Kling 3.0 даёт очень детальный результат, но с оговоркой: модель обучена преимущественно на фотоматериале и активно тянет рисунок к реализму. Для портретной фотографии это сила, для иллюстрации — ограничение. Использовать можно, но промпт должен явно ограничивать реализм, иначе авторская эстетика уйдёт.
Seedance хорошо работает на иллюстрациях с природой, тканью и органическим движением. Развевающийся плащ, трава на ветру, вода — здесь Seedance даёт более естественное движение, чем конкуренты. На рисованных портретах крупным планом он немного уступает Grok по сохранению авторской эстетики.
Все три модели доступны в SpeShu.AI без VPN и иностранных карт — с оплатой в рублях по СБП. При пополнении работает промокод SOSTAV15, который даёт 15% к сумме.
1) Качество исходника напрямую влияет на результат — и для рисунков это важнее, чем для фотографий. У фото много визуальных подсказок: свет, тени, объём. У рисунка их меньше, и если исходник слабый, моделям просто не с чем работать.
2) Разрешение — от 1000 пикселей по длинной стороне. Низкое разрешение даёт размытые контуры на входе, и модель начинает «додумывать» детали сама — обычно не в ту сторону.
3) Фон — однотонный или прозрачный. Загромождённый фон путает модель: она не понимает, что является объектом анимации, а что — фоном. Чистый белый или однотонный цвет решает эту проблему.
4) Контрастность линий — средняя или высокая. Слишком светлые линии на светлом фоне модель может проигнорировать. Если скетч карандашный и лёгкий — перед загрузкой усильте контраст в любом редакторе.
Старый скан или слабый исходник? Прогоните через апскейлер — он есть в разделе ИИ-агентов в SpeShu.AI. Это поднимет разрешение и уберёт артефакты сканирования до того, как рисунок попадёт в генерацию.
Шаг 1. Подготовьте исходник: разрешение от 1000 пикселей, однотонный фон, хорошая контрастность линий.
Шаг 2. Зайдите на speshu.ai, откройте раздел видео-нейросетей и выберите Grok — для рисунков это лучший старт.
Шаг 3. Напишите промпт. Для рисунков структура та же, что для фото — объект, действие, физика, фон — но с обязательным добавлением: явным указанием сохранить стиль.
Готовые варианты:
Персонаж, портрет:Крупный план. Персонаж медленно моргает, лёгкая улыбка. Глаза живые, мимика едва заметная. Фон неподвижный. Сохранить стиль и эстетику исходного рисунка, не добавлять фотореализм.
Персонаж с одеждой или плащом:Средний план. Лёгкий ветер колышет плащ и волосы. Движение ткани естественное. Персонаж стоит на месте. Фон статичный. Визуальный стиль иллюстрации сохранить полностью.
Пейзаж или сцена с природой:Широкий план. Трава и листья слегка колышутся. Вода на заднем плане с лёгкой рябью. Небо неподвижное. Общее настроение иллюстрации сохранить, не улучшать до фото.
Шаг 4. Нажмите «Сгенерировать». Результат появится через 30 секунд — несколько минут в зависимости от модели.
Для фотографии достаточно описать движение и физику. Для рисунка этого мало — нужно ещё объяснить модели, что она работает с иллюстрацией, а не с реальным объектом, который нужно улучшить.
Без такой инструкции модель действует по умолчанию: берет рисунок и начинает приводить его к тому, как, по её мнению, должен выглядеть реальный объект. Художественные линии сглаживаются, плоские цвета получают объём и тени, специфический стиль исчезает.
Фразы, которые стоит добавлять в промпт для любого рисунка:Сохранить визуальный стиль исходного изображения.Не добавлять фотореализм, сохранить рисованную эстетику.Анимировать в стиле исходной иллюстрации.
Ещё один приём: если рисунок выполнен в конкретном стиле — укажите его прямо. «Аниме», «комикс», «акварель», «карандашный скетч» — модель лучше понимает задачу, когда стиль назван явно, а не оставлен на её усмотрение.
Экспериментировать с формулировками удобно там, где платишь за каждую генерацию отдельно, а не по подписке. В SpeShu.AI именно такая модель: токены за фактическое использование, без ежемесячного списания. Попробовали — заплатили за конкретный результат. Промокод SOSTAV15 даёт 15% к сумме пополнения.
Промпт как для фотоОписание движения без указания на сохранение стиля — и модель делает из рисунка полуфотографию. Фраза про стиль обязательна.
Белый персонаж на белом фонеМодель не видит границы объекта и начинает анимировать фон вместе с персонажем. Однотонный контрастный фон решает это.
Слишком сложная сценаПопытка оживить иллюстрацию с несколькими персонажами и детальным фоном одновременно почти всегда даёт артефакты. Начинайте с простых исходников — один персонаж, чистый фон.
Низкокачественный скан без подготовкиАртефакты сканирования, размытые линии и низкое разрешение модель воспринимает как «повреждённый» исходник и пытается его восстановить по своему усмотрению. Апскейл перед генерацией — не опция, а необходимость для старых рисунков.
Оживить рисунок нейросетью онлайн бесплатно в полном смысле не получится — генерация требует вычислительных ресурсов, и серьёзные модели работают за деньги. Но начать с минимальными затратами — реально.
В SpeShu.AI собраны все три модели из этого гайда: Grok, Kling и Seedance. Русский интерфейс, оплата в рублях, без VPN. Скоро на платформе появятся чаты сообщества — отдельно для разработчиков, бизнеса и креаторов. В чате для креаторов можно будет смотреть чужие работы с рисунками, разбирать промпты и участвовать в конкурсах — это быстрее, чем учиться только на собственных артефактах. Промокод SOSTAV15 даёт 15% к сумме пополнения.
Для первого раза: возьмите любой рисунок с однотонным фоном, добавьте в промпт фразу про сохранение стиля и запустите Grok. Это самый предсказуемый старт.