Ролик из фото за вечер: связка трёх нейросетей
Виральный стек из Threads: Gemini (Nano Banana) делает кинематографичный кадр из вашего фото, Kling оживляет его в видео, CapCut собирает ролик со звуком. Пошагово, с готовыми промптами.
Пошаговый план
-
Шаг 1 midjourney design
Промпт для генерации фото по описанию: свет, камера, стиль
Шаг 1 — кадр из вашего фото
Открыть промпт → -
Шаг 2 gemini creative
Промпт для генерации видео: сцена, камера, движение и стиль
Шаг 2 — сцена и движение для оживления
Открыть промпт →
Как это работает: три нейросети — один ролик
Виральный стек лета-2026: обычное фото превращается в короткий кинематографичный ролик за вечер, без камеры и монтажёра. Логика простая: одна нейросеть готовит кадр, вторая его оживляет, третья собирает результат в готовый ролик со звуком. Каждый шаг занимает 10–20 минут, промпты ниже — готовые, со скобками-плейсхолдерами под вашу задачу.
Шаг 1. Кадр из вашего фото — Nano Banana (Gemini)
Загрузите своё фото в Gemini и опишите сцену по структуре: что в кадре, локация, свет, камера, стиль. Задача шага — получить один сильный статичный кадр, который станет первой сценой ролика. Промпт из подборки ниже удерживает черты лица и даёт кинематографичную картинку. Сгенерируйте 3–4 варианта и выберите самый удачный.
Шаг 2. Оживляем кадр — Kling
Полученный кадр загрузите в Kling (режим image-to-video) и опишите движение. Работает та же логика, что в нашем промпте для генерации видео: движение камеры, действие в кадре, длительность. Короткий шаблон под оживление кадра:
Оживи это изображение. Действие: [ЧТО ДВИЖЕТСЯ В КАДРЕ: волосы на ветру / пар от кофе / идёт снег]. Камера: [СТАТИКА / МЕДЛЕННЫЙ НАЕЗД / ЛЁГКИЙ ОБЛЁТ]. Движение плавное и естественное, черты лица не менять, длительность [5/10] секунд.
Чем меньше движения вы просите, тем реалистичнее результат: пар, ветер в волосах и медленный наезд камеры выглядят лучше, чем резкие жесты.
Шаг 3. Монтаж и звук — CapCut
Сгенерированные фрагменты соберите в CapCut: обрежьте неудачные первые кадры, добавьте музыку из встроенной библиотеки, титры и переходы. Для вертикальных площадок выбирайте 9:16 и длительность 10–20 секунд — такие ролики удерживают внимание лучше всего.
Частые ошибки
- Слишком много движения в промпте Kling — лицо «плывёт». Просите одно-два движения.
- Мутный исходный кадр — видео унаследует артефакты. Не жалейте попыток на шаге 1.
- Текст на кадре — нейросети искажают буквы, надписи лучше добавлять в CapCut.
Частые вопросы
Нужны ли платные подписки?
Базовые лимиты всех трёх сервисов позволяют собрать первый ролик бесплатно: Gemini даёт генерации кадров, у Kling есть бесплатные ежедневные кредиты, CapCut бесплатен для базового монтажа.
Можно ли вместо Kling использовать другую нейросеть?
Да, шаг 2 работает в любом image-to-video генераторе: Sora, Veo, Runway. Структура промпта та же — действие, камера, длительность.
Почему ролик не похож на исходное фото?
Сходство закладывается на шаге 1: в промпте кадра должно быть требование сохранить черты лица. На шаге 2 лицо уже не трогаем — только фон и лёгкое движение.