Ролик из фото за вечер: связка трёх нейросетей

Виральный стек из Threads: Gemini (Nano Banana) делает кинематографичный кадр из вашего фото, Kling оживляет его в видео, CapCut собирает ролик со звуком. Пошагово, с готовыми промптами.

2 промптов 2 нейросетей

Пошаговый план

  1. Шаг 1 midjourney design

    Промпт для генерации фото по описанию: свет, камера, стиль

    Шаг 1 — кадр из вашего фото

    Открыть промпт →
  2. Шаг 2 gemini creative

    Промпт для генерации видео: сцена, камера, движение и стиль

    Шаг 2 — сцена и движение для оживления

    Открыть промпт →

Как это работает: три нейросети — один ролик

Виральный стек лета-2026: обычное фото превращается в короткий кинематографичный ролик за вечер, без камеры и монтажёра. Логика простая: одна нейросеть готовит кадр, вторая его оживляет, третья собирает результат в готовый ролик со звуком. Каждый шаг занимает 10–20 минут, промпты ниже — готовые, со скобками-плейсхолдерами под вашу задачу.

Шаг 1. Кадр из вашего фото — Nano Banana (Gemini)

Загрузите своё фото в Gemini и опишите сцену по структуре: что в кадре, локация, свет, камера, стиль. Задача шага — получить один сильный статичный кадр, который станет первой сценой ролика. Промпт из подборки ниже удерживает черты лица и даёт кинематографичную картинку. Сгенерируйте 3–4 варианта и выберите самый удачный.

Шаг 2. Оживляем кадр — Kling

Полученный кадр загрузите в Kling (режим image-to-video) и опишите движение. Работает та же логика, что в нашем промпте для генерации видео: движение камеры, действие в кадре, длительность. Короткий шаблон под оживление кадра:

Оживи это изображение. Действие: [ЧТО ДВИЖЕТСЯ В КАДРЕ: волосы на ветру / пар от кофе / идёт снег]. Камера: [СТАТИКА / МЕДЛЕННЫЙ НАЕЗД / ЛЁГКИЙ ОБЛЁТ]. Движение плавное и естественное, черты лица не менять, длительность [5/10] секунд.

Чем меньше движения вы просите, тем реалистичнее результат: пар, ветер в волосах и медленный наезд камеры выглядят лучше, чем резкие жесты.

Шаг 3. Монтаж и звук — CapCut

Сгенерированные фрагменты соберите в CapCut: обрежьте неудачные первые кадры, добавьте музыку из встроенной библиотеки, титры и переходы. Для вертикальных площадок выбирайте 9:16 и длительность 10–20 секунд — такие ролики удерживают внимание лучше всего.

Частые ошибки

  • Слишком много движения в промпте Kling — лицо «плывёт». Просите одно-два движения.
  • Мутный исходный кадр — видео унаследует артефакты. Не жалейте попыток на шаге 1.
  • Текст на кадре — нейросети искажают буквы, надписи лучше добавлять в CapCut.

Частые вопросы

Нужны ли платные подписки?

Базовые лимиты всех трёх сервисов позволяют собрать первый ролик бесплатно: Gemini даёт генерации кадров, у Kling есть бесплатные ежедневные кредиты, CapCut бесплатен для базового монтажа.

Можно ли вместо Kling использовать другую нейросеть?

Да, шаг 2 работает в любом image-to-video генераторе: Sora, Veo, Runway. Структура промпта та же — действие, камера, длительность.

Почему ролик не похож на исходное фото?

Сходство закладывается на шаге 1: в промпте кадра должно быть требование сохранить черты лица. На шаге 2 лицо уже не трогаем — только фон и лёгкое движение.