Gemini 视频生成提示词与 Omni Flash 对话式编辑实战

陈知远 2026-05-20 7分钟阅读

Google I/O 2026 之后，Gemini 视频创作的重点不再只是“一条 Prompt 生成一个片段”，而是先生成一个可用母版，再围绕画面、动作、镜头、音频和风格进行连续对话式编辑。本文会把旧版视频生成提示词，升级成更适合 Gemini 3.5 Flash、Gemini Omni / Omni Flash 与 Veo 工作流的实战写法。

第一步

先做母版

一次说清主体、场景、镜头、风格和画幅。

第二步

只改一处

用“保持 A 不变，只修改 B”减少画面跑偏。

第三步

逐轮定稿

分别微调动作、音频、转场和字幕，不要一次塞满。

一、Gemini 视频提示词的基础公式

构建视频提示词时，不建议只写“生成一个高级感视频”。更稳定的基础公式是：主体 + 场景 + 动作 + 镜头 + 风格 + 约束。

可直接复用的母版 Prompt：

生成一段 8 秒 16:9 横屏视频：一位身穿机甲汉服的黑发女孩站在雨后的未来城市街道，镜头从半身中景缓慢推近到眼部特写，霓虹灯在金属纹理上反射，发丝随风轻微摆动。整体风格为电影级赛博国风，真实物理光影，避免文字、水印、畸形手指和过度锐化。

这个结构的好处是：模型先知道“谁在做什么”，再知道“镜头如何看它”，最后知道“哪些错误要避免”。如果你直接堆形容词，画面容易好看但不可控。

二、传统长 Prompt 与 Omni Flash 怎么分工

传统视频生成适合第一轮定方向，Omni Flash 这类对话式编辑更适合后续迭代。也就是说，第一轮 Prompt 应该完整，第二轮之后应该克制。

阶段	适合写法	不要这样写
首轮生成	完整描述主体、场景、镜头、光线、风格	只写“高级、震撼、电影感”
二次编辑	保持角色和镜头不变，只替换背景或动作	重新写一整段全新 Prompt
最终微调	单独处理字幕、音效、色调、节奏	一次要求换风格、换人物、换镜头

三、对话式视频编辑指令模板

如果你的 Gemini 或 Flow 页面已经开放 Gemini Omni / Omni Flash 相关入口，可以把修改指令写得像给剪辑师下 brief。关键句式是：先锁定保留项，再说明修改项。

1. 只换背景

保持人物、服装、动作和镜头节奏不变，只把背景改成雨后的东京街头，加入湿润地面反光和远处车灯虚化。

2. 只调动作

保持场景、构图和角色外观不变，让人物从静止改为缓慢转头看向镜头，动作自然，不要改变面部特征。

3. 只改风格

保留原始分镜和主体运动，将整体视觉改成真实电影摄影风格，降低卡通感，增加柔和景深和胶片颗粒。

4. 补声音与节奏

保持画面不变，加入轻微雨声、远处城市环境音和低频氛围音乐，整体节奏保持安静、克制、未来感。

四、8 类高频场景 Prompt 示例

产品展示

A premium product video of a translucent AI device on a dark glass table, slow orbit camera, soft studio lighting, minimal background, 8 seconds.

人物口播

A confident creator speaking to camera in a modern studio, subtle hand gestures, clean lighting, shallow depth of field, natural facial movement.

短剧分镜

A three-shot micro story: close-up of phone notification, character reaction, fast walk through neon corridor, suspenseful mood, cinematic pacing.

教程演示

A clean screen-recording style tutorial animation showing steps in a Gemini interface, cursor movement, highlighted buttons, readable labels.

电影运镜

A slow dolly-in shot through a rainy cyberpunk street, reflections, volumetric light, realistic physics, dramatic but restrained color grading.

数据可视化

An animated dashboard showing AI usage growth, smooth chart transitions, clean labels, dark background, professional SaaS visual style.

ASMR 感官

A macro ASMR video of ice cracking in a glass, crisp sound design, close-up texture, soft condensation, slow motion.

抽象概念

An abstract video representing memory, flowing luminous particles, layered transparent shapes, calm motion, deep blue and silver palette.

五、常见翻车点与修正方法

角色变脸：在二次编辑时写清“保持人物脸部、发型、服装和年龄不变”。
镜头乱跳：减少一次性镜头变化，优先使用 slow dolly-in、static shot、slow pan 这种明确动作。
文字乱码：尽量避免让模型生成复杂中文招牌；需要文字时，后期叠加更稳。
风格过度：不要堆 10 个风格词，选择 1 个主风格 + 2 个辅助质感即可。
权限不一致：视频生成、Omni、Flow 等入口可能受地区、订阅层级和灰度影响，实际以账号内页面显示为准。

六、常见问题解答

Gemini Omni Flash 和普通视频生成有什么不同？

普通视频生成更像一次性出片；Omni Flash 的重点是理解多模态上下文，并围绕上一版视频继续做对话式修改。

中文 Prompt 还是英文 Prompt 更好？

中文适合描述业务需求，英文适合精确控制镜头、材质和摄影语言。实际使用中可以中文说明目标，再补英文镜头词。

旧视频生成提示词还需要保留吗？

需要。首轮母版仍然依赖结构化 Prompt，只是后续编辑从“重写一整段”变成“局部修改”。

七、核心要点总结

首轮 Prompt 写完整，二次编辑写克制。

Omni Flash 类工作流最稳的句式是“保持 A 不变，只修改 B”。

镜头、动作、音频、风格分轮处理，比一次塞满更容易出可用结果。

关于作者：陈知远

独立 AI 工具研究者，深度体验 Google Gemini 系列产品超过 2 年。专注于 AI 工具使用技巧、订阅攻略和效率提升方法的研究与分享，所有内容均基于亲身测试与真实使用体验。