
提示词 + 图片参考
上传产品图、人像或风格参考,让 Gemini Omni 保留主体特征,再用提示词控制场景和运动。

用 Gemini Omni 预览版多模态模型,把产品图、人物参考、场景提示词和短视频动作参考组合成 4 秒 AI 视频。供应商失败会自动退还积分。✨ 图片转视频 · 视频参考动作 · 默认选中 Gemini Omni · 可一键切换其他模型
Preview Provider Model
Gemini Omni 的价值在于把不同参考类型放进同一个请求里测试:一句提示词、一组图片,以及一段短视频参考。当前 KIE 侧调用成功率和队列稳定性还在成熟过程中,所以页面会明确提示预览状态,并在失败时自动退还积分。


上传产品图、人像或风格参考,让 Gemini Omni 保留主体特征,再用提示词控制场景和运动。

当文字难以描述动作节奏、镜头运动或肢体动作时,用一段短视频作为运动参考。

把脸部、服装、情绪和场景线索放进同一需求里,测试 Gemini Omni 是否理解创意方向。
Model Advantages
它不是“最稳定万能模型”,而是一个适合探索多模态输入的视频模型。当创意方向需要图片、文字和视频动作共同说明时,Gemini Omni 比单纯文字生成更容易把需求说清楚。
Gemini Omni 的优势在于同时理解多种输入:主体图、风格线索、动作示例和简洁场景提示词。
先用它判断创意方向是否成立,再用同一提示词对比 Kling、Seedance、Wan 或 Veo 做最终交付。
对于产品运动、角色连续性或视频引导的运镜,Gemini Omni 能让你用素材直接说明需求。
由于供应商稳定性仍在成熟阶段,页面会提前说明预期;上游任务失败时自动退还积分。
Use Cases
不要把它当成只靠一句提示词出片的工具。更好的用法是用素材把需求说明白,再让 Gemini Omni 做第一轮创意探索。

先把产品图变成短视频动效概念,再决定是否用更高成本的生产模型继续优化。

提供脸部、服装和情绪参考,测试模型能否在片段中保持同一个角色设定。

当重点是节奏、手势、环绕镜头或身体动作时,用短视频直接提供动作参考。
Model Comparison
最稳妥的策略是:先用 Gemini Omni 验证混合参考方向,再用成熟模型做更稳定的最终输出。这样既能探索新模型能力,也能控制失败风险。
同时测试提示词、图片和视频参考
供应商预览队列和成功率可能波动
更可预期的动作和生产迭代
不如 Gemini Omni 适合混合参考实验
更成熟的成片、电影感或通用结果
更适合在创意方向明确后使用
稳定性提示:Gemini Omni 仍是 provider preview model。高峰期可能出现排队较长、任务失败或需要重试的情况;上游供应商任务失败时会自动退还 credits。
先验证多模态方向,再决定是否切换成熟模型成片
这个工作流适合创意打样、参考素材测试和模型对比。



Gemini Omni 常见问题