
用 AI 把一张静态照片变成竖屏 9:16 的 TikTok / Reels 短片。带 ImageToVideoAI 真实截图的完整操作流程,附提示词和发布技巧。
你手机里有张照片,挺好看的一张。现在你想让它在 TikTok 上动起来,而不是躺在相册里一动不动。
大多数人第一反应是用幻灯片 App:把照片丢进去,加个 Ken Burns 缩放,配一首热门音乐,搞定。问题是,谁的 feed 里不全是这种东西,那种假的平移加缩放一看就很敷衍,刷的人直接划走。
图片转视频 AI 做的是另一回事——它真的把照片动起来。头发会飘,咖啡上会冒热气,镜头会像真实拍摄那样推进去。这就是"有人看完"和"被划走"的区别。这篇教程会在 ImageToVideoAI 里把整个流程走一遍,从一张静态图到一段能直接发的竖屏 MP4。

不是每张照片都适合动起来。效果好的那些通常有几个共同点。
一个简单的判断:如果这张照片作为静态图发出来就已经好看,那它动起来也会好看;如果它本身就很弱,AI 救不了。
六步。点点鼠标大概两分钟,然后等渲染。
进入 图片转视频生成器,你会直接落到工作区。需要的东西都在一屏里:提示词框里的上传位、下方的各项设置,以及一个会显示实时积分消耗的生成按钮。

点上传位里的 +,或者直接把文件拖进去,也可以从剪贴板粘贴。它支持 JPG、PNG、WebP、GIF 和 HEIC,所以 iPhone 拍的照片不用转格式就能用。上传后会弹出一个裁剪窗口,让你在照片进工作区之前先框好画面。

打开画面比例选择器,选 9:16。这是最多人忘记、但对 TikTok 又最关键的一项设置。选了 9:16,你的短片才会铺满屏幕,而不是夹在上下黑边里。
然后设时长,先从 4 或 5 秒 开始。短片渲染更快、花的积分更少,而短本来就是 TikTok 更吃的那一套。

提示词负责告诉模型怎么让这张图动起来。把你想要的动作说具体。含糊的提示词什么都给不了你,具体的提示词才能换来一个像样的镜头。
几条好用的:
Slow cinematic zoom in on her face, soft hair movement in the breeze, warm natural light.
Gentle camera push toward the subject, a subtle smile forming, shallow depth of field.
Slow pan across the scene, drifting clouds in the background, golden-hour glow.
写明镜头怎么走、画面里什么该动,再加一句光线说明。这就是配方。

打开模型选择器。每个模型都有自己的强项:
| 模型 | 最擅长 |
|---|---|
| Kling | 人脸和人物 |
| Seedance / Wan | 镜头运动和动态 |
| Veo 3.1 | 精致、高端的质感 |
| Hailuo、Runway、Grok、Gemini Omni | 值得逐个镜头试 |
要让人物动起来?先用 Kling。想给风景来一段有戏剧感的镜头运动?Seedance 或 Wan。
省钱的关键动作:先用便宜的配置试。把分辨率设成 480p 或 720p、时长设短,先生成一遍。如果动作对了,再用 1080p 跑最终版。这比一上来就拉满设置、结果还不满意要省得多。

看一眼 生成 按钮上的积分消耗,然后点下去。费用会随模型、时长、分辨率和片段数量变化,所以一段 5 秒、720p 的快速测试很便宜。
跑完后,短片会直接在预览里播放。满意?下载 MP4。觉得动作不对?改一下提示词再跑一遍,然后再升到 1080p。

复制下来,按你的照片改细节,然后跑。
人像,轻微动作:
Slow zoom in, hair gently moving in the wind, eyes blinking naturally, soft warm light, cinematic.
产品展示:
Camera slowly orbits the product on a clean surface, soft studio lighting, a light reflection moving across the surface.
宠物:
Dog tilts its head and ears perk up, slight camera push-in, bright natural daylight, playful.
穿搭 / 时尚:
Subtle fabric movement, slow camera tilt from feet to head, fashion editorial lighting, confident pose.
美食:
Steam rising from the dish, slow push-in, glistening texture, warm cozy lighting.
风景:
Slow drone-style pull-back revealing the landscape, drifting clouds, golden hour, sweeping motion.
渲染只是一半,发布是另一半。
抢下第一秒。 TikTok 很快就会判断要不要继续把你的片子推出去。用最强的画面和最明显的动作开场。如果你的推镜或揭示恰好落在最开头,留下来的人会更多。
字幕和音乐在 App 里加。 ImageToVideoAI 给你的是一段干净的动画 MP4。文字叠加和热门音频,下载之后在 TikTok 里做。原生字幕和原生音乐往往比预先烧进画面里的更吃推荐。
保持 9:16,保持短。 你在第 3 步已经设好了比例,所以它会铺满屏幕。一段紧凑的 4 到 8 秒短片会循环播放,而循环能堆出播放时长。
多试几版。 别死磕第一次的结果。同一张照片用两条不同提示词跑,或者同一条提示词在 Kling 和 Seedance 上各跑一遍,发表现最好的那条。便宜的测试让这件事毫无压力。
如果你是想把一张老的家庭合影做成怀旧帖,有个专门的入口:老照片动起来。如果你想让动作配上声音,Gemini Omni 视频生成器 能在同一次生成里把音频一起处理。
免费吗?
注册就送积分,所以你不花钱也能先试。费用会随你选的模型、时长、分辨率和片段数量变化——这正是先用 480p 或 720p 测试能省钱的原因。
会有水印吗?
生成前你可以先预览,下载的是标准 MP4。是否带水印取决于你的套餐,最终导出前到 价格页 看一下当前的具体规则。
TikTok 上多长合适?
短。一段能循环的 4 到 8 秒短片通常比更长的表现更好。循环堆播放时长,而播放时长正是算法看重的。从 4 或 5 秒开始。
能用自拍吗?
能,而且自拍是最好的素材之一。一张清晰、光线好的脸,正是 Kling 的强项。把它裁成 9:16,写一条带轻微动作的提示词,比如缓慢推近加自然的头发飘动,你就有了一段够强的竖屏短片。
挑一张照片。打开生成器。设 9:16,写一条动作提示词,先用便宜配置测试,然后导出。整套流程上手一次之后,就只要几分钟。
从 图片转视频生成器 开始。想要更多提示词套路,照片转视频完整指南 讲得更深,而 最好用的免费 AI 视频生成器 则拆解了各个模型的对比。

What Gemini Omni can do for multimodal AI video, when to use it, and how to handle preview-model reliability inside ImageToVideoAI.

用 AI 把婚礼照片变成 first dance 循环、周年纪念短片和社交预告。含真实页面截图、提示词模板和可落地执行流程。

一套能直接用的 40 个图片转视频提示词,覆盖人像、产品、房产、宠物和电影感镜头,还教你在 ImageToVideoAI 里写出自己的提示词。
邮件列表
订阅邮件列表,及时获取最新消息和更新