上传一张产品图,AI自动生成10个角度的模特展示图、九宫格连续分镜、10秒动态视频——从静态图到动态视频,全自动、不实拍、不请模特。
服装电商做商品视频,最烧钱的是什么?——请模特、租影棚、搭场景、专业摄影、后期剪辑……一个10秒的模特展示视频,从策划到出片,成本动辄几千上万。如果多角度展示,费用直接翻倍。
这套工作流把整个过程变成了:上传产品图 → 输入场景描述 → 点击运行。AI自动生成正面模特图、10个不同角度的动态姿势图、九宫格连续分镜图、最终10秒动态视频——从静态产品图到动态模特视频,全自动走完。
进阶在哪?从“1张图”到“1条视频”的完整链路
这套工作流的核心进阶之处在于完整的“图→图→视频”链路:
| 阶段 | 输入 | 输出 | 核心能力 |
|---|---|---|---|
| 阶段1 | 产品图 + 场景 | 正面模特图 + 10张角度图 | 从产品图生成穿着该服装的AI模特 |
| 阶段2 | 正面图 | 九宫格连续分镜 | 将静态图转化为连续动作序列 |
| 阶段3 | 九宫格 | 10秒动态视频 | Seedance 2.0将分镜转化为流畅视频 |
三个环节环环相扣,最终输出一条可直接用于电商详情页的模特展示视频。
全流程拆解
第一步:输入产品图 + 场景描述
工作流入口只需要三个参数:
- 场景描述(如“城市街拍”“居家休闲”“海边度假”)
- 产品图(服装/配饰的产品图片)
- API密钥
第二步:大模型生成正面图 + 10个角度提示词
第一个大模型节点接收场景和产品图,生成两样东西:
1. 正面模特图提示词
核心人物设定:中国女性模特,165-170cm,S型身材,精致妆容,强镜头表现力。场景、光线、构图与输入的场景描述匹配。9:16竖版,超高清画质。
2. 10个不同角度的动态姿势提示词
针对不同服装风格匹配不同的动作逻辑:
- 运动风:自然动态姿态,虚化背景
- 甜酷/Y2K风:侧身姿势,微妙曲线,强烈表情
- 通勤正式风:优雅利落,极简背景
- 复古田园风:柔和动作,流畅衣摆
- 休闲家居风:慵懒放松,日常感
关键约束:每张图只出现一个女性角色,无文字、无LOGO、无无关元素。所有提示词输出为英文。
第三步:GT2生成正面模特图
图片格式转换节点将产品图转为列表格式,作为参考图传入GT2图片生成插件,生成正面模特图(9:16竖版)。
这张图同时承担两个角色:
- 作为“穿着产品”的模特展示图
- 作为后续九宫格分镜的首帧参考图
第四步:代码节点聚合参考图
代码节点将场景描述和正面图URL聚合为图片数组,作为后续批处理生成多角度图的参考图列表。
第五步:批处理生成10张不同角度图
批处理节点遍历10条角度提示词,对每条提示词调用GT2生成对应的角度图。
批处理配置:
- 最大批量100张
- 并发数3张(同时生成,提高效率)
- 双路径兜底机制:首条GT2路径失败时,自动进入“提示词优化→再次生图”的备用路径,确保每张图都能拿到结果
所有成功生成的图片通过变量聚合节点合并为一个列表。
第六步:画板处理 + 九宫格分镜提示词生成
画板节点将正面模特图进行标准化处理(1080×1920竖版),输出为统一的格式。
第二个大模型节点基于正面图,生成九宫格分镜图的提示词。核心逻辑:
- 角色一致性:同一个模特、同一套衣服、同一个场景、同一种光线
- 连续动作:严格按左→右、上→下顺序推进,每格动作轻微变化
- 服装动态:真实物理规律——面料惯性、重力感、自然摆动
- 全全身构图:每一格都是全身镜头,完整展示人物与服装
- 分镜标注:每一格标注是“分镜几”
- 合规处理:分镜图中出现人脸的部分统一佩戴口罩
第七步:GT2生成九宫格分镜图
以九宫格提示词 + 多角度图列表为参考,调用GT2生成一张完整的九宫格分镜图,3×3排列,从左到右、从上到下依次为分镜1到分镜9。
第八步:大模型生成Seedance视频提示词
第三个大模型节点接收九宫格图和场景描述,生成10秒英文视频动作指令。核心逻辑:
- 按1→9顺序读取每格的位置、姿态、景别、构图
- 提取相邻两帧变化量:位移方向、身体转向、裙摆幅度,决定对应时段的动作速率
- 严格按图驱动:分镜已决定每一步动作走向,不自行添加不存在的内容
关键约束:
- 严禁九宫格拼贴:视频从第1帧的单人画面开始,不能出现任何多画面并存构图
- 严禁口罩残留:分镜图中的口罩是合规标记,生成视频时必须移除,展示完整自然面部
- 地球重力物理:面料加速度9.8m/s²,裙摆扬起后0.3-0.5秒内回落,不能漂浮
- 步态周期:每一步0.6-1.0秒,10秒内完成10-16步
第九步:Seedance 2.0生成视频
格式转换节点将九宫格图转为列表格式,作为参考图传入MIVIDEO生成快速版插件(即Seedance 2.0),结合视频提示词,生成10秒9:16竖版动态视频。
第十步:轮询查询 + 输出去重
提交任务后进入自动轮询机制(最多10次,每次60秒),通过任务查询接口持续查询生成状态。生成完成后,去空值插件自动过滤无效结果,输出纯净的视频URL列表。
技术规格一览
| 参数 | 说明 |
|---|---|
| 输入 | 场景描述 + 产品图 + API密钥 |
| 大模型1 | 豆包·2.0·Pro(生成正面图+10角度提示词) |
| 大模型2 | 豆包·1.6·极致速度(生成九宫格分镜提示词) |
| 大模型3 | 豆包·2.0·Pro(生成视频提示词) |
| 图生图 | GT2图片生成(IMAGE-2模型,9:16) |
| 图生视频 | Seedance 2.0(MIVIDEO快速版,10秒,9:16) |
| 批处理 | 并发数3,最大100张 |
| 输出 | 10张角度图 + 九宫格分镜图 + 10秒视频URL |
关键设计亮点
1. 双路径兜底机制
批处理中每条提示词生成角度图时,如果GT2首条路径失败(code≠200),自动走备用路径:提示词优化插件优化提示词 → 备用GT2重新生成。确保每条提示词都能出图。
2. 分镜→视频的无缝转化
九宫格分镜图本身是静态的,但大模型通过“提取相邻两帧变化量”的方式,将静态序列转化为动态指令——变化大的区间对应快速动作,变化小的区间对应慢速展示,形成自然的10秒节奏。
3. 口罩合规→移除设计
九宫格分镜图中模特佩戴口罩以满足合规要求,但视频生成指令中明确要求“移除口罩,展示完整自然面部”,实现了合规与成品效果的平衡。
4. 重力级物理模拟
视频提示词中强制约束面料的物理规律——不同类型面料(雪纺/真丝/牛仔/毛呢/棉麻)的摆动幅度、回落速度各不相同,确保视频质感接近真实拍摄。
应用场景
- 服装电商卖家:快速生成多角度模特展示图 + 走秀视频,无需实拍
- 品牌上新:新品到货前提前生成商品视频,预热种草
- 广告投放:多版本模特展示素材用于信息流广告测试
- 代运营公司:服务多个服装品牌,批量产出商品视频素材



























