阿里巴巴开源通义万相Wan2.2视频模型实战指南(一)
深圳/三维设计师/70天前/4808浏览
版权
阿里巴巴开源通义万相Wan2.2视频模型实战指南(一)
本文章分为三个部分
一、模型及加速介绍
二、模型能力介绍
三、作者实战展示
通义万相 Wan2.2 的发布,并非一次简单的迭代升级,而是代表了开源 AI 视频生成领域的一次重要范式转移。除了在上一代Wan2.1的基础上进行性能优化,这次重大的改变是核心架构层的一次深刻的革命。从根本上解决了前代模型在
运动控制、美学质量、画面构图、视频运镜、精准语义
等方面的核心挑战。
记住这几个词,后面要考
运动控制、美学质量、画面构图、视频运镜,精准语义
在其通义万相网址有免费/付费的体验,今天在这里主要分享的是Wan2.2开源模型搭配
ComfyUI
工作流的技巧全面分享。
一、大模型
1.官方模型
Wan2.2 的核心创新——专家混合(Mixture-of-Experts, MoE)架构,通过引入两个独立的 14B 参数专家模型进行分阶段去噪,本质上是用更复杂的计算流程换取了更高的生成质量。
高噪声专家 (High-Noise Expert):
具体的能力表现为
规划视频的整体布局、核心运动轨迹和场景结构
。它如同电影导演绘制的分镜草图,负责奠定整个视频的“骨架”,确保后续生成的内容在时空上具有一致性和合理性。
低噪声专家 (Low-Noise Expert):
具体的能力表现为
精炼视频的细节、纹理、光影效果和大气氛围
。它像一位精细的后期制作师,负责为“初稿”添加丰富的视觉元素,提升画面的质感和真实感,并确保帧与帧之间的过渡平滑自然。
完整的 Wan2.2 (MoE) 版本得分最高、学得最快、而且作品接近以假乱真的地步。
左图揭示了其工作原理:它将复杂的视频生成过程分为两个阶段,并派出两位“专家”接力完成。在噪声多、信噪比(SNR)低的前期,由“高噪声专家”上场,负责搭建视频的整体结构和运动“骨架”;当去噪进行到信噪比高的后期,则无缝切换给“低噪声专家”,负责精雕细琢画面的纹理、光影等细节。这是一种分工明确、高效协作的智能机制。右图则用科学实验数据,无可辩驳地证明了这种架构的卓越性:所以,这次的大模型相比以往(只需要一个大模型)进行了一次对比实验,分别测试了四种方案:仅使用高噪声专家、仅使用低噪声专家、旧的Wan2.1模型,以及完整的Wan2.2 MoE模型 。结果显示(如右图的“验证损失”曲线所示),完整的Wan2.2 (MoE) 版本(蓝线)始终处于最低位,这意味着它的“犯错率”最低,生成的视频与真实世界的差距最小 。
并且,在全新 Wan-Bench 2.0 平台上对 Wan2.2 与领先的闭源商业模型进行了比较,评估了多个关键维度的性能。结果表明,Wan2.2 的性能优于这些领先模型。
只不过,两个大模型在ComfyUI官方工作流同时使用时,时间极其之久,根据我实测的数据来看
模型:FP8量化版显卡:4090模式:文生图尺寸:1280×720总采样:20步总帧率:121帧(5秒) 单秒:24帧
时长:
3514.12秒(几乎60分钟)
720P
模型:FP8量化版显卡:4090模式:文生图尺寸:640×480总采样:20步总帧率:153帧(5秒) 单秒:30帧
时长:
810秒(13分钟)
480P
效果
所以显卡的算力和显存,在这一刻显得极其重要,下图数据是官方使用的FP16(原版),可以看到一样是720P,使用H20显卡,出图时间高达4048.7秒(68分钟)
- 在如此需要高配置的情况下使用,确实是极其艰难的,此刻提高速度才是重中之重。所以官方还出了一款高效混合模型:为消费级硬件设计的 TI2V-5B(T2V、I2V)。该模型的推出,旨在将高质量视频生成技术普及消费级显卡上。
- 它在一个统一的框架内,原生支持文本到视频(Text-to-Video)和图像到视频(Image-to-Video)两种任务,为用户提供了极大的灵活性 。
- 其高效性的关键在于背后采用了一款全新设计的高压缩比变分自编码器(VAE)——wan2.2_vae.safetensors的模型。
- 这款 VAE 实现了在时间、高度和宽度三个维度上高达 4×16×16 的压缩比,这种极致的压缩技术显著降低了模型在推理过程中的显存占用。测试表明,TI2V-5B 模型能够在配备 24GB VRAM 的单张消费级显卡(如 NVIDIA RTX 4090)上,在约 9 分钟内生成一段 5 秒钟的 720p@24fps 高清视频。对比我上面的FP8,快了50分钟!
-------------------------------------------------------------------------
2.加速LoRA
- Lightx2v:
这是一个轻量级的视频生成推理框架,其核心技术是利用
知识蒸馏(Knowledge Distillation)
,将大型、复杂的视频模型(如 Wan2.2)的生成能力“蒸馏”到一个小型的、高效的
LoRA
模型中 。这使得在推理时,可以通过加载这个特制的
LoRA
来模拟原始模型的行为,但计算量却大大减少。
以 Wan2.2 为例,其标准的 MoE 工作流需要经过两个阶段,总计约 20+20=40 个采样步骤才能获得高质量结果。而 LightX2V 通过其蒸馏 LoRA,成功地将这一过程压缩到了惊人的4-6 步。根据测试,6步兼具质量和速度,最为推荐!
所以我们再来个测试
模型:FP8量化版显卡:4090模式:文生图尺寸:1280×720总采样:4步总帧率:121帧(5秒)LoRA:Lightx2v
时长:
210秒(3.5分钟)
720P
由最早期的3514.12秒(几乎60分钟),压缩至210秒(3.5分钟),实在是非常惊人的速度...
3 KJ模型
在开源社区的一位大神kijai,独特的优化处理,使其产出的视频大模型,基于官方但又区别于官方的FP8版本,并且搭配上了2-3种机制,速度更是飞起。除了结合上面的
Lightx2v的LoRA
提高速度,还可以增加一种注意力,进行提速。
3.2 Sageattention:
这是一种高性能的
量化注意力
实现,其核心思想是在极小牺牲模型精度的前提下,大幅提升计算速度 。社区的大量测试表明,成功启用 SageAttention 后,用户可以期待高达 30% 的生成速度提升 。
在这里,我依旧以官方工作流,加入了Lightx2v这个LoRA之后,已经可以直接从20步,压缩至4步,速度已经非常逆天,再加上Sageattention进行加速,那么速度就是飞一般地起步。
模型:FP8量化版显卡:4090模式:文生图尺寸:1280×720总采样:4步总帧率:121帧(5秒)LoRA:Lightx2v加速:Sageattention
时长:
148秒(2.5分钟)
720P
3514.12秒(几乎60分钟)→ 210秒(3.5分钟)→ 148秒(2.5分钟)
重点:在锁定种子,测试了单独加入LoRA和结合注意力输出的两种情况之下,质量几乎并没有损害,以及跟原本接近1小时的视频相比。
单独LoRA效果:
两者结合效果:
我测试的尺寸比较大,如果基于其他尺寸,速度也许能更快
我为这个测试效果说一句,是我这个提示词写得太逆天了,包带有点穿帮,其他提示词的效果,真的很不错!
并且在我进行测试的时候,出现了爆显存的情况,所以最好采用48G显存,我在用这款L40S/48G的显卡使用,速度比4090更快,显存也够大,与前面两者进行搭配后,确实让AI视频的产出极度平民化了!
https://www.gpufree.cn/market?product_code=1005&product_name=L40S+/+48G
3.GGUF量化:
https://hf-mirror.com/collections/QuantStack/wan22-ggufs-6887ec891bdea453a35b95f3
对于显存有限的用户而言,即便 Wan2.2 推出了
5B
模型,也依旧需要
4090 24G VRAM
的显卡来匹配,对多数用户来说依然是遥不可及。而GGUF(GPT-Generated Unified Format)量化格式的出现,彻底改变了这一局面。
它可以将原本需要数十GB 显存才能加载的 FP16 模型,进行不同级别的量化压缩。Wan2.2 14B 模型的多种 GGUF 量化版本,从 Q2_K 到 Q8 不等 。这些量化版本极大地降低了显存门槛,使得
8GB VRAM
的 GPU(如 RTX 4060)上运行 “14B” 模型成为现实 。
量化级别越低(如 Q2_K),模型文件越小,显存占用越低,甚至可以在
6GB VRAM
的显卡上运行,但相应的,视频质量的损失也越大,可能会出现更多的伪影和细节模糊。反之同理。
如图所示,high和low都有相应的量化版模型,T2V亦如此。
二、模型能力
1.Wan2.2 相较于 Wan2.1 的提升是全方位且具有压倒性优势的,这源于其在训练数据、模型架构和核心算法上的根本性改进。
2.首先,在
训练数据
层面,Wan2.2 的训练集规模远超前代,图像数据量增加了
65.6%
,视频数据量更是增加了
83.2%
。更重要的是,数据集中引入了包含
光照、构图、对比度、色调
等详细标签的
电影级美学数据
。这使得 Wan2.2 能够更深刻地理解和执行“电影感”、“黄金时刻光照”、“柔和的窗光”等描述性、艺术性的提示词,而不再像 Wan2.1 那样更依赖于技术参数式的指令 。
3.尤其,在
运动控制与物理真实感
方面,Wan2.2 展现了巨大的进步。对于
相机运动
,它成功克服了 Wan2.1 的一些顽固缺陷。比如:Wan2.1能
近(dolly-in)
不能
远(dolly-out)
。而而 Wan2.2 则能稳定地执行拉远镜头。同样,
“tilt”(倾斜)
和
“camera roll”(相机横滚)
等在 Wan2.1 中难以实现的复杂运镜,在 Wan2.2 中也得到了极大的改善,尽管
“whip pan”(快速摇摄)
等极端运镜仍有挑战,但其生成效果已今非昔比。
4.再者,在
语义理解与细节表现
上,官方和社区的对比测试均显示,Wan2.2 对复杂提示词的遵循度更高。例如,在人物生成方面,角色的面部表情更生动、细节更逼真。
4.1提示词的核心公式
4.1.1:主体 + 场景 + 运动
- 示例:一只大橘猫在草地上奔跑
进阶公式
4.1.2:提⽰词 = 主体(主体描述)+ 场景(场景描述)+ 运动(运动描述)+ 美学控制 +
风格化
- 午后阳光下,一只橘白相间的虎斑猫在蒲公英草甸上奔跑,蓬松的尾巴高高扬起,带起细碎的光尘。逆光勾勒出它圆润的轮廓,爪垫踏过之处,草叶轻轻摇曳,泛起金色的光晕。
提示词+运镜
(低角度跟拍)午后阳光下,一只橘白相间的虎斑猫在蒲公英草甸上奔跑,(切逆光特写)蓬松的尾巴高高扬起,带起细碎的光尘。逆光勾勒出它圆润的轮廓,爪垫踏过之处,草叶轻轻摇曳,泛起金色的光晕。
三、影视美学控制
1.光源类型(由于GIF较为卡顿、掉帧,真正的视频效果比较丝滑,下方统一把“光源类型”的案例做成一个视频)
Current Time 0:00
/
Duration Time 0:00
Progress: NaN%
Playback Rate
1.00x
- 日光
清晨的阿尔卑斯山草甸,强烈的日光穿透薄雾,在沾满露水的蜘蛛网上投下无数微小的彩虹光斑,
一头孤零零的羱羊正在安静地吃草。
- 人工光
雨夜,一家24小时营业的洗衣店内,一排滚筒洗衣机发出单调的轰鸣,
惨白而均匀的顶灯照亮一个独自等待的男人,他的脸上映着手机屏幕的冷光。
- 月光
一位少女在屋顶铺着蓝灰色屋瓦的古宅上仰望星空,穿着白色连身睡衣,
头发微卷自然披落。夜风轻拂,月光从她侧脸投下银色光带,背景中远山轮廓模糊,如同一幅静止的水墨画。
- 油灯光
镜头静止在一间暗室中,一位老年科学家独自点亮桌上的煤油灯,
火苗跳动,映出他戴着老花镜的脸部轮廓。背景几乎全黑,
仅剩一些仪器和管线在低光下显现轮廓,灯光将他与过去的时代一起定格在岁月中。
- 火光
一家三口围坐在户外营火旁,父亲正翻动烤架上的食物,
小女孩坐在毯子上用火柴点燃一小支仙女棒,母亲递过饮料。
火光在他们脸上闪烁,森林远处透着朦胧的树影与星点,呈现温馨、真实与野趣兼备的氛围。
- 荧光
镜头缓缓拉近一位穿着防护服的科学家走进实验仓,
蓝绿色的液晶屏与灯管反射在她面罩上。
她双手缓慢调整数据面板,背景的玻璃门泛着微光,
整个空间光线冷静而理性,充满未来实验室的冷感与控制感。
- 阴天光
苏格兰高地,阴云密布,柔和而均匀的漫射光笼罩着古老的石砌城堡废墟,
苔藓的绿色和岩石的灰色在没有阴影的光线下显得格外饱和。
- 混合光
雨夜的东京街头,一个拉面摊位的蒸汽在橙色白炽灯下升腾,
映照着食客疲惫而满足的脸庞,地面湿滑的柏油路反射着霓虹灯的斑斓色彩。
- 霓虹灯光
雨夜的东京街头,一个拉面摊位的蒸汽在橙色白炽灯下升腾
映照着食客疲惫而满足的脸庞,地面湿滑的柏油路反射着霓虹灯的斑斓色彩。
- 柔光
清晨,一位芭蕾舞者在洒满柔光的练功房里舒展身体,
巨大的落地窗被白纱帘遮挡
光线变得轻盈而弥散,勾勒出她优雅的肌肉线条。
- 日出
喜马拉雅山脉的日出,第一缕阳光越过世界之巅,将珠穆朗玛峰的峰顶染成
“日照金山”的奇景,金色的光芒逐渐向下蔓延,唤醒沉睡的群山。
- 日落
非洲大草原的日落时分,一棵巨大的金合欢树和一队长颈鹿的黑色剪影
映衬在橙色、红色和紫色交织的壮丽晚霞天空下。
- 背光
正午时分的墨西哥沙漠,一个牛仔的轮廓被头顶的烈日
切割出清晰而深刻的阴影,他帽檐下的脸半明半暗,眼神坚毅。
- 轮廓光
一对情侣在山顶拥吻,落日恰好在他们身后,金色的光芒为他们的
身体勾勒出一圈耀眼的轮廓光,他们的面容和表情则融入浪漫的剪影之中。
- 边缘光
一位僧侣在寺庙的暗室中冥想,背后唯一的烛光在他的黑色僧袍边缘
勾勒出一条纤细而明亮的金线,将他与黑暗的环境分离开来。
光的种类不止于此,但是从筛选了一些进行测试的效果来看,确实是比前者进步的很多,同时加入的电影画面质感也确实生效了!
2.镜头
- 特写
一位老人布满皱纹的眼睛的特写,瞳孔中倒映着窗外的烛火,
眼神中流露出智慧、沧桑和一丝不易察觉的悲伤。
- 近景
一位爵士乐手在烟雾缭绕的俱乐部里吹奏萨克斯,镜头捕捉到他上半身和乐器
他闭着眼睛,身体随着音乐轻轻摇摆,完全沉浸其中。
- 中景
一位宇航员站在火星的红色沙漠上,从头到膝盖的景别,展示了她宇航服的完整细节
以及她与这片陌生土地的互动,背景是广阔而荒凉的火星地貌。
- 广角
巴西里约热内卢的狂欢节,广角镜头从高处俯瞰,将整个街道上拥挤的人潮
华丽的花车和漫天飞舞的彩带尽收眼底,场面宏大而热烈。
- 中心构图
一棵孤独的、千年古树屹立在广袤平原的正中央,树冠巨大,
枝干遒劲,顶天立地,给人以稳定、庄严和永恒之感。
- 平衡构图
画面左侧是一座古老的灯塔,右侧是海面上的一艘归航的渔船
两者在视觉重量上形成巧妙的平衡,营造出一种和谐、宁静的氛围。
- 左侧构图
一个小女孩站在画面最左侧,背着书包望向右侧广阔的
空无一人的街道,大面积的留白暗示了她内心的孤独或对未来的期盼。
- 对称构图
印度泰姬陵在前方水池中的完美倒影,建筑与倒影形成了
严格的上下对称,展现出极致的和谐、秩序和建筑之美。
- 短边构图
采用竖屏构图,拍摄纽约高耸的摩天大楼,强调其垂直感和压迫感
一辆黄色的出租车从下方街道驶过,形成动态对比。
- 中焦距
街头人像摄影,使用50mm镜头拍摄一位坐在咖啡馆窗边的女士
背景被适度虚化,人物面部细节清晰,视角自然,仿佛观者就坐在她对面。
- 过肩镜头
镜头越过一位父亲的肩膀,拍摄他正在教儿子骑自行车的场景
观众能看到孩子专注而略带紧张的表情,代入感极强。
- 长焦
在非洲野生动物保护区,使用长焦镜头拍摄远处正在喝水的一头狮子
镜头压缩了空间,使得背景中的山脉看起来离狮子很近,主体突出,充满张力。
- 高角度机位
从高处俯拍一个正在迷宫中行走的男人,高角度的机位使
他显得渺小而无助,强调了环境的压迫感和人物的困境。
- 航拍
无人机航拍马尔代夫的环礁,从高空展现了清澈碧绿的海水
白色的沙滩和水上小屋组成的完美心形图案,景象壮观。
色彩情绪和动作风格
Current Time 0:00
/
Duration Time 0:00
Progress: NaN%
Playback Rate
1.00x
- 暖色调
一个意大利家庭正在准备圣诞晚餐,厨房里充满了烤火鸡的金色、番茄酱的红色和烛光的橙色,整个画面洋溢着温暖、幸福和节日的氛围。
- 冷色调
一位黑客在深夜的地下室里工作,多块显示器屏幕发出蓝绿色的幽光,映照在他脸上,整个空间被蓝色、青色和黑色的冷色调主导,充满科技感和神秘感。
- 高饱和度
印度洒红节,人们互相投掷五颜六色的粉末,空气中充满了高饱和度的品红、亮黄、宝蓝和翠绿,画面色彩鲜艳夺目,充满了生命力和欢乐。
- 低饱和度
一部描绘世界末日后的电影场景,幸存者走在废弃的城市里,所有颜色都褪去了,只剩下不同层次的灰色、棕色和暗绿色,营造出一种压抑、绝望的末世感。
- 跑步
一位马拉松选手在比赛的最后冲刺阶段,汗水从他紧绷的脸颊滑落,他咬紧牙关,双臂有力地摆动,超越了前方的对手。
- 滑滑板
在一个废弃的泳池(pool skating)里,一个滑手沿着弧形的池壁高速滑行,在顶端完成一个漂亮的空中抓板动作(Indy Grab)后平稳落地。
- 踢足球
世界杯决赛的最后一分钟,一名前锋在禁区外接到传球,以一记势大力沉的倒挂金钩将球射入球门死角,球网剧烈地颤动。
- 滑雪
在陡峭的雪山上,一位自由式滑雪者从巨大的跳台上一跃而起,在空中完成了720度转体并稳稳地落在松软的粉雪中,激起一片雪雾。
- 打篮球
在洛克公园的街头篮球赛上,一名球员运球晃过防守者,高高跃起,完成了一记战斧式扣篮,篮筐在剧烈地摇晃。
- 愤怒
一位公司高管在会议室里,因项目失败而暴怒,他一拳砸在会议桌上,桌上的文件和水杯被震得跳了起来,他的脸因愤怒而涨红,青筋暴露。
- 恐惧
一个小男孩在黑暗的森林里迷了路,他紧紧抱着一个玩具熊,惊恐地环顾四周,风吹过树林发出呜咽的声音,他的眼睛里噙满了泪水。
- 高兴
一位年轻的科学家在实验室里看到实验成功的读数,她激动地跳了起来,脸上绽放出灿烂的、发自内心的笑容,她挥舞着拳头,难以抑制自己的喜悦。
- 惊讶
一个女孩在自己的生日派对上,朋友们突然从藏身之处跳出来,她惊讶地捂住了嘴,双眼睁得大大的,脸上充满了难以置信和感动的表情。
- 镜头平移
在一个宏大的图书馆里,镜头从全景开始,缓缓地、平稳地向一位正在书架间寻找书籍的学者推进,最终停留在她手中一本古老书籍的特写上。
- 镜头拉远
一个人孤独地站在悬崖边,镜头从他的近景开始,平滑地向后拉远,将他和他脚下壮丽但险峻的峡谷一同展现出来,凸显出人类的渺小和自然的宏伟。
- 镜头向左移动
在一个繁忙的集市,镜头横向向左移动,扫过一排排挂满了香料、丝绸和手工艺品的摊位,捕捉集市的生机与活力。
- 镜头上摇
镜头从一位游客的脚开始,他正站在一座巨大的哥特式教堂前,然后镜头缓缓向上摇,展现教堂复杂的雕刻、高耸的尖塔,直至最终指向天空。
- 手持镜头
在一个战地场景中,摄影师跟随着一队士兵在废墟中穿行,手持镜头的晃动和不规则的运镜,为观众带来了强烈的现场感和紧张感。
- 镜头推进
镜头一边向前推进(Dolly In),一边向上升起(Crane Up),跟随一位攀岩者登上一座陡峭的岩壁,最终越过他,展现出山顶壮丽的景色。
- 跟随镜头
镜头从背后紧紧跟随一位女特工在拥挤的摩洛哥市场中穿行,她灵活地避开人群和障碍物,营造出一种紧张的追逐感和沉浸式体验。
- 环绕运镜
在一场浪漫的舞会中,男女主角在舞池中央翩翩起舞,镜头以他们为中心,进行360度环绕拍摄,背景中其他宾客和华丽的吊灯都化为旋转的光影。
- 毛毡风格
一个由毛毡制成的小熊宇航员,孤独地坐在同样是毛毡质感的月球表面,仰望着一颗用黄色毛线球做成的地球,场景温暖而又带有一丝忧伤。
- 3D卡通
皮克斯风格,一个表情夸张、戴着厚厚眼镜的小发明家,在他乱糟糟的车库实验室里,被自己制造的一个笨拙可爱的机器人追着跑。
- 像素风格
16-bit像素艺术风格,一位像素化的骑士骑着马,穿过一片像素化的魔法森林,背景是滚动的像素云朵和一轮巨大的像素月亮。
- 木偶动画
蒂姆·伯顿风格的木偶动画,一个瘦长的、关节明显的稻草人,在阴森的南瓜田里,笨拙地学习跳华尔兹,动作略带僵硬和诡异的美感。
- 3D游戏
虚幻引擎5渲染的开放世界游戏场景,一位身穿高科技盔甲的战士,站在一座悬浮在空中的古代神庙遗迹上,远方是壮丽的瀑布和奇幻的植物。
- 粘土风格
阿德曼工作室风格的黏土动画,一只穿着雨衣、戴着帽子的企鹅,在黏土制成的暴风雨中,努力地撑着一把小小的、被风吹得变形的黏土雨伞。
- 二次元
新海诚风格,东京的雨后街道,电车驶过,溅起的水花在阳光下闪闪发光,穿着校服的少年和少女在铁道口擦肩而过,空气中充满了细腻的光影和情感。
- 宫崎骏风格
吉卜力工作室背景画风格,夏日的乡间小路,一个孩子追逐着蝴蝶,跑过一片被水彩渲染得绿意盎然的稻田,远处的山峦在湿润的空气中呈现出柔和的蓝色。
- 黑白动画
早期迪士尼或“杯子头”风格的黑白橡胶管动画,一个戴着礼帽、会跳踢踏舞的骷髅,在墓地里用自己的肋骨当木琴,进行着一场欢快而荒诞的表演。
- 移轴镜头
从高楼顶端使用移轴镜头拍摄的城市十字路口,真实的汽车和行人都变成了微缩模型玩具,快速移动,仿佛一个繁忙的、小人国般的沙盘世界。
- 延时摄影
从白天到黑夜,对一座正在建设中的摩天大楼进行延时拍摄,云朵在天空中快速流转,太阳和月亮交替升落,建筑的钢筋骨架在光影变幻中一层层向上生长。
效果确实是有了“质”的提升!
三、实战
在要实现符合自己意愿的AI视频的时候,几乎只能依托于图生视频来实现,也就是先进行文生图→图生视频。如果一味地文生视频,是很难抽到如愿的效果的。
我让AI生成一个小剧本,跟着输出简单做一个小视频,体验Wan2.2(说明一下:非商业,仅仅从AI处获取“脚本”体验Wan2.2)
在这次的体验下能感觉到,在对于运镜跟表情这块的表达,确实有了很大的进步。
由欢乐到疑惑
由严肃→疑惑→惊喜→开心
由疑惑→好奇→紧张→挤眉弄眼
丝滑运镜
总是来说,只要花足够的心思,效果还是有惊喜出现的
写在最后
从AI天马行空地写出第一版脚本,到我的修改,最后剪完这段小Demo,不知不觉就熬过了三个下午。过程嘛,也确实出现跟AI斗智斗勇的血泪史。
说实话,这个小作品还有点粗糙,但它真真切切地让我感受到了AI圈现在的“疯狂”:每天醒来都感觉像是错过了一个世纪,各种神仙工具井喷式地出现,效果一个比一个惊艳,但也是一场创造力的狂欢!
感谢看到这里,点个关注吧!
54
Report
声明
51
Share
相关推荐
in to comment
Add emoji
喜欢TA的作品吗?喜欢就快来夸夸TA吧!
You may like
相关收藏夹
Log in
54Log in and synchronize recommended records
51Log in and add to My Favorites
评论Log in and comment your thoughts
分享Share
















































































































































































