图片批量生视频,终于解决了!2.3模型+Agent王炸登场
杭州/平面设计师/195天前/10395浏览
版权
图片批量生视频,终于解决了!2.3模型+Agent王炸登场
前言
上个月刚带大家体验过海螺2.0首尾帧,时隔一月
海螺带着它的2.3和Agent...又双叒叕来了
来看看这波 “偷摸更新”的功能,到底更新了啥?
ok,接下来我将详细讲解下2.3模型以及Agent板块
PART 01
海螺2.3模型,进化了多少?
聊到海螺,大家的第一印象是不是还停留在 “打斗牛皮”、“运镜很秀”?
这回,我要“不务正业”一点哈哈哈
今天我将用五花八门的风格来盘一盘2.3模型
OK,闲聊结束,直接上实测 ↓
1)AI特效与“变身”
因为想看看2.3到底优化了些什么
我拿2.0、2.3模型用同图同提示词都跑了一遍。。
提示词:人物变成一团火然后消失
对比感受:
可以看到2.0运镜是不错
但是2.3的语意遵循能力更强
2.3理解了我所说的变成一团火并消失!
另外生成速度上2.3-fast模式下更快
再来一组 ↓
提示词:人像头部的粒子开始解体,像发光的灰烬一样飘散,完全消散。
这组的“消失感”各有千秋,你更喜欢哪个的消失感~
摸索下来,万能公式:“某物” 变成 “某物”
来吧,接着整活
更多创意 ↓
提示词:人物变成成一团蓝色雾然后消失
提示词:人物变成风沙消散
ok, 换种风格再来试试,变化的同时加入情绪
提示词:人物越画越生气,然后变成气球爆炸飞走
甚至可以更脑洞大开一点
当模型接到“变成黄金”的指令时,它不仅是改变颜色
而是在模拟光线如何在金属表面反射和折射,酷~
提示词:从上面掉下来两片黄金,女人变成黄金材质
这种“万物皆可变”的能力,可玩性还是挺高的~
大家可以自行。。。脑洞大开一下哈哈
提示词:女人变成一只章鱼,墙面的眼睛看着女人
这些案例共同揭示了一个深层逻辑:
2.3模型在变形效果上的巨大进步,并非简单的视觉滤镜或贴图替换
它的背后,是模型对语言和物理属性更深、更细致的理解!!
2)广告效果
AI视频迟早是要“进厂打工”的哈哈
所以让我们将目光转向商业应用
提示词:从一个展示完整构图的广角镜头开始,焦点转移,使瓶子失焦,转而清晰地对焦于前景的浮木。接着平滑移动的极端特写镜头,分别掠过浮木的粗糙纹理、香水瓶光滑的玻璃侧面,展示香水。
接下来这个提示词并非简单的画面描述,而是一连串专业的摄影指令
包括“广角镜头”、“焦点转移”、“极端特写”和“平滑移动”
对比2.0和2.3的输出,可以发现2.3在执行这些复杂运镜指令时更加精准
无论是焦点切换的平滑度,还是产品在运动中的稳定性,都表现出了商业广告级别的质感 ↓
再来试试商业摄影中常见的高速慢动作和食物特写
需要精确的物理模拟(重力、液体粘度)
对多种材质的逼真光影处理,以及始终保持高端、纯净的视觉美学
来看看表现的怎么样~
提示词:慢动作展示一个三明治的组装过程。在一个明亮的纯橙色工作室背景前,面包、生菜、奶酪片、西红柿片和粉色的花瓣在空中优雅地漂浮并缓慢下落组合在一起。商业广告摄影风格,色彩饱和度高,光线明亮,有清晰的阴影。
提示词:一段商业广告风格的3D动画,超级慢动作。在一个高饱和度的纯红色背景前,一杯水果酸奶(或冰淇淋)猛烈地向上飞溅。奶油形成一个凝固在空中的皇冠形状,大量的香蕉片和芒果块随着飞溅物一起被抛向空中。高速摄影美学。
3)物理、液体测试
视频AI容不容易“翻车”,很大程度看它对物理世界的理解
注意看花朵撑开时,塑料袋那种特有的“撕扯感”
提示词:镜头从一个中景开始,对准一个装满粉色和白色花束的透明塑料袋,花朵生成撑破塑料袋,变成一个布满锋利白色牙齿的花朵张嘴吃掉屏幕面前
细菌到海浪的转场
提示词:彩色的细菌变成退潮的海浪,光线迅速褪去,最后完全消失。
从“惊讶”到“悲伤”的表情变化,加上逼真的液体滴落感
提示词:一个白色幽灵形状的冰淇淋甜筒,背景是纯正的红色。 它开始迅速融化,幽灵惊讶的‘O’型嘴表情,随着融化逐渐变成了悲伤、下垂的表情。 融化的冰淇淋(液体)质感非常逼真,在底座上向四周飞溅开来,液滴四溅。
4)情绪变化、光线处理
来到我个人最惊喜的部分 !!
技术上的完美固然重要,但能否捕捉到真实的人类情感
才是AI从一个工具蜕变为一个真正的叙事伙伴的分水岭
以前很多AI视频,怎么说呢,就是“能演,但当不了影帝”哈哈。。
表情总是有点僵,有点“AI味”
但2.3这次,在人物的细节和情绪处理上
都呈现出一种微妙的真实感 ↓
提示词:女人抬眸的瞬间开心的微笑,镜头拉远
既然能处理情绪,我们再试试在画面里“加戏”
提示词:女人开心的微笑,镜头推近,屏幕变黑出现Hailuo AI的字样
可以看出,2.3模型在这种复杂场景的调度能力,确实强了不少
5)运动
同时运动和运镜,算是海螺的“传统强项”了
这部分我们来点高难度的
我给了一个比较不常见的风格,然后测试了多人跳舞+人物遮挡的场景
看看它接不接得住
提示词:4个人跳舞
随后,我又加入了一个戏剧性的镜头反转
这同时考验了模型的舞蹈动作生成和镜头叙事能力
提示词:一个穿着闪亮青色套装的女人在广阔的橙色沙漠中快乐地独舞,天空是青色的。突然镜头切换到她的背后,揭示她正面对着沙漠中成百上千的密集人群。高饱和度,橙色与青色对比。
OK,继续
我又故意给了张人物不全,且姿势奇怪的首帧参考图
看它怎么“圆”回来哈哈
哈哈,不得不说,它处理得还挺巧妙
没有崩溃或生成不合逻辑的动作 !
提示词:1970年代复古放克美学,一个男人正在跳舞,旋转拍摄
不仅是跳舞,极限运动也处理得不错
看看这个摔倒的真实感,浪花拍打的瞬间 ↓
提示词:从背后跟拍镜头,一个男人骑着自行车往前开,突然海水拍打着沙滩,连人带着自行车摔倒在海里,浪花拍打着屏幕
刺激感拉满
提示词:镜头极低,紧密跟随,充满了快速的摇摄和旋转。车手在急转弯时漂移,扬起大量灰尘。画面有强烈的运动模糊和径向模糊效果,天空是清澈的蓝色,充满速度感。
这些场景考验了模型对运动模糊、镜头抖动
粒子效果以及撞击物理的综合处理能力
6)以言为笔,织梦成影
前面图生视频测了不少
接下来让我们看看纯粹的文生视频效果如何
在没有图片的情况下,凭文字,从零开始构建一个完整的世界、角色和叙事~
提示词:一座被云海环绕的古老石塔静立于天地之间。塔顶之上,一只手高举着燃烧的黄纸符咒,符纸在风中颤动,边缘被火焰吞噬。随着符咒燃尽,火焰化为一团旋转上升的金色火星,宛如灵力在空气中流动。无数金色余烬在夜空中汇聚、翻涌、重塑,最终凝聚成一只沐浴在炽烈魔法光芒中的金色凤凰,振翅而起,照亮云海与群山。
我给的这个提示词本质上是一个多个阶段的微型剧本:
场景设定(古塔云海)、核心物件(燃烧的符咒)、动作序列(燃烧化为火星)、高潮(火星成凤凰)
接下来这个提示词的指令更为复杂和具体
它融合了场景(剧院)、人物(弹琴女子)、特效(彩虹光丝)、变形(光丝编织成孔雀)、背景切换(剧院消散为迷雾)和最终动作(孔雀开屏)
提示词:从一个聚光灯下的古典剧院舞台开始,一位身穿复古长裙的女子正在弹奏一架华丽的竖琴,琴弦正散发着流动的、明亮的彩虹色光芒。随着镜头推进(或音乐达到高潮),彩虹琴弦的线条开始振动、模糊并‘射’出,化作万千道彩色的光丝。光丝在空中飞舞、重组,逐渐编织成一只金蓝色孔雀的形态。剧院的背景在光芒中悄然消散,取而代之的是一片金色、梦幻的迷雾。这只孔雀在迷雾中缓缓转身,骄傲地展开它巨大的尾羽,最终‘开屏’。金色的羽毛闪烁着无数魔法光点,一道完整的彩虹在它身后显现。
测到这里,大家有没有发现一个点?
我写的提示词都非常精简,很多时候就是一句话描述
但海螺2.3“想象力”强,帮我补完了很多画面细节
这点对于我们这种“懒人”博主(bushi)来说,还是挺友好的哈哈哈
PART 02
Media Agent
如果说2.3模型是“引擎”,Media Agent就是“智能驾驶舱”
它很灵活:你既可以
单独
让它生成图片、声音(语音/音乐)、或视频
也可以让它当“总导演”,把这些
组合
起来,一站式搞定。
因为最近频繁的看到有小伙伴在说:
如果能把图片批量生成视频就好了
所以我在看到Agent更新的第一时间就去试验了一下:
我先上传了3张图片,对话要求让其直接生成视频
以下是没写视频提示词,直接跑出来的视频 ↓
我看了一下,他背后就是海螺自身的模型
试了3个视频后,感觉效果还不错
所以我直接丢了48张图给海螺Agent
并发出了疑问 ↓
所以说理论上图片批量生成视频解决了!!
非常适合批量做宣传片的空镜
当然,不止可以批量生成视频,我总结了下这次更新的亮点 ↓
① 工作流程被简化到了极致:
用户只需输入一段想要表达的内容描述,系统便会自动完成后续的所有工作
② 专业创作者的画布:
可以“自由上传图片、视频和音频素材”
ok,让我们来看看一键成片的效果 ↓
我的指令:用简单的动画和图标解释“碳中和”的概念。从工厂排放、树木吸收,讲到新能源和我们的日常生活。色调以蓝、绿为主,显得干净专业。配音要清晰、有说服力,背景音乐用沉稳大气的纯音乐。结尾呼吁环保行动。
同时可以分开输出,这样方便我们调整 ↓
另外给配音让生成画面和视频也是可以的
理论上这岂不是,可以aimv了
所以,看到这,你觉得我说清楚2.3和海螺新Agent了嘛~
最后
OK,总的来说
一个负责“跑得猛”,一个负责“开得稳”
我们离“全自动智能驾驶”的AI创作又近了一步
期待你们也玩出花来,下期见~
122
举报
声明
96
分享
相关推荐
评论你的想法~
表情
喜欢TA的作品吗?喜欢就快来夸夸TA吧!
你可能喜欢
相关收藏夹
登录注册
99+登录即可同步推荐记录哦
96登录即可加入我的收藏
评论登录即可评论想法
分享分享



















































































































