AI时代的AIGC产品使用体验
成都/UX设计师/149天前/5050浏览
版权
AI时代的AIGC产品使用体验
从2023年开始AIGC大爆发, 从Midjourney、达芬奇到Stable Diffusion, 再到即梦、ChatGPT、Liblib、Banana等, AIGC的发展越发的完善,各种产品层出不穷。作为一个体验设计师出于专业需求和兴趣爱好,在使用之后有一些自己的思考,希望与大家分享。
如果要说AI出图完全取代人类, 那么需要考虑是哪一类图纸。最初我也不相信AI出图能够完全取代人类,作为设计师,对于创意和图纸质量的要求,如何通过文字训练让AI精准生成自己的想法。我曾经是一个景观设计师,需要大量出图,且建模、修图是一个繁杂的过程,但这也是一个思考的过程。在stable diffusion问世后,不得不承认AIGC时代的到来,精准的控制和fancy的效果。
就体验过的几款工具来一个总结
简单结论:
v1.0
非专业人士
:Mid-Journey,即梦,Nano Banana,ChatGPT 创意出图相对容易
v2.0
路人友好
:Mid-Journey、即梦的创意度相对高,能够提供更多支持
v3.0
专业大师级
:Stable Diffusion,Liblib 对图片的细节要求高、需要对内容精准控制
深度剖析:
Mid-Journey {会反推提示词的社区小能手}
这是一款轻量化的产品,团队最初是把应用放在Discord上作为plugin使用,这对于GenZ一代来说非常友好,但是推广力度有限,毕竟不是所有人都会去用Discord。目前来说在2024年上线了官网版,但Discord的功能对新手更友好。个人以为,针对国内用户来说,Mid-Journey难的其实是Discord的操作和使用,而作为Mid-Journey本身的操作其实相对简单。
功能
这里要特别提一下,目前的AIGC出图产品中,只有Mid-Journey是提供反向提示词输出的,这一点有什么好处呢?就是对于新手小白来说,能够随意在网上找一张图片放进Mid-Journey,然后
bot会根据你的图片输出可能的提示词
,这样能够帮助新手快速学习和理解如何写提示词能够达到更加精准的控图效果。
Mid-Journey在操作步骤上相对简单,只需要用户选择模型,输入相应的描述即可,而难点在于对于新手来说是否了解各种艺术风格的流派形式和名称,以及自己想要创作和表达什么样的作品。
商业
另外Mid-Journey因为推出相对较早,所以有大量的AIGC图片平台作为下游,做图例展示。这也无形中帮助Mid-Journey建立了社区,虽然Discord自带社区,但是浏览便捷性和数量都有限。而社区机制能够很好的激发用户的潜在和持续使用,为产品增加创收。
即梦 {先有灵感,再动手}
即梦跟Mid-Journey比较类似,但即梦
自有网站
,界面和操作更符合大多数用户的mindset和习惯,对新手特别友好,且创意度俱佳。当用户进入即梦后,第一个看到的界面其实并非操作界面本身,而是社区图库,这个设计非常有趣。介于即梦的用户相对广泛,所以提供灵感图库,更加能够帮助普通用户或者说没有明确目标的用户寻找一些创意参考。同时,前面提到过,Mid-Journey为用户提供反向输出的提示词参考,而即梦其实也同样为用户提供prompt的参考,因为当你点开任何一张社区图片,都会看到提示词,并且可以勾选
“使用同款”
,这其实也是一种变相的为用户提供提示词。
同时以更加可视化的方式为用户提供参考,某种程度上替代了tutorial,让用户能够自主探索,在社区中自学
。
即梦的整体使用体验不错,但是要生成相对精准的图片,
需要不断调整提示词 + 大量刷图
。在这个过程中,笔者注意到另一个
有趣的细节
:每次输入prompt后,即梦会生成4张图,接着用户会点开查看,而如果用户对某张图片感兴趣,比如使用鼠标进行“下载”或者“放大”等操作,那么算法会自动记录用户的操作,并且被标记为“用户认可”,
再下一次的出图优化中,模型会自动优先对上一次标记有“用户认可”的图进行采样分析
。所以,即使用户对上一轮过程的结果并不感兴趣,只是单纯下载,那么即梦也会在下一轮的输出中模仿和偏向上一轮被默认标记图片,比如上一轮中用户下载的图片有一个杯子,但用户可能并不需要,而在后续优化中模型会自动在图片中添加杯子的图样,即使prompt中没有表达。
尽管即梦简单易操作,但在精准出图方面还需多轮优化,才能达到一个相对理想的效果
。这也引发了笔者的思考,即既然我们都使用AIGC工具来进行创作了,那么为何不接受AIGC的创意呢?其实这种偏差很多时候正是人类和AI的视角不同,而造就的最终图片内容有差异。
Agent模式
,是目前即梦主推的一个模式,跟Banana和GTP类似,但目前来说功能还不够齐全。与生图模式区别在于,Agent是通过对话形式与用户沟通,尝试理解用户的想法,并且过程中会显示Agent的思考过程。在用户缺乏灵感和创意的情况下也许有用,但对于设计师,或者有明确创意目标的用户来说在使用过程中更倾向于选择图片模式。
Stable Diffusion {精准的参数实验室}
相对来说,Stable Diffusion的出图非常精确,能够通过各种参数的调整精准控制到一根手指,但是要达到大师级别的出图水平,
学习曲线相对较高
,需要一定基础知识的学习以及理解。比如,了解什么是采样算法,什么样的图片适合什么样的采样器;又如,如何实现酷炫的效果,如何通过Control Net精准调整人物等关节和活动位置,也需要一定的知识储备。
Stable Diffusion的各种参数与设置,让整个界面变得复杂。这也是一众应用之中唯一把
“负向提示词”单独列出来作为输入项之一的
,因为相对来说某些情况下
SD的幻觉确实更大
,需要用户提供更多的prompt。
此外,SD还提供了不同风格的大模型(Checkpoint)和垂直匹配风格的小模型(Lora),user在操作时可以根据自己的图片需求进行选择,从而输出预期效果的图片。Checkpoint控制整体画风和效果,Lora更加精准控制具体的细节、材质、风格等。简单来说类似Mid-Joureny、即梦、Nano Banana、ChatGTP等
大多数AIGC产品更像是Stable Diffusion的傻瓜版本
,就如同美颜相机自带的滤镜,或者单反的Auto模式;而
SD则需要手动调试
,尽管麻烦但是效果能够更加贴合设计师的需求。
LiblibAI {全家桶工作流一站打包}
Liblib更像是一个集合,或者说
一个AIGC的工作平台
,既有类似即梦一般简便的出图框,也有SD的工作流,还提供在线的ComfyUI等。区别在于,Liblib让用户自己选模型,提供Seeddream,Banana,可灵等多种模型。
对于团队用户来说能够直接搭建工作流,相对更加方便
。就学习曲线来说,Liblib的庞大功能系统对于新手不如即梦友好,但是提供更多创作形式和内容。无论对于新手,还是专业设计师来说,都能够在Liblib平台获得很好的体验,其用户群体主要是有AIGC出图需求的人,用户画像的定义更加广泛。
首页设置
与即梦类似,LiblibAI也把社区放在首页,但是整体界面内容相对复杂,而不同于即梦把prompt输入框放置于最上方的页面主要位置,Liblib的首页生成器存在感极低,仅仅一个button大小,如果不仔细看很容易淹没在海量的图片中。这也是为什么Liblib更像一个工作平台,和即梦则是创作应用;
Liblib强调平台,而即梦强调创作
。当然,市场定位不同,界面和体验流程的设计也不同。
Nano Banana {文字友好型}
Banana本身只是Google的一个AIGC模型,在Gemini和很多平台都可以搭载使用。与前面几种产品不同,它和ChatGPT的图片生成功能类似,但是Banana对prompt有更好的理解。因为Banana和GPT都是基于LLM的一个function,所以在语义理解上会更加到位,其结果的精准度很好。
但是Banana创意度有限,图片生成的质量和美感度也非常有限,
对于设计师来说图片内容很难直接运用,但对于网络内容创作者来说,以此作为生产工具够用
。
ChatGPT {聊天顺带出图型}
ChatGPT的生成图片功能相较于其他的模型来说就稍显呆板,OpenAI更多的还是把重心放在LLM上,所以你会发现跟GPT聊天很开心,舒适,但是出图效果就需要多轮调整了。区别于即梦的模型是因为幻觉而进行调整,ChatGPT的图片更多的是缺乏创意度,而且会将prompt理解为比较具象的语义表达。
如果用户是有明确的参考图片或者形式和风格,那么ChatGPT就能很好的帮助用户进行创作。就这一点来说,GPT更像一个执行者,而Mid-Journey,即梦,Nano Banana,Liblib等产品中,用户能够明显感知AI模型作为主体的“思考意识”。因为其生成的图片内容、质量、风格等,除了高度符合用户的prompt描述,通常会有一定的元素添加,具备AI的自我理解意识。当然,这也会有幻觉存在,所以类似Mid-Journey,即梦这样的高创意度、低学习曲线产品的一个明显“副作用”是需要用户多轮测试。
那么各位AIGC的user们,你们觉得呢?是更喜欢精准控制出图,还是偏向于懒人型呢?欢迎在留言区讨论哦~
31
举报
声明
62
分享
相关推荐
评论你的想法~
表情
喜欢TA的作品吗?喜欢就快来夸夸TA吧!
你可能喜欢
相关收藏夹
登录注册
31登录即可同步推荐记录哦
62登录即可加入我的收藏
评论登录即可评论想法
分享分享















































































