大家好久不见,前段时间答应大家的教程,并没有忘记。只是抽空去做了几个AI项目,加上年底部门事情多耽误了一下。
也就在这耽误的日子里,收到很多同学的问题,比如啤酒瓶角度控不住:
像啤酒这个我当时在朋友圈也发了教程,用我这个提示词,包你大概率能一次出来~
如果不会写,也可以如下图所示,接一个提示词优化节点,参考下ai给我们润色后的写法。
其实,
上面这3个看似完全不相干的例子,实则背后暴露了ai跑图的同一个问题
,哪怕是用当下最强的nano pro模型来跑,也同样有这个问题。
之所以有这种情况,用易于理解的话来说就是:
提示词污染
。也就是nano pro在处理信息的时候被“
脏东西
”给污染了!
那今天就教大家,如何从底层逻辑去解决问题,学会举一反三应~
由于考虑到很多同学未曾修习"飞行魔法",因此咱们今天的所有操作,均使用
工具入口:www.zcool.com.cn/ai/workspace
我们来挨个分析这3个案例的受害者,它们都是输入了什么提示词导致出不了效果。
那不禁要问的同学就不禁要问了,这里所说的图1和图2,到底谁是谁?
AI真能懂图片序号吗?
其实除GPT,以及接口输入时有明确指向功能的ai外,其他大多数ai,如nano一类,都是不太懂什么是图1、什么是图2的。
因为这类ai工具,仅是把图片作为一个附件,并未给这个附件添加序号。
因此,为保守起见,我们务必对图1和图2,加上其特征描述。
比如,把描述:“
图1
” → 改成:“
图1中的蓝色啤酒瓶
”。这样ai就知道你说的是蓝色这个啤酒瓶,这才是令ai起到识别作用的关键。
把xx
变成
xx,把xx
调整成
xx。这一类型的写法,都是在原有基础上进行调整的指令,那就势必会被原有信息给影响。
简单的图还好,一旦复杂了,或者需求情况很极端,那效果就会大打折扣。
比如我们来看
【烤盘受害者】
,跑出的烤盘和产品完全不像:
像这个案例,控制难度相比啤酒更高了,因为它的污染更严重。我直接说答案:
污染1:
两者都是烤盘,只是手柄和盘底的结构不一样,结构不同的地方占整体画面的视觉比例很小。这就会导致ai容易忽略细节,“偷懒”直接参考原图烤盘特征,导致错误结果大幅提升。
污染2:
原烤盘底部是带波浪纹理的,且被食材覆盖了大部分,外加底部的木托盘也是波浪纹理,这几个因素一结合,就又把ai带沟里去了。
因此,在这种污染信息比较多的情况下,我们最稳妥的办法就是
把污染源给屏蔽掉
。
屏蔽的方式有很多,最常见的一个是涂鸦,只需直接把受影响的区域给它涂抹覆盖掉即可!
屏蔽后,ai没有了影响其跑图的反向因素,因此在这种情况下就容易出图了:
新的问题又来了,假如整张图都是污染源呢?那我涂个鸡毛?接下来邀请【动漫受害者】。
这位受害者,是想把一张3D动漫渲染成超写实的真人风格海报,是那种一看就是真人饰演的,且装扮容貌又得和动漫里的高度相像。
然后我们就会发现,ai确实在很努力的把原图刻画成真人模糊,皮肤等细节真实了许多,但还是一眼3D感。一种怎么都没有摆脱3D感的味儿~
这正是原图一整张都是污染源的情况。那这种时候,我们就可以使用借尸还魂手法了~
我们
不再让ai去把原图改成新图,而是让ai重新生成一张新图
,但这张新图又必须参考原图的部分我们需要的信息来生成。只取需要的,避免干扰的。
这样思路一转,抽出真人的概率大幅提高,我们看看细节效果:
由于避免了原图中3D风格的干扰,ai就能更好的生成真实人物照片。
以此类推,我又跑了一些你们爱看的动漫角色,都是用的上面这套方法:
因为是照着参考,所以也偶尔会出现内容修改的地方,如果想要完全的一致,我们可以补充关键词词配合抽卡获得。
这套思路吃透底层逻辑,非常适合举一反三,能解决工作中遇到的很多问题。
好啦~ 今天的分享就到这里,希望这篇教程能给大家带来些启发!也希望大家能多多转发,
只有点赞/转发量达标
,老板才允许我继续往外说,因为这些都是课程内的知识点。
目前手上还积压了最近整理的2篇教程,也会陆续更出来,大家记得点点关注不迷路哦~
(前几篇也都是干活教程,没看的同学们可以看看哦~)