WHEE是美图出品的一套AI创作工具,具备了常用的文生图、图生图、模型训练、AI改图、AI扩图等功能。它有一个简单易用同时功能强大的在线网页版,也有iOS和Android的APP版。
作为实验电子异术家,挑战工具边界是我一贯的恶趣味,没想到用WHEE轻松做出了一组二维码芯片效果。
文生图默认是“快捷创作”模式,在这里可以输入提示词、选择风格模型、设定画面比例大小和生成的张数。
在提示词里直接输入中文即可,本例不需要负提示词(即“不希望呈现的内容”)。
在大模型越发强大的现在,提示词不需要纠结所谓魔法,输入一些要想内容的关键词即可,更不需要背诵咒语。
更何况WHEE在提示词这里还提供了“智能联想”和“词库”。
例如打开“词库”,实际上就是一个Prompt Generator(提示词生成器)。
如果你有Stable Diffusion使用经验,第一个“模型”,实际上就是通用模型或微调(Fine Tune)过的大模型(几个G的那种)。
第二个“风格模型”,就是LoRA了。在这里可以添加多个风格模型。
本例只使用了一个LoRA:赛博城市,我想让生成的效果看起来科技感更足一些。但实际上这个LoRA,对我要的效果影响并不大。作为教程,参数完整保留。
在参数设定部分,大部分相对灵活可调,对本例的结果影响不大。
经过反复测试,1024×1024虽然精度更高,但生成的图在扫码效果方面,不如512×512灵敏。
例如下面这张,1024×1024直出,排线都很清晰,可惜绝大部分时候扫码不成功。
其实这个就是ControlNet,WHEE提供了三组可以用。
然后在下面的ControlNet各功能模型中,选择“二维码融合”。
二维码ControlNet玩法是国内几位优秀的在校生(当时)首创,风靡全球。在Stable Diffusion里去做还是有一定调试难度的。
下面的权重参数留意一下,数值越高,生成的图越接近二维码,扫码成功率也越高。但如果想让二维码跟生成画面融合的更自然一些,这里可以尝试调低权重。
到这里其实就可以生成了,点击左下角的“立即生成”按钮,等待几分钟即可。
在“控制2”中,再加入同一张二维码图片,选择“深度估算”模式,可以让画面的凹凸感更强,从而产生更逼真的效果。
注意“控制2”的示例中,二维码图片我使用的是与“控制1”的图片同一张图但取了相反色,黑白反转,因为黑色和白色,在深度图中,分别代表两个方向,体现在效果图中就是“凹”和“凸”。
你也可以在“控制2”中仍然使用二维码的原图去尝试。
相反色效果可以在Photoshop等软件中使用“负片”模式。
生成图像的效果创意度,与二维码扫码成功率,往往成反比,建议多次尝试,取得满意结果。