一篇文章学会AI绘画——midjourney
一篇文章带你学会AI绘画——midjourney(第一集)
一、了解 AI 绘图
1、AI绘图发展背景:AI 绘画的整个发展史,总体而言有这样几个关键节点。
第一个节点::GAN 的时代
"旧纪元时期",彼时 Al 绘画的方案还是 GAN。GAN 这种方案就是训两个模型,一个造假,一个判真,两个模型相互卷,直到卷到造假的模型能造出"以假乱真”的图片时,就算练成了。但 GAN 有个致命缺陷叫做"鞍点问题",它造成"模型训练过程中,数据处理的难度很大",而且数据越复杂、越多样,难度就越大。这时的模型是很不稳定的,自然也不可能依托它形成什么商业模式。
第二个节点:一篇论文,带来新的范式
2020 年发布的开创性论文《Denoising Diffusion Probabilistic Models》,带来了一种新的图像生成范式。用这个方法生成出来的图片效果非常好,比 GAN 要好的多,而且不存在 GAN 的缺陷,由此,这种新范式突破了实用化的临界点。
第三个节点:优秀的开源模型出现
2022年8月份,Stable Diffusion 模型的开源给"Al 绘画的爆发"上了倒数第二块拼图,这个模型的生成图像效果丝毫不逊于DALL-E 系列,Midjourney 等商业模型,而且还有优良的开源社区支持。最重要的是,它在"大模型"家族里算是比较小巧的个人设备也可以完成推理过程。
第四个节点:爆发,二次元的破圈力
2022年 10 月份,基于 Stable Diffusion 但"二次元专精"”的 NovelAl 模型发布当天被黑客泄露事件,彻底引爆了 AI绘画,事件影响大大超过了绝大多数人的预期,AI 绘画作为大部分时间里一直默默无闻的新技术,被一瞬间推进到公众讨论阶段。
1.2 目前比较前沿的 AI绘画模型有哪些?
目前比较前沿的AI绘画模型主要有以下 5个,其中只有前 2个是开源的,国内大多数中文 AI 绘画应用都是基于这两个开源模型封装的。
Stable Diffusion (开源)
Disco Diffusion (开源)
Midjourney(未开源) ——今天主要讲这个
DALL-E-2 (未开源)
NovelAI (未开源)
—— 重点开始 ——
本篇从零起步,开始一步一步使用 Midjourney。
它的显著特点是使用过程更简单,出图更精致更绚丽,出图速度快,电脑、手机端都可以使用。真正的1分钟出图。在不加任何修饰语的情况下,Midjourney 也会随机生成非常好看的图片,操作界面也很友好。
Midjourney 是一个前端通过 discord 聊天软件进行外显交互的 A 绘图网站,因此在使用的过程中,会需要一个 discord 的账号。
二、学会用 Midjourney 完成 AI绘图
前期准备:
① 一个能使用的谷歌账号
② 可以访问外网
1、初次使用
1.登陆网站:www.midjourney.com
2.进入discord界面
如果之前没有注册过 discord 的账号,这里就会出现注册的界面,输入用户名,点继续,然后它会验证你是不是人类等,包括之后可能还会需要邮箱验证一下等等;(建议用谷歌邮箱)
如果注册好,或者之前就有discord账号,就会出现接受邀请按钮,点击接受会进入 discord 界面
3.进入discord界面后,左边频道栏就会出现一个小帆船图标,点一下:
如果此时没有出现小帆船图标,重复一下1、2步骤即可。
4.鼠标放在频道处,往下滑动滚轮:
5.找到“newbies -XX"频道,点击进入 (每个人的数字不一定相同):
6.在这里,你就可以看到别人出的图片以及别人出的描述词:
按钮 U::在对应图片的基础上细化,出一张大图
按钮 V::在对应图片的基础上再变化出4张新图
7.完成出图在聊天框打一个“/”字符,选择出现的 /imagine
接着就可以在这里输入描述词了:
比如输入“Portrait of a white rabbit dressed in Assassin's Creed style Charlie Bowater, no hood, symmetrical portrait, in Las Mills style, medium full lens, cinematic lighting, dark gray background, 4k, 8k, Unreal Engine, Octane render, high detail, super resolution”
打字结束后按回车,即可在聊天栏出图:
去聊天栏找你正在生成的图片:
会慢慢出4张图,大约1分钟左右出完:
加载到100%时,会在最新的聊天记录里出现,需要你回去找 (找不到就上下翻找):
实在找不到,就在搜索栏搜索:
这里,比如我们觉得第三张图更像我们想要的,点一下 U4 按钮即可。它会在第三张图的基础上细化,出大图
到这里,1分钟的时间,我们的图片就已经生成完毕。
此处,各个按钮的作用:
Make Variations:在此基础上再生成4张图
Light Upscale Redo:轻度重新生成 (微调)
Beta Upscale Redo:测试重新生成(较大调整)
2、再次使用
上述方法是初次使用的流程,对于再次使用的朋友们而言,直接到你的 discord 账户里找小帆船即可。后续操作同初次使用。
三、学习描述词(本期资源福利上百款描述词)
描述词是学习AI绘画中关键的一环,简单来说,就是学会与 AI 沟通的语言,让它听懂你的需求,描绘出你想要的画面。即会说话,就会画画;会改数字,就会改图。想要学好 AI 绘画,学习描述词就是必经之路
1、参考学习:优质描述词与对应图片
在学习描述词之前,先来看看优秀描述词的生成效果使用方式:找你最喜欢的 Al图,复制图对应的描述词,按照想要的效果更换词语。一步一步达到自己想要的。
图一:portrait of a white gorilla dressed in Assassin's Creed in the style of charlie bowater,without hood, symmetric portrait, in the style of Russ Mills,medium full shot, cinematic lighting, Dark gray background,4k, 8k, unreal engine, octane render,high detail, super resolution
图二:A matte painting of beautiful Huge cliff, China Palace,rainbow waterfall, water mist, soft light, crystal texture of clouds, fairy tales, dreams, Fluorescence, volume light,below the waterfall is a huge lake, blue water,by thomas kinkade and Tyler Edlin,trending on cgsociety,8k, Volumetric light
图三:Tenpeng Marshal Zhu Bajia, dressed in Charlie Bowater style Assassin's Creed, snake like face, no bandana, symmetrical portrait, in the style of Ra's Mills, medium full shot, cinematic lighting, dark gray background, 4k, 8k, Unreal Engine, Cinetin render, high detail, super resolution
图四:symmetric portrait of The Predator, snake-like by Stan Winston,dressed as an assassin from Assassin's Creed in the style of charlie bowater, in the style of Russ Mills, cinematic lighting, Dark gray background,4k, 8k, unreal engine, octane render,high detail, super resolution, aspect 9:16
图五:Portrait of a white rabbit dressed in Assassin's Creed style Charlie Bowater, no hood, symmetrical portrait, in Las Mills style, medium full lens, cinematic lighting, dark gray background, 4k, 8k, Unreal Engine, Octane render, high detail, super resolution
图六:manga art in the style of CLAMP, A Lovely Girl with Sun Umbrella Sitting Among Blossoming Trees, projecting intricate details, delicate line, romantic ambiance, and magical elements ar 16:9, 1080p, stylized and enchanting
图七:The golden flame rose, and above it was a huge golden lotus floating on the slippery water. Standing on the lotus is a beautiful woman, the snake lady, who is moving. The lotus gives out golden light. The stars shine from the lotus, and the starlight shines on it. Below is a huge golden Chinese angel dragon flame propagation lamp. HD, 4k
图八:In the fantasy world in the game, a cute little witch is looking straight ahead and holding a small pastel pink potion.
百款描述词在文末的链接中:https://mp.weixin.qq.com/s/yzTG4pqBmM0VYnqVksphXg














































































