深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理

用户头像
西安/UI设计师/1年前/5922浏览
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理
大家好,我是三石(dan),接触AI绘画以来,发现很多时候对一些基础词汇理解地很模糊,然后在搭建comfyui工作流时,只能知其然,不知其所以然的感觉,也不知搭选哪个模型,很多时候都是照猫画虎地模仿,很难受。而且,很多时候,网上找不到详细地教程来详细解释这些含义。
好在我周围有很多算法同学,在跟他们交流中,对一些基础词汇有了比较深刻的了解,在这里做了个分享。
今天给大家分享的是 stable diffusion中的一些基础问题,主要分两块:
  1. SDXL、SD1.5是什么意思
  2. checkpoint、lora是什么意思
  3. checkpoint和lora的区别
放轻松,我会通过设计师的视角帮大家更好地理解。
问题1:SDXL、SD1.5这些版本有什么区别,到底有多少版本?
为什么会出现这个问题,是因为每次在浏览网站时,左上角的xl,lora等搞得我莫名其妙,云里雾里。一会儿1.0,一会儿1.5,一会儿XL,不明所以。
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjQ2MjQ=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
经过我一番研究,发现是这么回事:sd是stable diffusion的缩写,后面的后缀其实是各个版本的称号;
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjQ2ODg=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
Stable Diffusion (SD) 自发布以来经历了多个版本的迭代。以下是SD主要版本的概览:
  1. Stable Diffusion v1.0 (2022年8月)首次公开发布
  2. Stable Diffusion v1.1 - v1.4 (2022年8月-10月)陆续发布的小版本更新,主要改进模型性能和质量
  3. Stable Diffusion v1.5 (2022年10月)在1.4基础上的进一步改进
  4. Stable Diffusion v2.0 (2022年11月)重大更新,改进了文本理解和图像质量
  5. Stable Diffusion v2.1 (2022年12月)对2.0的改进,增强了生成能力
  6. Stable Diffusion XL 0.9 (2023年6月)SDXL的预览版本
  7. Stable Diffusion XL 1.0 (2023年7月)目前最新的主要版本,大幅提升了模型能力
每个版本都比之前的版本生图质量更好,学习的图片数量也更多。接下来就给大家简单做个区分:
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjQ3MTI=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
SD v1.1-1.5:训练的图片基本上都是 512*512 大小;
SD v2.0-2.1: 训练的图片大小是768*768;
SD XL:分别以600000步256*256 和200000步 512*512 大小的图片进行训练,适合生成1024*1024大小的图片,生成质量大大提高,非常受欢迎。
简单理解就是SD的每一个版本都比之前的版本 训练的步数更多,出图的质量更好。
那这么多版本,我应该下载哪个版本最合适呢?这里我推荐大家下载sd1.5和sdXL这两个版本,因为1.5版本生态最繁荣,sdXL 出图质量最好,画面表现高,但是占用显存略高,训练速度慢。
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjQ3ODA=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
如果大家现在手里还没有这两个模型,可以点击下方链接进行下载:
可以底部评论来联系我获取。
问题2:checkpoint、lora是什么意思?
梳理了stable diffusion各版本之后,接下来帮大家理解checkpoint和lora的含义和不同;
2.1什么是checkpoint?
官方:
Checkpoint是深度学习中常用的一个术语,用于描述在每次训练后保存模型参数(权重)的惯例。类似于游戏中保存关卡的功能,Checkpoint允许我们在训练过程中保存模型的状态,以便之后可以加载这些保存的参数并继续训练或进行推理。
简单理解的话,checkpoint就是在stable diffusion底模的基础上,再次训练得到特定风格的,更适合生成某种调性图片的模型。
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUwNjQ=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
所以我们可以在liblib上看到很多的checkpoint,这些都是在底模的基础上再次训练得到的。
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUwNjg=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
checkpoint模型
收藏
每种checkpoint都可以在详情页中看到基础模型的版本,看下图:
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUxNjQ=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
这个大家要注意了。controlnet跟模型的版本是一一对应的,如果checkpoint的版本和controlnet模型版本不一致,就会报错,因为训练的图片尺寸不一样。
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUxNjg=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
报错信息如下:
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUxNzI=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
2.2:什么是lora?
lora(Localized Refinement of Attributes)不同于checkpoint,lora可以看成是在基础模型生成的图片上,加了一层“滤镜”,达到切换风格的效果。因此他的体积很小,只有几百MB,受到很多小伙伴的青睐,毕竟一般人没有那么大的算力和时间去训练一个checkpoint,但是训练一个lora只要几个小时,而且要的训练素材也很少,优势很大,非常吸引人。
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUxNzY=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
我们可以把lora理解成lol中的皮肤,原始的皮肤是大模型,后续的皮肤就是lora,lora可以改变英雄的服装,姿态,但是主要框架是不变的。所以说lora技术是一种轻量化的模型微调训练方法
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUxODA=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
我们可以在很多网站上下载不同风格的lora,大家可以看我之前的一篇文章去找到网站下载链接:
有时候大家会遇到一个问题,就是lora出来的图片效果没有网站发布的案例好看,可能是因为没有选对底模的原因。
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUyMjg=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
或者是没有输入触发词:
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUyMzI=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
问题3:checkpoint和lora 的区别在哪里:
如果大家仔细看过上面的内容,不难理解两者的区别:
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUyMzY=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
最后怎么在comfyui中选lora,需要在“新建节点”下找到“加载器”,再找到“lora加载器”:
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUyNDA=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
然后再lora节点中选择自己已经下载好的lora就可以啦
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUyNDQ=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
lora文件的存储位置在:models下的loras中,关于安装等问题,大家可以看下我之前的一篇文章:
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUyNDg=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
后记:
今天的分享到这里就结束了,通过这篇文章,希望大家能更好的理解sd各版本的差异和lora的使用,了解了这些基础知识之后,可以帮助大家更快地上手comfyui。
最后祝愿大家能一下子就生成自己心目中的那张图,谢谢!
深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理(图ZMTQ4NjUyNTI=) - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL
收藏
57
举报
|
75
分享
相关推荐
评论
用户头像
评论你的想法~
表情
喜欢TA的作品吗?喜欢就快来夸夸TA吧!
加载中
推荐素材
新年插画 | 12只蛇卡通形象设计
蓝色背景下的台灯铅笔和AI字母组成的静物
十大女性最爱的宠物狗
蛇年IP全套新年产品原创设计
AI Prompt工程深度解析PPT
儿童插画素材
清新雏菊少女扁平风元气少女ip形象
AI人工智能机器人正在写作
金蛇送福 | 蛇年主题卡通插画设计
端午龙舟赛
御姐风头像
蛇年旺财 | 新年插画文创设计
赛博朋克风格动漫赛车壁纸
记录 PPT创作 阅读助手 AI 笔记
黄色台灯和黄色灯泡照射出的光交织在AI字
魔法礼帽鲜花插画 创意图案设计素材包
金蛇送福 | 蛇年主题卡通插画设计
未来都市AI音乐创作系统
记录 PPT创作 阅读助手 AI 笔记
金蛇送福 | 蛇年主题卡通插画设计
AI音乐创作系统界面
蓝色背景下的台灯和AI字母组成的静物照
北京城市地标儿童插画矢量
8款红红火火2025立体字
柿柿如意
你可能喜欢
相关收藏夹
大家都在看
登录注册