深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理

体验与思考

西安/UI设计师/1年前/6174浏览

版权

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理

体验与思考

大家好，我是三石（dan），接触AI绘画以来，发现很多时候对一些基础词汇理解地很模糊，然后在搭建comfyui工作流时，只能知其然，不知其所以然的感觉，也不知搭选哪个模型，很多时候都是照猫画虎地模仿，很难受。而且，很多时候，网上找不到详细地教程来详细解释这些含义。

好在我周围有很多算法同学，在跟他们交流中，对一些基础词汇有了比较深刻的了解，在这里做了个分享。

今天给大家分享的是 stable diffusion中的一些基础问题，主要分两块：

SDXL、SD1.5是什么意思
checkpoint、lora是什么意思
checkpoint和lora的区别

放轻松，我会通过设计师的视角帮大家更好地理解。

问题1：SDXL、SD1.5这些版本有什么区别，到底有多少版本？

为什么会出现这个问题，是因为每次在浏览网站时，左上角的xl，lora等搞得我莫名其妙，云里雾里。一会儿1.0，一会儿1.5，一会儿XL，不明所以。

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjQ2MjQ=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

经过我一番研究，发现是这么回事：sd是stable diffusion的缩写，后面的后缀其实是各个版本的称号；

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjQ2ODg=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

Stable Diffusion (SD) 自发布以来经历了多个版本的迭代。以下是SD主要版本的概览：

Stable Diffusion v1.0 (2022年8月)首次公开发布
Stable Diffusion v1.1 - v1.4 (2022年8月-10月)陆续发布的小版本更新，主要改进模型性能和质量
Stable Diffusion v1.5 (2022年10月)在1.4基础上的进一步改进
Stable Diffusion v2.0 (2022年11月)重大更新，改进了文本理解和图像质量
Stable Diffusion v2.1 (2022年12月)对2.0的改进，增强了生成能力
Stable Diffusion XL 0.9 (2023年6月)SDXL的预览版本
Stable Diffusion XL 1.0 (2023年7月)目前最新的主要版本，大幅提升了模型能力

每个版本都比之前的版本生图质量更好，学习的图片数量也更多。接下来就给大家简单做个区分：

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjQ3MTI=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

SD v1.1-1.5：训练的图片基本上都是 512*512 大小；

SD v2.0-2.1: 训练的图片大小是768*768；

SD XL：分别以600000步256*256 和200000步 512*512 大小的图片进行训练，适合生成1024*1024大小的图片，生成质量大大提高，非常受欢迎。

简单理解就是SD的每一个版本都比之前的版本训练的步数更多，出图的质量更好。

那这么多版本，我应该下载哪个版本最合适呢？这里我推荐大家下载sd1.5和sdXL这两个版本，因为1.5版本生态最繁荣，sdXL 出图质量最好，画面表现高，但是占用显存略高，训练速度慢。

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjQ3ODA=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

如果大家现在手里还没有这两个模型，可以点击下方链接进行下载：

stable-diffusion-v1-5

stable-diffusion-xl-base-1.0

可以底部评论来联系我获取。

问题2:checkpoint、lora是什么意思？

梳理了stable diffusion各版本之后，接下来帮大家理解checkpoint和lora的含义和不同；

2.1什么是checkpoint？

官方：

Checkpoint是深度学习中常用的一个术语，用于描述在每次训练后保存模型参数（权重）的惯例。类似于游戏中保存关卡的功能，Checkpoint允许我们在训练过程中保存模型的状态，以便之后可以加载这些保存的参数并继续训练或进行推理。

简单理解的话，checkpoint就是在stable diffusion底模的基础上，再次训练得到特定风格的，更适合生成某种调性图片的模型。

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUwNjQ=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

所以我们可以在liblib上看到很多的checkpoint，这些都是在底模的基础上再次训练得到的。

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUwNjg=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

checkpoint模型

收藏

每种checkpoint都可以在详情页中看到基础模型的版本，看下图：

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUxNjQ=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

这个大家要注意了。controlnet跟模型的版本是一一对应的，如果checkpoint的版本和controlnet模型版本不一致，就会报错，因为训练的图片尺寸不一样。

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUxNjg=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

报错信息如下：

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUxNzI=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

2.2:什么是lora？

lora（Localized Refinement of Attributes）不同于checkpoint，lora可以看成是在基础模型生成的图片上，加了一层“滤镜”，达到切换风格的效果。因此他的体积很小，只有几百MB，受到很多小伙伴的青睐，毕竟一般人没有那么大的算力和时间去训练一个checkpoint，但是训练一个lora只要几个小时，而且要的训练素材也很少，优势很大，非常吸引人。

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUxNzY=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

我们可以把lora理解成lol中的皮肤，原始的皮肤是大模型，后续的皮肤就是lora，lora可以改变英雄的服装，姿态，但是主要框架是不变的。所以说lora技术是一种轻量化的模型微调训练方法

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUxODA=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

我们可以在很多网站上下载不同风格的lora，大家可以看我之前的一篇文章去找到网站下载链接：

用设计师语言解释AI绘画底层原理二（comfyui生图逻辑）

有时候大家会遇到一个问题，就是lora出来的图片效果没有网站发布的案例好看，可能是因为没有选对底模的原因。

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUyMjg=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

或者是没有输入触发词：

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUyMzI=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

问题3：checkpoint和lora 的区别在哪里：

如果大家仔细看过上面的内容，不难理解两者的区别：

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUyMzY=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

最后怎么在comfyui中选lora，需要在“新建节点”下找到“加载器”，再找到“lora加载器”：

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUyNDA=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

然后再lora节点中选择自己已经下载好的lora就可以啦

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUyNDQ=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

lora文件的存储位置在：models下的loras中，关于安装等问题，大家可以看下我之前的一篇文章：

comfyui 超详细安装教程

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUyNDg=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

后记：

今天的分享到这里就结束了，通过这篇文章，希望大家能更好的理解sd各版本的差异和lora的使用，了解了这些基础知识之后，可以帮助大家更快地上手comfyui。

最后祝愿大家能一下子就生成自己心目中的那张图，谢谢！

深度解析｜sd1.5、sdxl、checkpoint、lora 含义与原理（图ZMTQ4NjUyNTI=） - 教程 - 站酷设计师体验与思考原创素材 - 站酷ZCOOL

收藏

57

举报

|

声明

75

分享

原创文章 AI创作平面 UI aigc SD stablediffusion AI绘画 comfyui lora sdxl 大模型 checkpoint sd1.5

相关推荐

解决Google Ai Studio做完应用不会部署和调用API

解决Google Ai Studio做完应用不会部署和调用API

25

体验与思考

虚拟仿真与可视化工厂2.0_Unity

虚拟仿真与可视化工厂2.0_Unity

123

站酷推荐设计师

推广

再来！Kontext指定区域局部重绘，处理图片更自由了！

再来！Kontext指定区域局部重绘，处理图片更自由了！

12

体验与思考

参加WAIC分论坛「与AI共同进化：艺术创造力的迭代和韧性」中的一些思考

参加WAIC分论坛「与AI共同进化：艺术创造力的迭代和韧性」中的一些思考

18

体验与思考

好玩，我用coze搭了一个类似Lovart的智能体逻辑

好玩，我用coze搭了一个类似Lovart的智能体逻辑

166

体验与思考

Comfyui

Comfyui

Comfyui

Comfyui

10

深度测评｜我用Lovart做了一套品牌全案

深度测评｜我用Lovart做了一套品牌全案

179

体验与思考

干货分享｜Kontext工作流搭建+提示词技巧，彻底解决出图困难

干货分享｜Kontext工作流搭建+提示词技巧，彻底解决出图困难

36

体验与思考

核心节点解析｜Latent大法——打开图生图的神奇钥匙！

核心节点解析｜Latent大法——打开图生图的神奇钥匙！

133

体验与思考

ComfyuI工作流｜快速搭建手写书法字体效果

ComfyuI工作流｜快速搭建手写书法字体效果

250

体验与思考

核心节点解析｜ControlNet模型和预处理器之间的那些事儿

核心节点解析｜ControlNet模型和预处理器之间的那些事儿

110

体验与思考

评论

评论你的想法~

表情

喜欢TA的作品吗？喜欢就快来夸夸TA吧！

相关收藏夹

Comfyui

Comfyui

Comfyui

Comfyui

10

AIGC

AIGC

AIGC

AIGC

8

2

1

AIGC

AIGC

AIGC

AIGC

1

1

大家都在看

登录注册

57

75

评论

分享