突发!DeepSeek刚刚开源V3.1-Base

北京/设计爱好者/68天前/6浏览
突发!DeepSeek刚刚开源V3.1-Base
今天凌晨,全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。
非常低调没有任何介绍,只是把模型放上去了。但在Hugging Face的趋势榜单中已经上升到第4名,还是相当受欢迎的。
突发!DeepSeek刚刚开源V3.1-Base
Collect
开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base/tree/main
Hugging Face联合创始人Clement Delangue特意发了推文祝贺,他表示,Deepseek V3.1 已经悄无声息地发布,没有附带模型卡片,却已登上 Hugging Face 趋势榜第四位,太有意思了。
这就是在 Hugging Face 上拥有 8 万名关注者的力量。
突发!DeepSeek刚刚开源V3.1-Base
Collect
根据网友的推测,新升级版本,速度更快、智能程度更高,可与GPT级模型媲美。该模型拥有 6850 亿参数,支持 BF16、F8_E4M3、F32三种张量类型,以Safetensors格式发布,便于高效推理,还具备扩展的上下文窗口。
同时非常欣赏DeepSeek这种 “先放权重,后补说明”的风格,能让社区能够优先开展模型探索。
突发!DeepSeek刚刚开源V3.1-Base
Collect
很高兴看到仍有公司在发布基础模型。
突发!DeepSeek刚刚开源V3.1-Base
Collect
它应该是一个结合了 v3 和 r1 的模型。其对话模板包含一个思考参数,用于控制思考过程。
突发!DeepSeek刚刚开源V3.1-Base
Collect
我试着在我的 4GB 显卡上加载新的 DeepSeek-V3.1-Base 685B 模型,结果它崩溃了,不知道为啥?
突发!DeepSeek刚刚开源V3.1-Base
Collect
那近期R2还会有希望吗?
突发!DeepSeek刚刚开源V3.1-Base
Collect
END
0
Report
|
收藏
Share
相关推荐
评论
in to comment
Add emoji
喜欢TA的作品吗?喜欢就快来夸夸TA吧!
推荐素材
You may like
x oasis coffee
Homepage recommendation
相关收藏夹
ip形象设计+表情包
ip形象设计+表情包
ip形象设计+表情包
ip形象设计+表情包
精选收藏夹
作品收藏夹
企业展厅/文化墙 参考
企业展厅/文化墙 参考
企业展厅/文化墙 参考
企业展厅/文化墙 参考
精选收藏夹
作品收藏夹
小家电
小家电
小家电
小家电
精选收藏夹
作品收藏夹
企业展厅
企业展厅
企业展厅
企业展厅
精选收藏夹
作品收藏夹
IP形象及IP内容
IP形象及IP内容
IP形象及IP内容
IP形象及IP内容
精选收藏夹
作品收藏夹
IP形象——动物类
IP形象——动物类
IP形象——动物类
IP形象——动物类
精选收藏夹
作品收藏夹
大家都在看
Log in