问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

DeepSeek-r1和DeepSeek-v3使用对比

创作时间:
作者:
@小白创作中心

DeepSeek-r1和DeepSeek-v3使用对比

引用
1
来源
1.
https://juejin.cn/post/7469754354495078415

本文将对比分析DeepSeek-r1和DeepSeek-v3两个大模型的能力表现。通过多个维度的对比,包括模型规模、GPU显存需求、适用场景、下载大小、存储尺寸以及实际使用效果等,帮助读者了解两个模型的特点和适用场景。

模型基本情况

模型规模
最低GPU显存
推荐GPU型号
纯CPU内存需求
适用场景
1.5B
4GB
RTX 3050
8GB
个人学习
7B、8B
16GB
RTX 4090
32GB
小型项目
14B
24GB
A5000 x2
64GB
专业应用
32B
48GB
A100 40GB x2
128GB
企业级服务
70B
80GB
A100 80GB x4
256GB
高性能计算
671B
640GB+
H100 集群
不可行
超算/云计算

官方性能总览对比

注意点:

  1. 容量
  • r1的实际大小在10G左右,Ollama轻松下载即可使用。
  • v3版本,672B参数,400G左右的体量,下载都吃力。使用时需要注意磁盘和网络流量情况。
  1. Ollama版本
  • v3要求ollama版本至少0.5.5以上。
  • r1版本中并没有此要求。

基本数据对比

  • r1:参数7.62B,存储尺寸4.7GB
  • v3:参数671B,存储尺寸404GB

实际效果对比

我们尝试问几个问题,看它的回复。

1. 你的大模型数据是截止到何时的

  • r1:截止到2024年7月
  • v3:截止日期是2024年7月

2. 中国有个微信小程序【字形绘梦】,请问你知道是什么产品吗?

  • r1:没有找到讯息。但给了一些建议和纠错的讯息。还不错。
  • v3:有答案,但是是错误的回复。反而误导了。差评。

这个问题,天工AI的回复非常正确。所以国内质量对比就差很多了。不过查了下GPT也是同样错误的答案。

3. 请作为一个风水算命大师,给我算算今日财运如何。我的生日是1988年8月8日,职业是工程师

  • r1:算命的答案让我惊讶。非常好。
  • v3:答案让我失望,甚至比r1都差。

4. 请作为一名C#编程专家,回到我在C#中如何使用RestRequest库请求multipart/form-data的Post内容,直接给我代码接口

  • r1:代码生成的内容非常的丰富,但是经过正式的历练,显得准确度不高。甚至过多的内容,影响了最终的效能和决策。开发人员拿到这种代码直接使用的话,搞不好就会出现比自己亲自写的都要累。需要修改的地方太多了。有的甚至是错误的引导。
  • v3:代码质量效果非常好。可以和微软的phi4 相比了。 因此看来,就代码这块而言V3 全量版本胜出太多了。

总结

  1. r1 在某些内容表现比v3 好。
  2. 在代码能力方面和准确度还是 v3 好很多,非常高质量 。
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号