问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

本地离线模型搭建指南：本地运行显卡选择

创作时间:

作者:

@小白创作中心

本地离线模型搭建指南：本地运行显卡选择

引用

CSDN

1.

https://blog.csdn.net/Master_Shifu_/article/details/139902029

随着人工智能技术的快速发展，越来越多的开发者开始尝试在本地搭建中文大语言模型。本文将详细介绍如何选择适合本地运行的显卡，帮助读者从硬件层面为模型搭建做好准备。

2. 本地运行显卡选择

在Awesome-Chinese-LLM仓库中，有许多中文大语言模型适合在本地运行。对于需要选择消费级别显卡的用户，可以参考以下信息：

2.1 适合消费级别显卡运行的模型参数大小

大小为6B或7B，部分8B的模型，可以在消费级别的显卡上运行。显存建议8G起步，否则会出现模型加载不成功的问题。
这些模型参数大小同样也可以在CPU上运行，但聊天文字生成速度只有同类型显卡的1/5-1/10。CPU配置最低建议16核心，32G内存。

2.2 推荐消费级别显卡

NVIDIA GeForce RTX 4060 至 4090 系列，显存12GB起步。
NVIDIA T4卡也可以运行本地模型。

2.3 性能比较

T4卡：服务器级别GPU计算图形显卡，本地运行模型推荐12G起步，大致对等评估，T4卡16G的性能和4070T16G显存性能一致。
RTX 4060-4090 系列：消费级显卡，性能强劲，显存从12GB到24GB不等，适合高性能计算和深度学习任务，本地运行模型推荐12G起步。

2.4 消费级显卡配置建议

优先选择单卡配置：单卡配置简单，易于管理。
双卡配置：消费级台式机最多支持两张显卡集火（NVIDIA SLI或NVLink）。
若需突破双卡限制：

请查阅并考虑使用华硕 ESC8000-G4 服务器配置，该服务器支持多达8张显卡的集火，适用于更大规模的计算需求。

2.5 本地部署模型实践运行配置

底座	包含模型	模型参数大小	机器配置	显存大小	是否可运行
ChatGLM	ChatGLM3-6B	6B	CPU 16核心 32G内存	无	可以
ChatGLM	ChatGLM3-6B	6B	显卡4070Ti	16G	可以
ChatGLM	ChatGLM4-9B	9B	显卡4070Ti	16G	可以
LLaMA	Chinese-LlaMA2	7B	显卡3060Ti	8G	可以
Qwen	Qwen1.5	7B	显卡4070Ti	16G	可以

注意：以上运行均值单独运行模型后是否可以运行以及显存是否够用，如果后期做RAG架构，ChatGLM4-9B模型在16G显存上不够，刚好差200M的显存，所以如果买新显卡，如果预算够，显存是第一优先考虑选项，之后才是显卡的计算能力。

2.6 相关模型链接

ChatGLM
ChatGLM2-6B
ChatGLM3-6B
Chinese-LLaMA-Alpaca
Chinese-LLaMA-Alpaca-2
Chinese-LlaMA2
Llama2-Chinese
Qwen/Qwen1.5

选择适合的显卡和配置，可以在本地高效地运行这些中文大语言模型。

热门推荐

五一必打卡！西安周边绝美摄影胜地推荐

五一必打卡！西安周边绝美摄影胜地推荐

国庆自驾游：打卡临潼最美环山公路

国庆自驾游：打卡临潼最美环山公路

夏日避暑胜地：关山草原自驾游攻略

夏日避暑胜地：关山草原自驾游攻略

D882三极管：高性能信号放大的理想选择

D882三极管：高性能信号放大的理想选择

D882三极管：你家音响的秘密武器？

D882三极管：你家音响的秘密武器？

D882三极管：DIY电子项目的理想选择

D882三极管：DIY电子项目的理想选择

看演唱会震碎了肾结石？专家解读肾结石自行排出的可能性及预防方法

看演唱会震碎了肾结石？专家解读肾结石自行排出的可能性及预防方法

红烧鲍鱼：一道美味又养颜的佳肴

红烧鲍鱼：一道美味又养颜的佳肴

10条关于人性的哲学思考，看完让人生“豁然开朗”

10条关于人性的哲学思考，看完让人生“豁然开朗”

从素颜到红毯：揭秘明星化妆过程中的每一个细节

从素颜到红毯：揭秘明星化妆过程中的每一个细节

怎样煎中药、喝中药才能获得好药效？这份指南请收好！

怎样煎中药、喝中药才能获得好药效？这份指南请收好！

藿香正气水使用的安全剂量多少合适

藿香正气水使用的安全剂量多少合适

街舞运动的价值及推广

街舞运动的价值及推广

北京二中院发布家庭借贷纠纷审理情况：87件涉夫妻共同债务案件占比64%

北京二中院发布家庭借贷纠纷审理情况：87件涉夫妻共同债务案件占比64%

北京二中院案例解析：家庭借贷纠纷如何避免与解决

北京二中院案例解析：家庭借贷纠纷如何避免与解决

双十一家庭理财指南：避开消费陷阱，让财富稳步增长

双十一家庭理财指南：避开消费陷阱，让财富稳步增长

生成式人工智能：如何改变网络漏洞挖掘与安全防护

生成式人工智能：如何改变网络漏洞挖掘与安全防护

米其林大厨教你做冬季滋补法式炖羊肉

米其林大厨教你做冬季滋补法式炖羊肉

冬季进补，羊肉真的会伤害心脏吗？

冬季进补，羊肉真的会伤害心脏吗？

冬季养生首选：羊肉的N种好处

冬季养生首选：羊肉的N种好处

OKR方法：年度绩效目标设定的利器

OKR方法：年度绩效目标设定的利器

如何避免负面绩效反馈伤人心？

如何避免负面绩效反馈伤人心？

字节跳动&美团：如何用绩效塑造企业文化？

字节跳动&美团：如何用绩效塑造企业文化？

绩效管理考核系统：企业内卷新解法？

绩效管理考核系统：企业内卷新解法？

蒙自法院教你如何应对微信拉黑欠债人

蒙自法院教你如何应对微信拉黑欠债人

职场微信拉黑：你敢用吗？

职场微信拉黑：你敢用吗？

微信拉黑功能背后的黑科技揭秘！

微信拉黑功能背后的黑科技揭秘！

苏州以改革为笔做好科技金融大文章为产业科技创新插上“金翅膀”

苏州以改革为笔做好科技金融大文章为产业科技创新插上“金翅膀”

金花松鼠如何快速适应新家？这份养殖指南请收好

金花松鼠如何快速适应新家？这份养殖指南请收好

红霉素药膏≠红霉素眼膏，这些情况下不能用

红霉素药膏≠红霉素眼膏，这些情况下不能用

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号