问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

本地离线模型搭建指南：如何选择适合的显卡

创作时间:

作者:

@小白创作中心

本地离线模型搭建指南：如何选择适合的显卡

引用

CSDN

1.

https://blog.csdn.net/master_shifu_/article/details/139902029

随着人工智能技术的快速发展，越来越多的开发者开始尝试在本地搭建中文大语言模型。然而，如何选择合适的显卡和配置，以确保模型能够稳定运行，成为了许多开发者面临的问题。本文将为你提供详细的指导，帮助你从零开始构建和运行一个中文大语言模型。

2.1 适合消费级别显卡运行的模型参数大小

大小为6B或7B，部分8B的模型，可以在消费级别的显卡上运行。显存建议8G起步，否则会出现模型加载不成功的问题。
这些模型参数大小同样也可以在CPU上远行，但聊天文字生成速度只有同类型显卡的1/5-1/10。CPU配置最低建议16核心，32G内存。

2.2 推荐消费级别显卡

NVIDIA GeForce RTX 4060 至 4090 系列，显存12GB起步。
NVIDIA T4卡也可以运行本地模型。

2.3 性能比较

T4卡：服务器级别GPU计算图形显卡，本地运行模型推荐12G起步，大致对等评估，T4卡16G的性能和4070T16G显存性能一致。
RTX 4060-4090 系列：消费级显卡，性能强劲，显存从12GB到24GB不等，适合高性能计算和深度学习任务，本地运行模型推荐12G起步。

2.4 消费级显卡配置建议

优先选择单卡配置：单卡配置简单，易于管理。
双卡配置：消费级台式机最多支持两张显卡集火（NVIDIA SLI或NVLink）。

若需突破双卡限制：

请查阅并考虑使用华硕 ESC8000-G4 服务器配置，该服务器支持多达8张显卡的集火，适用于更大规模的计算需求。

2.5 本地部署模型实践运行配置

底座	包含模型	模型参数大小	机器配置	显存大小	是否可运行
ChatGLM	ChatGLM3-6B	6B	CPU 16核心 32G内存	无	可以
ChatGLM	ChatGLM3-6B	6B	显卡4070Ti	16G	可以
ChatGLM	ChatGLM4-9B	9B	显卡4070Ti	16G	可以
LLaMA	Chinese-LlaMA2	7B	显卡3060Ti	8G	可以
Qwen	Qwen1.5	7B	显卡4070Ti	16G	可以

注意：以上运行均值单独运行模型后是否可以运行以及显存是否够用，如果后期做RAG架构，ChatGLM4-9B模型在16G显存上不够，刚好差200M的显存，所以如果买新显卡，如果预算够，显存是第一优先考虑选项，之后才是显卡的计算能力。

2.6 相关模型链接

ChatGLM
ChatGLM2-6B
ChatGLM3-6B
Chinese-LLaMA-Alpaca
Chinese-LLaMA-Alpaca-2
Chinese-LlaMA2
Llama2-Chinese
Qwen/Qwen1.5

选择适合的显卡和配置，可以在本地高效地运行这些中文大语言模型。

热门推荐

后脑勺有块突出的骨头怎么办？医生专业解答

后脑勺有块突出的骨头怎么办？医生专业解答

深度解析：Markdown有序列表嵌套的最佳实践与常见问题

深度解析：Markdown有序列表嵌套的最佳实践与常见问题

游戏搬砖工作室现状与影响深度解析

游戏搬砖工作室现状与影响深度解析

"打扰一下"的英语表达：从基本用法到跨文化沟通

"打扰一下"的英语表达：从基本用法到跨文化沟通

视频剪辑上下黑边怎么去除

视频剪辑上下黑边怎么去除

长期染发会致癌吗？提醒：有1种染发剂已被多国禁用，宁愿扔掉也别碰

长期染发会致癌吗？提醒：有1种染发剂已被多国禁用，宁愿扔掉也别碰

朝鲜半岛上的文字之争：汉字与谚文的六百年较量

朝鲜半岛上的文字之争：汉字与谚文的六百年较量

解读儿牙生长秘密！小孩大牙坏了以后会换新牙吗？虽然乳牙会被恒牙替换，但需要时间！

解读儿牙生长秘密！小孩大牙坏了以后会换新牙吗？虽然乳牙会被恒牙替换，但需要时间！

从 GUI 到 VUI：设计思维大转变，打造卓越语音用户界面的秘诀

从 GUI 到 VUI：设计思维大转变，打造卓越语音用户界面的秘诀

美国硕士留学一年费用超全面解析！

美国硕士留学一年费用超全面解析！

核对判决书原件的步骤和方法

核对判决书原件的步骤和方法

多地上调！2025年最新工资标准！上海人不能低于这个数……

多地上调！2025年最新工资标准！上海人不能低于这个数……

英文也有爆笑“谐音梗”！分享10个，来看看你能get到几个吧

英文也有爆笑“谐音梗”！分享10个，来看看你能get到几个吧

轻松掌握乐谱转换的技巧

轻松掌握乐谱转换的技巧

《人间失格》：太宰治的自我剖析与人性探索

《人间失格》：太宰治的自我剖析与人性探索

老一辈人眼中的鬼神：坚信鬼神存在

老一辈人眼中的鬼神：坚信鬼神存在

地球存在了46亿年，人类的出现才几百万年，地球是否有过高度文明？

地球存在了46亿年，人类的出现才几百万年，地球是否有过高度文明？

是时候在家动一动啦！简单易学宅家运动教程来了

是时候在家动一动啦！简单易学宅家运动教程来了

健身减脂，你要怎么吃？如何减脂不减肌？

健身减脂，你要怎么吃？如何减脂不减肌？

如何实现个人财富的合理规划？这种规划有哪些潜在风险？

如何实现个人财富的合理规划？这种规划有哪些潜在风险？

数控编程入门先学什么语言

数控编程入门先学什么语言

刚吃完饭就想睡觉？学会这5招，驱除困意精神好~

刚吃完饭就想睡觉？学会这5招，驱除困意精神好~

穷人囤物资，中产建安全屋，富豪买地堡，美国人为何沉迷末日准备？

穷人囤物资，中产建安全屋，富豪买地堡，美国人为何沉迷末日准备？

咖啡色的秋冬时尚法则：从高级感到百变搭配的全面指南

咖啡色的秋冬时尚法则：从高级感到百变搭配的全面指南

手机卡突然没有信号无服务怎么办？这些妙招帮你快速恢复

手机卡突然没有信号无服务怎么办？这些妙招帮你快速恢复

医疗器械选购指南：如何选择合适的医疗设备

医疗器械选购指南：如何选择合适的医疗设备

如何利用知识库内容提升搜索引擎推荐关键词的准确性？

如何利用知识库内容提升搜索引擎推荐关键词的准确性？

3分钟看懂界面原型图是什么？怎么画？

3分钟看懂界面原型图是什么？怎么画？

温泉酒店服务品质提升策略研究

温泉酒店服务品质提升策略研究

极限运动：你敢挑战自己的勇气极限吗？

极限运动：你敢挑战自己的勇气极限吗？

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号