问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

本地离线模型搭建指南：本地运行显卡选择

创作时间:

作者:

@小白创作中心

本地离线模型搭建指南：本地运行显卡选择

引用

CSDN

1.

https://blog.csdn.net/Master_Shifu_/article/details/139902029

随着人工智能技术的快速发展，越来越多的开发者希望在本地搭建中文大语言模型。本文将详细介绍如何选择适合本地运行的显卡，包括模型参数大小、推荐显卡型号、性能比较以及具体配置建议，帮助读者高效地在本地运行中文大语言模型。

2.1 适合消费级别显卡运行的模型参数大小

大小为6B或7B，部分8B的模型，可以在消费级别的显卡上运行。显存建议8G起步，否则会出现模型加载不成功的问题。
这些模型参数大小同样也可以在CPU上远行，但聊天文字生成速度只有同类型显卡的1/5-1/10。CPU配置最低建议16核心，32G内存。

2.2 推荐消费级别显卡

NVIDIA GeForce RTX 4060 至 4090 系列，显存12GB起步。
NVIDIA T4卡也可以运行本地模型。

2.3 性能比较

T4卡：服务器级别GPU计算图形显卡，本地运行模型推荐12G起步，大致对等评估，T4卡16G的性能和4070T16G显存性能一致。
RTX 4060-4090 系列：消费级显卡，性能强劲，显存从12GB到24GB不等，适合高性能计算和深度学习任务，本地运行模型推荐12G起步。

2.4 消费级显卡配置建议

优先选择单卡配置：单卡配置简单，易于管理。
双卡配置：消费级台式机最多支持两张显卡集火（NVIDIA SLI或NVLink）。

若需突破双卡限制：

请查阅并考虑使用华硕 ESC8000-G4 服务器配置，该服务器支持多达8张显卡的集火，适用于更大规模的计算需求。

2.5 本地部署模型实践运行配置

底座	包含模型	模型参数大小	机器配置	显存大小	是否可运行
ChatGLM	ChatGLM3-6B	6B	CPU 16核心 32G内存	无	可以
ChatGLM	ChatGLM3-6B	6B	显卡4070Ti	16G	可以
ChatGLM	ChatGLM4-9B	9B	显卡4070Ti	16G	可以
LLaMA	Chinese-LlaMA2	7B	显卡3060Ti	8G	可以
Qwen	Qwen1.5	7B	显卡4070Ti	16G	可以

注意：以上运行均值单独运行模型后是否可以运行以及显存是否够用，如果后期做RAG架构，ChatGLM4-9B模型在16G显存上不够，刚好差200M的显存，所以如果买新显卡，如果预算够，显存是第一优先考虑选项，之后才是显卡的计算能力。

2.6 相关模型链接

ChatGLM
ChatGLM2-6B
ChatGLM3-6B
Chinese-LLaMA-Alpaca
Chinese-LLaMA-Alpaca-2
Chinese-LlaMA2
Llama2-Chinese
Qwen/Qwen1.5

选择适合的显卡和配置，可以在本地高效地运行这些中文大语言模型。

热门推荐

羊毛毡：探寻无限可能倾听非遗语言

羊毛毡：探寻无限可能倾听非遗语言

开学啦！这些传染病易高发防控指南请查收

开学啦！这些传染病易高发防控指南请查收

人社部新规：电子医保卡异地使用指南

人社部新规：电子医保卡异地使用指南

电子医保卡异地使用，这些细节要注意！

电子医保卡异地使用，这些细节要注意！

南京大屠杀，德国公民救下25万中国人，晚年南京市民捐亿元救助

南京大屠杀，德国公民救下25万中国人，晚年南京市民捐亿元救助

从环保到互动：2024国际包装设计大奖作品全解析

从环保到互动：2024国际包装设计大奖作品全解析

白酒包装色彩搭配指南：从对比色到类色运用

白酒包装色彩搭配指南：从对比色到类色运用

中国首艘大洋钻探船 “梦想”号两年内将首钻

中国首艘大洋钻探船 “梦想”号两年内将首钻

德乙第18轮：凯泽斯劳滕主场迎战科隆，谁将笑到最后？

德乙第18轮：凯泽斯劳滕主场迎战科隆，谁将笑到最后？

德乙新赛季揭幕战：菲尔特 vs 明斯特普鲁士谁更强？

德乙新赛季揭幕战：菲尔特 vs 明斯特普鲁士谁更强？

德乙保级关键战：菲尔特主场迎战普鲁士明斯特，谁能占据保级主动？

德乙保级关键战：菲尔特主场迎战普鲁士明斯特，谁能占据保级主动？

清洁工安全培训，保障职业健康

清洁工安全培训，保障职业健康

光的本质：从几何光学到量子场论的演变

光的本质：从几何光学到量子场论的演变

光的本质探索：从几何光学到量子场论

光的本质探索：从几何光学到量子场论

达喜副作用揭秘：真的会影响营养吸收？

达喜副作用揭秘：真的会影响营养吸收？

达喜副作用知多少？

达喜副作用知多少？

冬季护胃必备：达喜的正确使用指南

冬季护胃必备：达喜的正确使用指南

色胺酸：调节情绪助睡眠，每日摄入量有标准

色胺酸：调节情绪助睡眠，每日摄入量有标准

白萝卜+排骨，这样做汤最鲜美，还暖胃

白萝卜+排骨，这样做汤最鲜美，还暖胃

土豆炖排骨：掌握关键步骤，做出餐厅级美味，兼顾营养与口感

土豆炖排骨：掌握关键步骤，做出餐厅级美味，兼顾营养与口感

筷子DIY作品大全旧筷子也有春天

筷子DIY作品大全旧筷子也有春天

从废物到宝物：28个创意设计让你大开眼界，环保又有趣！

从废物到宝物：28个创意设计让你大开眼界，环保又有趣！

捡到手机后扔掉了，需要赔偿吗？

捡到手机后扔掉了，需要赔偿吗？

汾酒杏花节推“全家总动员”：古法酿酒+VR体验

汾酒杏花节推“全家总动员”：古法酿酒+VR体验

第七届汾酒杏花节开幕，VR技术重现杜牧笔下杏花村

第七届汾酒杏花节开幕，VR技术重现杜牧笔下杏花村

杏花村冬酿：低温发酵成就汾酒独特清香

杏花村冬酿：低温发酵成就汾酒独特清香

海外华媒深度探访上海：从改革开放桥头堡到现代化国际大都市

海外华媒深度探访上海：从改革开放桥头堡到现代化国际大都市

“竖起来的外滩”是如何建成的？专家在上海现代建筑科技馆揭秘

“竖起来的外滩”是如何建成的？专家在上海现代建筑科技馆揭秘

以案释法：捡到的钻戒被丢弃，失主索赔3万元，法院会怎么判？

以案释法：捡到的钻戒被丢弃，失主索赔3万元，法院会怎么判？

捡到金项链不归还怎么处理

捡到金项链不归还怎么处理

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号