问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

大模型训练指南：从预训练到结果评测

创作时间:

作者:

@小白创作中心

大模型训练指南：从预训练到结果评测

引用

CSDN

1.

https://m.blog.csdn.net/youmaob/article/details/142458640

大模型训练是一个复杂的过程，通常被分解为预训练、监督调优和对齐等阶段。本文将详细介绍大模型训练的各个方面，包括模型架构、训练数据、训练成本估算等内容。

一、模型架构

1.1 模型架构

虽然业内普遍采用的是Decoder架构，但在词表、向量化、注意力、神经网络等各层依然有比较大的差异。基于时间、资源等方面考虑，可以从主流开源的大模型中选择一款作为参考。流程走通之后，再修改模型架构。

比如训练中文常规的大语言模型，可以从下面的列表中选择：

清华智谱的chatglm架构
百川的Baichuan模型架构
阿里的Qwen模型架构
零一万物的0-1模型架构

1.2 模型参数量

理论上讲，最好选择可以承担的最大规模参数的模型。当然，从实验的角度考虑，可以优选小一点的模型，逐步扩大模型参数规模。比如，可以选择0.5B左右的参数量。

实际上，现在HuggingFace已经推出更小的参数规模，参考：SmolLM：一个超快速、超高性能的小模型集合。这些小模型的能力也不错：

二、训练数据

2.1 数据类型

初次训练通用的大模型，不需要包括翻译、代码、数学等专业知识的大模型。可以筛选掉这些数据。

2.2 数据量

根据数据和模型参数20倍比的关系，如果选择0.5B参数，则需要数据量：20*0.5B= 10B

换算成1000 Token/sample，则需要：10*1，000,000,000/1000=10,000,000 samples，即不少于1千万行。据说是越多越好。

2.3 数据来源

理论上讲，学习过程应该包括：百科，新闻、作文、小说、书籍、杂志、论文、中小学教材等。可以不包括古文、古诗、歌词、代码等。

三、训练成本估算

如果选择0.5B参数，10B训练数据。

0.5B参数，需要的显存大小可以估算：40*0.5= 20GB，单张4090可以训练。按单张4090卡进行训练。

计算量=0.5109101098=4*10^19

4090能力=83Tfloats = 83*10^12/s

训练时长：计算量/4090能力/GPU卡利用效率(0.3)/3600 = 446 hours

按租用4090一小时2.5元，预计成本1116元。如果使用多张卡，比如4张，时长在120小时左右。

四、结果评测

训练的结果可以使用多种大语言模型评测工具进行评测。下面是参考qwen2模型架构，使用0.5B参数，4.6B数据（900万行*512/行）进行预训练，未进行Chat调优的模型，训练时长为120小时。

五、学习资源推荐

为了帮助读者更好地学习大模型，本文还推荐了一些学习资源，包括：

AI大模型入门学习思维导图
精品AI大模型学习书籍手册
视频教程
实战学习录播视频
《中国大模型落地应用案例集》
GitHub海量高星开源项目
LLM大模型学习视频
640份大模型行业报告（持续更新）

这些资源可以帮助读者快速入门大模型，并深入学习相关知识。读者可以根据自己的需求选择合适的学习资源，系统地学习大模型的相关知识。

热门推荐

湖州四季游：春看山野秋赏月，三地自驾路线全攻略

湖州四季游：春看山野秋赏月，三地自驾路线全攻略

浙江湖州自驾进藏：北线南线双选攻略及费用预算

浙江湖州自驾进藏：北线南线双选攻略及费用预算

海尔冰箱温度设置攻略：让食物保鲜效果翻倍

海尔冰箱温度设置攻略：让食物保鲜效果翻倍

一文读懂冰箱温度：这样设置才能留住食物营养

一文读懂冰箱温度：这样设置才能留住食物营养

别再调最低了！夏季冰箱这样设置最省电

别再调最低了！夏季冰箱这样设置最省电

重庆旅游攻略：北站到鹅岭二厂，网红景点打卡全攻略

重庆旅游攻略：北站到鹅岭二厂，网红景点打卡全攻略

重庆鹅岭二厂：工业遗存变身艺术园区，5大打卡点全攻略

重庆鹅岭二厂：工业遗存变身艺术园区，5大打卡点全攻略

《屏幕时代的养育》教你打造无手机干扰的学习环境

《屏幕时代的养育》教你打造无手机干扰的学习环境

电脑开机黑屏？BIOS设置教你快速搞定

电脑开机黑屏？BIOS设置教你快速搞定

笔记本电脑故障排除与维护保养全攻略

笔记本电脑故障排除与维护保养全攻略

用三杯酱油打造美味乳鸽（掌握制作乳鸽的窍门）

用三杯酱油打造美味乳鸽（掌握制作乳鸽的窍门）

离线也能玩！五款免费单机游戏推荐

离线也能玩！五款免费单机游戏推荐

《黑神话：悟空》花棍流攻略：从入门到精通

《黑神话：悟空》花棍流攻略：从入门到精通

明清葫芦文化：从生活用品到艺术珍品

明清葫芦文化：从生活用品到艺术珍品

千年苍茫，历代中国画名家画雪

千年苍茫，历代中国画名家画雪

绝美，这雪景油画可以看一整个冬天！

绝美，这雪景油画可以看一整个冬天！

黄昏大雪杨万里写下首调皮之作，无一雪字却句句不离雪，令人叫绝

黄昏大雪杨万里写下首调皮之作，无一雪字却句句不离雪，令人叫绝

雪之花：自然主题的艺术诠释

雪之花：自然主题的艺术诠释

解码孩子沉迷手机：从心理需求到解决方案

解码孩子沉迷手机：从心理需求到解决方案

和平精英SS31新赛季全面解析：金蛇赛年玩法攻略

和平精英SS31新赛季全面解析：金蛇赛年玩法攻略

和平精英SS31赛季地图调整全解析：资源点分布与实战攻略

和平精英SS31赛季地图调整全解析：资源点分布与实战攻略

家庭手机使用规则：如何平衡数字生活与家庭关系？

家庭手机使用规则：如何平衡数字生活与家庭关系？

6973万留守儿童的手机困境：现状、原因与对策

6973万留守儿童的手机困境：现状、原因与对策

小孩子能吃鹿肉吗？多大年龄可以吃鹿肉

小孩子能吃鹿肉吗？多大年龄可以吃鹿肉

摩羯座女人实力派摩羯女

摩羯座女人实力派摩羯女

银装素裹，诗情画意：探寻雪景诗词的魅力

银装素裹，诗情画意：探寻雪景诗词的魅力

“体无完肤”：从三国历史到成语典故

“体无完肤”：从三国历史到成语典故

“体无完肤”：垓下之战与项羽的悲壮结局

“体无完肤”：垓下之战与项羽的悲壮结局

大寒将至，4道应季开胃菜温暖餐桌

大寒将至，4道应季开胃菜温暖餐桌

手机频繁关机会伤硬件？这样做才能延长寿命

手机频繁关机会伤硬件？这样做才能延长寿命

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号