资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

大模型所谓的参数是什么？大模型为什么需要训练？大模型训练到底干了什么？

创作时间:

作者:

@小白创作中心

大模型所谓的参数是什么？大模型为什么需要训练？大模型训练到底干了什么？

引用

来源

http://www.360doc.com/content/24/0602/13/48115167_1125107549.shtml

大模型（如GPT）的参数到底是什么？为什么需要训练？训练过程中究竟发生了什么？本文将从机器学习的基本原理出发，深入浅出地解释这些核心问题。

大模型的参数到底是什么？

大模型的发展从最初的几百个参数，到现在的上千亿个参数，比如GPT-3就拥有1750亿个参数。随着参数数量的提升，大模型的功能也变得越来越强大，特别是现在GPT-4的出现，大模型已经可以和人类进行正常的语音和视频交流。

但很多人都不知道这个参数到底是个什么东西？首先，我们要明白一件事，不要把训练数据当作参数；训练数据是训练数据，参数是参数。

大模型是基于机器学习模型，通过大量数据训练出来的模型，所以叫做大模型。而现在主流的大模型都是基于神经网络模型构建的模型，不论是基于卷积神经网络(CNN)，还是循环神经网络(RNN)，亦或者是Transformer神经网络等。

但神经网络模型只是机器学习模型中的一个分类，其它还包括支持向量机，决策树，回归模型等。而这里说的大模型的参数，是基于神经网络模型而构建的参数。我们知道，神经网络模型有很多层，每一层都有很多个神经元，而每一层又需要进行连接；这就是大模型参数的由来，比如权重与偏置，就是每个神经元都有的参数。

一般情况下，大模型的参数是在网络架构时就设定好的，参数数量一般不会发生变化；但也有例外情况，比如动态神经网络就会对参数数量进行动态调整。

大模型训练的具体过程？

我们都知道，训练大模型需要准备大量的数据，然后对模型进行训练。那么这个训练的过程到底是干了什么，哪些训练数据的作用是什么？

其实说白了，大模型训练的本质就是调整参数。在前面我们说了，大模型有很多个参数，现在的大模型基本上参数都是以亿为单位；当然，参数的数量根据大模型的架构而有所不同。

训练的过程其实就是把训练数据输入到大模型中，然后模型根据这些数据对参数进行调整的过程，以求达到一个最优解。如果把神经网络看作一个黑盒，那么我们输入数据，经过神经网络这个黑盒处理之后，再输出我们的数据。

神经网络单层模型

类似于人体有无数个神经元组成，而从数学理论来说，更多的神经元与更复杂的神经网络架构，就能够进行更加复杂的数据处理。所以，就有了多层的神经网络架构，如下图所示，神经网络由多个神经层组成。如GPT-3就有96层。

多层神经网络

这就是神经网络的模型架构。训练开始时，需要把训练数据输入到模型中，具体的输入方式这里暂不讨论，我们只需要知道训练数据需要输入到神经网络中即可。

因为模型有多个神经层，所以训练数据从输入层进入大模型之后；需要在模型的多个神经层之间进行流转，而这个过程术语叫做正向传播。数据从输入层，一层一层的传播到输出层，然后输出结果；但由于大模型刚开始就像一个小学生，所以它输出的结果往往不尽人意。

所以，为了解决这个问题，大模型的输出结果需要跟实际结果进行匹配，术语叫做计算损失差，损失差越大说明输出结果越差。而有了损失差，说明当前的模型是有问题的；所以就需要对模型进行调整，这就是所谓的反向传播。

意思就是，模型把输出的结果再次输入到模型中，然后模型根据这个结果，使用某种算法对模型中的参数进行调整，比如不同神经元的权重等。而调整参数的这个东西叫做优化器。

模型训练流程

然后，模型根据这个原理，使用训练数据一次一次的输入，然后一次一次的对参数进行调整。最后达到一个最优解，也就是训练好的大模型。这也是为什么大模型要经过很多轮的训练，才能达到比较满意的效果。

当然，大模型的神经层并不是越多越好，训练数据也不是越多越好，有时候更多的参数和训练数据训练出来的结果，可能还没有少一点的效果好。而这也有专门的评估函数对训练结果进行评估。

以上就是大模型训练的原理。

热门推荐

半夜口干舌燥，可能不是缺水！这6种情况一定要警惕

嘴唇易干裂上火怎么办正确使用加湿器可改善皮肤干燥状况

包涵体蛋白常见问题解析

写春天的诗有哪些描绘细腻入微？

如何让婚姻幸福最大化？这四点很重要！

杨过都不会独孤九剑，风清扬从哪学的剑法？你看风清扬的爷爷是谁

四川青城山：道教文化的发源地

84消毒液能否灭活艾滋病毒？科学揭秘与认知误区

数字科技“活化”历史遗址：以北京中轴线为例

团队沟通如何改进

5大高蛋白食物，白细胞低的患者，一定要常吃！

反攻！刚刚，利好来了！

小金鱼眼睛为什么不眨眼？

使用弹力带训练增强力量的完整指南

原油价格波动的原因是什么？这种价格波动会产生怎样的后果？

短视频制作的技巧与创新，如何通过创意提升短视频效果

情感的枷锁：束缚心灵的温柔牢笼

上海全市开展电动自行车专项整治，八大步骤详解线上上牌流程

多维度对比：大学与学院，哪个更适合你？

CPI和PPI反映什么