MLP多层感知机原理详解
创作时间:
作者:
@小白创作中心
MLP多层感知机原理详解
引用
CSDN
1.
https://blog.csdn.net/qq_35768355/article/details/140719548
MLP(Multi-Layer Perceptron),即多层感知机,是一种前馈型人工神经网络。它由一个输入层、一个输出层以及至少一个隐藏层(输入层和输出层中间的层)组成。每个神经元(或称为节点)与下一层中的所有神经元相连,并且这些连接具有权重。
MLP多层感知机的结构
全连接层:
- MLP 中的每一层都是一个全连接层,这意味着每一层中的每个神经元与下一层中的所有神经元相连接。
- 每个连接都有一个权重,用于调节信号强度。
输入层:
- 输入层接收原始输入数据,并将其传递给第一个隐藏层。
- 输入层中的神经元数量通常等于输入数据的维度。
隐藏层:
- 隐藏层位于输入层和输出层之间,用于提取输入数据中的特征。
- 隐藏层可以有多个,每个隐藏层都是全连接层。
- 隐藏层中的神经元数量和层数可以根据任务的复杂性和数据的特性来调整。
输出层:
- 输出层是网络的最后一层,用于生成最终的预测或分类结果。
- 输出层也是全连接层,其中的每个神经元与前一层中的所有神经元相连接。
- 输出层中的神经元数量取决于任务类型。对于分类任务,输出层中的神经元数量通常等于类别数量;对于回归任务,输出层可能只有一个神经元。
MLP多层感知机的优点
强大的表示能力:
- MLP理论上能够近似任何连续函数,这得益于多层非线性变换的能力。
- 隐藏层越多,网络越深,能够学习到的数据结构就越复杂。(但不是越深越好,过深的网络会导致过拟合、梯度消失/梯度爆炸,所以后面出现了ResNet网络,ResNet理论上可以支持非常深的网络,比如ResNet-1001,但并不是说网络越深就一定越好。ResNet通过这些跳过连接使得训练深层网络成为可能,但实际上,网络的深度仍然需要根据具体的任务和数据集来调整)
端到端学习:
- MLP可以从原始数据直接学习到有用的特征表示,不需要像机器学习一样手动进行特征工程。
- 网络可以通过反向传播算法自动调整权重和偏置,以最小化损失函数。
灵活的输出类型:
- MLP可以用于多种任务,如回归、分类等。
- 输出层的激活函数可以根据任务需求选择,如使用sigmoid函数进行二分类、softmax函数进行多分类等。
MLP多层感知机的缺点
过拟合
原因:MLP中的全连接层使得每个神经元都与前一层的所有神经元相连,这种密集的连接方式意味着网络具有很高的参数,当训练数据量相对较小时,MLP能直接记住训练数据,而不是学习到数据的内在模式,从而导致过拟合。
计算成本过大
原因:MLP 中的每一层都是一个全连接层,这意味着每一层中的每个神经元与下一层中的所有神经元相连接,全连接层中的每个连接都有一个权重,加上每个神经元还有一个偏置项,对于高维输入数据,参数的数量可能会非常庞大。
例子:假设输入图像是 100×100 的灰度图像,那么输入层就有 100×100=10,000个神经元。如果第一个隐藏层有 500 个神经元,那么仅这一层就需要 10,000×500个权重加上 500个偏置项,总共 5,000,500个参数。如此庞大的参数数量不仅增加了训练时间,还会加剧过拟合的风险。
本文原文来自CSDN
热门推荐
护士休假制度怎么规定的?
极化恒等式专题讲义
浅谈光伏发电原理
企业社保包含哪些内容
辽宁新高考政策解读2025版:含赋分规则、等级对照表
农村宅基地买卖全攻略:处罚规定、户主变更与房屋拍卖条件
电车油车大对决:理智选购指南
办理无犯罪记录证明的法律程序与实务操作指南
拓展坞会烧坏主板吗
血脂四项指标中只有甘油三酯偏高,其它三项正常,这说明什么?
蹦极运动的生理影响与心理体验探讨
解决战网报错:修复“a required.dll文件丢失“的全面指南
疝气手术的补片有几种
从科研合作到共创成果:分享跨学科团队中的协作策略
茄子豆腐怎么做好吃
凸轮机构的压力角、基圆半径
生物样本库液氮罐中的氮气为何能冻存样本?
宋兆普:托起脑瘫儿童的生命方舟
孕妇甲状腺功能异常怎么办?医生建议这样做
中药饮片的炮制方法有哪些 中药饮片切制前软化方法
如何科学设置止损和止盈点以保护投资?这些设置对投资结果有何影响?
网络管理员的职业发展
五分钟了解《第二次世界大战》1939年——1945年大事年表
二战中,如果没有英美的援助,苏联能够打得过德国?
五行属水的女孩名字寓意好的字,五行属水最旺的名字
智能鸡舍:现代养鸡业的科技新标杆
六个动作改善脊柱曲线
抢滩细分蓝海市场:商用车智能化走向何方?
探索多样化分销渠道提升销售业绩的方法
慢跑对糖尿病有好处吗