问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

由单个神经元到神经网络：简单全连接神经网络工作解析

创作时间:

作者:

@小白创作中心

由单个神经元到神经网络：简单全连接神经网络工作解析

引用

CSDN

1.

https://blog.csdn.net/m0_58040765/article/details/145226639

神经网络是机器学习和深度学习的核心组件，它通过模拟人脑神经元的工作方式来处理和分析数据。本文将从单个神经元出发，逐步介绍神经网络的构建、激活函数的作用以及反向传播与梯度下降的优化过程。

由单个神经元到神经网络

在上一篇文章中，我们已经了解了单个神经元的具体架构。现在，我们将从单个神经元出发，探寻简单全连接神经网络的工作过程。

单个神经元其实就是一个函数，现在我们假设单个神经元的结构都为线性结构（即 (y=wx+b)）如图：

多个神经元相互连接就构成了神经网络：

在上图中蓝色正方形分别代表一个参数，我们将其称为 (x_1, x_2, x_3, x_4)，上图中每一条线都代表一个权重参数（也就是 (y=wx+b) 中的 (w)）：

也就是说我们可以得到，在上图中的最终运算表达式为：

[y = r_1 \cdot r_1 + r_2 \cdot r_2 + r_3 \cdot r_3]

[= w_{11} \cdot x_1 + w_{12} \cdot x_2 + W_{13} \cdot x_3 + w_{14} \cdot x_4 + b_1]

[+ w_{21} \cdot x_1 + w_{22} \cdot x_2 + W_{23} \cdot x_3 + w_{24} \cdot x_4 + b_2]

[+ w_{31} \cdot x_1 + w_{32} \cdot x_2 + W_{33} \cdot x_3 + w_{34} \cdot x_4 + b_3]

至此我们得出了此神经网络的预测值。

激活函数的引入

其实通过上面的运算过程不难发现，虽然这个神经网络增加了两个神经元，但是似乎对结果的影响微乎其微。我们将上述表达式稍作整理：

[y = r_1 \cdot (w_{11} \cdot x_1 + w_{12} \cdot x_2 + W_{13} \cdot x_3 + w_{14} \cdot x_4 + b_1)]

[+ r_2 \cdot (w_{21} \cdot x_1 + w_{22} \cdot x_2 + W_{23} \cdot x_3 + w_{24} \cdot x_4 + b_2)]

[+ r_3 \cdot (w_{31} \cdot x_1 + w_{32} \cdot x_2 + W_{33} \cdot x_3 + w_{34} \cdot x_4 + b_3)]

[= (r_1 \cdot w_{11} + r_2 \cdot w_{21} + r_3 \cdot w_{31}) \cdot x_1]

[+ (r_1 \cdot w_{12} + r_2 \cdot w_{22} + r_3 \cdot w_{32}) \cdot x_2]

[+ (r_1 \cdot w_{13} + r_2 \cdot w_{23} + r_3 \cdot w_{33}) \cdot x_3]

[+ (r_1 \cdot w_{14} + r_2 \cdot w_{24} + r_3 \cdot w_{34}) \cdot x_4]

[+ r_1 \cdot b_1 + r_2 \cdot b_2 + r_3 \cdot b_3]

[= w_1 \cdot x_1 + w_2 \cdot x_2 + w_3 \cdot x_3 + w_4 \cdot x_4 + B]

结果发现本神经网络 (y) 的运算结果其实和一个神经元的情况下似乎没有差别，其实用大白话来讲就是无论多少根直线加在一起，结果还是直线。

但是我们生活中亟待解决的问题有相当一部分是非线性的问题，那么如何让线性神经元拟合非线性函数呢？很简单，让直线“变软”就行了，这就是激活函数干的事情：让直线“变软”使其能够拟合非线性函数，在每个神经元得出结果后，将这个结果输入激活函数，然后再把他传到下一层神经元。

反向传播与梯度下降

前面两部分其实就是神经网络前向传播的全过程，接下来我们来研究神经网络中的 optimization，也就是反向传播与梯度下降。

在上一篇文章中我们知道了，对于单个神经元，梯度下降其实就是优化参数，优化 (y=wx+b) 中的 (w) 和 (b)，使 loss 值变得更小，优化方式为：

对于神经网络而言，梯度下降的意义并没有发生改变，无非就是参数变多了而已，以这张图为例：

如果我要更新 (w_{11}) 的参数，那么根据上文得出的 (y) 计算方式：

[y = r_1 \cdot r_1 + r_2 \cdot r_2 + r_3 \cdot r_3]

[= r_1 \cdot (w_{11} \cdot x_1 + w_{12} \cdot x_2 + W_{13} \cdot x_3 + w_{14} \cdot x_4 + b_1)]

[+ r_2 \cdot (w_{21} \cdot x_1 + w_{22} \cdot x_2 + W_{23} \cdot x_3 + w_{24} \cdot x_4 + b_2)]

[+ r_3 \cdot (w_{31} \cdot x_1 + w_{32} \cdot x_2 + W_{33} \cdot x_3 + w_{34} \cdot x_4 + b_3)]

我们由链式求导法则可得：

[\frac{\partial L}{\partial w_{11}} = \frac{\partial L}{\partial y} \cdot \frac{\partial y}{\partial r_1} \cdot \frac{\partial r_1}{\partial w_{11}}]

（loss function 为损失函数，是关于 (y) 的函数）

其他参数梯度下降方式与 (w_{11}) 一样。

热门推荐

西红柿和樱桃，一个会触发痛风，一个能缓解痛风？

西红柿和樱桃，一个会触发痛风，一个能缓解痛风？

美食厨房：清蒸鸦片鱼的做法与技巧

美食厨房：清蒸鸦片鱼的做法与技巧

葱油鸦片鱼头

葱油鸦片鱼头

淄博烧烤带火文旅，你get到秘诀了吗？

淄博烧烤带火文旅，你get到秘诀了吗？

双十一冰箱价格大揭秘：最高直降55%，政府补贴叠加平台优惠创历史低价

双十一冰箱价格大揭秘：最高直降55%，政府补贴叠加平台优惠创历史低价

新型号冰箱：电费上涨下的省钱神器？

新型号冰箱：电费上涨下的省钱神器？

达龙硬骨头：拯救小鸡后腿站不起来的养殖难题

达龙硬骨头：拯救小鸡后腿站不起来的养殖难题

维生素B1缺乏，你的小鸡也中招了吗？

维生素B1缺乏，你的小鸡也中招了吗？

这些大学，上春晚了！

这些大学，上春晚了！

闽菜之首佛跳墙：从官府名菜到黑珍珠榜单

闽菜之首佛跳墙：从官府名菜到黑珍珠榜单

夏末的爱尔兰：体验8月的庆典与美好时光

夏末的爱尔兰：体验8月的庆典与美好时光

一凤一鸾：伊犁博物馆元青花凤首扁壶的传奇故事

一凤一鸾：伊犁博物馆元青花凤首扁壶的传奇故事

离婚后父母应该如何对待孩子

离婚后父母应该如何对待孩子

大年初二带娃回娘家攻略：从准备到礼仪，让亲情更温暖

大年初二带娃回娘家攻略：从准备到礼仪，让亲情更温暖

大年初二回娘家，你准备好了吗？

大年初二回娘家，你准备好了吗？

大年三十回娘家 vs 大年初二回门：哪个更增亲情？

大年三十回娘家 vs 大年初二回门：哪个更增亲情？

微信加好友新姿势：五招让你社交圈爆棚！

微信加好友新姿势：五招让你社交圈爆棚！

微信加好友新姿势：轻松扩大你的社交圈！

微信加好友新姿势：轻松扩大你的社交圈！

卢布暴跌考验下，中俄贸易如何破局？

卢布暴跌考验下，中俄贸易如何破局？

离婚后如何照顾孩子？监护权和抚养费问题如何解决？

离婚后如何照顾孩子？监护权和抚养费问题如何解决？

《南京大屠杀档案》入选世界记忆遗产：历史真相的国际认可

《南京大屠杀档案》入选世界记忆遗产：历史真相的国际认可

张纯如：用一本书唤醒西方世界的南京大屠杀记忆

张纯如：用一本书唤醒西方世界的南京大屠杀记忆

南京大屠杀纪念日将至，日本民间团体再起波澜

南京大屠杀纪念日将至，日本民间团体再起波澜

中庸和礼乐制度

中庸和礼乐制度

浅谈周朝的礼乐制度

浅谈周朝的礼乐制度

太冲穴：你的私人解酒神器！

太冲穴：你的私人解酒神器！

酒精性脂肪肝：戒酒是最佳解药！

酒精性脂肪肝：戒酒是最佳解药！

如何正确使用万用表进行电压、电流和电阻测量的实用指南

如何正确使用万用表进行电压、电流和电阻测量的实用指南

离婚后如何管理财务，规划新的经济生活？

离婚后如何管理财务，规划新的经济生活？

婚姻中的经济压力：家庭条件不如他人，如何应对？

婚姻中的经济压力：家庭条件不如他人，如何应对？

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号