问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

Dropout在训练阶段和测试阶段的工作原理详解

创作时间:

作者:

@小白创作中心

Dropout在训练阶段和测试阶段的工作原理详解

引用

CSDN

1.

https://blog.csdn.net/m0_67708072/article/details/138686511

Dropout是深度学习中常用的一种正则化技术，用于防止模型过拟合。本文将详细介绍dropout在训练阶段和测试阶段的工作原理，并通过PyTorch代码示例展示其具体实现。

训练阶段

在训练阶段，dropout会随机地以概率$p$将输入的某些元素置为0，以模拟神经元的随机失活。具体来说，在前向传播过程中，对于输入的每个数，dropout模块会以概率$p$将其置为0，如果该数未被置0，则将其乘以$\frac{1}{1-p}$作为输出。反向传播阶段，即求导数阶段，dropout的行为如下图所示：

下面通过代码验证一下dropout的工作原理。

前向过程

首先，我们创建一个dropout层，设置丢弃概率$p=0.3$：

dp = torch.nn.Dropout(0.3)

创建一个包含3个随机数的张量：

torch.manual_seed(10)
x = torch.randn(3, requires_grad=True)
x

输出结果为：

tensor([-1.2277, 0.9198, -0.3485], requires_grad=True)

通过dropout层处理：

y = dp(x)
y

输出结果为：

tensor([-1.7538, 1.3140, -0.0000], grad_fn=<MulBackward0>)

可以看出，第三个数被置为0。以第一个数为例，它未被置为0，输出是输入的$\frac{1}{1-p}$倍：

-1.2277 * (1 / (1 - 0.3))

计算结果为：

-1.753857142857143

这与实际输出-1.7538相符。

反向传播，即求导

反向传播过程也分为两种情况：

如果前向输出被置为0，则输出$y$对输入$x$的导数为0；
否则，输出$y$对输入$x$的导数为$\frac{1}{1-p}$。

通过代码验证：

y.sum().backward()  # 求导
x.grad

输出结果为：

tensor([1.4286, 1.4286, 0.0000])

这表明第三个数的导数为0，而其他两个数的导数为$\frac{1}{1-0.3}=1.4285714285714286$。

另一种验证方式：

y = dp(x)  # y三维向量
y.backward(torch.tensor([1.0, 1.0, 1.0]))
x.grad

输出结果同样为：

tensor([1.4286, 1.4286, 0.0000])

测试阶段

在测试阶段，dropout相当于被关闭，经过dropout层得到的输出等于输入。例如：

dp.eval()  # 测试阶段
y = dp(x)
y

输出结果为：

tensor([-1.2277, 0.9198, -0.3485], requires_grad=True)

验证输入输出是否相等：

y == x

输出结果为：

tensor([True, True, True])

这表明在测试阶段，dropout层不会对输入进行任何修改。

训练阶段和测试阶段的切换

一个模型默认处于训练模式。可以通过以下方式切换模型的训练和测试模式：

dp = torch.nn.Dropout(0.3)
dp.training  # 是否是训练模式

输出结果为：

True

切换到测试模式：

dp.eval()
dp.training

输出结果为：

False

切换回训练模式：

dp.train()
dp.training

输出结果为：

True

通过这种方式，可以灵活地控制模型在不同阶段的行为。

热门推荐

真假玛瑙灯光下图片对比：揭示玛瑙真假的秘密

真假玛瑙灯光下图片对比：揭示玛瑙真假的秘密

最顶级的强者思维：允许一切发生

最顶级的强者思维：允许一切发生

2025年中国农用塑料行业：绿色转型与投资策略深度分析

2025年中国农用塑料行业：绿色转型与投资策略深度分析

怎么注册个体户公司？个人注册公司全流程指南

怎么注册个体户公司？个人注册公司全流程指南

山东双城记：潍坊与临沂的文旅魅力探索

山东双城记：潍坊与临沂的文旅魅力探索

《柳叶刀》最新研究：新冠感染对中国人群健康影响的长期追踪

《柳叶刀》最新研究：新冠感染对中国人群健康影响的长期追踪

掌握疫情动态，全国疫情高峰感染高峰进度查询指南

掌握疫情动态，全国疫情高峰感染高峰进度查询指南

跑步不只是跑步 — 每位跑者都需要的四种运动

跑步不只是跑步 — 每位跑者都需要的四种运动

如何优化研发文档管理类体系，提高团队效率？

如何优化研发文档管理类体系，提高团队效率？

不良饮食习惯容易诱发便秘

不良饮食习惯容易诱发便秘

启蒙未来小科学家：不白吃学科启蒙系列漫画书深度解读

启蒙未来小科学家：不白吃学科启蒙系列漫画书深度解读

一文读懂快恢复二极管：高频应用的关键元件，性能与类型全解析

一文读懂快恢复二极管：高频应用的关键元件，性能与类型全解析

ODI 备案：医疗器械行业出海的重要保障，不可忽视

ODI 备案：医疗器械行业出海的重要保障，不可忽视

人类吃肉的习惯导致了这些动物大灭绝？

人类吃肉的习惯导致了这些动物大灭绝？

药瓶上的铝箔封口，究竟是用来干啥的？说是为了防谋杀你信吗？

药瓶上的铝箔封口，究竟是用来干啥的？说是为了防谋杀你信吗？

揭秘：透明真空袋和铝箔袋，哪个能保鲜更久？

揭秘：透明真空袋和铝箔袋，哪个能保鲜更久？

建筑工地噪声治理的有效方法

建筑工地噪声治理的有效方法

中药熬制的正确方法加多少水

中药熬制的正确方法加多少水

每日黄历小知识：值神——玄武

每日黄历小知识：值神——玄武

“预制人”是个什么梗？

“预制人”是个什么梗？

不消化，消化不良怎么办？2025年这些简单实用的方法帮你快速缓解！

不消化，消化不良怎么办？2025年这些简单实用的方法帮你快速缓解！

一体机重装系统的方法与步骤（轻松学会一体机重装系统，恢复电脑原有速度）

一体机重装系统的方法与步骤（轻松学会一体机重装系统，恢复电脑原有速度）

水飞蓟种子该如何种植？怎样才能让它更高产？

水飞蓟种子该如何种植？怎样才能让它更高产？

清远汇聚多方力量推动“百千万工程”落地见效

清远汇聚多方力量推动“百千万工程”落地见效

梨的成熟时间与采摘技巧全攻略

梨的成熟时间与采摘技巧全攻略

入境加拿大能带茶叶吗：最新政策与限制解析

入境加拿大能带茶叶吗：最新政策与限制解析

18世纪至今的德国反犹太主义史

18世纪至今的德国反犹太主义史

八字印星旺的含义与作用：智慧与情感的双重影响

八字印星旺的含义与作用：智慧与情感的双重影响

从不拍烂片的顶级影帝，推荐10部汤姆·汉克斯主演的高分电影

从不拍烂片的顶级影帝，推荐10部汤姆·汉克斯主演的高分电影

2024伤残等级赔偿标准表是怎样规定的

2024伤残等级赔偿标准表是怎样规定的

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号