深度学习中的迭代次数、批次大小和周期详解
创作时间:
作者:
@小白创作中心
深度学习中的迭代次数、批次大小和周期详解
引用
CSDN
1.
https://blog.csdn.net/weixin_31866177/article/details/141680180
在深度学习的训练过程中,迭代次数(iterations)、批次大小(batch size)和周期(epoch)是三个重要的概念,它们之间有密切的关系。本文将详细解释这些概念及其相互关系,并通过一个PyTorch代码示例帮助读者更好地理解。
1. 批次大小(Batch Size)
批次大小是指在一次前向和后向传播中,模型处理的样本数量。批次大小的选择会影响训练的稳定性和速度:
- 小批次大小:更频繁地更新模型参数,可以更快地找到好的方向,但会导致更高的噪声和不稳定性。
- 大批次大小:每次更新模型参数时有更准确的梯度估计,但更新频率较低,训练时间可能更长。
2. 迭代次数(Iterations)
迭代次数是指模型在训练过程中更新参数的次数。每次迭代,模型处理一个批次的样本并更新参数。迭代次数的计算公式为:
3. 周期(Epoch)
一个周期(epoch)是指模型已经看过所有训练样本一次。换句话说,一个周期意味着模型已经完成了一轮完整的训练数据集的遍历。周期的数量通常用来衡量训练的进展。
关系总结
- 迭代次数和批次大小的关系:
- 每次迭代处理一个批次(batch size)的样本。
- 一个周期内的迭代次数等于训练集的样本数量除以批次大小。
- 迭代次数和周期的关系:
- 一个周期内的迭代次数为:
- 总的迭代次数(Total iterations)等于每个周期的迭代次数乘以周期数:
示例
假设有一个训练集包含1000个样本,批次大小为50,训练10个周期:
每个周期的迭代次数:
总的迭代次数:
实践中的选择
- 批次大小:选择合适的批次大小通常需要在稳定性和计算效率之间权衡。较小的批次大小可能导致更高的噪声,但更频繁的参数更新。较大的批次大小则提供更稳定的梯度估计,但需要更多的内存和较长的计算时间。
- 周期数:通常通过观察训练和验证损失或准确率来决定训练的周期数。过多的周期可能导致过拟合,而过少的周期可能导致欠拟合。
代码示例
以下是一个简单的PyTorch代码示例,展示了迭代次数、批次大小和周期数的关系:
import torch
from torch.utils.data import DataLoader, TensorDataset
# 生成一些示例数据
num_samples = 1000
inputs = torch.randn(num_samples, 10)
targets = torch.randn(num_samples, 1)
# 创建数据集和数据加载器
dataset = TensorDataset(inputs, targets)
batch_size = 50
dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True)
# 模型、损失函数和优化器
model = torch.nn.Linear(10, 1)
loss_fn = torch.nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
# 训练
num_epochs = 10
for epoch in range(num_epochs):
for batch_inputs, batch_targets in dataloader:
# 前向传播
outputs = model(batch_inputs)
loss = loss_fn(outputs, batch_targets)
# 后向传播和优化
optimizer.zero_grad()
loss.backward()
optimizer.step()
print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')
在这个示例中,我们有1000个样本,批次大小为50,每个周期有20次迭代,总共训练10个周期。因此,总的迭代次数为200次。
热门推荐
如何实现纸张的可持续变革?纸张变革对相关产业有何影响?
天氣冷就腰酸背痛?趕走脊椎痛!脊椎保健學起來
探讨智慧银行如何降低金融服务门槛,推动普惠金融的普及
申请房贷时需要注意哪些事项?
乡村发展实用方法探索
山火连发,原因公布!多地拉响红色预警→
凯美瑞点烟器没电怎么办?保险丝检查与更换指南
PLC控制系统的操作指南,从入门到精通
四种国检(NGTC)钻石鉴定证书,哪种才最靠谱?
咸鸭蛋的营养与制作秘籍:美味与健康并存的秘诀!
26元的"仅退款"该不该支持?法院:买受人违反约定应承担支付义务
当消费者维权遇到难题……
阿姨饱受“蛇缠腰”折磨,医生用这招为其斩断“痛根”!
思域是否配备正时皮带?
这里的县中不塌陷,不止“县县都有清北生”
出行更便利了!一大波重大工程建成通车,“轨道上的长三角”加速驶来
晚上喝凉茶会不会睡不着
慢牛行情的特征是什么?如何把握慢牛行情中的投资机会?
治肠痈之要药——大血藤
睡眠冥想:深度解析其原理、方法与科学依据
炖牛骨头虽然看似简单,但要想炖得入味、软烂,还是需要掌握技巧
拉曼光谱仪或荧光显微镜中激光光斑尺寸的影响因素分析
显微镜物镜上的数字代表什么意思
如何利用AI快速生成小说情节?五个技巧助你高效创作
充电玩手机遭遇手机爆炸,安全使用手机需警惕
Omiyage:日式伴手礼的深厚文化与选择指南
银行转账的异地转账到账速度详解
早上可以空腹吃梨子吗?饭前还是饭后吃更好?
如何选靠谱的月嫂
什么是ROE?一文读懂净资产收益率的计算与应用