零基础学PyTorch:自动求导机制与梯度计算详解
创作时间:
作者:
@小白创作中心
零基础学PyTorch:自动求导机制与梯度计算详解
引用
CSDN
1.
https://m.blog.csdn.net/qq_46038405/article/details/145595731
PyTorch的自动求导机制是深度学习中非常重要的一部分,它能够自动计算梯度,从而帮助我们优化模型参数。本文将详细介绍PyTorch的自动求导机制,包括计算图构建、梯度计算、梯度累积特性等内容,并通过多项式函数求导等实战案例加深理解。
PyTorch Day 2:自动求导机制与梯度计算
一、Autograd核心原理
1. 计算图构建
import torch
# 创建需要跟踪梯度的张量
x = torch.tensor(2.0, requires_grad=True)
w = torch.tensor(1.0, requires_grad=True)
b = torch.tensor(0.5, requires_grad=True)
# 前向计算
y = w * x + b # 构建计算图
2. 梯度计算
y.backward() # 自动计算梯度
print(f'dy/dw = {w.grad}') # 输出2.0 (x的值)
print(f'dy/dx = {x.grad}') # 输出1.0 (w的值)
print(f'dy/db = {b.grad}') # 输出1.0
3. 梯度累积特性
# 多次反向传播前需清零梯度
x.grad.data.zero_()
w.grad.data.zero_()
b.grad.data.zero_()
二、梯度计算实战
案例:多项式函数求导
f(x) = 3x^3 + 2x^2 + 5x + 1
x = torch.tensor(2.0, requires_grad=True)
f = 3*x**3 + 2*x**2 + 5*x + 1
f.backward()
print(f'在x=2处的导数:{x.grad:.2f}') # 应输出49.00
验证计算正确性
手动计算:
f’(x) = 9x^2 + 4x + 5
当x=2时:
f’(2) = 94 + 42 + 5 = 36 + 8 + 5 = 49
三、高阶梯度应用
二阶导数计算
x = torch.tensor(3.0, requires_grad=True)
y = x**2 + 2*x
# 一阶导
first_grad = torch.autograd.grad(y, x, create_graph=True)[0]
# 二阶导
second_grad = torch.autograd.grad(first_grad, x)[0]
print(f'二阶导数值:{second_grad}') # 输出2.0
四、梯度控制技巧
1. 禁用梯度跟踪
with torch.no_grad():
y = x * 2 # 不记录计算历史
2. 分离计算图
loss = model(input)
# 仅保留数值,断开梯度连接
loss_value = loss.detach()
五、注意事项
梯度清零:每次反向传播前使用
.zero_()
方法清空梯度类型匹配:确保所有参与计算的张量类型一致(float/double)
中间变量:避免对非叶子节点直接修改,可能导致梯度错误
内存管理:及时释放不再需要的计算图(
del
变量或使用
with
语句)GPU计算:梯度计算与设备无关,但需确保所有张量在同一设备
六、今日总结
理解计算图构建原理与梯度传播机制
掌握
backward()
和
grad
的基本使用方法实现手动梯度验证,理解自动微分正确性
学习梯度控制技巧,避免常见内存泄漏问题
完整代码示例:https://gitee.com/sr01/pytorch
⚠️常见错误:
忘记
requires_grad=True
导致无法计算梯度未及时清零梯度导致数值累加
在验证阶段未禁用梯度跟踪造成内存浪费
热门推荐
银行零售财富业务数字化转型“实操秘笈”
企业在数字化转型时如何借鉴其他公司的成功案例?
PCIe传输速率和有效带宽计算方式
MySQL非root账号管理:创建、登录与权限分配详解
CDN如何实现就近原则
阿斯巴甜是代糖吗?有何危害?
貔貅的象征意义及相关禁忌分析 貔貅的寓意和禁忌是什么
心脑血管病人能吃山楂片吗?专家解读其利弊与注意事项
尿崩症的治疗方法主要有哪几种
探索磷酸铁锂 (Lifepo4) 电池的使用寿命
是药三分毒,医生提醒:这8种常见降糖药的副作用,老年糖友一定要知道!
商标使用博眼球?公序良俗要注意!
新能源汽车能量管理系统概述
英国大学课本购买全攻略:在线平台、实体书店、二手交易一站通
罗汉松养护指南:土壤、浇水与修剪技巧
卓越领导团队如何沟通
逆变器测试生产线规划指南:从设备选择到持续优化
数据库管理系统——SQL(数据查询)
多发性硬化症研究新进展:新型生物标志物与治疗方法
黄道婆:古代女纺织师的传奇与贡献
打开DCM文件
头晕,血压低怎么办
间歇性禁食不安全?间歇性禁食影响青少年胰岛β细胞发育
苏州社保基数计算详解:影响因素及应对策略
健康备孕:戒烟戒酒的科学指南
怎么查汽车电路故障?查找汽车电路故障的方法有哪些及如何进行故障排查?
血管神经性水肿的症状及处理方法
LOGO设计完全指南:文字与图形的完美结合
提升数据安全意识,防范数据安全风险
暑假用眼过度?这些护眼方法请收好!