学习率对线性回归模型的影响(基于梯度下降法)
创作时间:
作者:
@小白创作中心
学习率对线性回归模型的影响(基于梯度下降法)
引用
CSDN
1.
https://m.blog.csdn.net/Lovely_Chen/article/details/140317385
在机器学习领域,线性回归是一种基础且广泛使用的预测模型,用于建立输入特征和连续输出变量之间的线性关系。而学习率,作为梯度下降法中的关键参数,对模型的训练效果有着重要影响。本文将探讨学习率对梯度下降法在线性回归模型中的影响。
线性回归与梯度下降法
线性回归模型通常采用以下形式:
梯度下降法通过迭代地调整模型参数来最小化代价函数,即均方误差(MSE):
梯度下降算法的目标是通过最小化代价函数 (J(\theta)) 来找到参数的最佳值。梯度下降的更新规则如下:
对于线性回归模型,参数的梯度更新公式可以具体表示为:
梯度下降算法通过重复应用上述更新规则来逐步调整参数,直到找到一个使代价函数最小化的参数集合。
我们可以发现,学习率控制着每次更新的步长,学习率越大,步长越大,反之也成立。
但是不同的学习率,对我们的影响也是不同的,接下来,我们看一看不同学习率对结果的影响。
不同学习率的影响
我们的最终目的是找到梯度更新公式的收敛部分,当我们设置合适的学习率时,看到的图片如下:
可以看到,在迭代次数到100左右时,函数已经收敛了,这是一个好的结果。但是当我们设置不好的学习率时,就会出现不好的结果。
例如,学习率设置的过大:
很明显,这是一个错误的结果。那是因为,当我们设置的步长过大,反而会错过收敛点,这种情况下,只会越来越错。
当然,也不是学习率越小越好。当我们设置的学习率过小的时候,它的步长就会很小,会迭代好多次才可以找到,其次,也会导致训练的成本和时间增长。
所以设置一个合适的学习率,是一个重要的环节。
最后,我们用Python代码模拟一下这个过程:
import numpy as np
import matplotlib.pyplot as plt
# 设置随机种子以获得可重复的结果
np.random.seed(0)
# 生成随机数据点
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)
# 定义线性模型
def predict(X, w, b):
return np.dot(X, w) + b
# 定义均方误差代价函数
def compute_mse(y_pred, y_true):
return ((y_pred - y_true) ** 2).mean()
# 梯度下降法
def gradient_descent(X, y, w, b, learning_rate, iterations):
cost_history = []
for i in range(iterations):
y_pred = predict(X, w, b)
cost = compute_mse(y_pred, y)
cost_history.append(cost)
# 计算梯度
dw = (2 / len(X)) * np.dot(X.T, (y_pred - y))
db = (2 / len(X)) * np.sum(y_pred - y)
# 更新参数
w -= learning_rate * dw
b -= learning_rate * db
return w, b, cost_history
# 初始化参数
w = np.random.randn()
b = np.random.randn()
# 梯度下降参数
learning_rate = 0.001
iterations = 100
# 执行梯度下降
w, b, cost_history = gradient_descent(X, y, w, b, learning_rate, iterations)
# 绘制代价函数图像
plt.plot(cost_history)
plt.title('Cost Function over Iterations')
plt.xlabel('Iterations')
plt.ylabel('Cost (MSE)')
plt.show()
通过这段代码,我们可以直观地看到不同学习率对模型收敛速度和效果的影响,从而更好地理解学习率这一关键参数的作用。
热门推荐
五贝(彭飞)观世音菩萨:慈悲与智慧的化身
区块链技术在物流供应链发展中的应用研究
汉代农业土地政策研究
2024年中国高速公路行业经营现状分析——多元化投资及跨界经营助力企业转型发展
网友建议江夏吞并洪山!武汉行政区划能否重新调整一下?
全球医用麻醉药物市场:增长趋势与未来机遇深度剖析
解锁村上春树的私人歌单,用音乐治愈精神内耗
俄罗斯坐拥1700万平方公里,为何还总觉得不够?多数是不毛之地
生日情话最暖心短句:让爱意满满传递
守护“头”等大事!养成这6个好习惯,能有效保护大脑健康
解决维护旧系统与新产品开发的冲突方法
马桶的历史:一个小小的改变推动了人类文明!
《哪吒2:魔童归来》里的父子情深与家庭教育密码
Transformer中的前馈层:深度解析与应用探索
激光技术的革新与挑战:探索未来科技新纪元
央企加快AI布局,国内外共振,上半年运营商、算力或率先爆发
左手指头麻木是什么原因
梅菜扣肉:传统美味与文化传承的交融
入户门地垫知识:使用范围、类型、注意事项、选购与搭配
牙齿太细太长也是病?这种情况不可逆!华西医生4招教你预防
中国赛马史竟有三千年?一文看中国古代赛马进化史
去油污最强的清洁剂配方
冲绳海葡萄:不可错过的美味与独特魅力
创新驱动,科技赋能:中国运动品牌迎来新篇章
《汤姆叔叔的小屋》:一部影响深远的文学经典
C919试飞圆满落幕,适航证冲刺在即,国产大飞机翱翔蓝天指日可待!
成人高考本科电气工程及其自动化专业介绍附报考院校指南
血糖高不高,看尿就知道!早期糖尿病尿液什么颜色
人力资源薪酬制度的价值与员工满意度之间的关系是什么?
聚乳酸的作用