一元线性回归——最小二乘法详细介绍
创作时间:
作者:
@小白创作中心
一元线性回归——最小二乘法详细介绍
引用
CSDN
1.
https://blog.csdn.net/m0_74383359/article/details/139634992
最小二乘法是机器学习中一个非常重要且基础的算法,它不是回归分析本身,而是一种用于执行回归分析的技术。通过最小化预测值与实际值之间的误差平方和来估计回归模型的参数,从而帮助我们找到描述因变量和自变量之间关系的最佳拟合线或曲线。
最小二乘法介绍
形如:y=k*x+b的图像。我们可以根据点到直线的距离计算出距离,使得距离最小。得到一个关于k与b的一元线性方程。为了使得距离最小,在高等数学里面一般就是求导、当倒数等于零时取最小。所以说我们要对这个一元线性方程对k,b分别进行求导。最后算出两个关于k和b的式子到这一步基本上我们回归方程基本构建完成。
使用Python实现步骤
1. 引入库
import numpy as np
import matplotlib.pyplot as plt
2. 读入数据
编写一个读取csv的函数,提取出数据以及标签
def reed_csv():
data = np.genfromtxt("太阳镜销售数据集.csv", delimiter=',')
x = data[:, 1]
y = data[:, 0]
print(data)
return x, y
# 运行结果:
[[ 75. 2.]
[ 90. 5.]
[148. 6.]
[183. 7.]
[242. 22.]
[263. 25.]
[278. 28.]
[318. 30.]
[256. 22.]
[200. 18.]
[140. 10.]
[ 80. 2.]]
3. 逻辑实现
3.1 这里用三个自定义函数搞定
第一个函数(kbcost)用于计算斜率以及截距和损失值
def kbcost(x, y):
L = len(x)
# 获取当前数据的长度
x_sum = np.sum(x) # 计算和
y_sum = np.sum(y)
x_avg = x_sum/L # 平均值计算
y_avg = y_sum/L
tmp1 = 0
tmp2 = 0
for i in range(L): # 在L里面经行循环遍历i
tmp1 += (x[i]-x_avg)*(y[i]-y_avg)
tmp2 += (x[i]-x_avg)**2
k = tmp1 / tmp2
b = y_avg - k * x_avg
cost = 0
for i in range(L):
cost += (y[i]-k*x[i]-b)**2
cost = cost/L
return k, b, cost
第二个函数用于画图,将我们求的k,和b值绘制成线性方程
def darw_L(x, y, k, b):
plt.scatter(x, y)
plt.plot(x, k*x+b, 'r')
plt.show()
最后一个主函数
调用read_csv()函数将变量保存在x,y里面无需参数,
调用kbcost(x,y)函数用于计算k,b,cost传入参数为x,y,\
在进行可视化,画出一元线性回归方程
最后用户随机输入一个值经行预测,并且计算损失值
if __name__ == "__main__":
x, y = reed_csv()
k, b, cost = kbcost(x, y)
print(cost)
darw_L(x, y, k, b)
x_in = int(input())
print(x_in*k+b)
总结
最小二乘法是机器学习最重要最基础的一个算法,最小二乘法不是回归分析本身,而是一种用于执行回归分析的技术。它通过最小化预测值与实际值之间的误差平方和来估计回归模型的参数,从而帮助我们找到描述因变量和自变量之间关系的最佳拟合线或曲线。
完整项目参考GitHub(Gitee)ZMCpythonProject: 人工智能机器学习代码 (gitee.com)
热门推荐
钢结构住宅在高层建筑中的应用(钢结构住宅施工周期对比)
南京保卫战中的中国军队和日军分别是多少人,各自伤亡多少人?
温湿度无小事:医药仓库监控系统助力药品储存合规化
引体向上 vs 俯卧撑,更推荐你练哪一个?
脉冲信号傅里叶变换与频域分析:从计算到理解
什么是贸易救济措施
身份证快到期了提前多久更换,都有哪些材料要准备和注意事项
如何在求职简历中写出优秀的项目经历
花艺师岗位的工作技能
餐具消毒柜的温度是多少?选择合适的消毒设备很重要
月底流量告急?这些隐藏技巧让你每月免费攒下10G+
恒温恒湿箱定期校准的重要性
绝美晚霞竟然可以预测,你猜下次再现时间是……
高标准农田信息化管理的10大必备技术
商业银行声誉风险与舆情应对
支气管炎与肺炎的区别在于
全面解析炒股配资:投资策略与风险管理的艺术
终裁胜诉!OLED专利337调查结果公布 京东方维护全球显示产业公平竞争
丁真现象:从流量经济到文化符号的深度解读
酒驾危害重重:对个人、家庭和社会的严重威胁
根据自己的兴趣喜好选择专业
宣布造车23个月后,小米过得怎么样了?
脾胃虚寒与脾胃不和:原因、症状及调理方法
2024浙江高考415分能上什么大学?
新规后首家!重大违法强制退市,连续多年造假!此前股价多次涨跌停
黄铜会生锈吗?腐蚀、氧化和护理
医生中级职称评定对学历有什么规定?
腻子开裂、空鼓莫惊慌!三大原因解析,带你走出困扰!
ISFP 与 ESFJ:性格特点及相处之道
抓包(wireshark)详细分析OSPF状态运行机制