预测值:线性回归
创作时间:
作者:
@小白创作中心
预测值:线性回归
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/introduction-machine-learning-models/2-prediction-linear-regression
线性回归是机器学习中最基础也是最重要的模型之一,它通过寻找最佳拟合直线来预测变量之间的关系。本文将从最简单的两点连线预测出发,逐步深入讲解线性回归的原理和应用,帮助读者理解这一经典算法的核心思想。
也许最简单的机器学习形式是画一条连接两点的线,并预测这种趋势可能会走向何方。但是,如果你有两个以上的点,而这些点没有整齐地排列,又该怎么办呢?如果你有超过两个维度的点呢?这就是使用线性回归的原因。
线性回归通常用于预测依赖于一个或多个“预测因子”(与 $Y$ 正交的一个或多个轴上的值,通常统称为 $X$)的定量“响应”($Y$ 轴上的值)。工作假设是,预测因子和响应之间的关系或多或少是线性的。
线性回归的目标是以最好的方式拟合一条直线,以最小化我们在数据集中观察到的响应与我们的直线(线性近似)预测的响应之间的偏差。评估这种误差最常见的方法称为“最小二乘法”。该方法为,求预测值与实际值之间的差值的平方,然后将整个数据集的所有这些差值平方求和,最后将总和最小化。
从统计学上说,我们可以将响应和预测因子之间的关系表示为:
$Y = B_0 + B_1X + E$
还记得高中几何吗?$B_0$ 是直线的截距,$B_1$ 是其斜率。我们通常将 $B_0$ 和 $B_1$ 作为系数,将 $E$ 作为误差项,表示模型中的误差范围。
让我们用实际数据来练习。(请注意,在这些预测过程中,不会损坏任何方格纸。)
热门推荐
《我的楼兰》走红,揭秘楼兰古城的历史与文化
探秘广西百色:德天瀑布与通灵大峡谷的自然奇观
百色旅游新宠:通灵大峡谷、鹅泉、天坑群
百色起义纪念馆打卡攻略:追寻红色记忆,传承革命精神
广西百色旅游打卡,三大必去景点揭秘
广东观音山:民营资本的生态保护样本
帽峰山和佛山祖庙:广东4A级景区的文化盛宴
广州塔夜景打卡攻略:最佳观赏点、门票、交通全攻略
肖战徐克联手打造春节档最强武侠片
学霸高效备考秘籍大揭秘
如何根据兴趣选择小学教育本科热门科目?
探索中部与西南的魅力:武汉至贵州深度旅游全攻略
九叔再出江湖!《九叔传说》开播在即,白河镇惊悚案件待解
林正英:九叔形象的银幕变迁与僵尸片传奇
苏义飞律师详解刑事案件审查起诉时间
这些小物件可能在“偷听”你的生活
打架致伤如何界定?一文详解轻微伤鉴定标准
学生打老师4耳光被判1年半,为啥路虎女司机只行政拘留?律师最新解答
新能源车电机烧毁,这些问题你了解吗?
知名品牌电机召回,教你快速修复电机故障
电机烧毁后,专业维修技巧大揭秘
电机烧毁紧急处理指南
用心理学原理优化你的晚安问候语
智能电冰箱:节能黑科技如何改变我们的生活?
二郎神教你玩转古代弹弓技艺
2025高考选科攻略:找到最适合你的科目组合
刑事诉讼案件的程序是怎么样
君卓机械TS16949认证:管理者如何引领变革?
钢运两路分公司的企业文化演讲稿
一把手发言稿:如何彰显领导力?