预测值:线性回归
创作时间:
作者:
@小白创作中心
预测值:线性回归
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/introduction-machine-learning-models/2-prediction-linear-regression
线性回归是机器学习中最基础也是最重要的模型之一,它通过寻找最佳拟合直线来预测变量之间的关系。本文将从最简单的两点连线预测出发,逐步深入讲解线性回归的原理和应用,帮助读者理解这一经典算法的核心思想。
也许最简单的机器学习形式是画一条连接两点的线,并预测这种趋势可能会走向何方。但是,如果你有两个以上的点,而这些点没有整齐地排列,又该怎么办呢?如果你有超过两个维度的点呢?这就是使用线性回归的原因。
线性回归通常用于预测依赖于一个或多个“预测因子”(与 $Y$ 正交的一个或多个轴上的值,通常统称为 $X$)的定量“响应”($Y$ 轴上的值)。工作假设是,预测因子和响应之间的关系或多或少是线性的。
线性回归的目标是以最好的方式拟合一条直线,以最小化我们在数据集中观察到的响应与我们的直线(线性近似)预测的响应之间的偏差。评估这种误差最常见的方法称为“最小二乘法”。该方法为,求预测值与实际值之间的差值的平方,然后将整个数据集的所有这些差值平方求和,最后将总和最小化。
从统计学上说,我们可以将响应和预测因子之间的关系表示为:
$Y = B_0 + B_1X + E$
还记得高中几何吗?$B_0$ 是直线的截距,$B_1$ 是其斜率。我们通常将 $B_0$ 和 $B_1$ 作为系数,将 $E$ 作为误差项,表示模型中的误差范围。
让我们用实际数据来练习。(请注意,在这些预测过程中,不会损坏任何方格纸。)
热门推荐
32万亿元公募基金再启航
全国大豆压榨企业利润统计解析及分析
咖啡机是锅炉好还是加热块好?如何选择咖啡机的加热系统
咖啡机是锅炉好还是加热块好?如何选择咖啡机的加热系统
失信人员坐高铁二等座是否受限?
新买的内衣怎么洗才正确?有哪些注意事项?
PostgreSQL与MySQL深度对比:功能、性能与适用场景全解析
升主动脉扩张丨阈值、相关因素
离婚冷静期的今生前世
《2024ADA糖尿病诊疗标准(精简版)》重磅发布,9大“核心图表”一文汇总
乳酸菌素片饭前吃还是饭后吃
冷空气+雨水即将到货!广东降温3~6℃
绵阳到四川九寨沟旅游景点线路:沿途经过哪些地方与美食推荐
明日方舟娜仁图亚干员图鉴 六星回环射手
从兵家流派起源、分类、治国治军内涵角度,谈其与诸子百家的关系
甲流失去味觉嗅觉怎么恢复
女生最实用的减肥方法
酒后如何解酒?六种实用方法助你快速恢复
黄金作为避险资产:当前经济环境下的表现
能源产业转型与智能变压器市场趋势
学术会议交流指南:八大要点助你高效沟通
人际交往之倾听与沟通
14.归一化——关键的数据预处理方法
柠檬酸镁的功效与作用
重质氧化镁的主要用途
什么叫大便溏稀
如何预防口腔溃疡反复发作
谭咏麟《一生中最爱》:一首关于爱情与人生的深情寓言
美国必去十大历史滑雪小镇
离婚后女性如何避免财务困境?三个实用建议帮你做好“钱”程规划