统计学、机器学习名词解析——TSS、ESS、RSS、拟合优度、调整后拟合优度
创作时间:
作者:
@小白创作中心
统计学、机器学习名词解析——TSS、ESS、RSS、拟合优度、调整后拟合优度
引用
CSDN
1.
https://m.blog.csdn.net/juewang159632/article/details/140682334
在统计学和机器学习领域,如何判断真实值与拟合值的贴合程度是一个核心问题。本文将介绍几个关键的评估指标:TSS(总平方和)、ESS(解释平方和)、RSS(残差平方和)、拟合优度(R-squared)以及调整后拟合优度(Adjusted R-squared),并通过Python代码示例帮助读者深入理解这些概念。
数据准备
首先,我们随机生成一组数据并进行拟合(这里仅作解释变量使用):
import matplotlib.pyplot as plt
import numpy as np
x = np.arange(1, 51)
y = x + np.round(np.random.uniform(-5, 5, 50), 2)
plt.plot(x, x, color='r')
plt.plot(x, y, color='b')
plt.show()
核心概念
TSS、ESS、RSS
- 总体平方和(TSS,Total Sum of Squares):衡量数据的总变异程度。
- 解释平方和(ESS,Explained Sum of Squares):衡量模型对数据变异的解释能力。
- 残差平方和(RSS,Residual Sum of Squares):衡量模型预测误差的总量。
拟合优度(R-squared)
拟合优度(R-squared)也称为决定系数,表示模型解释的数据方差比例。其值越接近1,模型对数据的解释能力越强,拟合效果越好。
调整后拟合优度(Adjusted R-squared)
调整后拟合优度考虑了模型自由度对拟合优度的影响,可以在模型增加自变量但增加的拟合优度并不显著时进行惩罚。
Python代码实现
下面是计算这些指标的Python代码实现:
def compute_R_square(data_real, data_pred):
# 计算真实值平均值
y_mean = sum(data_real) / len(data_real)
# 循环求解TTS
TSS = 0
for temp in data_real:
TSS += (temp - y_mean) ** 2
# 循环求解ESS
ESS = 0
for temp in data_pred:
ESS += (temp - y_mean) ** 2
# 循环求解RSS
temp_real_pred = data_real - data_pred
RSS = sum(x ** 2 for x in temp_real_pred)
# 计算拟合优度R方
R_square = ESS / TSS
return TSS, ESS, RSS, R_square
# 将真实值带入得到最终结果
y_TSS, y_ESS, y_RSS, y_R_square = compute_R_square(y, x)
print(y_TSS, y_ESS, y_RSS, y_R_square)
运行结果:
11065.547048 10416.845352000002 397.7123999999999 0.9413764459013126
调整后拟合优度
调整后拟合优度的计算公式如下:
def compute_Adjust_R_square(n, k, R_square):
Adjust_R_square = 1 - (1 - R_square) * (n - 1) / (n - k - 1)
return Adjust_R_square
运行结果:
0.94015512185759
总结
- R-squared衡量模型解释因变量变化的能力,但不考虑模型复杂度。
- Adjusted R-squared在计算时考虑了模型的复杂度,通过减去自由度的惩罚项来避免因模型复杂度增加而导致的不合理的优化。
因此,一般来说,当比较不同模型时,调整后拟合优度更适合用作评估标准,因为它可以更准确地反映模型的预测能力,避免了过度拟合的可能性。
由于本文使用的数据是随机生成的,每次运行代码得到的数值可能会有所不同,这是正常现象。
热门推荐
含有栀子的中成药有哪些
减肥党必看!美式和拿铁谁才是天选咖啡?
墙体拆除需注意要点
耳前瘘管患者能否食用鱼罐头
榴莲和酒不宜同食,间隔2小时更安全
词汇精选:modest的用法和辨析
什么是蓝思值?蓝思值多少能通过KET/PET考试?
老子到底悟出了什么道
如何在装修行业中提高设计水平?这种提高需要具备哪些条件?
浅谈高压线束铜铝连接的技术
36只公募基金重仓光线传媒,ETF成最大赢家,资金正获利离场
清洁、消毒、灭菌,你真的分得清吗?你可能一直以来都做错了
创新“智造” 新能源汽车加速跑
从零开始学习技术分析:均线的奥妙
甲亢症状有哪些?危害大吗?一文读懂甲亢防治要点
2025年中国海军展望:多达19万吨舰等待服役,整体规模再创新纪录
农旅融合激活乡村振兴“新引擎” 全椒六镇镇依托自然风光打造特色文旅
C语言链表全面解析:从基础概念到算法实现
糖尿病人吃橘子,是升血糖还是降血糖?科学依据是什么?
地下暖气管道漏水怎么找到漏水点
小番茄品种排名:8种优质品种详解
摊余成本的测算方法是什么?这种测算方法的误差如何控制?
台湾距离大陆最近多少公里
简单 4 种方法教你打开 Windows 设备管理器
退款如何开票?税务实务指南
游戏引擎是如何调度渲染和逻辑代码的?
商业思维与商业模式的深度解析
宝宝感冒打喷嚏流鼻涕,可以用鼻腔盐水冲洗吗?
筋膜的七大功能及其与瘢痕形成的关系
经济学家:巴萨财政处于恶性循环中,俱乐部缺少专业人才