为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
为花园鸟类建造安全的筑巢空间
“AI+医学教育”,交医探索新医科背景下医学创新人才培养新模式
薪资工资和绩效奖金在法律上有什么不同
10种世界知名的马
Excel混合引用完全指南:从基础到实战应用
猫咪流鼻血是怎么回事
企业挑选新供应商的5个关键考量因素
墙面翻新处理方法及注意事项
看《唐诡》没被吓到被馋到:胡饼夹羊肉、冰淇淋、葡萄酒、馎饦……
如何隐藏WiFi信号防止被蹭网?
JUNO:中国的中微子研究领先世界:揭开宇宙的秘密
胃印戒细胞癌怎么检查
法的种类有哪些
【科研绘图】【数据拟合曲线】:附Origin详细画图流程
黄山天都峰时隔5年恢复开放,著名景点“鲫鱼背”再上线
《Monica》歌曲简介、Monica歌词介绍及主唱
泰瑟枪的工作原理是什么?再彪悍的歹徒也能一招制敌
全面解析VR技术入门:设备选择、安装使用及推荐应用
寄生电感的影响分析与解决方案
盐酸多奈哌齐片的说明书使用指导
五年生存率是什么意思
苏美尔语与阿卡德语:古代美索不达米亚的主要语言
昼夜节律失调性睡眠觉醒障碍的预防
每天跑5公里能减肥吗?全面解析运动与减肥的关系
1.35万亿!济南又迈过一个千亿台阶
中法艺术的绚丽火花,来自这些留法艺术家
山东十大特色名小吃,你吃过几个?
银价的趋势受哪些因素制约?这些因素如何影响银价的波动?
古田县率先引入RPA技术,智慧政务实现新突破
电动车开空调对续航影响大吗?电动车开空调一小时多少电