为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
一文读懂“病理科”与“病历科”:医院里的这两个科室究竟有什么不同?
银行卡被冻结后申请解冻需要提供哪些材料?
低空经济火爆,普通人入场赚钱机会详解
考哪个?CAAC执照VS AOPA合格证,全面解析无人机驾驶执照选择指南
化州市地理冷知识探秘
洁牙的目的是什么呢?是不是洁牙以后就能消除口臭呢?
房子买了十年没有办房产证怎么办?一文详解房产证办理难题
古巴导弹危机内幕令美国后怕:苏联核武已到位
3D打印真的“费钱”吗?——深度剖析成本与价值
C语言如何判断是不是死循环
肩膀旋转肌腱撕裂:膊头痛症元凶
油价调整的原因、影响及决定因素全解析
家用洗衣机一般多大功率?如何选择合适的节能家电
至暗时刻?2025年网络安全五大趋势与十大威胁预测
如何正确的将有氧运动安排到我们的训练计划中去?
如何挑选完美的结婚戒指,从预算到设计的全方位指南
哪些因素影响机械键盘数字键布局的舒适度?
不同材质档案对温湿度要求不同,怎样精准匹配?
深入解析潜望长焦与直立长焦:两者有何不同?
27城最新首位度排名,到底哪些省会是一城独大
工厂高效污染废气处理设备
什么是空性?空性代表了怎样的智慧?
关键金属资源潜在分布区被揭示!
长期使用非那雄胺真的会产生耐药性吗?
猛龙vs凯尔特人前瞻:巴恩斯对决塔图姆,卫冕冠军仍需谨慎
饮料兑酒不容易醉?医生:经常喝,小心这些病统统找上你!
价值购买、规范行业……医保为医药产业带来了什么样的发展?
A股实施T+0会带来哪些改变?这些改变对市场有何影响?
一个物体从无穷远的地方自由落体到地球,速度会超光速吗?
视野检查报告怎么看? 视野检查正常值与异常值解读