为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
梧州必打卡:中国骑楼城
梧州旅游终极攻略:吃住行玩一网打尽
蛇年祝福语,春节必备的传统文化元素
春节祝福语大揭秘:这些话让你倍儿有面儿!
春节将至,如何让你的祝福语更暖心?
春节给领导发祝福,这4点让你情商爆表!
心理学中团队协作是什么
如何通过团队建设与管理提升企业竞争力?
软件开发团队文化与团队动力:构建成功开发团队的关键
体检尿潜血阳性就是血尿吗?教你正确区分
发现小儿血尿怎么办?教您如何分别真假血尿
法院强制执行程序书面材料怎么写
云冰山:永州最美自然景观
永州必打卡网红景点TOP10:从九嶷山到云冰山
九嶷山、零陵古城、柳宗元文化旅游区:永州旅游打卡胜地
云冰山&阳明山:永州摄影打卡胜地
柳宗元带你探秘永州古城
伤情鉴定费用探讨:价格因地区、机构不同而异
关系修复:另一半不懂情绪管理,如何做好婚姻情感经营?
公安民警心理健康指南:六个方法释放负能量,赶走浑身疲惫
伤情鉴定后多久拿结果
基于50万中国人的研究:谁在婚姻中受益更多?
道教、佛教、民间宗教、基督教,谁最会"造神"?
这些关于拔火罐的知识,你应该知道
揭秘三系法杂交水稻:从遗传学到分子机制
袁隆平的三系杂交水稻,真的牛!
张树沁解析网络造神现象:平台算法不能“造神”,普罗大众才是关键
听泉鉴宝爆红背后的网络造神现象
不服伤情鉴定,怎样要求重新鉴定
电动车电池的激活方法是什么?这种激活对续航能力有何帮助?