为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
鼠类防治全攻略:从环境治理到药物使用
少数民族预科班:助力少数民族学生适应大学生活的重要教育平台
弘一法师讲:心若不自由,身在天地间也如同牢笼
辨析 | 老子说的“有”与“无”,究竟该怎么理解?
甘油三酯高的饮食红灯区:十大禁忌一览
中世纪骑士的职责:从战场到文学的永恒传奇
【福彩科普】彩票资金的构成及其比例
人工智能的广泛应用与未来发展:机遇与挑战并存的技术变革
江淹:从六岁能诗到“江郎才尽”的文学旅程
逐步取消新能源汽车限购,说给谁听?
揭开《面纱》:毛姆笔下的爱情、背叛与自我救赎之旅
电商运营怎么样?就业前景如何
欧亨利式结尾是什么(浅谈“欧·亨利式结尾”及其文学影响)
高股息率是什么?高股息率股票的投资策略有哪些?
山西(晋南线)5天4夜详细旅游攻略
法治日报:公共场所肆意直播频生争议,拍短视频边界在哪?
缘分背后的社交心理学
数字化转型中的企业文化重塑与领导力变革
研究发现:人类大脑和宇宙高度相似,这意味着什么?
飞机起飞的复杂过程:科学、技术与飞行员的完美结合
生物安全实验室操作规程和技术规范
突破语言瓶颈,高效掌握英语的秘诀
碘伏的10大禁忌
智能手机使用必知知识全解析:新手必备指南
滇中高原湖泊水质的年内分异特征及影响因素研究
相声和漫才:不同文化下的幽默艺术之辨
游戏心理学研究:游戏奖励机制中的4种行为强化模式及解说
寓言故事的智慧宝藏:提升智慧、感悟人生、处世之道与语言艺术
网络暴力和恐吓侮辱:对女性的威胁
唐代艺术与科技发展