为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
西南医科大学团队揭示Pak2调控心律失常的作用机制及干预价值
自驾游的行程安排怎么做
全网最详细!6天近亿!《燕云十六声》数据如何?
研讨|《上甘岭》:致广大而尽精微,完整再现上甘岭战役全貌
先天性畸形的主要原因及怎样预防先天性畸形
中国的生活水平跟欧洲国家还有多大差距?用数据来对比下。
好玩的国外游戏盘点 2025高质量的国外手游推荐
菊苣栀子茶配方组成及功效:现代科学视角下的作用解析与禁忌探讨
数字化新能源汽车充电桩设计中的用户需求分析
如何分析MACD金叉?这些分析方法有哪些实际应用和局限性?
这6部电影里中年困境的故事,比你想象的更精彩
“大雄宝殿”的“大雄”是啥意思?里面都有哪些神仙?
兰州:联络四域,襟带万里!
最新禽流感H5疫苗品种和厂家汇总(2024年版)
如何制作科技音乐:逐步指南
今夜全球屏息以待!鲍威尔如何回应降息预期、关税风暴与通胀困局
数据库如何实现树形结构
治疗心绞痛的中药奇效方
槲寄生:一种有着丰富寓意的植物
15首经典校园歌曲推荐,能不能唤起你对青春岁月的怀念?
说说元朝时期统治下的汉人
从3字头到1字头,苏州这个曾经火出圈的板块还值得买吗?
什么是发动机调整?原理、方法与未来趋势全解析
M24“霞飞”轻型坦克 诞生于二战炮火当中 性能超越其他同类型号
父母最大的远见:在子女结婚之前,给出这3个“提醒”,很重要
凭告密发迹,遭告密被杀,张亮被反噬留给后人怎样的启示?
伦勃朗《夜巡》:荷兰黄金时代的艺术巅峰
如何计算购房的首付比例?这些首付金额如何影响财务规划?
公司人格混同的后果:企业社会责任与公司治理的挑战
两步拆解「三明医改」背后逻辑