为什么决策树相关的算法不需要标准化?哪些模型需要标准化?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?哪些模型需要标准化?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据预处理是一个至关重要的步骤。其中,标准化(或归一化)是常用的数据预处理方法之一。然而,并非所有算法都需要进行标准化处理。本文将探讨为什么决策树相关的算法不需要标准化,以及哪些模型需要标准化。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
劳动力人口减少但结构性矛盾突出,2025年稳岗扩岗政策如何加力?
联通号码可转移动宽带?携号转网只需几步
移动卡可以使用联通套餐吗?
一张小小的光栅卡,为什么能让人体验丰富的立体世界?
地方两会声音 | 心智障碍者全生涯帮扶链条如何补全?多位委员呼吁构建社会支持网络
虹吸式底滤鱼缸控制水位的7种方法及底滤鱼缸选购指南
机械设备价格排行榜及购买指南
丰花紫藤:一年开几次花?种植方法详解
仁寿视高“房价破万”前夕的4个关键词
一文详解"Off":从基本含义到实际应用
1985年黄克诚提议全面评价林彪:林彪没有功劳,他怎么当的元帅?
掌握设备管理器的基本用法和打开方法,优化你的Windows硬件管理体验
决战在即,中国U20与沙特U20备战情况及战术分析
夏日茶饮全攻略:哪些茶能美容养颜、护肤和改善体质
本科论文写作全攻略:从选题到答辩的完整指南
给人力资源投简历怎么说
自动化生产线能改善新能源汽车锂电池生产效率
宅基地买卖需要什么手续,准备哪些材料
独坐幽篁里全诗的意思及创作背景
如何选择适合投资的黄金产品?各类产品特点全解析
建筑八大员考试通关全攻略:从基础到实战的必备技巧
停车熄火前多做个动作,发动机至少多用5年,老司机告诉你怎么做
如何正确拉起手刹以确保行车安全?手刹的操作技巧有哪些需要特别注意的地方?
纺织品防护服的创新材料和设计
“从鱼到人”演化史补上初始一环
PLOS Biology:戴磊/陈沫先团队揭示植物根际微生物对生长素的分解代谢
机械设备的全面解析:定义、选择要点及品牌排行榜
哪些公务员面试高分经验值得借鉴?
“敬老月”普法——《民法典》如何保护老年人合法权益
减肥到底靠「少吃」还是「多动」?这篇论文给你答案