为什么决策树相关的算法不需要标准化?哪些模型需要标准化?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?哪些模型需要标准化?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据预处理是一个至关重要的步骤。其中,标准化(或归一化)是常用的数据预处理方法之一。然而,并非所有算法都需要进行标准化处理。本文将探讨为什么决策树相关的算法不需要标准化,以及哪些模型需要标准化。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
全面解析:多笔逾期记录下如何成功申请贷款或信用卡
长期喝药酒有害处吗?专家解析药酒饮用注意事项
桩基工程可以甲分包吗
出国留学健康体检指南
天上宫阙 —— 洛阳老君山
成语:入木三分;书圣王羲之的故事,官场失意成就了一代书圣
如何判断5种肤质?T字部位出油状况检测干性、油性、混合肌
如何判斷5種膚質?T字部位出油狀況檢測乾性、油性、混合肌
人-AI协同中的输入、处理、输出与反馈
新重庆·老地名丨万盛——青年镇
新重庆·老地名丨万盛——青年镇
ST股票是什么意思?新手股民的必修课
红酒牛肉选什么红酒
审计风险评估如何进行
弱光环境下怎么拍出好照片 注意这几点 小白也能拍好弱光题材
自媒体运营如何做时间管理?这些方法帮你提效!
美媒将杰里韦斯特和库里的职业生涯进行比较,谁是更伟大的球员
议起复盘 | 4000三分!历史最独特的库里配不配争GOAT
电子管:经典遗产与现代应用
老年中风:别让“风”吹倒你的健康!
服装的选择与搭配:如何挑选适合自己的风格?
高尿酸多久查一次?医生建议来了
如何批量修改图片名称
App网络异常导致无法提现,该如何解决?
债券贴现率计算公式及其应用
双节科普丨健康美味两不误的烧烤技巧与营养搭配
肝血不足的治疗方法
“与狼共武”——解析以“机器狼”为代表的地面无人作战系统
换工作后还能领取生育津贴吗?
吹气球小妙招助力解决肺不张