为什么决策树相关的算法不需要标准化?哪些模型需要标准化?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?哪些模型需要标准化?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据预处理是一个至关重要的步骤。其中,标准化(或归一化)是常用的数据预处理方法之一。然而,并非所有算法都需要进行标准化处理。本文将探讨为什么决策树相关的算法不需要标准化,以及哪些模型需要标准化。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
15种耐阴花卉推荐(打造阴暗角落的绿色空间)
减重需要的基本心理建设
7个超级好看且适合内容网站阅读的英文字体
315晚会曝光全名单:罔顾食用品安全和泄露消费信息的行为该收敛了
如何判断是否该分手?专家分析与建议
罗斯福为何能成为美国史上唯一一位连任四届的总统?
电脑操作入门知识:从开关机到鼠标键盘使用
两块硬盘如何RAID:模式选择、配置步骤与最佳实践
相亲之道:自我认识、沟通技巧与尊重选择
玉米须最好的搭配是谁
FGO地之奥尔加玛丽配置:又是希耶尔售后
儿童阅读障碍症怎么治疗
山东高考成绩700分以上考生17人,日照占了4位,两个全省前5名
阳明心学三大核心,毛泽东学到两点受用终生
蓝牙设备配对失败(解决连接问题)
蓝牙技术全解析:从历史起源到未来发展
英文小常识:常用英文月份之dec是几月份
EMA指标的设置方法及其在技术分析中的意义
未公开资料:乔布斯 1983 年关于计算机未来的演讲(原文附全文字幕)
网前斗法,李诗沣完胜世界第33,2-1晋级全英公开赛16强
全英羽毛球公开赛|石宇奇、李诗沣会师半决赛,国羽斩获一半四强席位
医药代表是什么意思
苹果手机如何屏蔽骚扰电话和短信?
湿房镜对干眼症有用吗
读《百年孤独》才明白:生命的解药,在你自己手里
未成年人违规行为处理指南:家规与法律的界限探讨
西之丸宝物馆:探索名古屋城历史,邂逅珍贵文物
短信API验证接口如何保证安全
无痕浏览模式(如何设置无痕浏览模式来确保在线隐私安全)
高考复习应该怎样做 如何科学规划