为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
李林甫改革埋隐患,安禄山叛乱致唐朝衰落
解密安史之乱:财政失衡如何导致唐朝盛世崩塌
以《清明上河图》为蓝本,横店打造北宋主题景区
海参泡发秘籍:水质要求与详细步骤
股票交易佣金设5元门槛,四招帮你节省交易成本
洛阳陶艺师孙震:成功挑战“世界陶王”
2024年实施延迟退休,养老金这样计算
60%到300%:养老保险基数如何选择最划算
中药调理肝肾气血不足,你get了吗?
女性养生必修课:肝肾不足怎么破?
慢性咽炎怎么调理好呢?喉咙堵有异物感声音嘶哑
缓解喉咙灼热感的方法
鸡的身体零部件,为啥比整只鸡贵?
品京味美食 开启老北京独特的味觉记忆
如何处理房产中介的沟通和协商?这些沟通技巧有哪些注意事项?
U盘文件误删?这些恢复方法让你轻松应对!
方中格教你写好“公”字偏旁
广东中医院开创全国首个中医ICU,收治77种疾病
中医经典病房在梅州开科,创新“治未病”诊疗体系
长治中医经典病房:传统疗法结合现代技术,疗效显著
个人养老金制度全面实施,如何选择最优投资组合?
李大壮的广州养老金计算秘籍
雁北归、鹊筑巢、雉求偶:陕西博物馆里的小寒图鉴
从“四张白纸”到春晚传奇:倪萍的主持人生
三种清肺戒烟茶的做法与功效
何景明《公无渡河》:一首关于执着、爱与命运的悲剧
《公无渡河》:一首汉乐府诗的悲剧美学
2024最新公文格式规范:从纸张到页码的全面解析
突破!商业卫星数据首入气象局业务系统,观测能力大增
蓉宝带火成都街区商业