为什么决策树相关的算法不需要标准化?哪些模型需要标准化?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?哪些模型需要标准化?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据预处理是一个至关重要的步骤。其中,标准化(或归一化)是常用的数据预处理方法之一。然而,并非所有算法都需要进行标准化处理。本文将探讨为什么决策树相关的算法不需要标准化,以及哪些模型需要标准化。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
三角债怎么解决
从民营经济座谈会看A股投资新机遇
一文读懂银行体系:总行、全行、分行、支行、营业部的区别
CVT变速器和6AT变速箱哪种更好?维修师傅一番话,让我茅塞顿开
kg与斤:傻傻分不清楚?一篇文章带你了解重量单位的秘密
线性规划简介
动漫制作技术专业主要学什么?
胰腺癌疼怎么止住
靶向α核素疗法:癌症治疗的新希望
水利工程优化方案(3篇)
B站博主如何赚钱?揭秘UP主的创收路径
深层解读时间的本质:时间究竟是什么,科学家们怎么看?
周易算命生辰八字深度解析
蔚蓝档案切里诺角色抽取深度分析与建议:是否值得入手?
电影点映:让影迷提前体验新片的重要环节与宣传策略解析
芹菜炒牛肉
鱼刺卡喉后要怎么自救?这些“土办法”有大危险!
《儒林外史》严监生:不舍油灯两茎草,万贯家产皆为谁
如何制作员工工资表一年汇总表?
36种金属元素对照表 金属元素分类概述
品味AK47:感受步枪之王的力量
“每20个80后就有1人去世”?谣言!罪魁祸首可能是AI
体温波动大揭秘:你真的会正确解读体温信号吗?
Nature Reviews聚焦结直肠癌,一文了解最新药物研发动态
郭清推荐!这份攻略带你吃遍阳江,从早到晚不重样
心态的力量:如何用积极、沉稳与坚韧铺就成功之路
如何正确使用橄榄油以达到更健康的食用效果?
痰中带血的原因分析与处理建议,保持健康的重要性提醒
地产政策“组合拳”持续发力,地产境外债风险是否出清?
如何深入分析利润亏损的原因?这种分析对企业决策有哪些启示?