为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
游戏王决斗链接:魔法卡效果全解析
网络主播获官方认证 1500万从业者迎来新职业身份
大模型在安全领域的十大应用场景及实现路径
Excel跨表合并全攻略:6大高效技巧告别复制粘贴
澳洲留学热门商科专业深度解析
探寻股票杠杆:开启高收益与高风险并存的投资新维度
轻松拿捏,家常卤味这样做更好吃!
车轴草的功效与食用方法
补领结婚证要什么手续?异地办理怎么办?
电脑D盘数据误删怎么恢复?一篇文章教你轻松找回
电脑D盘格式化了怎么办?三种实用的数据恢复方法
公证遗嘱的收费标准及办理条件
邮报:伤病原因以及过多的比赛,是影响曼城状态的主要原因
2024年澳洲大学电子工程专业前十排名
汪小姐身上有蓓蒂的影子
颗粒板甲醛释放量国家标准及去除方法
WCA官方认证的比赛异形魔方,你会玩哪些?
中国8大新兴产业+9大未来产业发展分析
肌肉拉伤要先冰敷还是热敷?记住POLICE法则,缓解、预防肌肉拉伤
生活科普|落枕后脖子该动吗?
探索汉语成语中的“七什么八什么”有趣表达及其深刻含义
哈佛大学学生的真实生活体验
学会倾听与观察:提高人际交往能力的技巧
IDEA社区版够用吗?一文详解社区版与企业版功能差异
深覆合可以不管吗?建议进行就医!尽早干预|正规治疗|定期复查!
摔了一跤腿肿了应该怎么办
长期吃他汀会升高血糖? 并不全这样!这2种他汀或可降血糖
优化免疫规划 为儿童健康筑起“防火墙”
办理施工许可证的流程是什么
周庄 | 除了陈逸飞画笔下的双桥,这里还有12座古桥,每一座都有故事