为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
教师做研究的最佳方式——不断说出一个个真实的故事
公积金贷款买房需考虑负债情况,如何应对不批贷款?
健康科普:肝脏功能之蛋白质代谢
产品拍摄的角度:展现产品魅力的视角选择
网店商品图片拍摄技巧:从摆放角度到拍摄技法的全方位指南
2024年成都重点产业规划布局全景图谱
如何准确计算基金的相关费用?这些费用计算方法有哪些影响因素?
遭遇突发山洪如何防范和自救?这份安全指南请收好
反问句的句式有哪些?反问句的句式大揭秘:那些你不知道的表达方式!
光纤电缆的材料构成与创新
年利率计算公式:金融产品的收益评估
黑枸杞到底含糖量高不高(探究黑枸杞的营养成分及其对血糖的影响)
探究黑枸杞与茶叶同泡的益处与禁忌
无人机执照详解:三类、四类、视距内、超视距,你会选哪个?
2024年起,农村自建房将实行年检制度,哪些房屋需要年检?
宇宙大爆炸与时空起源之谜
老年多病患者诊疗的最佳方式:CGA老年综合评估
热锅油烫伤后皮肤起泡怎么办
Excel双轴Y轴图表制作教程:从原理到实战
房子过户需要哪些手续和费用?一文详解三种常见情形
质量管理体系要求标准有哪些主要内容?
封装工艺简介及元器件级封装设备
家中下水道有异味怎么办?下水道反味的成因与防臭方法全解析
高压108是否太低
恢复血小板的三种有效方法
冲量和动量的关系是什么
全面解析纽约地铁卡:价格、申请、充值及使用指南
带状疱疹需要做什么检查
武侠小说中的人物塑造与社会现实映射
赣州"非遗"联展开启匠心文旅高质量发展路