为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
胆囊切除患者术后复查指南:两次检查项目与注意事项
地道青岛菜:啤酒鸭、崂山菇炖鸡等四道家常菜做法详解
青岛大虾走红社交平台,百年泊里大集焕发新活力
青岛特色美食戳子肉:炭火炙烤里的百年传承
“食”间智慧|高血压患者需注意食物中的“隐形钠”
低温慢煮西冷牛肉,你get了吗?
从经典到笑点:《还珠格格》25年后的再解读
金匮肾气丸等十种中药丸服用全攻略
鸦片战争后中国近代经济转型:被迫开放与主权丧失
漯河十大热门旅游景点深度解读:从自然风光到历史文化
河南省郑州人
郑海燕教你:颈椎突出的日常护理全攻略
颈椎突出新疗法,你get了吗?
从漯河到重庆的火车路线:途经主要站点及旅行指南
移动信号塔辐射真危险?专家:完全不用担心!
氯代甲酯是环保型增塑剂 环保政策下应用场景将不断扩大
青岛圣弥厄尔教堂:德国设计的百年建筑,曾藏“亚洲第一”管风琴
更年期女性易患「灼口综合征」,心理疏导加药物治疗可缓解
深圳梅沙尖徒步:云海广场出发,可观日出日落的深圳第三高峰
嘉兴三日游深度攻略:乌镇、西塘、南湖不容错过!
基因编辑探秘系列之原理篇
听障人士:我们不只是“聋哑人”
特殊教育助力聋哑人打破沟通壁垒
春运首日,湘潭交警检查重点企业保障交通安全
突破肝脏限制!新型LNP实现器官精准治疗
法国低温慢煮:家庭健康饮食新宠
siRNA递送载体:LNP广泛适用,GalNAc精准制胜
新型LNP递送系统精准靶向肿瘤,siRNA治疗展现临床潜力
突破性进展:siRNA借助LNP载体实现精准肿瘤治疗
低温慢煮PK美式BBQ:谁才是厨房里的终极神器?