为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
人民币贬值,美元升值:全球经济格局生变
从发烫到反转:数控雕刻机主轴电机故障处理全攻略
儿童骨折后如何做好心理护理?专家解读关键要点
59元玩转潮州古城:元旦起推惠游套餐,含六大景点美食攻略
江苏名菜荷叶鸡:传统美食与健康饮食的完美结合
原神5.3混池革新:100%定轨不歪,申鹤复刻在即?
两天览尽银川精华:贺兰山黄河最佳打卡攻略
糖尿病患者必备:燕麦、糙米、全麦面包、绿叶蔬菜
汉中龙头山:自然与历史的双重盛宴
卫健委2024糖尿病饮食指南:家庭烹饪新思路
跨越世界的桥梁:培养跨文化友谊的艺术
心理调节助缓解颈椎痛,四种方法科学证实有效
从打扫到才艺:古代宫女的日常工作与晋升之路
广州太古汇洗手间走红背后:当洗手间变成“景点”
1990版100元人民币:收藏价值与市场价格全解析
老年手足皲裂怎么办?医生教你预防和治疗全攻略
黄芩配伍应用指南:26个经方治疗脏腑热证
《甄嬛传》不是爽剧:权力巅峰背后的孤独与挣扎
2000米深矿泉,瘦西湖畔温泉度假正当时
约翰·比特洛夫与雷克斯·霍尔曼:两起谋杀案的真相之辨
“三黄”之中黄芩独可用:孕期妇女的清热解毒良药
迪拜旅游旺季安全攻略:扒窃、诈骗防范全指南
外卖诗人王计兵:在低处寻找诗意
西夏王陵:9座帝陵见证千年沧桑,多元文化交融的东方金字塔
微博之夜红毯:三位实力派女星的时尚对决
从选种到采收:新疆巴旦木高产栽培技术要点
《白日焰火》成就柏林影帝,廖凡陈建斌结下银幕情
龙头山雪后仙境,摄影爱好者的天堂
外卖员的诗意人生:《低处飞行》热卖背后的故事
5A级景区博斯腾湖:1715平方公里碧波,7大景点详解