为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
创作时间:
作者:
@小白创作中心
为什么决策树相关的算法不需要标准化?那么那些模型需要标准化那?
引用
CSDN
1.
https://m.blog.csdn.net/zhongkeyuanchongqing/article/details/118164277
在机器学习领域,数据标准化是一个常见的预处理步骤,但对于决策树及其衍生算法而言,这一步骤是否必要?本文将从决策树的工作原理出发,深入探讨这一问题,并进一步说明哪些模型确实需要进行标准化处理。
基于树的算法,如决策树(Decision Tree)、随机森林(Random Forest)和GBDT,xgboost等,对变量的大小不敏感。因此,在拟合这类模型之前,不需要进行标准化。
以决策树使用信息熵进行特征区间的划分为例,对于特征的划分只能信息熵的变化有关,而和特征的本身的大小无关,即只和特征对于模型分类或者回归的确定性的能力有关,而和特征本身数值的幅度无关;
也就是说,因为数值缩放不会影响分裂点位置,对树模型的结构不造成影响。
树生长,按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同。而且,树模型是不能进行梯度下降的,因为构建树模型(回归树)寻找最优点时是通过寻找最优分裂点完成的,因此树模型是阶跃的,阶跃点是不可导的,并且求导没意义,也就不需要归一化。
既然树形结构不需要标准化,那为何非树形结构
热门推荐
糖尿病治疗新突破:台湾白及在动物模型中展现降血糖潜力
《王者荣耀》东方曜最强实战攻略
掌握东方曜连招,轻松上分不是梦!
第二届世界的“香格里拉”文化旅游节:不一样的“民族风”
郴州最美摄影点:资兴东江湾城市公园
老板酒驾,企业IPO受阻?
黄渤于适揭秘《封神2》角色成长之路:从师徒到战友的蜕变
伊木萨克片过量使用的后果
石正丽团队研究揭示:中国蝙蝠冠状病毒的起源及跨物种传播
越来越多人开始在家熬猪油吃,真的健康吗?你怎么看?
相泽南:从清新小仙女到国民女神的蜕变之路
从86版到新版:《西游记》角色改编的变与不变
解码孙悟空:一个融合道教、佛教与民间信仰的文化符号
新版《西游记》角色大变脸,网友热议:经典该如何创新?
VR技术为退伍军人心理健康治疗插上科技翅膀
退伍军人事务部推荐:VR疗法改善PTSD
虚拟现实+AI:医疗新纪元
七百余年马街书会:一场冰天雪地里的曲艺盛宴
《帕斯卡契约》销量破百万,45元定价引发的思考
邓稼先:中国首颗原子弹背后的关键人物
东北大学VR冥想游戏:生物反馈技术助力PTSD治疗新突破
VR黑科技:用虚拟现实治愈心理创伤
初一十五上香的正确姿势,你get了吗?
VR黑科技如何拯救PTSD患者?
VR治疗PTSD:新科技带来心理疗愈希望
村支书酒驾背后:基层职场文化的反思与整治
赣菜榜单双星:抚州甲鱼粉皮与黎川芋糍
香港必买的平价美妆好物大揭秘!
石正丽团队研究:武汉实验室样本与新冠病毒没有近亲!
割伤烫伤摔伤,及时正确处理不要慌丨健康新春“医”句话