【知识分享】归一化与标准化
创作时间:
作者:
@小白创作中心
【知识分享】归一化与标准化
引用
CSDN
1.
https://blog.csdn.net/qq_48185833/article/details/137174193
在数据预处理中,标准化和归一化是两种常用的技术,它们可以帮助我们处理数值范围差异巨大的特征,使数据更容易被模型处理。本文将详细介绍这两种技术的概念、方法以及代码实现。
数据的标准化(Standardization)和归一化(Normalization)是数据预处理中的两种常见技术。
为什么要进行标准化和归一化?
- 样本不同的特征/属性所在的数值范围差异巨大,导致训练不收敛或其他问题。
- 所有数据在相同的取值空间更容易处理,方便模型的统一化和规范化,更好地适应模型或数据分析方法。
- 更容易发现数据的本质规律。
一、归一化(Normalization)
- 将数据按比例缩放,使之落入一个小的特定区间,通常是[0, 1]或[-1, 1]
- 归一化有多种方法,其中最常见的是最小-最大归一化(Min-Max Normalization)
- 它的数学公式如下:
- 代码实现:
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaled_result = scaler.fit_transform(data)
- 直观展示:
归一化对异常值非常敏感,因为异常值可能会显著影响xmin 和xmax 的值。
二、标准化(Standardization)
- 也称为Z值归一化(Z-Score Normalization),将数据转换到0值附近
- 线性变换,是将每一维特征的均值都调整为0,标准差(方差)调整为1
- 标准差指数据间的差异程度,数据差异越大,标准差越大
- 进行标准化后,数据并非一定呈现正态分布,若想改变数据的整体形态,需要采取非线性变换(eg:取对数、平方根...)
- 它的数学公式如下:
- 代码实现:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
standardized_data = scaler.fit_transform(data)
热门推荐
纯电动汽车如何办理上牌手续?办理纯电动汽车上牌需要准备哪些材料?
信创产品适配迁移:如何高效实现系统迁移与兼容性优化?
如何理解公摊面积的计算方法及其对购房者的影响?
情绪ABC理论与合理情绪疗法:认知行为疗法的重要组成部分
教程来了!Mac mini外接硬盘盒扩容,只需四步
揭秘:诗歌中的情感表达奥秘,那些触动人心的写作手法
我们该如何定义优秀?教育应该培养什么样的人?
牛奶为什么是白色的?
医生提醒:两岁女孩过度喝冰奶茶会影响身高发育
减重减到闭经、脱发,不推荐健康人生酮/低碳减重
银行借款人向抵押人反担保:风险与收益的权衡
十种热门海淘商品种类推荐 适合海淘的商品有哪些
开源好用的云盘软件有哪些
小苏打加什么洗脸能美白祛斑?小苏打洗脸的正确方法
PCIe配置优化:提升系统性能的关键步骤
长沙房屋交易面积年度目标提前完成,长沙房市政策如何影响市场?
重温经典|“不抛弃、不放弃”的《士兵突击》是这样炼成的
心理学实验揭示:正面互动如何改善人际关系
三点说清黑茶与其它茶的不同
信用卡逾期销卡后多久征信可以消除
《射雕英雄传:侠之大者》影评:战争史诗武侠的新尝试!
近代广东学派是怎样形成的
神话小说中妖和魔的区别
如何在租房市场中找到合理价格?怎样判断租金是否符合市场行情?
申请租房补贴的流程如何?这种补贴政策对租房者有哪些实际帮助?
吃花椒有什么好处
41胎68仔、26只、四大洲17个国家……大熊猫保护国际合作正有序推进
我国为何要向外租赁大熊猫?
MOS管的ESD防护措施与设计要点
电脑机箱配置选购攻略:完美搭配指南与精选推荐