【知识分享】归一化与标准化
创作时间:
作者:
@小白创作中心
【知识分享】归一化与标准化
引用
CSDN
1.
https://blog.csdn.net/qq_48185833/article/details/137174193
在数据预处理中,标准化和归一化是两种常用的技术,它们可以帮助我们处理数值范围差异巨大的特征,使数据更容易被模型处理。本文将详细介绍这两种技术的概念、方法以及代码实现。
数据的标准化(Standardization)和归一化(Normalization)是数据预处理中的两种常见技术。
为什么要进行标准化和归一化?
- 样本不同的特征/属性所在的数值范围差异巨大,导致训练不收敛或其他问题。
- 所有数据在相同的取值空间更容易处理,方便模型的统一化和规范化,更好地适应模型或数据分析方法。
- 更容易发现数据的本质规律。
一、归一化(Normalization)
- 将数据按比例缩放,使之落入一个小的特定区间,通常是[0, 1]或[-1, 1]
- 归一化有多种方法,其中最常见的是最小-最大归一化(Min-Max Normalization)
- 它的数学公式如下:
- 代码实现:
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaled_result = scaler.fit_transform(data)
- 直观展示:
归一化对异常值非常敏感,因为异常值可能会显著影响xmin 和xmax 的值。
二、标准化(Standardization)
- 也称为Z值归一化(Z-Score Normalization),将数据转换到0值附近
- 线性变换,是将每一维特征的均值都调整为0,标准差(方差)调整为1
- 标准差指数据间的差异程度,数据差异越大,标准差越大
- 进行标准化后,数据并非一定呈现正态分布,若想改变数据的整体形态,需要采取非线性变换(eg:取对数、平方根...)
- 它的数学公式如下:
- 代码实现:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
standardized_data = scaler.fit_transform(data)
热门推荐
眼睛长眼结石怎么办
专家解读:幼儿眼袋发黑的五大应对方案
罗汉果清肺茶最佳配方是什么
霸屏朋友圈的夏日夜宵“顶流”:小龙虾,正确吃法来了→
罗汉果的食用方法
每天1小时有氧运动,长期坚持,6个好处不请自来
阿根廷2025经济展望:通胀下降、比索稳定、增长回暖
同为看家法宝,金刚琢和金钵盂哪个更厉害?你看太上老君说过什么
香港邵氏最好看的 10 部 武侠片
货车手刹安装的步骤是什么?如何检查货车手刹安装是否合格?
高情商的人,与人聊天时,往往懂得这12个“接话技巧”!你懂吗?
银行个人转账业务的手续费差异化定价?
硅酸镁铝:一种多功能无机材料
Intel i7处理器深度解析:技术优势与应用场景全解读
五个有效的职场模型和结构,帮助你提升汇报工作的效率
肖战现象与粉丝经济,解读流量明星背后的经济逻辑
网络名誉侵权包括哪些内容
白色裤子如何搭配鞋子?根据气质、场合以及个人喜好来选择!
养心妙文《快乐铭》,短短百字道尽人生真谛,原来快乐这么简单!
小儿预防接种的护理要点
为什么有的程序员需要两个显示器?
墙面腻子用量计算公式有几种 该如何计算
非工伤受伤能做劳动能力鉴定吗
热水增压泵选型:4种类型优缺点介绍
金属波纹管的设计原理、材料、作用及应用
如何解决滚筒洗衣机失去平衡的问题?
世界最凶猛的七大野猪,疣猪的命运最悲惨,最强野猪就在我们身边
GPT-4、PaLM-2等AI模型对黑人or女性存在偏见?丨AI偏见的案例和应对
南方三四月份适合种什么菜和水果?
企业经营困难降薪如何操作