资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

【知识分享】归一化与标准化

创作时间:

作者:

@小白创作中心

【知识分享】归一化与标准化

引用

CSDN

https://blog.csdn.net/qq_48185833/article/details/137174193

在数据预处理中，标准化和归一化是两种常用的技术，它们可以帮助我们处理数值范围差异巨大的特征，使数据更容易被模型处理。本文将详细介绍这两种技术的概念、方法以及代码实现。

数据的标准化（Standardization）和归一化（Normalization）是数据预处理中的两种常见技术。

为什么要进行标准化和归一化？

样本不同的特征/属性所在的数值范围差异巨大，导致训练不收敛或其他问题。
所有数据在相同的取值空间更容易处理，方便模型的统一化和规范化，更好地适应模型或数据分析方法。
更容易发现数据的本质规律。

一、归一化（Normalization）

将数据按比例缩放，使之落入一个小的特定区间，通常是[0, 1]或[-1, 1]
归一化有多种方法，其中最常见的是最小-最大归一化（Min-Max Normalization）
它的数学公式如下：
代码实现：

from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaled_result = scaler.fit_transform(data)

直观展示：
归一化对异常值非常敏感，因为异常值可能会显著影响xmin 和xmax 的值。

二、标准化（Standardization）

也称为Z值归一化（Z-Score Normalization），将数据转换到0值附近
线性变换，是将每一维特征的均值都调整为0，标准差（方差）调整为1
标准差指数据间的差异程度，数据差异越大，标准差越大
进行标准化后，数据并非一定呈现正态分布，若想改变数据的整体形态，需要采取非线性变换（eg：取对数、平方根...）
它的数学公式如下：
代码实现：

from sklearn.preprocessing import StandardScaler 
scaler = StandardScaler() 
standardized_data = scaler.fit_transform(data)

热门推荐

眼睛长眼结石怎么办

专家解读：幼儿眼袋发黑的五大应对方案

罗汉果清肺茶最佳配方是什么

霸屏朋友圈的夏日夜宵“顶流”：小龙虾，正确吃法来了→

罗汉果的食用方法

每天1小时有氧运动，长期坚持，6个好处不请自来

阿根廷2025经济展望：通胀下降、比索稳定、增长回暖

同为看家法宝，金刚琢和金钵盂哪个更厉害？你看太上老君说过什么

香港邵氏最好看的 10 部武侠片

货车手刹安装的步骤是什么？如何检查货车手刹安装是否合格？

高情商的人，与人聊天时，往往懂得这12个“接话技巧”！你懂吗？

银行个人转账业务的手续费差异化定价？

硅酸镁铝：一种多功能无机材料

Intel i7处理器深度解析：技术优势与应用场景全解读

五个有效的职场模型和结构，帮助你提升汇报工作的效率

肖战现象与粉丝经济，解读流量明星背后的经济逻辑

网络名誉侵权包括哪些内容

白色裤子如何搭配鞋子？根据气质、场合以及个人喜好来选择！

养心妙文《快乐铭》，短短百字道尽人生真谛，原来快乐这么简单！

世界最凶猛的七大野猪，疣猪的命运最悲惨，最强野猪就在我们身边

GPT-4、PaLM-2等AI模型对黑人or女性存在偏见？丨AI偏见的案例和应对

南方三四月份适合种什么菜和水果？

企业经营困难降薪如何操作