【知识分享】归一化与标准化
创作时间:
作者:
@小白创作中心
【知识分享】归一化与标准化
引用
CSDN
1.
https://blog.csdn.net/qq_48185833/article/details/137174193
在数据预处理中,标准化和归一化是两种常用的技术,它们可以帮助我们处理数值范围差异巨大的特征,使数据更容易被模型处理。本文将详细介绍这两种技术的概念、方法以及代码实现。
数据的标准化(Standardization)和归一化(Normalization)是数据预处理中的两种常见技术。
为什么要进行标准化和归一化?
- 样本不同的特征/属性所在的数值范围差异巨大,导致训练不收敛或其他问题。
- 所有数据在相同的取值空间更容易处理,方便模型的统一化和规范化,更好地适应模型或数据分析方法。
- 更容易发现数据的本质规律。
一、归一化(Normalization)
- 将数据按比例缩放,使之落入一个小的特定区间,通常是[0, 1]或[-1, 1]
- 归一化有多种方法,其中最常见的是最小-最大归一化(Min-Max Normalization)
- 它的数学公式如下:
- 代码实现:
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaled_result = scaler.fit_transform(data)
- 直观展示:
归一化对异常值非常敏感,因为异常值可能会显著影响xmin 和xmax 的值。
二、标准化(Standardization)
- 也称为Z值归一化(Z-Score Normalization),将数据转换到0值附近
- 线性变换,是将每一维特征的均值都调整为0,标准差(方差)调整为1
- 标准差指数据间的差异程度,数据差异越大,标准差越大
- 进行标准化后,数据并非一定呈现正态分布,若想改变数据的整体形态,需要采取非线性变换(eg:取对数、平方根...)
- 它的数学公式如下:
- 代码实现:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
standardized_data = scaler.fit_transform(data)
热门推荐
桃胶知识全解:了解桃胶,吃出健康
乔丹对阵詹姆斯:篮球历史第一人的终极比较
自动化或机器人专业的学习有哪些方向/分类
“同行”之旅:看中日两位艺术家的版画对话
肚子不舒服老想大便?可能是这些原因
唐宋八大家:一门三学士,师徒五大家
女命八字三庚金:性格、事业与婚姻的深度解析
八字分析配偶特征准确性分析 八字解读配偶健康状况分析
睡眠不好别愁!教你科学方法改善睡眠质量!
公司开户需要带什么材料
牙龈和牙龈沟的位置详解:龈嵴顶与牙龈沟的区别是什么?
房屋装修半包包括哪些项目?一文详解装修流程
这些人群可在线“云取号”,在家就能办理社区事务
无炉不成香:宣德炉与东方香道的千年对话
理财档案丨投资美元结构性存款产品 不同挂钩标的收益差距大
江西省住房公积金提取条件及所需材料详解
患者癌胚抗原(CEA)增高,到底有没有得肿瘤?
人工智能辅助下的大学英语个性化学习路径设计
加盟纠纷退费难,当场履行促和解
成都有人靠拆迁赔17套房?实地探访:哪里来的一夜暴富?
癌症的体征和症状
AsyncRAT远程访问木马技术分析:从传播到防御
作文细节描写指南:从基本概念到实战技巧
围生期的护理
【跳绳】顶尖选手都在做的跳绳训练
战略HR必修课:人均效能公式拆解与数字化提效路径
电化学及电解相关知识
领导给涨工资了说什么感谢的话合适?
入职体检是否需要检测艾滋病?全面解析带你了解
献给夜班人群的睡眠建议