环保数据缺失值填补方法
创作时间:
作者:
@小白创作中心
环保数据缺失值填补方法
引用
CSDN
1.
https://blog.csdn.net/m0_74752294/article/details/146468152
本次实验的实验目的:
现有开源公共空气质量监测数据集data.csv,包含字段:日期、城市名称、空气质量、PM2.5含量、PM10含量、二氧化硫含量、二氧化氮含量、一氧化碳含量、臭氧含量等字段。完成实验的相关要求。
实验环境:华育兴业、Python 3.10
实验内容:
平均值填补:计算空气质量字段中非空数据的平均值,通过平均值填补空气质量中现有空值;
中位数:计算PM2.5含量字段中非空数据的中位数,通过中位数填补PM2.5含量字段中现有空值;
前向填充:通过前向填充对二氧化硫字段中空值进行填充;
K近邻填充:以所有监测数值为计算字段,取最近的3个邻居进行K近邻计算填充二氧化氮字段中的空值;
将填充后的数据保存到/root/filldata.csv文件,且只保留原始字段。
算法设计思想:
平均值填补:计算某列的平均值,用该平均值替代该列中的缺失值。
中位数填补:计算某列的中位数,用该中位数替代该列中的缺失值。
前向填充:利用前面的非缺失值来替代当前的缺失值。
K近邻填补:通过找到特征空间中最近的k个邻居,用这些邻居的值来填补目标值。
调试过程:
1. 平均值填补:计算空气质量字段中非空数据的平均值,通过平均值填补空气质量中现有空值 1. 中位数:计算PM2.5含量字段中非空数据的中位数,通过中位数填补PM2.5含量字段中现有空值; 1. 前向填充:通过前向填充对二氧化硫字段中空值进行填充; 1. K近邻填充:以所有监测数值为计算字段,取最近的3个邻居进行K近邻计算填充二氧化氮字段中的空值; |
|---|
本文原文来自CSDN
热门推荐
股指期货与期权的区别:理解两种金融工具的特点与差异
公司章程修改程序的法律实务操作与合规要点
面条这样吃,营养均衡还不怕胖
音乐艺考器乐评分标准详解:从音准到表现力的全方位评价体系
头晕目眩的原因及预防措施
PCBA焊接需要注意哪些细节问题?
春寒料峭,申城各大公园迎来梅花最佳观赏期
如何选择武汉仁和的房产?其房产选择标准与市场趋势有何关联?
什么对高山流水?高山流水,究竟是什么?解码中国古代音乐的精髓!
全网最全最详细!一文带你了解国家信息安全水平考试(NISP)
国祚六百年的奥斯曼帝国,长寿秘诀是登基杀兄弟的弑亲继承大法?
【模块对比】:MPU6050与其他IMU性能对决
用于凝血检测和血沉测定中的柠檬酸钠抗凝剂
猫咪撒娇的表现(揭秘宠物猫咪撒娇的行为特征)
猫咪爱撒娇怎么办?如何正确回应猫咪的撒娇行为?
镜子为什么能成像:一个简单的光学小实验
深股通开启的条件是什么?它的开启对股市有何影响?
赡养费的计算标准判例
玉兰花扦插与水培完全指南:从选材到养护的全程详解
快速消除眼睛充血的有效方法与护理建议分享
运动相机和普通相机的区别是什么
十大冷门高质量游戏推荐榜2025 好玩的冷门手游汇总
任何数的0次方等于多少?这个数学概念的完整解释
燃气灶漏火的修复方法(安全快速解决燃气灶漏火问题)
燃气灶能打火但点不燃?10个常见故障原因及解决方法
数值分析中的样条插值:三次样条与B样条详解
Flask-SocketIO Example
公司买卖股票的税务问题详解:增值税与企业所得税如何计算?
剃光头人的心理:自由、清爽、自信还是其他?
企业宣传片拍摄中的镜头语言与品牌调性匹配