环保数据缺失值填补方法
创作时间:
作者:
@小白创作中心
环保数据缺失值填补方法
引用
CSDN
1.
https://blog.csdn.net/m0_74752294/article/details/146468152
本次实验的实验目的:
现有开源公共空气质量监测数据集data.csv,包含字段:日期、城市名称、空气质量、PM2.5含量、PM10含量、二氧化硫含量、二氧化氮含量、一氧化碳含量、臭氧含量等字段。完成实验的相关要求。
实验环境:华育兴业、Python 3.10
实验内容:
平均值填补:计算空气质量字段中非空数据的平均值,通过平均值填补空气质量中现有空值;
中位数:计算PM2.5含量字段中非空数据的中位数,通过中位数填补PM2.5含量字段中现有空值;
前向填充:通过前向填充对二氧化硫字段中空值进行填充;
K近邻填充:以所有监测数值为计算字段,取最近的3个邻居进行K近邻计算填充二氧化氮字段中的空值;
将填充后的数据保存到/root/filldata.csv文件,且只保留原始字段。
算法设计思想:
平均值填补:计算某列的平均值,用该平均值替代该列中的缺失值。
中位数填补:计算某列的中位数,用该中位数替代该列中的缺失值。
前向填充:利用前面的非缺失值来替代当前的缺失值。
K近邻填补:通过找到特征空间中最近的k个邻居,用这些邻居的值来填补目标值。
调试过程:
1. 平均值填补:计算空气质量字段中非空数据的平均值,通过平均值填补空气质量中现有空值 1. 中位数:计算PM2.5含量字段中非空数据的中位数,通过中位数填补PM2.5含量字段中现有空值; 1. 前向填充:通过前向填充对二氧化硫字段中空值进行填充; 1. K近邻填充:以所有监测数值为计算字段,取最近的3个邻居进行K近邻计算填充二氧化氮字段中的空值; |
|---|
本文原文来自CSDN
热门推荐
风险评估模型是什么
如何保证数据库第三范式
雍正剑侠图:童林北高峰喝号戴花,差点儿让人家踢了场子……
赤藻糖醇和麦芽糖醇:糖的健康替代品?
《小巷人家》:时代画卷中的家庭沉浮与社会变迁
蜂蜜怎么食用效果最佳?蜂蜜的服用方法?有什么注意事项吗?
电动车自燃原因分析及防范建议,为何自燃后无法及时应对?
创造自己的「地中海」:健康饮食指南
百叶窗的清洁与保养
苗木扦插育苗技术要点(扦插树苗的方法和技术)
“全民智驾”的口号盛行!智驾下的交通事故责任如何划分?
宝可梦:全球玩家的永恒童年,新手必入的冒险宇宙
数据库规范化设计 5大基本原则
关税调整如何影响黄金价格?三大逻辑解析黄金上涨趋势
CNC铝件清洗解决方案:超声波清洗的优势与应用
痛风发作五大常见诱因,90%的人都需要注意!
睡够8小时=拥有好睡眠?我们一直都被骗了!
周末补觉的正确方法:1-2小时最佳,这些注意事项要记牢
如何在旁路由中配置动态DNS
6个让伴侣'欲罢不能'的相处模式,这样做越久越恩爱
洗衣液执行标准全解析:安全选购与环保指南
如何正确佩戴眼镜:方法与注意事项详解?
《简·爱》:女性觉醒与真爱的赞歌
PLC肯定不会消失——未来十年PLC的发展趋势(功能、硬件、通信、集成、AI)
从零开始认识主板:结构、通信与选购指南
罚叔归来,《惩罚者》第三季有戏了!
领带和领结的佩戴场合,您了解么?
汽车易损件更换周期及注意事项全攻略
吃青椒胃胀消化不良?原因及预防建议
从基础到高阶:十大数学学习宝藏网站推荐