环保数据缺失值填补方法
创作时间:
作者:
@小白创作中心
环保数据缺失值填补方法
引用
CSDN
1.
https://blog.csdn.net/m0_74752294/article/details/146468152
本次实验的实验目的:
现有开源公共空气质量监测数据集data.csv,包含字段:日期、城市名称、空气质量、PM2.5含量、PM10含量、二氧化硫含量、二氧化氮含量、一氧化碳含量、臭氧含量等字段。完成实验的相关要求。
实验环境:华育兴业、Python 3.10
实验内容:
平均值填补:计算空气质量字段中非空数据的平均值,通过平均值填补空气质量中现有空值;
中位数:计算PM2.5含量字段中非空数据的中位数,通过中位数填补PM2.5含量字段中现有空值;
前向填充:通过前向填充对二氧化硫字段中空值进行填充;
K近邻填充:以所有监测数值为计算字段,取最近的3个邻居进行K近邻计算填充二氧化氮字段中的空值;
将填充后的数据保存到/root/filldata.csv文件,且只保留原始字段。
算法设计思想:
平均值填补:计算某列的平均值,用该平均值替代该列中的缺失值。
中位数填补:计算某列的中位数,用该中位数替代该列中的缺失值。
前向填充:利用前面的非缺失值来替代当前的缺失值。
K近邻填补:通过找到特征空间中最近的k个邻居,用这些邻居的值来填补目标值。
调试过程:
1. 平均值填补:计算空气质量字段中非空数据的平均值,通过平均值填补空气质量中现有空值 1. 中位数:计算PM2.5含量字段中非空数据的中位数,通过中位数填补PM2.5含量字段中现有空值; 1. 前向填充:通过前向填充对二氧化硫字段中空值进行填充; 1. K近邻填充:以所有监测数值为计算字段,取最近的3个邻居进行K近邻计算填充二氧化氮字段中的空值; |
---|
本文原文来自CSDN
热门推荐
夜钓灯选购与使用全攻略:从种类到实战技巧详解
痛风患者需忌口的五类水果
房颤射频消融术安全风险大吗
短视频AI:人工智能如何改变短视频营销的未来
哪些人适合做健身教练呢?做健身教练难不难?
2025年春晚刘谦表演的魔术实际上就是一个冒泡排序?
如何查询驾驶证的违章记录?这一过程中有哪些需要注意的事项?
大宗商品是什么?投资大宗商品需要注意哪些问题?
养成每天读一本书的习惯
清华附小、北清路改造……今年回天将投用29个项目
2025年全球3大「最适合移居国家」出炉!关键原因与自由度有关?
西方神话体系包括以下哪些神话? (西方神话体系有哪些)
康德的定言命令
牛排的最佳刀形是什么?
女人内分泌失调应该吃哪些食物?
探索最新的商业模式:创新驱动未来
机械式电子锁:安全与维护的完美指南
DNS工具大盘点:从动态到静态,从命令行到浏览器插件
网校搭建系统如何利用AI技术提升在线教育质量与效率?
返程前必看!火车携带物品全攻略
散熱、排濕、補水!小暑大暑飲食秘笈,教你如何消暑不傷身
开源协议和私有协议有何差别
海军院校有哪些
浅谈如何在医院推行6S管理
土地纠纷怎么有效处理
消瘦吃什么能增加体重?专业医生给出六大实用建议
透析患者过敏的主要原因
目前我国共有22座超大特大城市,其中半数城市位于我国东部地区
美国游泳队“紫脸”怎么回事儿?可能有这些原因
全国首个地质文化村处处流淌着“古、幽、奇、美”