Excel 如何数据清洗
创作时间:
作者:
@小白创作中心
Excel 如何数据清洗
引用
新浪网
1.
https://finance.sina.com.cn/tech/digi/2025-02-08/doc-ineitzmh6617055.shtml
数据分析中有个很重要的预处理步骤,叫做「数据清洗」。简单来说就是把数据中「脏脏的 」部分 —— 缺失的、重复的、错误的等等,给它清除掉,剩下「干净的」数据。
1. 缺失数据
如果某处缺了一两个数据,最简单的方法就是 —— 扔了它。别笑!这的确是正规的数据清洗手段,在表格不大、不完整数据较少的情况下,完全可以这样做。例如,2002 年「产品 C」的产量缺失了,那就偷偷把 2002 年从统计表里删掉,只分析后面的。
但这样可能将潜在信息删除,也可能导致数据分析出现较大偏差。所以,如果数据很多、空缺也多,删除过多条目会使得结果产生较大偏差时,我们还是得把空缺补上。
- 空值变 0 值:使用快捷键【Ctrl+G】定位,选择【定位条件】中的【空值】,最后输入 0。
- 统计学方法:实际应用常选择统计学方法,比如平均值,来填充缺失的数据。当然,根据数据实际类型,也可能使用中间值、最大值、最小值或者其他更复杂的函数值。
2. 重复数据
至于重复数据,在之前的「数据核对」篇中已经讲过了,这里就不再赘述。很多时候,我们在基础的 Excel 应用中就完成了「数据清洗」的步骤。
3. 错误数据
- 函数错误值:比如#DIV / 0!、#N / A! 之类,只要在公式外套上 IFERROR 就行。
- 其他错误数据:例如等级只有「A / B / C」三种,有个单元格却出现了「D」的;或者要求填写「√」,偏偏有人写「☑」的……这种除了在一开始设置数据验证,就只有用查找、计数、条件格式等偏门方法了。
这种错误数据「D」,可以用【查找】或【筛选】直接定位它。而「感觉上不对」的数据,就比较难找到了:
这时我们就只能因地制宜,想办法定位它,例如用 IF 函数筛选大于 36.13 的数据。找到之后按照「缺失数据」的办法处理它就是了。
4. 写在最后
今天从数据类型的角度给大家简单讲了下数据清洗的做法。小伙伴们还知道哪些属于数据清洗的 Excel 操作呢?
热门推荐
韩朝语言大不同:脱北者的沟通挑战
从无到有:朝鲜语的历史变迁与现代分化
脱北者在韩国的语言困境:从“听不懂”到融入社会
冰晶画:科技与艺术的完美融合
返程高峰到来!甘肃公安交警发布最新路况预测和安全提示
运营商补换SIM卡收费虚高?不同省份、渠道价格体系混乱
家庭电视安装全攻略:提升美观与观影体验的细节解析
强迫症:症状、诊断与治疗全解析
颈椎病导致浑身无力?这些预防和改善方法请收好
重庆去云南自驾游攻略:线路、价格及沿途风景指南
立春将至,这款养生粥助你开启健康一年
广州有哪些旅游景点!探寻千年古韵,尽揽南国风光!
感冒怎么好得快?要补充什么、吃什么缩短病程?
五种常见蔬菜根部的药用价值与食用方法
如何通过欧式建筑别墅设计提升居住品质与生活体验?
2025年快速开通股票账户全攻略
股票开户三大风险点,投资者必读!
楼兰古城:从丝绸之路上的明珠到神秘消失的千年之谜
楼兰博物馆:一座消失古城的千年记忆
《我的楼兰》:一首歌里的西域传奇
《楼兰颂》:一个不存在的电视剧
冬日探秘江郎山:衢州最美自然奇观
冬季必备:中药止痒药膏大揭秘!
赵本山复出巡演引热议:从春晚舞台到世界舞台
全国首条低空城际航线即将开通 从昆山打“飞的”30分钟内可到上海浦东机场
东航:国际航班启用电子登机牌 “苏州—新加坡”推出快线
苏州首条直达浦东机场的低空城际航线成功试飞
大理市多措并举让共享单车有序“归位”
数字经济浪潮下,第三产业新职业蓬勃发展
探索茂物自然与文化的融合