Excel 如何数据清洗
创作时间:
作者:
@小白创作中心
Excel 如何数据清洗
引用
新浪网
1.
https://finance.sina.com.cn/tech/digi/2025-02-08/doc-ineitzmh6617055.shtml
数据分析中有个很重要的预处理步骤,叫做「数据清洗」。简单来说就是把数据中「脏脏的 」部分 —— 缺失的、重复的、错误的等等,给它清除掉,剩下「干净的」数据。
1. 缺失数据
如果某处缺了一两个数据,最简单的方法就是 —— 扔了它。别笑!这的确是正规的数据清洗手段,在表格不大、不完整数据较少的情况下,完全可以这样做。例如,2002 年「产品 C」的产量缺失了,那就偷偷把 2002 年从统计表里删掉,只分析后面的。
但这样可能将潜在信息删除,也可能导致数据分析出现较大偏差。所以,如果数据很多、空缺也多,删除过多条目会使得结果产生较大偏差时,我们还是得把空缺补上。
- 空值变 0 值:使用快捷键【Ctrl+G】定位,选择【定位条件】中的【空值】,最后输入 0。
- 统计学方法:实际应用常选择统计学方法,比如平均值,来填充缺失的数据。当然,根据数据实际类型,也可能使用中间值、最大值、最小值或者其他更复杂的函数值。
2. 重复数据
至于重复数据,在之前的「数据核对」篇中已经讲过了,这里就不再赘述。很多时候,我们在基础的 Excel 应用中就完成了「数据清洗」的步骤。
3. 错误数据
- 函数错误值:比如#DIV / 0!、#N / A! 之类,只要在公式外套上 IFERROR 就行。
- 其他错误数据:例如等级只有「A / B / C」三种,有个单元格却出现了「D」的;或者要求填写「√」,偏偏有人写「☑」的……这种除了在一开始设置数据验证,就只有用查找、计数、条件格式等偏门方法了。
这种错误数据「D」,可以用【查找】或【筛选】直接定位它。而「感觉上不对」的数据,就比较难找到了:
这时我们就只能因地制宜,想办法定位它,例如用 IF 函数筛选大于 36.13 的数据。找到之后按照「缺失数据」的办法处理它就是了。
4. 写在最后
今天从数据类型的角度给大家简单讲了下数据清洗的做法。小伙伴们还知道哪些属于数据清洗的 Excel 操作呢?
热门推荐
2025春节祝福语大揭秘:这些话最火!
上海浦东新区旅游景点有哪些?跟随我一起来看看吧!
体制内职场:如何建立有效的人脉网络?
体制内理财新姿势:基金定投大揭秘
应届生如何在300万考生中突围?公务员考试攻略来了!
不卑不亢:职场生存的黄金法则
大众宝来怎么打开后备箱
养蚯蚓10大忌
经常“冥想”对身体有什么积极影响?4个益处,可以提前了解一下
坚持15个好习惯,让你越来越健康
50+蛇年吉祥話
经典名肴——豉汁蒸排骨
“扣”字到底怎么念?一起来“扣”一下吧!
“扣”字的N种玩法,你知道几个?
晋江飞重庆,最省钱的交通方案揭秘
北京现代伊兰特车主必看:自动挡换挡故障解决指南
自动变速器故障频发?这些应对方法请收好
自动变速箱换挡故障的终极指南
自动挡车辆换挡故障解决方案
自动挡挂不上档?这波操作让你秒变老司机!
【有声】韩国历史:光复节
韩国节庆日与传统文化习俗
三亚海鲜美食打卡攻略:从市场到餐桌的美味之旅
三亚必打卡:海胆蒸蛋的神仙美味
王安石教你贴春联,古诗里的讲究你知道吗?
山楂蜂蜜水,祛寒暖心喜迎新春
从《延禧攻略》魏璎珞看现代职场生存术
申请提前解冻司法冻结的财产需要提交哪些材料?
手机上怎么查询银行卡冻结原因?多途径解析与应对策略
忘了开过的银行卡、存过的钱?来“一键查卡”→