问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Power Query中处理重复值的完整指南

创作时间:
作者:
@小白创作中心

Power Query中处理重复值的完整指南

引用
1
来源
1.
https://learn.microsoft.com/zh-cn/power-query/working-with-duplicates

在数据处理过程中,重复值的处理是一个常见的需求。本文将详细介绍如何在Power Query中删除或保留重复值,包括在单列或多列中进行重复值处理的具体步骤。

本文内容

可以通过转换处理重复的值集,这些转换可以删除数据中的重复项。 或者,可以筛选数据以仅显示重复项,以便可以专注于它们。

警告:Power Query 区分大小写。 在处理重复值时,Power Query 会考虑文本的大小写,这可能会导致意外结果。 解决方法是,用户可以在删除重复值之前应用大写或小写转换。

对于本文,这些示例使用 ID、Category 和 Total 列的下表。

删除重复值

可以执行的操作之一是从表中删除重复值。

  1. 选择包含重复值的列。
  2. 转到“主页”选项卡。
  3. 在“减少行”组中,选择“删除行”。
  4. 从下拉菜单中,选择“删除重复值”。

警告:无法保证删除重复值时会选择一组重复值中的第一个实例。 若要详细了解如何保留排序,请转到“保留排序”。

删除多列中的重复值

在本例中,你会使用表中的所有列来标识和删除重复值。

有四行是重复的。 目标是删除这些重复行,以便表中只有唯一行。 从表中选择所有列,然后选择“删除重复项”。

该操作的结果提供要查找的表。

注意:也可以使用列的子集执行此操作。

从单个列中删除重复值

在本例中,你会仅使用表中的“类别”列来标识和删除重复值。

你希望删除这些重复值,并且只保留唯一值。 若要从“类别”列中删除重复值,请选择该重复值,然后选择“删除重复值”。

该操作的结果提供要查找的表。

保留重复值

可以使用重复值执行的另一个操作是仅保留表中找到的重复值。

  1. 选择包含重复值的列。
  2. 转到“主页”选项卡。
  3. 在“减少行”组中,选择“保留行”。
  4. 从下拉菜单中,选择“保留重复值”。

从多个列保留重复值

在本例中,你会使用表中的所有列来标识和保留重复值。

有四行是重复的。 本示例中的目标是仅保留表中重复的行。 选择表格中的所有列,然后选择“保留重复值”。

该操作的结果提供要查找的表。

保留单个列的重复值

在本例中,你会仅使用表中的“ID”列来标识和保留重复值。

在本例中,有多个重复值,并且只保留表中的重复值。 若要从ID列保留重复值,请选择ID列,然后选择“保留重复值”。

该操作的结果提供要查找的表。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号