Power Query中处理重复值的完整指南
Power Query中处理重复值的完整指南
在数据处理过程中,重复值的处理是一个常见的需求。本文将详细介绍如何在Power Query中删除或保留重复值,包括在单列或多列中进行重复值处理的具体步骤。
本文内容
可以通过转换处理重复的值集,这些转换可以删除数据中的重复项。 或者,可以筛选数据以仅显示重复项,以便可以专注于它们。
警告:Power Query 区分大小写。 在处理重复值时,Power Query 会考虑文本的大小写,这可能会导致意外结果。 解决方法是,用户可以在删除重复值之前应用大写或小写转换。
对于本文,这些示例使用 ID、Category 和 Total 列的下表。
删除重复值
可以执行的操作之一是从表中删除重复值。
- 选择包含重复值的列。
- 转到“主页”选项卡。
- 在“减少行”组中,选择“删除行”。
- 从下拉菜单中,选择“删除重复值”。
警告:无法保证删除重复值时会选择一组重复值中的第一个实例。 若要详细了解如何保留排序,请转到“保留排序”。
删除多列中的重复值
在本例中,你会使用表中的所有列来标识和删除重复值。
有四行是重复的。 目标是删除这些重复行,以便表中只有唯一行。 从表中选择所有列,然后选择“删除重复项”。
该操作的结果提供要查找的表。
注意:也可以使用列的子集执行此操作。
从单个列中删除重复值
在本例中,你会仅使用表中的“类别”列来标识和删除重复值。
你希望删除这些重复值,并且只保留唯一值。 若要从“类别”列中删除重复值,请选择该重复值,然后选择“删除重复值”。
该操作的结果提供要查找的表。
保留重复值
可以使用重复值执行的另一个操作是仅保留表中找到的重复值。
- 选择包含重复值的列。
- 转到“主页”选项卡。
- 在“减少行”组中,选择“保留行”。
- 从下拉菜单中,选择“保留重复值”。
从多个列保留重复值
在本例中,你会使用表中的所有列来标识和保留重复值。
有四行是重复的。 本示例中的目标是仅保留表中重复的行。 选择表格中的所有列,然后选择“保留重复值”。
该操作的结果提供要查找的表。
保留单个列的重复值
在本例中,你会仅使用表中的“ID”列来标识和保留重复值。
在本例中,有多个重复值,并且只保留表中的重复值。 若要从ID列保留重复值,请选择ID列,然后选择“保留重复值”。
该操作的结果提供要查找的表。