问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Power BI 傻瓜入门 9. 设计和部署数据模型

创作时间:
作者:
@小白创作中心

Power BI 傻瓜入门 9. 设计和部署数据模型

引用
CSDN
1.
https://blog.csdn.net/mwjcxl/article/details/134023447

在Power BI中设计和部署数据模型是创建有效可视化、报告和仪表板的关键步骤。本章将详细介绍如何在Power BI Desktop中设计数据模型,并将其发布到Power BI Services。通过本章的学习,你将掌握数据模型的设计方法,包括数据类型定义、表格管理、关系管理以及计算扩展等核心技能。

创建数据模型母版

在Power BI中创建数据模型不仅是一门技术活,更是一门艺术。导入的数据不仅要正确,还要精心组织。Power BI提供了强大的ETL(提取、转换和加载)框架,可以在多个数据集之间转换数据。但是,导入数据后,还需要进行一些特定的操作来准备数据,以便可以精心制作模型,并将其作为一个良好的数据集进行可视化和报告。

模型的创建不仅限于数据摄取,还需要定义数据类型、利用表设计、创建层次结构、创建联接和关系,以及对模型中的数据进行分类。

使用“数据”视图和“建模”视图

将数据导入Power BI Desktop环境后,需要操作数据,使其按照模型所需的方式工作。主要通过“数据视图”和“模型视图”两个选项卡来实现。

  • 数据视图:显示导入数据模型的所有数据。
  • 模型视图:基于Power BI认为模型在某个时间点所处位置的模型可视化。

无论在哪个视图中,模型视图的主功能区都被视为管理许多数据操作的驾驶舱。如图所示,模型视图的主功能区被分解为不同的区域:数据、查询、关系、计算、安全性和共享。每个区域都有自己的一组特征。

Power Query Editor与上述功能类似,但也有其特定功能,如设置数据源、管理参数、配置编辑器参数、配置行和列、分组依据、排序依据和处理数据类型等。

导入查询

导入Excel文件的过程已经在前面章节中介绍过,但练习导入一个或多个Excel文件以建立新的查询永远不会有什么坏处。以下是导入数据的步骤:

  1. 在“获取数据”下选择要导入Power BI的文件类型或源。
  2. 选择一个或多个数据集,然后单击“加载”或“转换数据”按钮。

如果选择“加载”,则表示数据不会映射到特定的数据类型。如果选择“转换数据”,Power BI会根据ETL属性尽最大努力映射正确的数据类型。

定义数据类型

Power BI导入数据集时,默认为特定的数据类型。例如,在图中,Products表有几列,其中两列表示十进制数作为选项。此处显示的列是ProductMSRP和ProductWhsPrice。数据类型可能不准确,因为这些列本质上是货币列。您可以选择十进制数或固定十进制数。在这种情况下,货币值需要小数。用户还可以在列中放置格式,以更好地表示每个单元格中数据的上下文。

要查看给定列的数据类型,请执行以下步骤:

  1. 转到数据视图。
  2. 选择要查看的列并高亮显示。
  3. 确保您在列工具选项卡上。
  4. 在“列工具”选项卡上,检查“名称”属性以确保。
  5. 检查以确保数据类型下拉菜单设置为正确的数据类型。
  6. 将该选项切换到“定点小数”。
  7. 使用选项卡的Format下拉菜单,将选项切换到Currency。

处理格式和数据类型属性

根据列是文本还是数字,可以使用“列工具”选项卡上的“格式”下拉菜单将特定属性应用于列,以确保特定行为。在上一节的末尾,对列应用了Currency格式,但如果列是数字列,您也可以应用其他行为,包括十进制数、整数、百分比和科学数字格式。

假设您希望对列应用度量、地理标记或数学行为等属性。在这种情况下,您可以应用摘要(一种从数学上进一步评估数据的方法)或数据类别(一种对基于地理位置的数据进行分类的方法)。

管理表格

添加表格

在将数据集导入Power BI Desktop后,有时可能需要将一个或多个表添加到数据模型中。以下是添加表的方法:

  1. 在“模型”视图中,单击“模型视图”功能区的“主页”选项卡上的“输入数据”按钮。
  2. 在相应的表格单元格中输入所需的列名和数据。
  3. 在“名称”字段中输入表格名称。

重命名表

重命名表是一个简单的活动。使用Power BI,数据模型中的每个表都必须具有唯一的名称。要在Power BI Desktop中重命名表,请执行以下步骤:

  1. 在“数据”视图或“模型”视图中,转到“数据”窗格。
  2. 在要更改的表名称上单击鼠标右键。
  3. 从出现的菜单中选择重命名。
  4. 在高亮显示的字段中输入表格的新名称,然后按Enter键。表名称将在30秒内刷新。

删除表

如果要从模型中删除表,则会面临一些风险。如果关系与表相关联,则这些关系将断开。此外,如果计算字段嵌入到报表中,这些字段也将消失。删除表的步骤如下:

  1. 在“数据”视图或“模型”视图中,转到“数据”窗格。
  2. 右键单击要删除的表,然后从显示的菜单中选择Delete from Model。
  3. 单击“删除”。表将从模型中删除。

重命名和删除列

重命名或删除列遵循与重命名或删除表相同的做法。删除列时,如果两个表之间存在关系,则会注意到链接已断开。

要重命名列,请执行以下步骤:

  1. 在“数据”视图或“模型”视图中,转到“数据”窗格。
  2. 在要重命名的列名上单击鼠标右键。
  3. 重命名列。列名会自动刷新。

删除该列时,如果两个表之间存在关系,则会注意到链接已断开。删除列的步骤如下:

  1. 在“数据”视图或“模型”视图中,转到“数据”窗格。
  2. 在列名上单击鼠标右键,然后从显示的菜单中选择“从模型中删除”。
  3. 按Delete。该列将被删除,模型将自动更新。

添加和修改表中的数据

有时,您可能希望添加或修改现有表中的数据。此过程需要进入Power Query Editor。以下是具体步骤:

  1. 在“模型”视图功能区的“常用”选项卡的“查询”区域中,单击“转换数据”图标。
  2. 选择您创建的数据集。
  3. 转到“应用的步骤”下的源。
  4. 单击齿轮图标。

如果数据存在于外部文件中,如Excel,可以直接在Excel中修改数据,然后在Power BI中刷新数据集。

管理关系

当两个表通过一个公共键连接时,通常意味着一个关系通过键存在。它可以是主主键关系,也可以是主外键关系。在某些情况下,一个表甚至可以在一个字段中连接在一起。单个字段可以映射到具有同类字段的另一个表,从而创建查找。

创建自动关系

Power BI能够自动检测数据集之间的关系。要查看Power BI如何查看数据集之间的关系,请执行以下步骤:

  1. 转到“模型”视图的“主功能区”。
  2. 在“关系”区域中,单击“管理关系”图标。
  3. (可选)如果希望系统自动检测关系,请单击“自动检测”按钮。

创建手动关系

有时主键和外键的名称可能不匹配,但您知道它们之间的数据会创建关系。要手动建立表和键之间的关系,请执行以下步骤:

  1. 转到“模型”视图的“主功能区”。
  2. 在“关系”区域中,单击“管理关系”图标。
  3. 单击“新建”按钮。
  4. 选择处于关系中的两个表。
  5. 使用Cardinality和Cross Filter Direction下拉菜单,选择所需的设置。
  6. 完成后按“确定”。

删除关系

删除关系有三种方式之一。您可以删除两个表中的一个表中设置两个表之间联接的字段,也可以使用管理关系接口断开关系,方法与创建接口相同。您可以取消选中“活动”框。然后按Delete。此时会出现一条警告,显示关系中断。你会承认这段关系已经破裂,然后按“确定”。

断开关系的最简单方法是转到“模型”视图并在链接上单击鼠标右键。选择“删除”。系统会提示你承认这段关系将会破裂。

对表格中的数据进行分类和编码

随着时间的推移,当您在Power BI中构建数据集时,添加上下文非常重要,这样任何访问您开始创建的数据集的用户都可以将拼图拼在一起。帮助任何遇到您的数据的用户更好地了解他们正在查看的内容的一种方法是在每个表或列属性中添加元数据。

要向每个表或列添加元数据,请执行以下步骤:

  1. 转到“模型”视图。
  2. 单击以选择表(描述整个表)或表中的列。
  3. 在“属性”窗格中,在“说明”框中输入说明。
  4. 输入也可以描述表或列名的同义词。

注意:不要将数据类别与数据类型混淆。数据类别是对模型中的数据进行分组的一种方式。而如果数据是文本、数字或混合数据,则数据类型是特定的,有助于进行限定。

排列数据

在数据集中排列数据可以通过几种不同的方式进行分类:排序依据、分组依据和隐藏数据。

排序依据和分组依据

“排序依据”按列按升序(A–Z)和降序(Z–A)对数据进行排序。一次只能按一列进行排序。

分组依据允许根据数学运算(例如计数、总和和平均值)和另一个字段对字段进行分组。

隐藏数据

有时,您可能希望抑制表中的列数据。隐藏数据的原因可能有很多。但是,您可以暂时隐藏它,而不是在以后可能仍然需要数据时简单地删除列。

要隐藏列,请执行以下步骤:

  1. 在“模型”视图中,转到包含有问题列的表。
  2. 单击以选择字段。
  3. 转到“属性”窗格。
  4. 找到“隐藏”滑块。
  5. 将选项从“否”滑动到“是”。

如果您想在任何时候取消隐藏列,只需重复这些步骤,但这次将“隐藏”滑块滑动到“否”。

使用扩展数据模型

DAX(Data Analysis eExpression的缩写)是为Power Bi Desktop中的计算而编写的语言。这种基于公式的语言由300多个单独或组合使用的公式组成,用于创建面向数学的度量。DAX中的许多公式与Excel中的公式完全相同。

了解计算类型

每次导入数据或通过DirectQuery连接到数据源以创建可视化时,您可能会惊讶地发现Power BI让您的生活变得轻松多了,因为您几乎不需要对数据集进行转换。不过,有一个问题:假设你需要量化你正在可视化的数据。您的目标可能是从表中开发计算,以便扩展数据集。

Power BI Desktop允许从源计算和导入所有度量类型。这些组件不仅对可视化工作很重要,而且对DAX计算也很重要:

  • 用于过滤可视化的组件
  • 用于数据分类的组件
  • 数据集的顺序和排名
  • 数据集的权重和值
  • 向数据集添加新列

不管是什么原因,使用其中一种技术扩展数据集都是因为导入数据或连接到实时数据集无法为用户提供量化和公式丰富的选择。请记住,这份清单并非详尽无遗。对计算数据进行量化处理还有其他原因。没有办法从一开始就知道数据集的期望模式、趋势和需求。

使用列内容和联接

尽管我在本章中倾向于讨论仅从单一来源导入数据,但企业组织将多个来源的数据导入单一来源并不罕见。在这种情况下,组织必须合并这些数据源中的列,并将它们连接到表和列中。

假设您想要创建一个列,其中包含与公司位置数据相关联的所有股票代码的数据。数据源位于两个不同的源中。您需要做的是创建一个新列,该列从两列中获取数据,并在导入和转换后在其中一个表中创建一个条目。要执行此操作,请执行以下步骤:

  1. 在Power BI Desktop中打开两个数据源。
  2. 转到“报表”视图。
  3. 在“字段”窗格中,单击以选择“Location”表中的“Location”和两个表中的Ticker Symbol。
  4. 转到数据视图。

这样做可以创建列内容的联合视图,该视图基于一个公共字段(Ticker Symbols字段)聚合内容。

发布数据模型

当数据模型准备好发布到Power BI Services时,这个过程就像按下按钮一样简单。要发布您的模型,请转到Power BI Desktop上的Home选项卡,然后按publish。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号