l 建模
通常情况下,你将会连接到多个数据源以创建报表,且需所有数据协同工作。 建模就是实现这一点的办法。
若要创建不同数据源之间的逻辑连接,需创建一种关系。 数据源之间的关系使 Power BI 能够了解表与表之间的关系,以便能创建有趣的视觉对象和报表。 本部分对关系作出了解释,甚至还说明了如何在不存在任何关系的情况下创建关系。
l 如何管理数据关系
Power BI 允许你以可视方式设置表或元素之间的关系。 若要查看数据的图表视图,请使用关系视图(位于报表画布旁屏幕的最左侧)。
在关系视图中,你可以看到表示各个表的数据块,它们之间的表列和表行就是表示的关系。
添加和删除关系非常简单。 若要删除关系,右键单击它并选择删除。 若要创建关系,拖放想要在表格之间创建链接的字段。
若要隐藏报表中的表格或单列,在关系视图中右键单击它,然后选择在报表视图中隐藏。
有关你的数据关系的更详细视图,请选择开始选项卡中的管理关系。 这将打开管理关系对话框,该对话框将你的关系显示为列表而不是直观的关系图。在此处,你可以选择自动检测以查找新的或更新数据中的关系。 选择管理关系对话框中的编辑,以手动编辑你的关系。 你也可以在该位置找到高级选项以设置关系的基数和交叉筛选方向。
基数的选项有*多对一*和*一对一*。 *多对一*是维度类型关系事实,例如一张销售表,每种产品都具有多行数据,与之匹配的是一个表格,在唯一行中列出了所有产品。 *一对一*通常用于链接引用表格中的单个条目。
默认情况下,关系将设置为在两个方向上交叉筛选。 只在一个方向交叉筛选限制了关系中的某些建模功能。
设置数据之间的准确关系让你能够在多个数据元素间创建复杂的计算。
l 创建计算列
创建计算列是一种用于丰富并增强数据的简单方法。 计算列是通过对以下计算进行定义而创建的新列:转换或合并现有数据的两个或多个元素。例如,可以通过将两列合并为一列来创建新列。
创建计算列的一个有效原因是,当没有可用于建立关系的唯一字段时,在表格之间建立关系。当在 Power BI Desktop 中创建简单的表格视觉对象时,缺少关系会变得明显,并且所有条目都将获得同样的值,而你知道基础数据是不同的。
若要使用具有唯一字段的数据创建关系,例如,当数据中存在“区号”和“本地电话”列时,你可以通过将两者的值合并创建新的“完整电话号码”计算列。 计算列是用于快速创建模型和可视化效果的有用工具。
若要创建计算列,请在报表画布的左侧选择 Power BIDesktop 中的数据视图。
在“建模”选项卡中,选择新建列。这将在你可以使用 DAX(数据分析表达式)语言输入计算的地方启用公式栏。 DAX 是一种功能强大的公式语言(Excel 中也有),它可以生成可靠的计算。 在键入公式期间,Power BI Desktop 会显示匹配的公式或数据元素来帮助并加速公式的创建。
在输入表达式期间,Power BI 公式栏将提供特定的 DAX 函数和相关数据列建议。
一旦在每个表中都创建了计算列,它们便可以用作关系键来建立它们之间的关系。 转到关系视图,你便可以将字段从一个表拖动到另一个表来创建关系了。
返回报表视图,你现在将看到各区的值都不同。
还有可以通过创建计算列执行的各种其他操作。
l 优化数据模型,获得更好的视觉对象
导入的数据通常包含报表和可视化任务中实际不需要的字段,原因是它为额外信息,或者此数据已在其他列中可用。 Power BI Desktop 提供一些工具,可用于优化数据、使其更利于创建报表和视觉对象,以及查看共享报表。
若要隐藏 Power BI Desktop 的字段窗格中的某列,请右键单击它,然后选择隐藏。如果此字段已在现有可视化对象中使用,则数据仍位于该视觉对象中,且你仍可在其他可视化对象中使用此数据,隐藏的字段仅不在字段窗格中显示。
若在关系视图中查看表格,则隐藏的字段将通过灰显进行表示。 同样,其数据仍然可用且仍是模型的一部分,只是隐藏不可见而已。通过右键单击该字段并选择取消隐藏,可随时取消隐藏已隐藏的任何字段。
建模选项卡中提供的按列排序工具对于确保数据按预期顺序显示非常有用。
举一个常见的例子,包括该月名称的数据默认按字母顺序排序,因此比如“八月”显示在“二月”之前。
此情况下,解决此问题的方法是在字段列表中选择字段、再从建模选项卡中选择按列排序,然后选择要排序的字段。本例中,“MonthNo”类别排序选项按预期对月份进行排序。
另一种优化信息以使其正确处理的方式是设置字段的数据类型。 若要从报表画布中更改数据类型,请在字段窗格中选择该列,然后使用格式下拉菜单选择其中一种格式设置选项。任何已创建且显示此字段的视觉对象均将自动更新。
l 创建度量值并使用基于时间的函数
度量值 是存在于你的 Power BI 数据模型中的一种计算。 要创建度量值,在报表视图中从建模选项卡选择新度量值。
DAX最大优势之一是它有很多有用函数,特别是关于基于时间的计算,如*本年截止到现在*或*同比*。 你只需使用 DAX 定义一次时间度量值,然后从数据模型中按照你所需数量的不同字段来划分它。
在 Power BI中,定义的计算称为*度量值*。 若要创建*度量值*,从主页选项卡中选择新建度量值。 此操作将打开公示栏,你可以在其中输入定义度量值的 DAX 表达式。 键入时,在输入计算过程中,Power BI 会建议相关的 DAX 函数和数据字段,并且你还将得到解释语法和函数参数的工具提示。
如果你的计算很长,则通过键入 ALT-Enter,你可以在表达式编辑器中添加额外的换行符。
创建新的度量值后,它将出现在屏幕右侧的字段窗格中一个表格中。 Power BI 会将新的度量值插入到当前你选中的表格中,不管度量值处在数据的什么位置,你都可以通过选中此度量值,并使用主页表下拉菜单,轻松地移动它。
你可以像使用其它任何表格列一样使用度量值:只需将它拖放到报表画布或可视化效果字段中。 度量值还可与切片器无缝集成,快速分割数据,这意味着你只需定义一次度量值,然后就可将其用于不同的可视化效果。
计算 DAX 函数是一个功能强大的函数,它可实现各种类型的有用的计算,对于财务报表和视觉对象尤为有用。
l 创建计算表
计算表是 DAX 的一个功能,可用于表达一众新增建模功能。例如,如果你希望进行不同类型的合并联接或以函数公式的结果为基础创建随即变化的新表,使用计算表可以达到此目的。
要创建计算表,请转到 Power BI Desktop 中的数据视图。
从“建模”选项卡选择新建表,以打开公式栏。
在等号的左侧键入新表的名称,在右侧键入要用于形成该表的计算。 完成计算后,新表将显示在模型的“字段”窗格中。
创建后,即可像使用任何其他表的关系、公式、报表那样使用计算表。
l 浏览基于时间的数据
使用 Power BI 分析基于时间的数据非常容易。 Power BI Desktop 中的建模工具自动包括一些生成字段,在这些字段中,你可通过一次单击深化到年份、季度、月份和日期。
当你在报表中使用日期字段创建表格可视化效果时,PowerBI Desktop 将自动包括按时间段分解的信息。 例如,Power BI 会自动将日期表中的单个日期字段分为年、季度、月和日,如下图中所示。
可视化效果默认在*年*级别显示数据,但是你可以通过打开视觉对象右上角的向下钻取来更改它。
现在,当你单击图表中的条幅或线段时,它将深化到时间层次结构的下一级别,例如从*年*到*季度*。
你可以继续深化,直到到达层次结构的最精细级别,在本例中即为*天*。 若要在时间层次结构中逆向移动,请单击视觉对象左上角的向上钻取。
你还可以深化视觉对象上显示的所有数据,而非只是所选字段,方法是使用钻取全部双箭头图标,它也位于视觉对象的左上角。
只要你的模型具有日期字段,Power BI 就会为不同的时间层次结构自动生成不同的视图。
若要返回单个日期(而不是使用日期层次结构),只需右键单击“字段”列中的列名称(在下图中,列名称为“*InvoiceDate*”,然后从显示的菜单中选择列名称,而不是选择“日期层次结构”。
然后,你的视觉对象会显示基于该列数据的数据,而无需使用日期层次结构。 需要返回以使用日期层次结构?没问题!只需再次右键单击并从菜单中选择“日期层次结构”。
下一步
祝贺你! 你已经完成了本部分的 Power BI 引导学习课程。 了解有关数据建模的信息后,即可学习下一部分中的有趣知识:可视化。
如上所述,本课程按照 Power BI 中的常见工作流构建知识:
- 将数据导入 Power BI Desktop,然后创建报表。
- 发布到 Power BI 服务,你可在该服务中创建新的可视化效果和构建仪表板
- 与他人(尤其是差旅人员)共享你的仪表板
- 在 Power BI Mobile 应用中查看共享仪表板和报表并与其交互
虽然你可能不会亲自动手进行所有操作,但你将*理解*这些仪表板的创建方式、其连接到数据的方式...完成本课程时,你将能够创建自己的仪表板。
下一部分见!