Power BI 如何获取数据做可视化

获 取 数 据

获取数据

Power BI Desktop 可连接到种类广泛的多种数据源,包括本地数据库、Excel 工作表和云服务等。 它可帮助清理数据和设置数据格式,以使数据更为有用,包括拆分和重命名列、更改数据类型和处理日期。还可创建列之间的关系,以便可以更轻松地将数据建模和分析数据。

 

 

Power BI Desktop 入门

在本主题中,我们将深入探讨一下 Power BI 的前两个部分如何结合在一起:

  • 在 Power BI Desktop 中创建一个报表。
  • 在 Power BI 服务中发布该报表。

选择 获取数据。 此时将显示数据源集合,允许你选择数据源。无论选择的数据源是什么,Power BI 都会连接到该数据源,并显示来自源的可用数据。

在 Power BI Desktop 报表 视图中,你可以开始生成报表。

报表视图具有五个主要区域:

  1. 功能区,用于显示与报表和可视化效果相关联的常见任务
  2. 报表视图或画布,可在其中创建和排列可视化效果
  3. 底部的页面选项卡,用于选择或添加报表页
  4. 可视化效果窗格,你可以在其中更改可视化效果、自定义颜色或轴、应用筛选器、拖动字段等
  5. 字段窗格,可在其中将查询元素和筛选器拖到报表视图,或拖到可视化效果筛选器窗格

通过选择边缘的小箭头,可以折叠可视化效果字段窗格,以便在报表视图中提供更多空间以生成炫酷的可视化效果。修改可视化效果时,你会看到这些箭头朝上或朝下,这意味着你可以相应展开或折叠该部分。

若要创建可视化效果,只需将字段从字段列表拖到报表视图即可。 此示例中,我们来拖动 RetirementStats 中的“状态”字段,看看会发生什么。

看一下Power BI Desktop 自动创建了基于地图的可视化效果,因为它识别到“状态”字段包含地理位置数据。

创建具有几个可视化效果的报表之后,我们就可以将该报表发布到Power BI 服务了。 在 Power BI Desktop 的开始功能区,选择发布

系统将提示你登录到 Power BI。当你登录并完成此发布过程后,你将看到以下对话框。选择成功!下面的链接以进入 Power BI 服务,你可以在此处看到你刚刚发布的报表。

当登录到 Power BI 时,你将看到刚才你在该服务上发布的 Power BI Desktop 文件。 在下图中,在 Power BIDesktop 中创建的报表显示在报表部分。

在该报表中,我可以选择大头针图标将该视觉对象固定到仪表板(下图)。

选择该图标时,将显示以下对话框,让我将视觉对象固定到现有仪表板,或创建新仪表板。

当我们从报告中固定几个视觉对象时,我们可以在仪表板中看到这些视觉对象。

当然,使用 Power BI 还可以执行更多操作,例如,共享你创建的仪表板。

接下来,我们了解一下可以自动创建仪表板的功能,只需连接到云服务(如 Facebook、Salesforce)等服务即可。

 

 

连接到 Power BIDesktop 中的数据源

Power BI Desktop 可以连接一系列数据源,包括本地数据库、Excel 工作簿和云服务。 目前,超过 59 种不同的云服务(例如 GitHub 和 Marketo)具有特定的连接器,并且你可以通过 XML、CSV、文本和 ODBC 连接到通用源。 Power BI 甚至将直接从网站 URL 擦除表格数据! 但让我们从头开始,打开 Power BI Desktop,然后连接数据。

启动 Power BI Desktop 并移至“开始屏幕”时,你可以在功能区“开始”选项卡上选择“获取数据”。

在 Power BI Desktop 中,存在各种不同的可用数据源。根据你的选择,将要求你在计算机或网络上查找相应源,或者系统会提示你登录某个服务,以对你的请求进行验证。

连接后,你将看到的第一个窗口是导航器。 导航器显示你的数据源的表或实体,单击其中一个将提供其内容的预览。然后,可以立即导入所选的表或实体,或在导入数据前,选择编辑以转换并清理数据。

选定想要导入到 Power BI Desktop 中的表后,通过选择右下角的加载按钮,可以将其加载到 Power BI Desktop 中。

但是,在将这些表加载到 Power BI Desktop 中之前,有时你可能想要先对它们进行更改。你可能只想要客户的子集,或可能会筛选仅发生在特定国家/地区的销售数据。 在这些情况下,可以先选择“编辑”按钮,筛选或转换这些数据,再将其所有导入到 Power BI Desktop 中。

下一部分中,我们将在该位置提取并编辑数据。

 

 

使用查询编辑器清除并转换数据

当你在“导航器”中选择“编辑”时,此时将启动“查询编辑器”并使用你从数据源中选择的表或其他实体进行填充。

你还可以使用开始功能区中的编辑查询按钮直接从 Power BI Desktop 启动查询编辑器

 

一旦查询编辑器与可供你定型的数据进行加载后,你将看到以下几个分区:

  1. 在功能区中,许多按钮当前处于活动状态,以与查询中的数据进行交互
  2. 在左窗格中,列出了所有查询(每个查询各对应一个表或一个实体)并可供选择、查看和定型
  3. 在中央窗格中,将显示已选择查询中的数据,可供你调整
  4. 显示的查询设置窗口列出了查询的属性和应用步骤

在中央窗格中,右键单击某一列将显示多种不同的可用转换,如从表中删除该列、以新名称复制该列并替换值。根据此菜单,你还可以通过常用分隔符将文本列拆分成多列。

查询编辑器功能区包含其他工具,如更改列的数据类型、添加科学记数法或根据日期(如一周中的某天)提取元素。

应用转换时,每个步骤都将出现在查询编辑器右侧的查询设置窗格中的应用步骤列表中。可以使用此列表撤消或查看特定更改,甚至更改步骤的名称。 若要保存你的转换,请选择开始选项卡上的关闭并应用

选择关闭并应用后,查询编辑器将应用所做的查询更改,并将其应用到 Power BI Desktop。

当在查询编辑器中转换数据时,你可以进行所有类型的操作,其中包括高级转换。 在下一节,我们将看看其中几个高级转换。

 

 

更高级的数据源和转换

在本文中,我们将讨论一些适用于 PowerBI Desktop 的高级数据导入和清理方法 。 在查询编辑器中塑造好你的数据并将其引入 Power BI Desktop中后,你可以以多种不同的方式进行查看。 Power BI Desktop 中有三种视图:报表视图、数据视图和关系视图。通过选择画布左上方的图标可以查看每个视图。

若要更改视图,只需选择两个图标中的任意一个。 图标旁的黄色条指示处于活动状态的视图。

Power BI Desktop 可在建模过程中随时将来自多个源的数据合并为单一报表。若要将其他源添加到现有报表,请在开始功能区中选择编辑查询,然后在查询编辑器中选择新源

Power BI Desktop 中可以使用许多不同的可能性数据源,其中包括文件夹。通过连接到文件夹,你可以同时导入来自多个文件的数据,例如一系列 Excel 文件的 CSV 文件。 所选文件夹中包含的文件会以二进制内容显示在查询编辑器中,单击内容顶部的双箭头图标将会加载它们的值。

Power BI 最有用的工具之一就是筛选器。 例如,选择与列相邻的下拉箭头将打开文本筛选器清单,你可以使用它来删除模型中的值。

你还可以合并和追加查询,并将多个表(或来自文件夹中多个文件的数据)转变成仅包含你所需数据的单一表格。你可以使用追加查询工具将数据从新表添加到现有查询。 Power BI Desktop 将尝试匹配查询中的列,你可以根据需要在查询编辑器中进行调整。

最后,添加自定义列工具为高级用户提供了使用功能强大的 M 语言从草稿编写查询表达式的选项。 你可以添加基于 M 查询语言语句的自定义列,并按所需的方式获取你的数据。

 

 

清理格式不规则的数据

有时数据不采用简单列格式,这种情况常出现在 Excel 电子表格中,适合肉眼查看的表格布局不一定是自动查询的最优选择。例如,以下电子表格具有跨多个列的标题。幸运的是,Power BI 中的工具能将多列表格快速转化为数据集供你使用。

 

Ø  转置数据

例如,使用查询编辑器中的转置,你可以对数据进行翻转(即将列变为行,将行变为列),从而将数据分解为可操作的格式。

Ø 设置数据格式

你可能还需要设置数据格式,以便 Power BI 在导入数据后对其进行适当分类和标识。

通过几种转换(包括将行提升为标题以分解标题、使用填充将null值变为给定列中上方或下方行内找到的值,以及逆透视列),即可将数据清理为可在 Power BI 中使用的数据集。

通过 Power BI,你可以在你的数据上对这些转换进行试验,确定可将数据转换为 Power BI 可处理的列格式的转换类型。 请记住,你采取的所有操作都记录在“查询编辑器”中的“应用的步骤”部分中,因此如果转换未达到预期,只需单击该步骤前面的小图标的x撤消操作即可。

Ø 创建视觉对象

数据 Power BI 可用格式后,即可通过转换和清理数据开始创建视觉对象。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/475617.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Power BI 将商业智能数据转换为数据理解

l 研究数据 在本部分中你要了解各种知识,并且积极的互动和进行 Power BI 共享在这一部分至关重要。 Power BI 服务简介 Power BI 服务是 Power BI Desktop 的自然扩展,其功能包括上传报表、创建仪表板,以及使用自然语言对数据进行提问。该服…

LeetCode 554. 砖墙(map计数)

1. 题目 你的面前有一堵方形的、由多行砖块组成的砖墙。 这些砖块高度相同但是宽度不同。你现在要画一条自顶向下的、穿过最少砖块的垂线。 砖墙由行的列表表示。 每一行都是一个代表从左至右每块砖的宽度的整数列表。 如果你画的线只是从砖块的边缘经过,就不算穿…

Power BI 数据可视化(核心),让报表更生动

可 视 化 l 可视化 Power BI 中的视觉对象简介 实现数据可视化是 Power BI 的核心部分(像我们在本课程前面所定义那样,它是基本的构建基块),而创建视觉对象是发现并共享你的见解的最简方法。 Power BI 默认提供众多可视化效果…

Power BI数据建模

l 建模 通常情况下,你将会连接到多个数据源以创建报表,且需所有数据协同工作。 建模就是实现这一点的办法。 若要创建不同数据源之间的逻辑连接,需创建一种关系。 数据源之间的关系使 Power BI 能够了解表与表之间的关系,以便能…

Power BI 数据可视化软件实现共享报表

l 在 Power BI 中与同事共享和协作 在此模块中,涵盖各种用于与同事共享和协作处理仪表板、报表和数据的方法。例如,你可以: 从 Power BI Desktop 向 Power BI 服务发布报表使用 Power BI Mobile 应用查看共享报表和仪表板并与其交互创建打包…

非线性规划 - 用非线性规划解决问题 - (Lingo建模)

在经营管理中,为取得更高的利润,不仅需要提高经营收入,也要考虑如何在现有的人力、物力和财力条件下合理安排,在满足要求的前提下,达到最低的成本。对于静态的最优化问题(即所有数据不会瞬息万变&#xff0…

PHP学习之路(二)让我们开始环境搭建(Windows篇)

在上篇中,我详述了在Windows下配置Zend开发工具的详细过程,但是没有一个开发环境,你再牛B的工具自然也跑不起来,比如没有了.NET Framework,你跑个Visual Studio试试,所以搭建开发环境也是学习程序开发一个必…

线性规划 - 用单纯形法解决整数规划问题 - (Matlab、Lingo建模)

现实生活中,比如机器的台数,参与工作的人数,可调动的车辆数,这些数据都是整数。因此对于变量中包含整数、或者完全是整数的规划问题,我们称之为整数规划。在解决整数规划常用的算法便是单纯形法。 课题名称&#xff1a…

Oracle 多表 连接 顺序 与 性能关系 测试

一. 创建表并insert 数据 create table ta (id number,name varchar2(10)); create table tb(id number,job varchar2(10)); begin for i in 1..1000000 loop begin insert into ta values(i,dave); commit; end; end loop; end; begin for i in 1..1000000 loop begin if i<…

线性规划 - 用单纯形法解决LP问题 - (Matlab、Lingo建模)

线性规划研究时间较早&#xff0c;在实际应用中也比较成熟&#xff0c;它是一种辅助人们进行科学管理的数学方法&#xff0c;为合理地利用有限的人力、物力、财力等资源作出的最优决策&#xff0c;提供科学的依据。 课题名称&#xff1a;配货问题&#xff0c;使运费收入最大 现…

微软Webcast课程下载软件iReaper正式登陆Android平台

微软Webcast课程下载软件iReaper正式登陆Android平台&#xff0c;我叫它iReaper for Android。目前正处于测试阶段&#xff0c;功能比较单一。 目前支持 1.视频下载 2.课程代码下载 3.讲义下载 4.问答下载 附上截图&#xff0c;敬请期待&#xff01; 1.下载地址&#xff…

动态规划 - Floyd算法求最短路径 - (Matlab建模)

Floyd算法又称为弗洛伊德算法、插点法&#xff0c;是一种利用动态规划的思想寻找给定的加权图中多源点之间最短路径的算法&#xff0c;与Dijkstra算法类似。该算法名称以创始人之一、1978年图灵奖获得者、斯坦福大学计算机科学系教授罗伯特弗洛伊德命名。 课题名称&#xff1a;…

神经网络 - BP神经网络与RBF神经网络模型解决实际问题 - (Matlab建模)

目录 神经网络模型简述 实例&#xff1a;交通运输能力预测设计 MATLAB程序及仿真结果 由于货物运输、地方经济及企业发展的紧密联系&#xff0c;因此作为反映货物运输需求的一项重要指标, 货运量预测研究和分析具有较强的实际意义。 常用的货运量预测方法包括时间序列方法、…

LeetCode 135. 分发糖果(DP)

1. 题目 老师想给孩子们分发糖果&#xff0c;有 N 个孩子站成了一条直线&#xff0c;老师会根据每个孩子的表现&#xff0c;预先给他们评分。 你需要按照以下要求&#xff0c;帮助老师给这些孩子分发糖果&#xff1a; 每个孩子至少分配到 1 个糖果。相邻的孩子中&#xff0c…

网络数据的背后-网络日志的分析指标【转】

通常网站分析的技术包括页面标签分析技术&#xff08;JS技术&#xff09;和日志文件分析技术两种&#xff0c;两种网站分析技术各有优缺点&#xff0c;譬如下文中介绍的基于回话的统计和点击流分析日志文件分析法就要优于页面标签分析法&#xff0c;通常&#xff0c;两种技术具…

词云图 - WorldCloud - Python代码实现

目录 第一步&#xff1a;安装必要的包WorldCloud&#xff08;安装好并且没有出错的可跳过这一步&#xff09; 第二步&#xff1a;准备文件&#xff0c;词云图的图片和文章&#xff0c;按照自己喜好准备吧 第三步&#xff1a;Python实现-源码 第一步&#xff1a;安装必要的包…

[Hands On ML] 2. 一个完整的机器学习项目(加州房价预测)

文章目录1. 项目介绍2. 性能指标3. 确定任务类型4. 查看数据5. 创建测试集6. 数据可视化7. 查找数据关联8. 特征组合9. 为算法准备数据9.1 数据清洗9.2 处理文本特征10. 自定义转换器11. 特征缩放12. 转换流水线Pipeline13. 训练模型14. 交叉验证15. 微调模型15.1 网格搜索15.2…

线性回归 - 机器学习多元线性回归 - 一步一步详解 - Python代码实现

目录 数据导入 单变量线性回归 绘制散点图 相关系数R 拆分训练集和测试集 多变量线性回归 数据检验&#xff08;判断是否可以做线性回归&#xff09; 训练线性回归模型 先甩几个典型的线性回归的模型&#xff0c;帮助大家捡起那些年被忘记的数学。 ● 单变量线性回归&…

聚类分析 - K-means - Python代码实现

算法简介 K-means算法是很典型的基于距离的聚类算法&#xff0c;采用距离作为相似性的评价指标&#xff0c;即认为两个对象的距离越近&#xff0c;其相似度就越大。该算法认为簇是由距离靠近的对象组成的&#xff0c;因此把得到紧凑且独立的簇作为最终目标。 算法过程如下&…

数据归一化 - MinMaxScaler()/MaxAbsScaler() - Python代码

目录 归一化 数据归一化的背景介绍 MinMaxScaler&#xff1a;归一到 [ 0&#xff0c;1 ] MaxAbsScaler&#xff1a;归一到 [ -1&#xff0c;1 ] 标准化 去均值&#xff0c;方差规模化 归一化 数据归一化的背景介绍 在之前做聚类分析的时候我们发现&#xff0c;聚类的…