【干货】和你谈谈数据分析报告

前言:
-更多关于数智化转型、数据中台内容请加入阿里云数据中台交流群—数智俱乐部 (文末扫描二维码或点此加入)

-阿里云数据中台官网 https://dp.alibaba.com/index

(作者:数智从业者)

在当今企业纷纷推动数字化运营的背景下,“No Data, No BB”成了职场人的口头禅。做一份好的数据分析报告,大到成为能否帮助企业做出正确的商业决策,小到成为能否说服老板获取业务资源的关键因素。因此做出一份高质量的数据分析报告是一个职场人必备的利器。

有人说,数据分析报告,不就是一堆的饼图、柱状图、散点图放到PPT上吗?我们尝试从这个人人习以为常的操作中看看是否有不变的门道。

注:本文中图表通过“阿里云 QuickBI”实现,中国首个入选Gartner魔力象限的BI产品

表达主题决定了我们的图表形式

决定分析报告图表形式的并不是拥有的数据是什么,而是你所需要表达的主题是什么。

图1和图2是根据一份相同的数据,展现的2个不同的图表:
image.png
image.png

上图可以发现对于相同的数据,因为我们所需表达的主题的差异,也将呈现完全不同的展现方式。图1表达的主题是爽肤水和沐浴露两个品类在不同城市的销量排名,图2主要表达的主题是在相同城市在两个不同的品类的销量差异。

因此在下笔做分析报告之前,先仔细想好自己要表达的主题是什么。

在进行了完整的分析后,要抵制住把所有向听众展示的冲动,而应该把所有注意力集中到需要表达的主题重点上来,因为这些才是听众所需要了解的信息。

为了找到我们分析的主题,需要了解分析报告针对的对象。详细的了解听众的背景和观点,并思考清楚我们期望听众对我们的看法。在内容上,希望听众了解什么,了解了以后有什么行动。了解了听众和内容后,再确认数据的表达形式,只展现能支持主题的数据。

整篇分析报告要能通过三分钟说得清楚,每页报告都能一句话概括清楚。

不要放弃“标题”这个绝佳的位置

有些图表的标题就和猜谜一样,例如:公司销售趋势、分公司销售分布情况。完全没有指出图表的重点,公司销售趋势是怎么样的?分公司销售分布又是如何?

别把我们需要强调的重点当做秘密一样不肯透露,而应该把它放在图表最前面,减少听众误解的可能性,并让他们的注意力集中到我们所想强调的数据上。

如下图,这张图到底是为了表达全量销售金额没有明显的增长呢?还是为了表达2月份销售金额断崖式下跌?还是为了表达其它什么主题呢。请在标题上明确的告诉听众。

image.png

处理“成分对比”的关系

成分对比主要体现在对与一个整体的每个部分的百分比的对比。常常出现“份额”、“百分比”等词汇。成分对比通常使用饼图来展现:

image.png

饼图在使用中建议不超过6个部分,如果超过6个部分,可以把剩余部分归类到“其它”项中。另外由于人们看数据习惯顺时针看数据,因此可把最重要部分放到12点位置,并用对比度强烈的颜色突出显示。

饼图主要在标识单一整体各部分比例,如果需要比较两个整体的成分时,重点考虑柱状图(图3)。因为如果使用饼图(图4)会导致读者视线需要在不同图表间来回移动:
image.png
image.png

成分分析可能包括子成分分析,需要把整体的一部分再作为整体进行分析,这时可将饼图放在开始的地方,百分比的柱状图放在后面:
image.png

我们要尽可能少使用饼图,饼图占整体的比例一般不超过5%。尽量不使用3D饼图或甜甜圈饼图。永远记住,图表只是为了让我们听众更好理解我们的数据,而不是图表有多与众不同。

处理“项目间对比”的关系

项目间对比主要是比较不同项目间的情况。常常出现“排名”、“大小”等词汇。项目间对比通常使用条形图来展示:
image.png

我们对于条形图的顺序需要深思熟虑,如果天然是有序的则按天然的顺序,例如人生阶段婴儿、少年、青年、中年、老年。但是如果没有这种天然顺序,需要考虑什么顺序对于我们数据主题是最有意义的。

根据我们所需要突出的主题,选择条形图的排序方式。展现条形图数值的方式包括刻度尺或在条形图上显示数字,可根据情况选择其中一种方式,但是不要两处都显示,多余容易导致图形的混乱。同时标识数字时,把小数点后的数值去掉,3%总是比3.1415%容易被听众记住。

对于项目间对比有时也会通过柱状图来代替,但是条形图相较于柱状图有两点明细的优势:第一,减少听众与时间序列对比的混淆;第二,条形图有较大的空间填写各项目的名称。

项目间对比,还可以通过背离式条形图,往往可以形象的将有利与不利的情况分离开来:

image.png

项目间还可能针对一个范围进行对比,这时可使用范围条形图:

image.png

当比较的项目由多个部分组成,可通过堆积条形图,必须将最重要的成分放在靠近基线的地方,因为只有这部分才可被准确度量:

image.png

处理“时间序列对比”的关系

时间序列对比关心的是随时间变化的对比。常常出现“变化”、“增长”、“下降”等词汇。时间序列对比通常使用柱状图或折线图来展示,如果时间点不多时可以使用柱状图,如果时间点是很长一段时间范围使用折线图更为合适:
image.png

对于折线图,趋势线一定要比背景线粗。当存在同一张折线图存在多条折线时,需要将最关注的线加粗加亮。但是当出现非常多折线时,我们的折线图就会呈现出“方便面式”图表,往往导致图表混乱。如下图:

image.png

解决“方便面式”图表的方式可通过将折线图拆分到不同的小的折线图中,虽然图表变多了,但是所需要表达的主题也能更加清晰:
image.png

在时间序列对比中,可通过箭头、线条、阴影等方式强调数据的某一部分,将听众的注意力集中到你所期待关注的点上:
image.png

同样,时间序列对比也可以通过刻度的正负来区分正面情况和负面情况:

image.png

我们常常在时间序列中,可能包括实际值和预计值,可通过将实际值设置为实线,将预计值设置为虚线的方式:
image.png

当一个折线图的数值,是可通过一个公式生成的,可将公式中的计算因子分别拆分到计算树中,使听众可清晰看到每部分计算因子的变化情况:
image.png

如果只有两个时间点,可展现两组数据之间各维度的提升和降低的差异,形成斜率图,连接的线条可以直观的感受到提升与降低的程度:
image.png

不同的刻度基线会产出完全相反的数据主题解读。看以下2张图,同样都是对杭州房价的描述:
image.png

同样的数据,产出的图表给人截然不同的感觉。那么我们到底应该如何定义刻度呢。其实关键取决于我们对于变化的理解,100块钱对于房价来说可能微不足道,但是对于动车票价格可能就是至关重要。我们应该选择一个刻度,能准确反映对变化重要性的理解。如果通过使用不合适的刻度基线来误导听众,只要有辨别能力的听众都能发现问题,那么我们的整套言论和信誉就会被唾弃。

处理“频率分布对比”的关系

频率分布对比表现的是数据分布范围情况。常常出现“范围”、“密度”、“分布”等词汇。频率分布对比通常使用柱状图或折线图来展示,当比较范围数量较多时可使用折线图,较少时可通过柱状图:
image.png

频率分布的范围大小非常重要,既不能太大也不能太小,建议5到20个分组。不同分组的大小应相同,否则会造成数据扭曲。

对于即需要展示频率分布,又需要进行项目间对比,可将分布柱状图进行组合,其中一个分布柱状图作为另一个的背景图:
image.png

处理“相关性对比”的关系

相关性对比表现的是不同变量之间的关系。常常出现“与XX有关”、“随XX增长”等词汇。相关性对比通常使用散点图或双条形图来展示。如下图:

image.png

在双条形图中,我们将独立变量按顺序排在左边,而把对比值放在右边,如果期望模式与实际模式一致时,右边的条形图就会变成左边的条形图的镜像,如下面左图。当关系不符合预期时,两组条形图则会发生偏离,如下面右图:
image.png
image.png

处理“多重对比”关系

对比可能不仅仅是一种对比关系,有可能是结合上文所说的成分、项目间、时间序列、频率分布、相关性对比中的一种或多种组合而成,我们称之为“多重对比”。例如“销售额在过去10年内稳步增长,但利润却没有同步增长”,这案例第一部分“销售额在过去10年内稳步增长”属于“时间序列对比”,第二部分“但利润却没有同步增长”属于项目间对比。对于这种情况,我们需要确定哪一种关系是主要的,哪一种是次要的。案例中,第一部分随时间变化是主要的,而销售额与利润项目间对比是次要的,因此最好选择以时间变化对比的折线图,并为每一个项目画一条支线的方式实现,如下图:

image.png

不仅仅只有图表

当然,对于数据分析报告,可定量信息我们可以通过图表构建,但是对于不可定量的信息,我们可以通过一些几何图形形成概念性视觉图像,或通过一些日常事务作视觉比喻。例如说到目标,可以形成高山这样的视觉图像。这需要发挥自己的想象力,平时多留意写优秀的海报广告,在生活中寻找灵感,在报告中能够做到与听众产生共鸣的效果。

消除认知负荷

听众在接受我们分析报告信息时,需要消耗脑力去学习新知识,脑力是有限的,因此需要消除听众无关紧要的脑力消耗。造成无关紧要脑力消耗最大的问题就是“杂乱”,因此消除杂乱是数据分析报告需要重点关注的。

通过将文字从原来居中对齐调为左对齐,进行相关的无关数据的淡化的处理,能减少听众的认知负荷,把关注点转移到我们的重点上::

image.png

image.png

通过将网格线消除、标记点消除、金额度量转换、直接标记数据等手段降低认知负荷,右图是修改后的图表:

image.png

通过消除一些干扰,能突出我们所需要表达的重点。所有的数据不是相同重要,消除不需要关注的元素,或将不直接影响内容的元素融入背景。去掉这个东西会有什么变化?如果不会,那么就去掉吧。

同时要突出我们需要吸引听众实现的地方。在文字中可通过加粗、颜色、斜体、大小、空间隔离、下划线等手段突出文字关键词。在图表中主要通过颜色、大小突出需要强调的内容。在使用颜色时需慎重选择,不能在一张图中有太多颜色,造成视觉干扰;可以使用颜色的不同饱和度来强调数据;根据分析报告背景,可选择对于的互补色来做内容的突出强调。

讲好分析报告

分析报告做好了,还需要以更好的语言表达方式呈现给听众。可以把分析报告当做一个故事来说,能更加引人入胜。

首先对整个背景做设定,接着介绍什么因素上下文驱动情节的演进,举例说明发生了什么样的冲突,基于这些冲突有哪些假设,再基于这些假设如何做数据验证,最后通过什么方式带来什么解决方案。

为了保证整个分析报告的逻辑清晰,可以构建类似金字塔的逻辑结构,以某一个中心论点为塔尖,在其以下分支出不同论点的数据分析支撑。让听众对我们的分析报告有个清晰的逻辑结构。

最后,希望每个职场人都能用数据分析报告打开一个新的天地。广阔数据天地,大有可为。

工欲善其事必先利其器,BI工具,推荐“QuickBI”,众多可视化组件拖拖拽拽就完成了,人人都是数据分析师。

 

数据中台是企业数智化的新基建,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。目前正通过阿里云数据中台解决方案对外输出,包括零售、金融、互联网、政务等领域,其中核心产品有:

  • Dataphin,一站式、智能化的数据构建及管理平台;
  • Quick BI,随时随地 智能决策;
  • Quick Audience,全方位洞察、全域营销、智能增长;
  • Quick A+, 跨多端全域应用体验分析及洞察的一站式数据化运营平台;

官方站点:
数据中台官网 https://dp.alibaba.com
数据中台钉钉群二维码2.jpg

 

原文链接

本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/515470.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3 安装axios使用报错:Uncaught TypeError: Cannot read property ‘use‘ of undefined

最近在学习Vue3,使用vue cli4搭建了一个demo项目,安装axios后,控制台报错: Uncaught TypeError: Cannot read property use of undefinedat eval (axios.js?be3b:59)at Module../src/plugins/axios.js (app.js:1229)at __webpac…

云原生五大趋势预测,K8s安卓化位列其一

作者 | 李响、张磊 Kubernetes 本身并不直接产生商业价值,你不会花钱去购买 Kubernetes 。这就跟安卓一样,你不会直接掏钱去买一个安卓系统。Kubernetes 真正产生价值的地方也在于它的上层应用生态。 “未来的软件一定是生长于云上的”,这是…

centos7 linux 安装 keeplived

文章目录一、简介部署总览1. 简介2. 部署总览二、安装实战2.1. 安装环境2.2. 下载软件包2.3. 同步软件包2.4. 解压、编译、安装三、系统服务3.1. 配置复制3.2. 脚本复制3.3. 服务开机启动四、配置修改4.1. 编辑配置4.2. 140 服务器配置4.3. 141 服务器配置4.4. 启动keepalived4…

阿里人脸识别安全技术获专利可防范3D人脸面具攻击

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 当人脸识别遇上3D技术,谁将是最后的胜利者?长期困扰人脸识别行业的安全问题有了最新的解法。日前,阿…

vue3中 使用 swiper 插件,自定义切换按钮, 将 前进后退 、左右切换 按钮放到容器外部

今天在使用 swiper 时,遇到一个 坑爹的 问题。 swiper 组件的本来样式长这样: 左右切换的按钮在滑动容器内部,但是我们想要它跑到容器外面去。 网上找了一堆方法都不好使 也不知道是不是因为 我使用的是 高版本原因 最终实验结果&#x…

一眼看尽5G江湖,Gartner发布5G网络基础设施魔力象限报告

作者 | 白告天来源 | 边缘计算社区头图 | 下载于视觉中国近日,国际权威分析机构Gartner发布了首份《通信运营商5G网络基础设施魔力象限》报告。以最直观的方式展示了这一领域内各家头部企业的力量对比情况。Gartner通信运营商5G网络基础设施魔力象限该魔力象限帮助通…

一篇小文带你走进RabbitMQ的世界

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 说到消息中间件,大部分人的第一印象可能是Kafka。毕竟Kafka自问世以来,就顶着高并发,大流…

nginx高可用方案:keepalived+nginx vip 动态位移

文章目录一、部署总览常用命令1. 部署总览2. 常用命令二、软件安装配置2.1. 安装keepalived2.2. 安装nginx2.3. 配置静态文件三、测试3.1. 启动nginx3.2. 验证四、vip动态位移测试4.1. 140验证4.2. 141验证4.3. 140停止kp服务4.4. 141 验证4.5. 140 重新启动kp服务一、部署总览…

多角度分析平台即服务?PaaS的类型和用例

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 没有适合所有人的单一PaaS。即使云计算已经发展了10多年,但对云计算服务模型的定义仍然相当模糊。通常&#xff0…

未来,边缘计算的功能支柱是 Kubernetes

来源 | SDNLAB责编 | 寇雪芹头图 | 下载于视觉中国编者按在数字化转型时代,5G网络是一个飞跃。5G正在推动边缘计算的发展,而Kubernetes则是5G与边缘计算之间的粘合剂。云计算的十年云计算之于信息技术(IT)产业,就像石油之于汽车工业一样。云让…

如何在工作中快速成长?致工程师的10个技巧

云栖号资讯:【点击查看更多行业资讯】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 作者 | 江建明 阿里巴巴高级无线开发专家 导读:精英人数的增长速度持续加快后,很多人开始焦虑&#…

在新项目中使用 Vue3 使用总结

一、使用背景 最近公司需要搭建一个新项目,用于做官网。因为作为官网,首先项目不算大,一共只有十来个页面,并且想要用户体验感很好,所以最终选定以 Vue 作为技术栈。 虽然 Vue3 (中文官网)刚问…

2020年从架构谈起到Mesh结束

作者 | 张羽辰(同昭)阿里云交付专家 导读:如今,几乎所有的事情都离不开软件,当你开车时,脚踩上油门,实际上是车载计算机通过力度感应等计算输出功率,最终来控制油门,你从…

Mendix:低代码平台四大常见用例开发

编辑 | 宋慧 供稿 | Mendix 头图 | 付费下载于视觉中国 如今,低代码对很多人来讲可能已经不再是一个陌生的名词。创新的低代码开发平台实现了低级别编码的抽象化和人工流程的自动化。低代码通过可视化开发工具和可重用组件,缩短了定制化网络和移动应用的…

下架已上线的小程序;2.设置不允许被用户搜索到

下架已上线的小程序: 登录微信开发者后台【设置】-【功能设置】-【暂停服务设置】-【暂停服务】,如图 设置小程序不允许被用户搜索到: 登录微信开发者后台【设置】-【功能设置】-【隐私设置】-【关闭】,如图 操作过程中遇到的问题…

5G新基建边缘计算乘风破浪

2019年6月6日,工信部向中国电信、中国移动、中国联通、中国广电发放5G商用牌照,这意味着中国正式进入5G元年。一年以来,随着基站的建设与用户认知的提升,5G应用如雨后春笋般涌现。而在今年上半年频繁被提及的“新基建”中&#xf…

那些年,我在阿里当数据开发

前言: -更多关于数智化转型、数据中台内容请加入阿里云数据中台交流群—数智俱乐部 (文末扫描二维码或点此加入) -阿里云数据中台官网 https://dp.alibaba.com/index (作者:数据从业者 ) 我是阿里数据部…

太白金星:我很关心分布式 Quorum NWR

来源 | 悟空聊架构责编 | 寇雪芹头图 | 下载于视觉中国先来看一段神秘的对话:太白金星:听闻老君最近在练神丹妙药,可否与我一讲?太上老君:老白啊,我最近在练六颗丹药:两颗延年丹、两颗健步丹、两…