图形化解释
作为数据分析师来说一个好的图形,就是自己的数据表达能力
- 简单文本
只有一两项数据需要分享的时候,简单的文本是最佳的沟通方法
下图的对比可以看出来文字的表达效果会好很多
- 散点图
散点图在展示两件事的关系时很有用,观察是否存在某种关系以及存在何种关系,
可以观察数据的一个整体分析情况
需要做回归分析的话,还是很有帮助的,还可以判断数据的拟合情况
- 表格
一般不太推荐使用表格,如果信息比较多的话,用其他展示容易流失信息,没有更好的方式,可以考虑使用表格
需要注意调整表格的格式,突出数据
- 折线图
一般用于表现数据变化的趋势和数据对比,常见且好用
比如今年月份的一个销售数据的变化趋势
- 热力图
使用颜色饱和度辅助用户更快速捕捉数据信息,热力图还有很多种形式,地理热力图,网页热力图
主要用于反馈数据分布所占比例对比的情况 比如 网页点击率
- 斜率图
斜率图适用于两个时间段内数据变化对比,可以快速的展示两组数据之间各维度的相对提升,降低等差异
常用于 两个时间段多维度对比分析
- 水平条形图
比起竖直条形图,展示数据分布更推荐水平的条形图,对比起来会更直观,因为大部分的人阅读习惯是 “之” 字型
水平的条形图符合我们的阅读顺序先了解柱子的含义,然后往右对比数值
- 竖直条形图
条形图适合用在数据分布上,当你添加多组数据时,专注其中一组并得出结论就变得更为困难,所以谨慎使用包含多组数据的条形图
- 堆叠竖直条形图
堆叠条形图比较类别内部的分布就非常困难,可以改成两个图或者一个条形图和一个折线图组合
- 堆叠水平条形图
一般来说堆叠条形图不是很好对比内部的数据分布
- 瀑布图
瀑布图看起来很炫酷,适合用在展示数据从起始到结果以及中间的变化过程
- 方形面积图
一般不太建议使用面积图,因为人眼不擅于在二维空间进行定量的度量,尤其是不规则的面积图
- 箱线图
箱线图(boxplot)也称箱须图,其绘制需使用常用的统计量,能提供有关数据位置和分散 情况的关键信息,尤其在比较不同特征时,更 可表现其分散程度差异。
箱线图利用数据中的五个统计量(最小值、下四分位数、中位数、上四分位数和最大值)来 描述数据,它也可以粗略地看出数据是否具有 对称性、分布的分散程度等信息,特别可以用 于对几个样本的比较。
可视化中需要避免的问题
- 尽量不使用饼图 / 甜甜圈图
2. 永远不要使用3D图形
不好区分 3 - 4月份数据的大小
3. 尽量避免双Y轴
会使数据感观很差,阅读起来很费劲
替代方案
图表优化的2大准则
1. 消除杂乱
- 去掉不必要的元素
- 对齐 (避免使用倾斜元素)
- 适当留白
- 正确使用对比 (事物的差异越多,则没有任何一种差异足够突出)
- 聚焦受众的视线
- 前注意属性引导视线
- 页面位置 (最重要的内容放在页面的左上方)
- 将必要但不直接影响内容的元素融入背景
优化案例
原图形
优化之后的图形