Python开发示例——使用Python实现炫酷的数据动态图

前言

数据可视化是通过图形、图表、地图等可视元素将数据呈现出来,以便更容易理解、分析和解释。它是将抽象的数据转化为直观形象的过程,有助于发现数据中的模式、趋势和关系。数据可视化对于数据科学、商业分析、决策制定等领域都至关重要。当我们想用数据描述世界、阐释想法和展示成果时,如果只有单调的文本和数字,很难吸引观众的注意。漂亮的可视化图表有时能够在表达信息上胜过大量文字。

一、 plotly库

Plotly是一款交互式的数据可视化库,支持多种编程语言,包括Python、R、JavaScript等。它可以用于创建各种类型的图表,从简单的折线图和散点图到复杂的热力图和3D图。Plotly的图表具有动态性和交互性,使用户能够在图表中进行缩放、拖动、悬停等操作,以更深入地探索数据。

  1. 安装 Plotly: 在Python中,可以使用以下命令安装Plotly库:

    pip install plotly
    
  2. 导入 Plotly: 在Python脚本或Jupyter Notebook中,导入Plotly库:

    import plotly.graph_objects as go
    
  3. 创建图表对象: 使用graph_objects模块创建图表对象,例如:

    fig = go.Figure()
    
  4. 添加图表元素: 向图表对象添加不同类型的图表元素,如散点、线条、柱形等。

    fig.add_trace(go.Scatter(x=[1, 2, 3], y=[4, 5, 6], mode='markers', name='Scatter'))
    
  5. 自定义图表: 设置图表的标题、坐标轴标签、布局等。

    fig.update_layout(title='My Plotly Chart', xaxis_title='X-axis', yaxis_title='Y-axis')
    
  6. 显示图表: 在Jupyter Notebook中,可以使用以下命令显示图表:

    fig.show()
    

Plotly还支持通过Dash创建交互式的Web应用程序,可以在数据可视化和用户界面方面提供更高级的功能。Dash是基于Plotly构建的开源框架,用于创建仪表板和数据分析应用。通过使用Plotly,可以轻松创建漂亮、交互式的图表,以更好地理解和传达数据。

二、示例

动画

在研究这个或那个指标的演变时,我们常涉及到时间数据。Plotly 动画工具仅需一行代码就能让人观看数据随时间的变化情况,如下图所示:

代码如下:

import plotly.express as px
from vega_datasets import data
df = data.disasters()
df = df[df.Year > 1990]
fig = px.bar(df,y="Entity",x="Deaths",animation_frame="Year",orientation='h',range_x=[0, df.Deaths.max()],color="Entity")
# improve aesthetics (size, grids etc.)
fig.update_layout(width=1000,height=800,xaxis_showgrid=False,yaxis_showgrid=False,paper_bgcolor='rgba(0,0,0,0)',plot_bgcolor='rgba(0,0,0,0)',title_text='Evolution of Natural Disasters',showlegend=False)
fig.update_xaxes(title_text='Number of Deaths')
fig.update_yaxes(title_text='')
fig.show()

只要你有一个时间变量来过滤,那么几乎任何图表都可以做成动画。下面是一个制作散点图动画的例子:

import plotly.express as px
df = px.data.gapminder()
fig = px.scatter(df,x="gdpPercap",y="lifeExp",animation_frame="year",size="pop",color="continent",hover_name="country",log_x=True,size_max=55,range_x=[100, 100000],range_y=[25, 90],#   color_continuous_scale=px.colors.sequential.Emrld
)
fig.update_layout(width=1000,height=800,xaxis_showgrid=False,yaxis_showgrid=False,paper_bgcolor='rgba(0,0,0,0)',plot_bgcolor='rgba(0,0,0,0)')

太阳图

太阳图(sunburst chart)是一种可视化 group by 语句的好方法。如果你想通过一个或多个类别变量来分解一个给定的量,那就用太阳图吧。

假设我们想根据性别和每天的时间分解平均小费数据,那么相较于表格,这种双重 group by 语句可以通过可视化来更有效地展示。

这个图表是交互式的,让你可以自己点击并探索各个类别。你只需要定义你的所有类别,并声明它们之间的层次结构(见以下代码中的 parents 参数)并分配对应的值即可,这在我们案例中即为 group by 语句的输出。

import plotly.graph_objects as go
import plotly.express as px
import numpy as np
import pandas as pd
df = px.data.tips()
fig = go.Figure(go.Sunburst(labels=["Female", "Male", "Dinner", "Lunch", 'Dinner ', 'Lunch '],parents=["", "", "Female", "Female", 'Male', 'Male'],values=np.append(df.groupby('sex').tip.mean().values,df.groupby(['sex', 'time']).tip.mean().values),marker=dict(colors=px.colors.sequential.Emrld)),layout=go.Layout(paper_bgcolor='rgba(0,0,0,0)',plot_bgcolor='rgba(0,0,0,0)'))fig.update_layout(margin=dict(t=0, l=0, r=0, b=0),title_text='Tipping Habbits Per Gender, Time and Day')
fig.show()

现在我们向这个层次结构再添加一层:

为此,我们再添加另一个涉及三个类别变量的 group by 语句的值。

import plotly.graph_objects as go
import plotly.express as px
import pandas as pd
import numpy as np
df = px.data.tips()
fig = go.Figure(go.Sunburst(labels=["Female", "Male", "Dinner", "Lunch", 'Dinner ', 'Lunch ', 'Fri', 'Sat','Sun', 'Thu', 'Fri ', 'Thu ', 'Fri  ', 'Sat  ', 'Sun  ', 'Fri   ', 'Thu   '
],parents=["", "", "Female", "Female", 'Male', 'Male','Dinner', 'Dinner', 'Dinner', 'Dinner','Lunch', 'Lunch', 'Dinner ', 'Dinner ','Dinner ', 'Lunch ', 'Lunch '],values=np.append(np.append(df.groupby('sex').tip.mean().values,df.groupby(['sex','time']).tip.mean().values,),df.groupby(['sex', 'time','day']).tip.mean().values),marker=dict(colors=px.colors.sequential.Emrld)),layout=go.Layout(paper_bgcolor='rgba(0,0,0,0)',plot_bgcolor='rgba(0,0,0,0)'))
fig.update_layout(margin=dict(t=0, l=0, r=0, b=0),title_text='Tipping Habbits Per Gender, Time and Day')fig.show()

平行类别

另一种探索类别变量之间关系的方法是以下这种流程图。你可以随时拖放、高亮和浏览值,非常适合演示时使用。

代码如下:

import plotly.express as px
from vega_datasets import data
import pandas as pd
df = data.movies()
df = df.dropna()
df['Genre_id'] = df.Major_Genre.factorize()[0]
fig = px.parallel_categories(df,dimensions=['MPAA_Rating', 'Creative_Type', 'Major_Genre'],color="Genre_id",color_continuous_scale=px.colors.sequential.Emrld,
)
fig.show()

平行坐标图

平行坐标图是上面的图表的连续版本。这里,每一根弦都代表单个观察。这是一种可用于识别离群值(远离其它数据的单条线)、聚类、趋势和冗余变量(比如如果两个变量在每个观察上的值都相近,那么它们将位于同一水平线上,表示存在冗余)的好用工具。

代码如下:

import plotly.express as px
from vega_datasets import data
import pandas as pd
df = data.movies()
df = df.dropna()
df['Genre_id'] = df.Major_Genre.factorize()[0]
fig = px.parallel_coordinates(df,dimensions=['IMDB_Rating', 'IMDB_Votes', 'Production_Budget', 'Running_Time_min','US_Gross', 'Worldwide_Gross', 'US_DVD_Sales'],color='IMDB_Rating',color_continuous_scale=px.colors.sequential.Emrld)
fig.show()

量表图和指示器

量表图仅仅是为了好看。在报告 KPI 等成功指标并展示其与你的目标的距离时,可以使用这种图表。

指示器在业务和咨询中非常有用。它们可以通过文字记号来补充视觉效果,吸引观众的注意力并展现你的增长指标。

import plotly.graph_objects as go
fig = go.Figure(go.Indicator(domain = {'x': [0, 1], 'y': [0, 1]},value = 4.3,mode = "gauge+number+delta",title = {'text': "Success Metric"},delta = {'reference': 3.9},gauge = {'bar': {'color': "lightgreen"},'axis': {'range': [None, 5]},'steps' : [{'range': [0, 2.5], 'color': "lightgray"},{'range': [2.5, 4], 'color': "

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/853532.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UniApp+Vue3使用Vant-微信小程序组件

第一步:打开创建好的UniappVue3的项目 第二步:下载Vant-Weapp npm i vant/weapp -S --production 第三步:修改目录名称 wxcomponents 必须是wxcomponents 第四步:将下载好的vant中的dist目录剪切到当前wxcomponents目录下 第五…

牛客网金九银十最新版互联网Java高级工程师面试八股文出炉!面面俱到,太全了

前言 作为一个 Java 程序员,你平时总是陷在业务开发里,每天噼里啪啦忙敲着代码,上到系统开发,下到 Bug 修改,你感觉自己无所不能。然而偶尔的一次聚会,你听说和自己一起出道的同学早已经年薪 50 万&#x…

2024年【陕西省安全员C证】考试及陕西省安全员C证最新解析

题库来源:安全生产模拟考试一点通公众号小程序 陕西省安全员C证考试参考答案及陕西省安全员C证考试试题解析是安全生产模拟考试一点通题库老师及陕西省安全员C证操作证已考过的学员汇总,相对有效帮助陕西省安全员C证最新解析学员顺利通过考试。 1、【多…

155. 最小栈 力扣 python 空间换时间 o(1) 腾讯面试题

设计一个支持 push ,pop ,top 操作,并能在常数时间内检索到最小元素的栈。 实现 MinStack 类: MinStack() 初始化堆栈对象。void push(int val) 将元素val推入堆栈。void pop() 删除堆栈顶部的元素。int top() 获取堆栈顶部的元素。int get…

MySQL 日志(二)

本篇将继续介绍MySQL日志的相关内容 目录 一、二进制日志 简介 注意事项 删除二进制日志 查看二进制日志 二进制日志的格式 二、服务器日志维护 一、二进制日志 简介 二进制日志中主要记录了MySQL的更改事件(不包含SELECT和SHOW),例如:表的…

【刷力扣】23. 合并 K 个升序链表(dummy节点技巧 + 分治思维 + 优先队列)

目录 一、合并升序链表问题二、题目:[21. 合并两个有序链表](https://leetcode.cn/problems/merge-two-sorted-lists/description/)1、掌握dummy节点的技巧 三、题目:[23. 合并 K 个升序链表](https://leetcode.cn/problems/merge-k-sorted-lists/descri…

Android 工程副总裁卸任

Android 工程副总裁卸任 Android工程副总裁Dave Burke宣布,他将辞去领导Android工程的职位,将重心转向“AI/生物”项目。不过,他并没有离开Alphabet,目前仍将担任Android系统开发顾问的角色。 Burke参与了Android系统的多个关键…

【TypeScript】类型兼容(协变、逆变和双向协变)

跟着小满zs 学习 ts,原文:学习TypeScript进阶类型兼容_typescript进阶阶段类型兼容 小满-CSDN博客 类型兼容,就是用于确定一个类型是否能赋值给其他的类型。如果A要兼容B 那么A至少具有B相同的属性。 // 主类型 interface A {name: string,a…

边界内聚和耦合

内聚 功能内聚 功能内聚是软件工程中一个重要的概念,它描述了一个模块内部各个元素之间的紧密程度。一个具有高功能内聚的模块意味着其内部的各个组件都共同完成一个具体的、明确的功能,并且这些组件之间的联系不是偶然的,而是因为它们共同服…

快手爬票概述

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 无论是出差还是旅行,都无法离开交通工具的支持。现如今随着科技水平的提高,高铁与动车成为人们喜爱的交通工具。如果想要知道…

【C语言】联合(共用体)

目录 一、什么是联合体 二、联合类型的声明 三、联合变量的创建 四、联合的特点 五、联合体大小的计算 六、联合的应用(判断大小端) 七、联合体的优缺点 7.1 优点 7.2 缺点 一、什么是联合体 联合也是一种特殊的自定义类型。由多个不同类型的数…

LVS三种负载均衡模式:NAT、Tunneling和DR的技术对比

1. LVS-NAT 模式的特性 IP使用:RS(Real Server)应使用私有地址,RS的网关必须指向DIP(Director IP)。网络范围:DIP和RIP必须在同一个网段内。数据包处理:请求和响应报文都需要经过Di…

数据库开发——并发控制(第十一章)

文章目录 前言并发执行例题一、封锁二、封锁协议三、可串行调度四、总结 学习目标:重点为并发控制的基本概念及几个基本协议 前言 数据库管理系统必须提供并发控制机制,保证事务的隔离性和一致性 并发执行例题 一、封锁 排他锁称为写锁,共…

atmega8 上传程序

使用icsp 烧写时先关闭串口程序,与串口uart连接相关的电路勿于电脑连接 接触不良 1.使用icsp 上传 1)可以直接上传程序 如官方示例blink 或是 serial示例 2)可以先烧录bootload 方便下次使用串口上传程序代码 A)使用专门的icsp 上传器上传…

关于二分法的理解(以JS为例)

算法介绍 基本概念 二分查找算法,又称折半查找算法,是一种在有序数组中查找特定元素的高效方法。它的核心思想是将数组分成两半,然后根据目标值与中间元素的比较结果来决定是继续在左半部分还是右半部分进行搜索。 工作原理 初始化&#…

【iOS】如何断点看系统方法在哪一个库

如何断点看系统方法在哪一个库 开源网站如何断点看系统方法在哪一个库1 下符号断点2 符号断点中输入 load ,并且开启断点(Enable)。3 运行程序,触发断点,在堆栈信息中找到load方法,可以看到其在libobjc.A.d…

程序员的wsl2

坑 wsl无法打开 上班时打开wsl2提示 WSL 正在完成升级... Could not write value to key \SOFTWARE\Classes\Directory\shell\WSL. Verify that you have sufficient access to that key, or contact your support personnel. 原因未知,之前并没有更新过&#xff…

【AI+编程】工作日常场景随时可以AI编程,记一个问答SQL快速导出数据日常示例

今天有个场景,我们有个老项目,由于历史原因差不多1年多没使用了,恰巧客户紧急情况要使用。因为当时没有需求,所以V1.0上线后 就没做更新。 需求很简单:我们假定 项目问题表、客户表、问题答案表, 实时查询…

TCP协议报头详解

目录 前言 TCP特点 TCP报头 1.源端口和目的端口 2.序号 3.确认号 4.数据偏移 5.保留 6.控制位 ① 紧急URG(URGent) ② 确认ACK(ACKnowledgment) ③ 推送PSH(PuSH) ④复位RST(ReSeT&…

Hexo 搭建个人博客(ubuntu20.04)

1 安装 Nodejs 和 npm 首先登录NodeSource官网: Nodesource Node.js DEB 按照提示安装最新的 Node.js 及其配套版本的 npm。 (1)以 sudo 用户身份运行下面的命令,下载并执行 NodeSource 安装脚本: sudo curl -fsSL…