数据可视化宝典:Matplotlib图形实战

  在数据分析领域,图形化展示数据是非常重要的环节。Python中的matplotlib库是绘制各类图形的强大工具。本文将介绍如何使用matplotlib绘制折线图、直方图、饼图、散点图和柱状图等数据分析中常见的图形,并附上相应的代码示例,可以当初matplotlib函数库来使用,将案列中的数据替换成自己真实的数据即可绘制出符合条件的图像。
  关于matplotlib进行数据可视化的案列,具体参考Matplotlib 3.6.0 文档示例库,里面给出各种图形可视化的案列代码,具体如下所示:
在这里插入图片描述
  下面示点进去带标签的分组条形图页面下官方代码案列;
  此示例显示如何创建分组条形图以及如何使用标签注释条形图。
在这里插入图片描述
  接下来我们将详细介绍matplotlib在进行数据可视化分析过程常用的图像绘制;

一、折线图(Line Plot)

  折线图通常用于展示数据随时间或其他连续变量的变化趋势。

import matplotlib.pyplot as plt
import numpy as np# 创建数据
x = np.linspace(0, 10, 100)
y = np.sin(x)# 绘制折线图
plt.plot(x, y)# 设置图表标题和坐标轴标签
plt.title('Sin Curve')
plt.xlabel('x')
plt.ylabel('y')# 显示图表
plt.show()

在这里插入图片描述

二、直方图(Histogram)

  直方图用于展示数据的分布情况,特别是连续型变量的分布情况。

import matplotlib.pyplot as plt
import numpy as np# 创建数据
data = np.random.randn(1000)# 绘制直方图
plt.hist(data, bins=30, edgecolor='black')# 设置图表标题和坐标轴标签
plt.title('Histogram of Data')
plt.xlabel('Value')
plt.ylabel('Frequency')# 显示图表
plt.show()

在这里插入图片描述

三、饼图(Pie Chart)

  饼图用于展示各类别的比例或占比。

import matplotlib.pyplot as plt# 创建数据
labels = ['Category A', 'Category B', 'Category C']
sizes = [15, 30, 55]# 绘制饼图
plt.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)# 设置图表标题
plt.title('Pie Chart Example')# 显示图表
plt.axis('equal')  # Equal aspect ratio ensures that pie is drawn as a circle.
plt.show()

在这里插入图片描述

四、散点图(Scatter Plot)

  散点图用于展示两个变量之间的关系,通过点的分布来观察是否存在某种趋势或模式。

import matplotlib.pyplot as plt
import numpy as np# 创建数据
x = np.random.rand(50)
y = np.random.rand(50)# 绘制散点图
plt.scatter(x, y)# 设置图表标题和坐标轴标签
plt.title('Scatter Plot Example')
plt.xlabel('X')
plt.ylabel('Y')# 显示图表
plt.show()

在这里插入图片描述

五、柱状图(Bar Chart)

  柱状图用于比较不同类别或不同时间点的数据大小。

import matplotlib.pyplot as plt# 创建数据
categories = ['Category 1', 'Category 2', 'Category 3']
values = [10, 15, 7]# 绘制柱状图
plt.bar(categories, values)# 设置图表标题和坐标轴标签
plt.title('Bar Chart Example')
plt.xlabel('Categories')
plt.ylabel('Values')# 显示图表
plt.show()

在这里插入图片描述

六、箱线图(Box Plot)

  箱线图用于展示一组数据的分布情况,包括最小值、下四分位数、中位数、上四分位数和最大值。

  下面是一个简单的示例,说明如何绘制箱线图,其中特征名称作为X轴的标签:

import matplotlib.pyplot as plt
import numpy as np# 创建一些示例数据
np.random.seed(10)
data = {'Feature 1': np.random.normal(0, 1, 100),'Feature 2': np.random.normal(1, 1.5, 100),'Feature 3': np.random.normal(-1, 0.7, 100),'Feature 4': np.random.normal(2, 2, 100)
}# 提取数据列表和特征名称列表
values = list(data.values())
labels = list(data.keys())# 绘制箱线图
fig, ax = plt.subplots()
ax.boxplot(values, vert=True, patch_artist=True, labels=labels)# 设置图表标题
ax.set_title('Box Plot with Features as X-axis Labels')# 显示网格
ax.grid(True)# 显示图表
plt.show()

在这里插入图片描述

  设置vert=True(这是默认值,表示箱体是垂直的),并启用patch_artist=True以允许我们为箱体设置颜色。最后,我们设置了图表的标题,并显示了网格和图表。

  要绘制水平分布的箱线图(即箱体的长轴沿X轴方向),你需要对matplotlibboxplot函数进行一些调整。特别地,你需要设置vert参数为False,这样箱线图就会水平显示。下面是一个简单的示例,说明如何创建水平箱线图:

import matplotlib.pyplot as plt
import numpy as np# 创建一些示例数据
np.random.seed(10)
data = {'Feature 1': np.random.normal(0, 1, 100),'Feature 2': np.random.normal(1, 1.5, 100),'Feature 3': np.random.normal(-1, 0.7, 100),'Feature 4': np.random.normal(2, 2, 100)
}# 提取数据为列表
values = [data[feature] for feature in data]# 创建箱线图的位置(即X轴上的刻度位置)
positions = np.arange(len(data))# 绘制水平箱线图
fig, ax = plt.subplots()
ax.boxplot(values, vert=False, patch_artist=True, positions=positions, notch=False)# 设置箱线图的颜色
colors = ['b', 'g', 'r', 'c']
for patch, color in zip(ax.artists, colors):patch.set_facecolor(color)# 设置X轴和Y轴的标签
ax.set_xlabel('Value')
ax.set_ylabel('Features')
ax.set_yticklabels(data.keys())  # 设置Y轴刻度标签为特征的名称# 显示网格
ax.grid(True)# 显示图表
plt.show()

在这里插入图片描述

七、箱线图
  面积图(Area Chart)结合了折线图和面积图的特性,可以展示随时间或其他连续变量的数据变化趋势,并且通过堆叠面积来表示多个类别的数据总量及其各自贡献。

  下面是一个简单的示例代码,演示如何使用matplotlib绘制折线面积图:

import matplotlib.pyplot as plt
import numpy as np# 创建数据
x = np.linspace(0, 10, 100)
y1 = np.sin(x)
y2 = np.cos(x)# 绘制折线图和折线面积图
fig, ax = plt.subplots()
ax.plot(x, y1, label='sin(x)', color='blue', linewidth=2)
ax.plot(x, y2, label='cos(x)', color='red', linewidth=2)# 绘制y1的面积图
ax.fill_between(x, y1, where=y1>=0, color='lightblue', interpolate=True)
ax.fill_between(x, y1, where=y1<0, color='blue', interpolate=True)# 绘制y2的面积图,注意要调整y的起始值以避免重叠
ax.fill_between(x, y1+y2, where=(y1+y2)>=0, color='lightpink', interpolate=True)
ax.fill_between(x, y1+y2, where=(y1+y2)<0, color='pink', interpolate=True)# 设置图表标题和坐标轴标签
ax.set_title('Stacked Line Area Chart Example')
ax.set_xlabel('x')
ax.set_ylabel('y')# 添加图例
ax.legend()# 显示网格
ax.grid(True)# 显示图表
plt.show()

在这里插入图片描述

  在上面的代码中,我们首先定义了两个函数y1y2,它们分别代表sin(x)cos(x)的值。然后,我们使用plot函数绘制了这两个函数的折线图。接下来,我们使用fill_between函数来绘制每个函数的面积图。需要注意的是,为了避免面积图之间的重叠,我们在绘制y2的面积图时,将y的起始值调整为y1+y2

  最后,我们设置了图表的标题、坐标轴标签,并添加了图例。调用plt.show()函数来显示最终的折线面积图。

八、热力图

  为了更直观地绘制热力图,通常会使用seaborn库,它是基于matplotlib的一个更高级的统计绘图库。下面是一个使用seaborn绘制热力图的示例代码:

  首先,确保你已经安装了seaborn库。如果没有安装,可以使用pip进行安装:

pip install seaborn

  然后,你可以使用以下代码来绘制热力图:

import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np# 创建一个随机数据矩阵
data = np.random.rand(10, 12)# 创建一个热力图
heatmap = sns.heatmap(data, cmap='coolwarm', annot=True, fmt=".2f")# 设置X轴和Y轴的标签
heatmap.set_xticklabels(range(1, 13))  # 设置X轴刻度标签
heatmap.set_yticklabels(range(1, 11))  # 设置Y轴刻度标签# 设置图表的标题
plt.title('Heatmap Example')# 显示图表
plt.show()

在这里插入图片描述

  在这个例子中,我们首先导入了所需的库,然后创建了一个10x12的随机数据矩阵。接着,我们使用sns.heatmap函数来绘制热力图,其中data参数是我们要展示的数据,cmap参数定义了颜色映射(这里使用了’coolwarm’),annot=True表示在每个格子中显示数据值,fmt=".2f"定义了数值的格式。最后,我们设置了X轴和Y轴的刻度标签,并为图表添加了标题。

  如果你坚持使用matplotlib而不使用seaborn,你也可以通过绘制一系列带颜色的矩形来手动创建热力图,但这将比使用seaborn更加复杂。因此,推荐使用seaborn来绘制热力图,因为它提供了更简洁、更高级的接口。

  后面将继续介绍seaborn绘图库;因为seaborn并是一个绘图库,它与DataFrame对象有很好的集成。

九、折线图多功能的封装图
  下面封装的ineChartPlotter类,是为绘制不同种类的折线图,有draw_line_chart、draw_line_ndims_one_dim和draw_nline_chart方法,具体的作用参看图片即可了解;

import matplotlib.pyplot as plt  
import pandas as pd  
import numpy as npfrom pylab import mpl
mpl.rcParams['font.sans-serif'] = ['Microsoft YaHei'] # 指定默认字体:解决plot不能显示中文问题
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题class LineChartPlotter:  def __init__(self):  self.fig = None  self.ax = None  def draw_line_chart(self, x, y, marker='o', label='工业', xlabel='Time', ylabel='Flow (累计进水流量)', title='南部污水厂累计进水流量(JSLL1/LJLL)'):  """在图上绘制一条折线图"""  self.fig, self.ax = plt.subplots()  self.ax.plot(x, y, marker=marker, label=label)  self.ax.set_xlabel(xlabel)  self.ax.set_ylabel(ylabel)  self.ax.legend()  self.ax.set_title(title)  self.ax.grid(True)  plt.show()  def draw_line_ndims_one_dim(self, data, xlabel='time', n=None, title='趋势对比图'):  """绘制一个n*1行的一个折线图,共用一个坐标轴"""  if n is None:  n = data.shape[1] - 1  self.fig, axs = plt.subplots(n, 1, figsize=(10, 15), sharex=True)  colors = plt.cm.viridis(np.linspace(0, 1, n))  for i, col in enumerate(data.columns[1:]):  if col != xlabel:  axs[i].plot(data[xlabel], data[col], color=colors[i], label=col)  axs[i].set_ylabel(f'({col})')  axs[i].legend()  axs[-1].set_xlabel('Time')  plt.tight_layout()  self.fig.suptitle(title)  plt.show()  def draw_nline_chart(self, data, xlabel='time', y_label='Flow', title='趋势对比图'):  """这一个图上绘制多个曲线的折线图"""  self.fig, self.ax = plt.subplots(figsize=(10, 5))  for column in data.columns[1:]:  self.ax.plot(data[xlabel], data[column], label=column)  self.ax.set_xlabel(xlabel)  self.ax.set_ylabel(y_label)  self.ax.set_title(title)  self.ax.legend()  max_flow = data[data.columns[1:]].max().max()  self.ax.set_ylim(0, max_flow)  self.ax.grid(True)  plt.show()  # 使用示例  
if __name__ == "__main__":  # 假设我们有一个DataFrame,包含时间和多个流量序列  data = pd.DataFrame({  'time': pd.date_range(start='2023-01-01', periods=100, freq='D'),  'flow1': np.random.rand(100),  'flow2': np.random.rand(100),  'flow3': np.random.rand(100)  })  # 创建绘图对象  plotter = LineChartPlotter()  # 绘制单个折线图  # plotter.draw_line_chart(data['time'], data['flow1'], label='Flow 1')  # # 绘制多个子图的折线图  # plotter.draw_line_ndims_one_dim(data)  # # 绘制单个图上的多个折线图  # plotter.draw_nline_chart(data)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  总之matplotlib是Python中一个功能强大的数据可视化库,它提供了丰富的绘图接口,可以帮助用户快速创建各种高质量的图形,如折线图、直方图、饼图、散点图、柱状图等。以下是使用matplotlib进行数据可视化的几个关键总结和优势:

  • 多样化的图形支持:
      matplotlib支持绘制各种常见的统计图形,包括折线图、柱状图、散点图等,也支持更复杂的图形,如热力图、等高线图等。这使得matplotlib能够应对各种数据分析和可视化的需求。

  • 高度可定制性:
      matplotlib提供了大量的参数和选项,用户可以根据需要自定义图形的各个方面,包括颜色、线条样式、字体、图例等。这使得用户能够根据自己的需求和审美创建出独一无二的图形。

  • 易于集成:
      matplotlib可以与Python中的其他库(如NumPy、Pandas等)无缝集成,使得数据预处理、数据分析和数据可视化可以在同一个环境中进行。这大大提高了数据分析和可视化的效率。

  • 交互式图形:
      matplotlib支持创建交互式图形,用户可以通过鼠标和键盘与图形进行交互,如缩放、平移、选择数据点等。这使得用户能够更深入地探索和分析数据。

  • 丰富的文档和社区支持:
      matplotlib拥有完善的文档和活跃的社区支持,用户可以通过官方文档、教程、示例代码以及社区论坛等途径获取帮助和解答问题。这使得学习和使用matplotlib变得更加容易。

  • 高质量的输出:
      matplotlib可以生成高质量的图形输出,支持多种文件格式(如PNG、PDF、SVG等),可以满足不同场景下的需求。同时,matplotlib还支持在图形中嵌入LaTeX数学公式,使得图形更具专业性和可读性。

  • 跨平台兼容性:
      matplotlib具有良好的跨平台兼容性,可以在Windows、Linux和Mac OS等操作系统上运行。这使得用户可以在不同的平台上使用matplotlib进行数据可视化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/5721.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

模型智能体开发之metagpt-单智能体实践

需求分析 根据诉求完成函数代码的编写&#xff0c;并实现测试case&#xff0c;输出代码 代码实现 定义写代码的action action是动作的逻辑抽象&#xff0c;通过将预设的prompt传入llm&#xff0c;来获取输出&#xff0c;并对输出进行格式化 具体的实现如下 定义prompt模版 …

神经网络与深度学习--网络优化与正则化

文章目录 前言一、网络优化1.1网络结构多样性1.2高维变量的非凸优化1.鞍点2.平坦最小值3.局部最小解的等价性 1.3.改善方法 二、优化算法2.1小批量梯度下降法&#xff08;Min-Batch&#xff09;2.2批量大小选择2.3学习率调整1.学习率衰减&#xff08;学习率退火&#xff09;分段…

Android数据恢复软件快速比较:Android数据恢复的7最佳工具

您在 Android 设备上保留哪些类型的数据&#xff1f;如果您和大多数人一样&#xff0c;那么您可能已经列出了文档、照片、视频和音频文件。如果您使用智能手机或平板电脑的时间足够长&#xff0c;我们愿意打赌您拥有Android数据丢失的第一手经验。 幸运的是&#xff0c;我们也…

打破失联困境:门店如何利用AI智能名片B2B2C商城小程序重构与消费者的紧密连接?

在如今这个消费者行为日益碎片化的时代&#xff0c;门店经营者们时常感叹&#xff1a;消费者进店如同一场不期而遇的缘分&#xff0c;然而一旦离开门店&#xff0c;就仿佛消失在茫茫人海中&#xff0c;难以再觅其踪迹。这种“进店靠缘分&#xff0c;离店就失联”的困境&#xf…

Cisco IOS XE Web UI 权限提升漏洞复现(CVE-2023-20198)

0x01 产品简介 Web UI 是一种基于GUI的嵌入式系统管理工具,能够提供系统配置、简化系统部署和可管理性以及增强用户体验。它带有默认映像,因此无需在系统上启用任何内容或安装任何许可证。Web UI 可用于构建配置以及监控系统和排除系统故障,而无需CLI专业知识。 0x02 漏洞…

Codeforces Round 941 (Div. 2) D. Missing Subsequence Sum

题目 思路&#xff1a; #include <bits/stdc.h> using namespace std; #define int long long #define pb push_back #define fi first #define se second #define lson p << 1 #define rson p << 1 | 1 const int maxn 1e6 5, inf 1e18, maxm 4e4 5; c…

翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习三

合集 ChatGPT 通过图形化的方式来理解 Transformer 架构 翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习一翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习二翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深…

java-spring-mvc(服务端接收客户端传参)

目录 &#x1f3af; 服务端接收参数 ✨HttpServletRequest接收 ✨ 声明参数接收 ✨声明pojo类来接收 &#x1f52a;小试牛刀 &#x1f3af; 服务端接收参数 ✨HttpServletRequest接收 HttpServletRequest是Java Servlet规范中定义的一个接口&#xff0c;它提供了与HTTP请求…

解决Redis的键值前出现类似\xAC\xED\x00\x05t\x00*这样的字符序列

文章目录 1.问题2.解决方法3.StringRedisTemplate和RedisTemplate的区别 1.问题 在使用RedisTemplate对Redis进行操作时,发现Reids键值对前有\xAC\xED\x00\x05t\x00*这样的字符序列 如图所示: 虽说不影响使用,但是听影响观感的 2.解决方法 查找了很多方法,可以指定RedisTem…

用户中心(下)

文章目录 计划登录逻辑接口简单说明cookie和session写代码流程后端逻辑层控制层测试用户管理接口 前端简化代码对接后端代理 计划 开发完成后端登录功能 &#xff08;单机登录 > 后续改造为分布式 / 第三方登录&#xff09;✔开发后端用户的管理接口 &#xff08;用户的查询…

基于EO平衡优化器算法的目标函数最优值求解matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述 基于EO平衡优化器算法的目标函数最优值求解matlab仿真。提供九个测试函数&#xff0c;分别对九个测试函数仿真输出最优解以及对应的优化收敛曲线。 2.测试软件版…

树莓派点亮LED灯

简介 使用GPIO Zero library 的 Python库实现点亮LED灯。接线 树莓派引脚参考图如下&#xff1a; LED正极 接GPIO17 LED负极 接GND 权限 将你的用户加到gpio组中&#xff0c; 否则无法控制GPIO sudo usermod -a -G gpio 代码 from gpiozero import LED from time impor…

ES全文检索支持拼音和繁简检索

ES全文检索支持拼音和繁简检索 1. 实现目标2. 引入pinyin插件2.1 编译 elasticsearch-analysis-pinyin 插件2.2 安装拼音插件 3. 引入ik分词器插件3.1 已有作者编译后的包文件3.2 只有源代码的版本3.3 安装ik分词插件 4. 建立es索引5.测试检索6. 繁简转换 1. 实现目标 ES检索时…

Springboot+Vue+小程序+基于微信小程序护农远程看护系统

开发平台为idea&#xff0c;maven管理工具&#xff0c;Mybatis操作数据库&#xff0c;根据市场数字化需要为农户打造小程序可远程查看农场的种植情况。项目是调试&#xff0c;讲解服务均可有偿获取&#xff0c;需要可在最下方QQ二维码处联系我。 SpringbootVue小程序&#xff…

【UE5】数字人基础

这里主要记录一下自己在实现数字人得过程中涉及导XSens惯性动捕&#xff0c;视频动捕&#xff0c;LiveLinkFace表捕&#xff0c;GRoom物理头发等。 一、导入骨骼网格体 骨骼网格体即模型要在模型雕刻阶段就要雕刻好表捕所需的表情体(blendshape)&#xff0c;后面表捕的效果直…

API安全

一&#xff0c;什么是API API指的是应用程序编程接口&#xff08;Application Programming Interface&#xff09;&#xff0c;是一组定义了软件组件如何相互交互的规范。通过API&#xff0c;不同的软件可以相互通信和交换数据&#xff0c;实现不同软件之间的集成和互操作。 …

代码随想录算法训练营DAY45|C++动态规划Part7|70.爬楼梯(进阶版)、322. 零钱兑换、279.完全平方数

文章目录 70.爬楼梯&#xff08;进阶版&#xff09;322. 零钱兑换思路CPP代码 279.完全平方数思路CPP代码 70.爬楼梯&#xff08;进阶版&#xff09; 卡码网&#xff1a;57. 爬楼梯 文章讲解&#xff1a;70.爬楼梯(进阶版) 322. 零钱兑换 力扣题目链接 文章讲解&#xff1a;322…

llama_index微调BGE模型

微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。 本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。 一、环境准备 Linux环境,GPU L20 48G,Python3.8.10。 pip该库即可。 二、数据准备 该框架实现了读取各种类型的文件,给…

LNMP部署及应用(Linux+Nginx+MySQL+PHP)

LNMP 我们为什么采用LNMP这种架构? 采用Linux、PHP、MySQL的优点我们不必多说。 Nginx是一个小巧而高效的Linux下的Web服务器软件&#xff0c;是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的&#xff0c;已经在一些俄罗斯的大型网站上运行多年&#xff0c;目…

数据分析及AI技术在旅游行业的应用

引言 旅游行业是一个充满潜力和机遇的领域&#xff0c;而数据分析和人工智能&#xff08;AI&#xff09;技术的迅猛发展为这个行业带来了前所未有的机遇和挑战。本文将探讨数据分析及AI技术在旅游行业中的具体应用及其带来的影响。 数据分析在旅游行业的4种应用 在旅游行业…