【Python】数据可视化之点线图

目录

散点图

气泡图

时序图

关系图


​​​​​​​

散点图

Scatterplot(散点图)是一种用于展示两个变量之间关系的图表类型。在散点图中,每个观测值(或数据点)都被表示为一个点,其中横轴(X轴)代表一个变量的值,而纵轴(Y轴)代表另一个变量的值。这些点的位置(即它们在图表上的x和y坐标)反映了两个变量之间的关系。

散点图非常适合于初步探索两个变量之间是否存在关系,以及这种关系的强度和方向。通过观察点的分布模式,可以识别出正相关、负相关、无相关或非线性关系。在散点图中,远离大多数数据点的观测值(即异常值或极端值)很容易被识别出来。同时,在统计学中,散点图可以用于支持或反驳关于两个变量之间关系的假设。

散点图需要注意一些问题:

  • 当数据点过多时,散点图可能会变得难以解读,因为点可能会重叠在一起。在这种情况下,可以考虑使用其他可视化方法,如密度图或六边形分箱图。
  • 散点图只能显示两个变量之间的关系,如果数据集包含多个变量,可能需要使用其他类型的图表(如多维散点图或平行坐标图)来展示更多信息。
  • 在解读散点图时,要注意数据点的分布是否均匀,以及是否存在潜在的偏差或异常值。
# 设置图形风格为whitegrid
sns.set(style="whitegrid")
# 加载diamonds数据集
diamonds = sns.load_dataset("diamonds")
# 创建一个8x8的图形
f, ax = plt.subplots(figsize=(8, 8))
# 去除图形的左边和底部的边框
sns.despine(f, left=True, bottom=True)
# x轴为depth,y轴为table,颜色为红色,数据为diamonds,坐标轴为ax,标记为圆形,大小为100,边框宽度为0.5,边框颜色为白色
sns.scatterplot(x="depth", y="table",color='r',data=diamonds, ax=ax, marker="o", s=100, linewidth=0.5, edgecolor="w")

也可以使用plt绘制 

# 生成一些随机数据
np.random.seed(0)
x = np.random.rand(100)
y = np.random.rand(100)
# 设置图表大小
plt.figure(figsize=(10, 6))  
# s是点的大小,c是颜色,alpha是透明度,edgecolors是边缘颜色
plt.scatter(x, y, s=50, c='blue', alpha=0.6, edgecolors='w') 
# 添加标题和标签
plt.title('Scatterplot', fontsize=16)
plt.xlabel('X Axis', fontsize=14)
plt.ylabel('Y Axis', fontsize=14)
# 设置坐标轴范围
plt.xlim(0, 1)
plt.ylim(0, 1)
# 添加网格线
plt.grid(True, which='both', linestyle='--', linewidth=0.5)
# 显示图例
plt.legend(['Data'], loc='upper left', fontsize=12)
# 显示图表
plt.show()

气泡图

气泡图(Bubble Chart)是一种多变量的数据可视化图表,它是散点图的一种变体,也可以看作是散点图和百分比区域图的组合。气泡图通过引入第三个变量来展示三个变量之间的关系,使得数据展示更加丰富和全面。

  • 多变量展示:能够同时展示三个或更多维度的数据。
  • 直观比较:通过气泡的位置和大小,可以直观地比较不同类别的数据。
  • 灵活性强:气泡图可以根据需要调整气泡的形状、颜色和透明度等属性,以增强视觉效果。
# 加载名为"planets"的数据集
planets = sns.load_dataset("planets")
# 创建一个颜色映射
cmap = sns.cubehelix_palette(as_cmap=True)
# 绘制散点图,x轴为"distance",y轴为"orbital_period",颜色映射为"year",大小为"mass"
ax = sns.scatterplot(x="distance", y="orbital_period",hue="year", size="mass",palette=cmap, sizes=(10, 200),data=planets)

# 设置绘图风格为白色
sns.set(style="white")
# 加载mpg数据集
mpg = sns.load_dataset("mpg")
# 绘制散点图,x轴为horsepower,y轴为mpg,颜色根据origin分类,大小根据weight分类
sns.relplot(x="horsepower", y="mpg", hue="origin", size="weight",sizes=(40, 400), alpha=.5, palette="plasma",height=6, data=mpg)

时序图

Lineplot是Seaborn库中用于绘制折线图的函数,它能够帮助用户可视化数据集中不同变量之间的关系,特别是展示随时间变化的数据趋势。Lineplot函数的基本用法是传入x轴和y轴的数据,以及包含这些数据的数据集(DataFrame或类似结构)。通过指定xy参数,Lineplot能够绘制出表示这两个变量之间关系的折线图。

Lineplot函数提供了多个参数来调整折线图的外观和行为:

  • x, y:分别指定折线图中x轴和y轴的数据。
  • data:指定包含x和y数据的数据集,通常是pandas的DataFrame。
  • hue:可选参数,用于根据某一列数据对折线进行分组着色,以区分不同的数据系列。
  • style:可选参数,用于指定折线的风格,如线型、破折号样式等。
  • markers:可选参数,设置为True时会在折线图上显示数据点,便于观察具体的数据值。
  • ci:控制置信区间的显示,如果不需要显示置信区间,可以设置为None。

在使用Lineplot时,需要确保传入的数据格式正确,且x轴和y轴的数据长度必须相同。如果数据中包含缺失值(NaN),Lineplot会自动跳过这些值进行绘图。Lineplot的绘图结果会受到Seaborn和matplotlib的样式设置影响,因此可以通过调整这些库的样式设置来改变折线图的外观。

# 加载fmri数据集
fmri = sns.load_dataset("fmri")
# 绘制折线图,x轴为timepoint,y轴为signal,根据region进行颜色区分,根据event进行线条样式区分
sns.lineplot(x="timepoint", y="signal",hue="region", palette="plasma",style="event",data=fmri)

# 创建一个随机数生成器,种子为88
rs = np.random.RandomState(88)
# 生成365个随机数,每个随机数有4个值
values = rs.randn(365, 4).cumsum(axis=0)
# 创建一个日期范围,从2016年1月1日开始,共365天,每天一个日期
dates = pd.date_range("1 1 2016", periods=365, freq="D")
# 创建一个DataFrame,包含生成的随机数和日期
data = pd.DataFrame(values, dates, columns=["A", "B", "C", "D"])
# 对DataFrame进行滚动平均,窗口大小为7
data = data.rolling(7).mean()
# data为数据集,palette为颜色调色板,linewidth为线宽
sns.lineplot(data=data, palette="inferno", linewidth=3)

关系图

relplot是Seaborn库中用于绘制关系图的函数,它是一个高级绘图函数,能够灵活地处理多变量关系,并自动生成具有多个子图的图表。

  • x, y:分别指定图表的x轴和y轴数据。
  • data:包含绘图所需数据的数据集,通常是pandas的DataFrame。
  • hue:用于根据某一列数据对数据进行分组,并在图表中用不同的颜色表示。
  • size:控制数据点的大小或线条的粗细,根据数据集中的某列进行映射。
  • style:控制数据点的样式或线条的样式,如点型、线型等,同样可以根据数据集中的某列进行映射。
  • row, col:用于将数据按照指定的列分割成多个子图,分别绘制在行或列上。
  • palette:指定hue参数分组的颜色映射方案。
  • height:每个子图的高度(单位:英寸)。
  • aspect:子图的宽高比,默认为1。
  • kind:指定绘图的类型,'scatter''line'
# 加载名为"dots"的数据集
dots = sns.load_dataset("dots")
# 绘制关系图,x轴为"time",y轴为"firing_rate",根据"coherence"进行颜色区分,根据"choice"进行大小区分,根据"align"进行列区分
# "size_order"指定了大小顺序,"height"指定了图形的高度,"aspect"指定了图形的纵横比,"facet_kws"指定了子图的关键字参数
# "kind"指定了图形的类型为线图,"legend"指定了图例的位置为全图,"data"指定了数据集为"dots"
sns.relplot(x="time", y="firing_rate",hue="coherence", size="choice", col="align",size_order=["T1", "T2"],palette="viridis",height=5, aspect=.75, facet_kws=dict(sharex=False),kind="line", legend="full", data=dots)

# 加载名为 "tips" 的数据集
tips = sns.load_dataset("tips")
# 绘制关系图,x 轴为 "total_bill",y 轴为 "tip",根据 "smoker" 进行颜色区分,根据 "day" 进行列区分
# "size_order" 指定了大小顺序,"height" 指定了图形的高度,"aspect" 指定了图形的纵横比,"facet_kws" 指定了子图的关键字参数
# "kind" 指定了图形的类型为线图,"legend" 指定了图例的位置为全图,"data" 指定了数据集为 "tips"
sns.relplot(x="total_bill", y="tip",hue="smoker", col="day",size_order=["T1", "T2"], palette="inferno",height=5, aspect=.75, facet_kws=dict(sharex=False),kind="line", legend="full", data=tips)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/55035.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手机USB连接不显示内部设备,设备管理器显示“MTP”感叹号,解决方案

进入小米驱动下载界面,等小米驱动下载完成后,解压此驱动文件压缩包。 5、小米USB驱动安装方法:右击“计算机”,从弹出的右键菜单中选择“管理”项进入。 6、在打开的“计算机管理”界面中,展开“设备管理器”项&…

Linux下驱动开发实例

驱动开发 驱动与硬件的分离 在传统的嵌入式系统开发中,硬件信息往往是直接硬编码在驱动代码中的。这样做的问题是,当硬件发生变化时,比如增加或更换设备,就需要修改驱动程序的代码,这会导致维护成本非常高。因此&…

从自动化到智能化:AI如何推动业务流程自动化

引言:从自动化到智能化的必然趋势 在当今数字化时代,企业为了提升效率、降低成本,纷纷采用自动化技术来简化重复性任务。然而,传统自动化仅限于标准化操作,无法应对复杂的决策和多变的市场环境。随着人工智能&#xff…

通信工程学习:什么是MAI多址干扰

MAI:多址干扰 MAI多址干扰(Multiple Access Interference)是无线通信领域,特别是在码分多址(CDMA)系统中,一个关键的干扰现象。以下是对MAI多址干扰的详细解释: 一、定义 多址干扰是指在CDMA系统中,由于多个用户的信号在时域和频域上是混叠的,从而导…

《程序猿之Redis缓存实战 · 哈希类型》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 CSDN入驻不久,希望大家多多支持,后续会继续提升文章质量,绝不滥竽充数…

基于Python大数据的音乐推荐及数据分析可视化系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码 精品专栏:Java精选实战项目…

简易CPU设计入门:取指令(三),ip_buf与rd_en的非阻塞赋值

在开篇,还是请大家首先准备好本项目所用的源代码。如果已经下载了,那就不用重复下载了。如果还没有下载,那么,请大家点击下方链接,来了解下载本项目的CPU源代码的方法。 下载本项目代码 准备好了项目源代码以后&…

jetlinks物联网平台学习4:http协议设备接入

http协议设备接入 1、创建产品2、配置设备接入方式3、配置网络组件4、上传消息协议5、填写网关信息6、配置http认证信息7、配置物模型8、创建设备9、使用apiPost模拟设备接入9.1、设备上线9.2、设备上报属性9.3、设备事件上报 1、创建产品 创建产品 2、配置设备接入方式 点击…

物联网行业中模组的AT指令详解以及使用

01 概述 AT 命令(AT Commands)最早是由发明拨号调制解调器(MODEM)的贺氏公司(Hayes)为了控制 MODEM 而发明的控制协议。后来随着网络带宽的升级,速度很低的拨号 MODEM 基本退出一般使用市场&am…

[深度学习]卷积神经网络CNN

1 图像基础知识 import numpy as np import matplotlib.pyplot as plt # 图像数据 #imgnp.zeros((200,200,3)) imgnp.full((200,200,3),255) # 可视化 plt.imshow(img) plt.show() # 图像读取 imgplt.imread(img.jpg) plt.imshow(img) plt.show() 2 CNN概述 卷积层convrelu池…

技术速递|加入 .NET 智能组件生态系统

作者:Daniel Roth - 首席产品经理 排版:Alan Wang .NET 智能组件是一组示例嵌入式 UI 组件,使得在应用中轻松添加 AI 启用的功能变得更加简单,例如从剪贴板数据自动填写表单、智能文本补全以及语义搜索等场景。.NET 智能组件演示了…

用友U8 CRM 多个接口存在SQL注入漏洞

本文所涉及的任何技术、信息或工具,仅供学习和参考之用,请勿将文章内的相关技术用于非法目的,如有相关非法行为与文章作者无关。请遵守《中华人民共和国网络安全法》。 中华人民共和国网络安全法 第二十七条 规定 任何个人和组织不得从事非…

uniapp 知识点

自定义导航 在page.json navigationstyle":"custom"navigateTo传参 页面传参只能onLoad(option)里面拿 px和upx的关系 在750设计图中,1px1upx 路由 navigateBack返回上一页 重定向 其实就是把当前页面干掉了 公共组件和页面共同点 computed,watc…

Unity中的功能解释(数学位置相关和事件)

向量计算 Vector3.Slerp(起点坐标,终点坐标,t),可是从起点坐标以一个圆形轨迹到终点坐标,有那么多条轨迹,那怎么办 Vector3.Slerp 进行的是沿球面插值,因此并不是沿着严格的“圆形…

【笔记】自动驾驶预测与决策规划_Part4_时空联合规划

文章目录 0. 前言1. 时空联合规划的基本概念1.1 时空分离方法1.2 时空联合方法 2.基于搜索的时空联合规划 (Hybrid A* )2.1 基于Hybrid A* 的时空联合规划建模2.2 构建三维时空联合地图2.3 基于Hybrid A*的时空节点扩展2.4 Hybrid A* :时空节…

- 串口通信

USART串口通信 目录 USART串口通信 回顾 USART串口通信 1、通信分类与作用 2、串口通信的相关参数(重点) 3、位协议层 -- RS232协议 4、STM32F103 中的串口外设 5、调试串口编程 -- (1)串口初始化:时钟、IO、…

数据结构:队列及其应用

队列(Queue)是一种特殊的线性表,它的主要特点是先进先出(First In First Out,FIFO)。队列只允许在一端(队尾)进行插入操作,而在另一端(队头)进行删…

某客户Oracle RAC无法启动故障快速解决

某日,9:50左右接到好友协助需求,某个客户Oracle RAC无法启动,并发过来一个报错截图,如下: 和客户维护人员对接后,远程登录服务端进行故障分析。 查看hosts信息,首先进行心跳测试,测…

数据库软题3-专门的集合运算

一、投影(筛选列) 题1 题2 二、选择(筛选行) 三、连接 3.自然连接 题1-自然连接的属性列数(几元关系)和元组数 解析: 题2-自然连接的属性列数(几元关系)和元组数 自然连接后的属性个数 A列…

GNSS定位中自适应调整电离层延迟参数过程噪声的方法

文章目录 前言一、非差非组合PPP模型二、电离层功率谱密度计算三、具体实现方法3.1 不平滑3.2 三阶多项式平滑 参考文献 前言 GNSS定位中不少技术手段如PPP和长基线RTK需要将电离层延迟作为参数估计,电离层延迟的变化通常被描述为随机游走过程,而功率谱密…