科研绘图(六)散点图矩阵

散点图矩阵是一种显示多个变量之间关系的数据可视化工具,特别是当数据集包含三个或多个变量时,这种图表非常有用。这种图通常在探索性数据分析中使用,以便快速理解数据集中变量之间的关系。在散点图矩阵中,每行和每列都代表数据集中的一个变量,而矩阵中的每个小图(除了对角线)都是两个变量之间的散点图。

对角线图形:通常是每个变量的单变量分布。在您上传的图像中,这些是密度图,也可以是直方图或箱线图。它们提供了变量自身分布的视觉概览。

非对角线图形:这些是散点图,显示了数据集中每对变量间的关系。每个点代表数据集中的一个观测值。在您的图中,不同颜色的点代表

关键特征

1、多变量关系展示:

对角线上方和下方的图是散点图,显示两个变量之间的关系。散点的分布可以揭示变量之间是否存在相关性,比如线性关系、非线性关系或没有明显关系。

2、分布可视化:

对角线上的图通常是直方图或密度图,显示单个变量的分布。这有助于了解数据的分布形状、集中趋势和离散程度。

3、数据分组:

不同的颜色或形状可以代表数据中的分类变量。

用途:

关系识别:快速识别多个变量间的潜在关系,比如线性、非线性或没有关系。

异常值检测:观察数据点集群之外的点来识别异常值。

分布检查:在对角线的图表帮助理解各个变量的分布特征。

群组比较:使用颜色或形状区分不同的群组,可以帮助比较不同群组的特征。

下面我们分别使用matlab以及python实现该种绘图。为了结果的准确性,我们使用国赛2017年C题的数据集进行绘制。

 

首先,利用python绘制这种散点图矩阵。如下所示 

 

import seaborn as sns
import matplotlib.pyplot as plt# 创建数据框
data = {'浓度(ppm)': [0, 100, 50, 25, 12.5, 0, 100, 50, 25, 12.5],'B': [68, 37, 46, 62, 66, 65, 35, 46, 60, 64],'G': [110, 66, 87, 99, 102, 110, 64, 87, 99, 101],'R': [121, 110, 117, 120, 118, 120, 109, 118, 120, 118],'H': [23, 12, 16, 19, 20, 24, 11, 16, 19, 20],'S': [111, 169, 155, 122, 112, 115, 172, 153, 126, 115]
}df = pd.DataFrame(data)# 使用Seaborn绘制散点矩阵图
sns.set(style="ticks")
sns.pairplot(df, diag_kind="kde", markers="o")# 显示图形
plt.show()

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt# 创建数据框
data = {'浓度(ppm)': [0, 100, 50, 25, 12.5, 0, 100, 50, 25, 12.5],'B': [68, 37, 46, 62, 66, 65, 35, 46, 60, 64],'G': [110, 66, 87, 99, 102, 110, 64, 87, 99, 101],'R': [121, 110, 117, 120, 118, 120, 109, 118, 120, 118],'H': [23, 12, 16, 19, 20, 24, 11, 16, 19, 20],'S': [111, 169, 155, 122, 112, 115, 172, 153, 126, 115]
}
df = pd.DataFrame(data)# 定义数据列数量
cols = df.columns
n = len(cols)# 扩展颜色列表以匹配数据列的数量
extended_colors = sns.color_palette("husl", n)# 设置更大的图表尺寸和字体大小
plt.figure(figsize=(20, 20))
plt.rcParams.update({'font.size': 10})for i in range(n):for j in range(n):ax = plt.subplot(n, n, i * n + j + 1)if i == j:sns.kdeplot(df[cols[i]], color=extended_colors[i], ax=ax)else:sns.scatterplot(x=cols[j], y=cols[i], data=df, color=extended_colors[j], ax=ax)# 设置坐标轴标签plt.xlabel(cols[j])plt.ylabel(cols[i])# 增加网格线plt.grid(True)# 增加整体标题和调整布局
plt.suptitle("散点图矩阵 - 进一步美化版", fontsize=24)
plt.subplots_adjust(top=0.95, hspace=0.4, wspace=0.4)# 显示图形
plt.show()

为了进一步美化可视化,我们在每一张图中,都绘制了线性回归的拟合图如下所示。

 

下面是matlab绘图代码 

% 创建数据矩阵
data = [
0 68 110 121 23 111
100 37 66 110 12 169
50 46 87 117 16 155
25 62 99 120 19 122
12.5 66 102 118 20 112
0 65 110 120 24 115
100 35 64 109 11 172
50 46 87 118 16 153
25 60 99 120 19 126
12.5 64 101 118 20 115
];% 创建变量名
varNames = {'浓度 (ppm)', 'B', 'G', 'R', 'H', 'S'};% 创建数据表格
dataTable = array2table(data, 'VariableNames', varNames);% 绘制散点矩阵图
figure;
gplotmatrix(dataTable{:,:}, [], [], [], [], [], false);% 添加标签和标题
xlabel('X轴标签');
ylabel('Y轴标签');
title('散点矩阵图');% 调整坐标轴范围
xlim([min(data(:)) max(data(:))]);
ylim([min(data(:)) max(data(:))]);
% 自定义图例
legend({'类别1', '类别2', '类别3'});% 调整图的尺寸
set(gcf, 'Position', [100, 100, 800, 600]); % 设置图的位置和大小

 

% 创建数据矩阵
data = [
0 68 110 121 23 111
100 37 66 110 12 169
50 46 87 117 16 155
25 62 99 120 19 122
12.5 66 102 118 20 112
0 65 110 120 24 115
100 35 64 109 11 172
50 46 87 118 16 153
25 60 99 120 19 126
12.5 64 101 118 20 115
];% 创建变量名
varNames = {'浓度 (ppm)', 'B', 'G', 'R', 'H', 'S'};% 创建数据矩阵和变量名
% ... [数据和变量名的代码] ...% 创建数据表格
dataTable = array2table(data, 'VariableNames', varNames);% 绘制散点矩阵图
figure;
colors = lines(size(data, 2)); % 使用 lines 颜色图
markerShapes = {'+', 'o', '*', '.', 'x', 's', 'd', '^', 'v', '>'}; % 标记形状
[h, ax] = gplotmatrix(dataTable{:,:}, [], [], colors, markerShapes, 12, 'on', 'hist', varNames, varNames);% 美化轴标签和标题
set(ax, 'FontSize', 12, 'FontWeight', 'Bold');
title('散点矩阵图', 'FontSize', 16, 'FontWeight', 'Bold');
xlabel('X轴标签', 'FontSize', 14);
ylabel('Y轴标签', 'FontSize', 14);% 添加网格线
set(ax, 'XGrid', 'on', 'YGrid', 'on');% 调整子图间的间距
set(ax, 'XTickLabelRotation', 45, 'YTickLabelRotation', 45);% 改进颜色映射
colormap('jet');% 添加颜色说明标签
for i = 1:length(varNames)
annotation('textbox', [.85, 1 - 0.05*i, .1, .05], 'String', varNames{i}, 'Color', colors(i,:), 'EdgeColor', 'none');
end% 保存图像
saveas(gcf, '散点矩阵图_改进版.png');

 最后,我们尝试在每一个图中加入线性回归的拟合图,如下所示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/625029.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot的启动器——spring-boot-starter介绍和常见启动器说明

文章目录 SpringBoot的启动器——spring-boot-starter介绍和常见启动器说明1、Starter是什么2、Starters命名规范3、Spring Boot提供的一些启动器(starter) SpringBoot的启动器——spring-boot-starter介绍和常见启动器说明 1、Starter是什么 Spring Boot通过将我…

深入探究Python Collections模块:高效数据结构解决方案

前言 这几天刷leetcode题时,看到题解中有这样一行代码collections.defaultdict(list),不明白是啥意思,平时开发的脚本中未遇到,借着这个机会,学习一下collections模块的用法。 collections 这个模块实现了一些专门化…

闪存的基础知识1-Vt的定义

系列文章目录 本次系列文章主要分享与存储相关的知识 文章目录 目录 系列文章目录 前言 一、mos管 阈值电压是什么? 二、详细分析 1.通俗理解 2.读入数据 总结 前言 阈值电压(Vt) 阈值电压(Vt或Vth)的概念是从MOS管来的。 一、mos管 阈值电压是什么? …

结构化流(Structured Streaming)

结构化流介绍 有界和无界数据 有界数据: 指的数据有固定的开始和固定的结束,数据大小是固定。我们称之为有界数据。对于有界数据,一般采用批处理方案(离线计算)特点:1-数据大小是固定2-程序处理有界数据&#xff0c…

嵌入式学习-网络编程-Day2

思维导图 tcp通信流程 udp通信流程 作业1 写一个基于TCP协议的客户端来控制RobArm机械臂 代码 #include <myhead.h> #define SER_PORT 8888 #define SER_IP "192.168.122.71" #define CLI_PORT 6666 #define CLI_IP "192.168.122.36"int main(int…

分布式搜索引擎ElasticSearch——搜索功能

分布式搜索引擎ElasticSearch——搜索功能 文章目录 分布式搜索引擎ElasticSearch——搜索功能DSL查询文档DSL查询分类全文检索查询精确查询地理查询复合查询Function Score QueryBoolean Query 搜索结果处理排序![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/37d…

Qt 使用vs2019制作Qt静态库( *.lib )并使用

一 .创建静态库 1.创建Qt Class Library(Qt静态类库)项目 2.设置项目名以及项目路径(注意:不能有中文字符) 点击next 3.选则需要的模式以及Qt 模块 然后点击next,Finish完成创建 4. 然后手动添加Qt Widget Form File (.ui)并对设计ui 5. tpendialog.h #pragma once #includ…

书生.浦语大模型实战一

从专用模型到通用大模型 数据 书生.万卷1.0 文本图像-文本视频数据 OpenDataLab开放平台 图像&#xff1a;ImageNettokens语料&#xff1a;WikiQA音频视频&#xff1a;MovieNet3D模型 预训练 微调 增量续训 使用场景&#xff1a;让基座模型学习到一些新知识&#xff0…

Ubuntu 20.04 Intel RealSense D435i 相机标定教程

下载编译code_utils mkdir -p ~/imu_catkin_ws/src cd ~/imu_catkin_ws/src catkin_init_workspace source ~/imu_catkin_ws/devel/setup.bash git clone https://github.com/gaowenliang/code_utils.git cd .. catkin_make报错&#xff1a;sumpixel_test.cpp:2:10: fatal err…

vivado 使用IP Integrator源

使用IP Integrator源 在Vivado Design Suite中&#xff0c;您可以在RTL中添加和管理IP子系统块设计&#xff08;.bd&#xff09;项目或设计。使用Vivado IP集成程序&#xff0c;您可以创建IP子系统块设计。IP集成程序使您能够通过实例化和将Vivado IP目录中的多个IP核互连。可…

改进YOLOv8:添加CBAM注意力机制(涨点明显)

1、计算机视觉中的注意力机制 计算机视觉中的注意力机制是一种聚焦于局部信息的机制&#xff0c;其基本思想是让系统学会忽略无关信息而关注重点信息。这种机制在图像识别、物体检测和人脸识别等任务中都发挥了重要作用。 注意力机制的实现方法有多种&#xff0c;其中包括空间…

亲手打造一个本地LLM语音助手来管理智能家居

经历过 Siri 和 Google 助手之后&#xff0c;我发现尽管它们能够控制各种设备&#xff0c;但却无法进行个性化定制&#xff0c;并且不可避免地依赖于云服务。出于对新知识的渴望以及想在生活中使用一些酷炫的东西&#xff0c;我下定决心&#xff0c;要追求更高的目标。我的要求…

【RTOS】快速体验FreeRTOS所有常用API(2)任务管理

目录 二、任务管理2.1 任务创建&#xff08;三种方式&#xff09;1&#xff09;动态内存分配方式创建任务2&#xff09;静态内存分配方式创建任务3&#xff09;带有任务参数方式创建任务 2.2 任务删除2.3 两种delay 二、任务管理 该部分在上份代码基础上修改得来&#xff0c;代…

​HDD回暖于2024,与SSD决战于2028--part2

东芝和西部数据在2023年的硬盘产品中都没有采用类似希捷的HAMR技术产品&#xff0c;而是采用了其他的技术方案用于提升存储容量。 东芝采用了MAMR技术&#xff0c;通过微波磁通控制现象来提高高密度区域的写入信号质量。根据厂商的测试数据发现&#xff0c;MAMR的磁头可靠性比H…

Flink-容错机制

Flink中的容错机制 流式数据连续不断地到来&#xff0c;无休无止&#xff1b;所以流处理程序也是持续运行的&#xff0c;并没有一个明确的结束退出时间。机器运行程序&#xff0c;996 起来当然比人要容易得多&#xff0c;不过希望“永远运行”也是不切实际的。因为各种硬件软件…

HCIP ISIS实验

拓扑图&IP划分如下图&#xff1a; 第一步&#xff0c;配置IP地址&环回地址 以R1为例&#xff0c;R2~R8同理 interface GigabitEthernet 0/0/0 ip address 18.1.1.1 24 interface GigabitEthernet 0/0/1 ip address 12.1.1.1 24 interface LoopBack 0 ip address 1.1.…

第07章_面向对象编程(进阶)拓展练习(关键字:this,继承性和方法重写,关键字:super,多态性,Object类)

文章目录 第07章_面向对象编程&#xff08;进阶&#xff09;拓展练习01-关键字&#xff1a;this1、Circle类2、MyDate类3、Card类 02-继承性和方法重写4、Person、Student、Teacher类5、DepositCard、CreditCard类6、Employee、Programmer、Designer、Architect类7、判断输出结…

统计学-R语言-4.6

文章目录 前言列联表条形图及其变种---单式条形图条形图及其变种---帕累托图条形图及其变种---复式条形图条形图及其变种---脊形图条形图及其变种---马赛克图饼图及其变种---饼图饼图及其变种---扇形图直方图茎叶图箱线图小提琴图气泡图总结 前言 本篇文章是对数据可视化的补充…

Centos7.9忘记Root密码找回

Centos7.9忘记Root密码找回 1. 背景2. 目的3. 具体操作3.1 重启系统3.2 增加代码3.3 单用户模式3.4 单用户模式3.5 修改密码3.6 创建文件3.7 重启验证 1. 背景 由于物理主机上安装了多个虚拟机&#xff0c;部分虚拟机忘记了root密码&#xff0c;前段时间刚好要用这个虚拟机&…

智慧康养项目:智能技术与产品提升老年人生活品质

智慧康养项目需要集成的一些独特的技术和产品&#xff0c;其中包括&#xff1a; 智能健康监测设备&#xff1a;我们开发了一款能够实时监测老年人身体状况的智能健康监测设备&#xff0c;包括血压、血糖、心率等指标。该设备通过数据分析处理&#xff0c;能够提供个性化的健康…