R语言数据分析案例39-合肥市AQI聚类和多元线性回归

一、研究背景

随着全球工业化和城市化的迅速发展,空气污染问题日益凸显,已成为影响人类健康和环境质量的重大挑战。空气污染不仅会引发呼吸系统、心血管系统等多种疾病,还会对生态系统造成不可逆转的损害。因此,空气质量的监测和治理成为各国政府和学术界关注的重点。

二、研究意义

研究合肥市空气质量指数(AQI)及其影响因素,不仅有助于理解空气污染的主要来源和变化趋势,还可以为政府制定有效的污染控制政策提供科学

依据。通过构建预测模型和进行实证分析,可以更准确地预估未来空气质量状况,从而采取预防性措施,减少污染物排放,提升城市居民的生活质量和健康水平。。。。。

三、实证分析

首先读取数据集展示数据前五行 

数据和代码

报告代码数据

aqi_data <- read.csv("合肥四月份AQI(1).csv")
head(aqi_data ,5)
# 检查数据结构
str(aqi_data)

上面展示了2024年4月1日合肥市在不同时间段的空气质量指数(AQI)及其相关污染物浓度数据,包括PM2.5、PM10、SO2、CO、NO2、O3,以及气温和湿度。

随后检查数据结构

发现包括字符串和数值型数据

接下来检查缺失值,并预处理

 

结果不存在缺失值,继续进行分析

接下来对数据进行描述性统计

图展示了各污染物和气象因素的描述性统计分析结果,包括AQI、PM2.5、PM10、SO2、CO、NO2、O3的最小值、最大值、中位数、均值及四分位数等统计信息 

接下来可视化数据集

# 绘制箱型图
ggplot(aqi_data, aes(x = city, y = AQI)) + geom_boxplot() + labs(title = "城市空气质量指数(AQI)箱型图", x = "城市", y = "AQI") + theme_minimal() + theme(plot.title = element_text(hjust = 0.5))

 

该图展示了合肥市空气质量指数(AQI)的箱型图,直观地显示了AQI值的分布情况。箱型图中间的线表示中位数,图中显示AQI的中位数大约在60左右。。。

ggplot(aqi_data, aes(x = datetime, y = AQI)) + geom_line(color = "blue") + labs(title = "合肥四月份空气质量指数(AQI)变化", x = "时间", y = "AQI") + theme_minimal() + theme(plot.title = element_text(hjust = 0.5))

 

该图展示了合肥市四月份空气质量指数(AQI)随时间的变化趋势。这是一张时间序列折线图,横轴表示时间,纵轴表示AQI值。图中显示,整个四月份AQI值波动明显,有多个高峰和低谷。 

相关系数热力图

ggplot(melted_cor_matrix, aes(x = Var1, y = Var2, fill = value)) +geom_tile(color = "white") +scale_fill_gradient2(low = "blue", high = "red", mid = "white", midpoint = 0, limit = c(-1, 1), space = "Lab", name = "相关系数") +labs(title = "空气质量相关系数热力图", x = "变量", y = "变量") +theme_minimal() +theme(plot.title = element_text(hjust = 0.5))

 热力图中,深红色表示高度正相关,深蓝色表示高度负相关,而浅色表示低相关或无关。图中显示,AQI与PM2.5和PM10的相关性最高,相关系数接近1,这表明颗粒物是影响空气质量的重要因素。。。

使用K-means聚类分析空气质量数据

 

图展示了合肥市四月份空气质量的K-means聚类分析结果,通过不同颜色的线条表示不同聚类(cluster)的AQI变化趋势。图中显示,AQI数据被分为六个聚类,每个聚类代表了不同时间段内相似的AQI模式。可以看到。。。

构建线性回归模型

# 构建线性回归模型
lm_model <- lm(AQI ~ PM25 + PM10 + SO2 + CO + NO2 + O3, data = aqi_data)
# 显著性检验
summary(lm_model)

 

 模型公式为AQI ~ PM2.5 + PM10 + SO2 + CO + NO2 + O3。

模型的R平方值为0.948,说明该模型可以解释94.8%的AQI变化。

结果表明,Durbin-Watson统计量为0.56543,p值小于2.2e-16,表明残差存在显著的正自相关性

残差图

# 绘制模型诊断图
par(mfrow=c(2,2))
plot(lm_model)

 

。。。总体来看,图中显示了一些异常值和高杠杆值点

# 绘制实际值与预测值对比图
ggplot(aqi_data, aes(x = datetime)) + geom_line(aes(y = AQI, color = "实际值")) + geom_line(aes(y = predicted_AQI, color = "预测值")) + labs(title = "合肥四月份空气质量实际值与预测值对比", x = "时间", y = "AQI") + scale_color_manual(values = c("实际值" = "blue", "预测值" = "red")) + theme_minimal()+theme(plot.title = element_text(hjust = 0.5))

该图展示了合肥市四月份空气质量实际值与预测值的对比。图中蓝色线表示实际值,红色线表示预测值。可以看到,预测值与实际值总体趋势一致,特别是在4月1日和4月22日的高峰处。。。。 

四、结论

本研究通过对2024年4月份合肥市空气质量指数(AQI)及相关污染物数据的分析,发现AQI与PM2.5和PM10之间存在显著的正相关关系,表明颗粒物是影响空气质量的主要因素。。。。本研究为合肥市空气质量的监测和治理提供了重要参考,建议进一步加强对颗粒物和其他污染物的控制,以改善空气质量。

创作不易,希望大家多点赞关注评论!!!(类似代码或报告定制可以私信)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/38606.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL高阶:事务和并发

事务和并发 1. 事务创建事务 2. 并发和锁定并发问题 3. 事务隔离等级3.1 读取未提交隔离级别3.2 读取已提交隔离级别3.3 重复读取隔离级别3.4 序列化隔离级别 4. 死锁 1. 事务 事务&#xff08;trasaction&#xff09;是完成一个完整事件的一系列SQL语句。这一组SQL语句是一条…

经典小游戏(一)C实现——三子棋

switch(input){case 1:printf("三子棋\n");//这里先测试是否会执行成功break;case 0:printf("退出游戏\n");break;default :printf("选择错误&#xff0c;请重新选择!\n");break;}}while(input);//直到输入的结果为假&#xff0c;循环才会结束} …

go Channel原理 (二)

Channel 设计原理 不要通过共享内存的方式进行通信&#xff0c;而是应该通过通信的方式共享内存。 在主流编程语言中&#xff0c;多个线程传递数据的方式一般都是共享内存。 Go 可以使用共享内存加互斥锁进行通信&#xff0c;同时也提供了一种不同的并发模型&#xff0c;即通…

error: Sandbox: rsync.samba in Xcode project

在Targets 的 Build Settings 搜索&#xff1a;User script sandboxing 设置为NO

python课程设计作业-TCP客户端-服务端通信

说明文档 目录 小组成员分工 作品功能介绍 使用的工具和方法 设计的步骤 课程设计中遇到的问题 结论 1. 小组成员分工 本次课程设计由以下小组成员完成&#xff1a; xxx 2. 作品功能介绍 本次课程设计的作品是一个简单的基于 TCP 协议的客户端-服务端通信示例。通过这个示…

【SpringBoot Web框架实战教程】06 SpringBoot 整合 Druid

不积跬步&#xff0c;无以至千里&#xff1b;不积小流&#xff0c;无以成江海。大家好&#xff0c;我是闲鹤&#xff0c;微信&#xff1a;xxh_1459&#xff0c;十多年开发、架构经验&#xff0c;先后在华为、迅雷服役过&#xff0c;也在高校从事教学3年&#xff1b;目前已创业了…

阿里云centos7.9 挂载数据盘到 www目录

一、让系统显示中文 参考&#xff1a;centos7 怎么让命令行显示中文&#xff08;英文-&#xff1e;中文&#xff09;_如何在命令行中显示中文-CSDN博客 1、输入命令&#xff1a;locale -a |grep "zh_CN" 可以看到已经存在了中文包 2、输入命令&#xff1a;sudo vi…

AGPT•intelligence:带你领略全新量化交易的风采

随着金融科技的快速发展&#xff0c;量化交易已经成为了投资领域的热门话题。越来越多的投资者开始关注和使用量化交易软件来进行投资决策。在市场上有许多量化交易软件可供选择。 Delaek&#xff0c;是一位资深的金融科技专家&#xff0c;在 2020年成立一家专注于数字资产量化…

第一后裔延迟高怎么办?快速降低第一后裔延迟

第一后裔/The First Descendant一款射击游戏&#xff0c;融合了刷宝、角色扮演、团队合作、剧情等元素&#xff0c;让每个玩家都能在自己的角度上&#xff0c;找到切入点&#xff0c;并不断地成长&#xff0c;一步步解开后裔身上隐藏的秘密。近期该作正式上线&#xff0c;很多玩…

vue项目创建+eslint+Prettier+git提交规范(commitizen+hooks+husk)

# 步骤 1、使用 vue-cli 创建项目 这一小节我们需要创建一个 vue3 的项目&#xff0c;而创建项目的方式依然是通过 vue-cli 进行创建。 不过这里有一点大家需要注意&#xff0c;因为我们需要使用最新的模板&#xff0c;所以请保证你的 vue-cli 的版本在 4.5.13 以上&#xff…

Debian linux忘记root密码如何重置

重启电脑, 到下图再按 e 键 在页面中可以看到有个ro的行&#xff0c;在ro行的尾部&#xff0c;添加 rw init/bin/bas 3. ctrl X 启动系统&#xff0c;最后会进入命令行模式 4. 重设root密码&#xff0c;输入命令 passwd root&#xff0c;按照提示输入新密码并确认 5. 重启系…

基于Python的自动化测试框架-Pytest总结-第一弹基础

Pytest总结第一弹基础 入门知识点安装pytest运行pytest测试用例发现规则执行方式命令行执行参数 配置发现规则 如何编写测试Case基础案例断言语句的使用pytest.fail() 和 Exceptions自定义断言函数异常测试测试类形式 pytest的Fixture使用Fixture入门案例使用fixture的Setup、T…

昇思25天学习打卡营第8天|模型训练

昇思25天学习打卡营第8天|模型训练 前言模型训练构建数据集定义神经网络模型定义超参、损失函数和优化器超参损失函数优化器 训练与评估 个人任务打卡&#xff08;读者请忽略&#xff09;个人理解与总结 前言 非常感谢华为昇思大模型平台和CSDN邀请体验昇思大模型&#xff01;从…

linux中如何启动python虚拟环境

找到python虚拟环境所在目录 执行下面的命令即可 source auth_python/bin/activate

【遇坑笔记】Node.js 开发环境与配置 Visual Studio Code

【遇坑笔记】Node.js 开发环境与配置 Visual Studio Code 前言node.js开发环境配置解决pnpm 不是内部或外部命令的问题&#xff08;pnpm安装教程&#xff09; 解决 pnpm : 无法加载文件 C:\Program Files\nodejs\pnpm.ps1&#xff0c;因为在此系统上禁止运行脚本。 前言 最近部…

【代码随想录】【算法训练营】【第49天】 [300]最长递增子序列 [674]最长连续递增序列 [718]最长重复子数组

前言 思路及算法思维&#xff0c;指路 代码随想录。 题目来自 LeetCode。 day 49&#xff0c;周二&#xff0c;坚持不了一点~ 题目详情 [300] 最长递增子序列 题目描述 300 最长递增子序列 解题思路 前提&#xff1a;最大递增子序列的长度 思路&#xff1a;动态规划 d…

基于X86+FPGA的精密加工检测设备解决方案

应用场景 随着我国高新技术的发展和国防现代化发展&#xff0c;航空、航天等领域需 要的大型光电子器件&#xff0c;微型电子机械、 光 电信息等领域需要的微型器件&#xff0c;还有一些复杂零件的加工需求日益增加&#xff0c;这些都需要借助精密甚至超精密的加工检测设备 客…

esp12实现的网络时钟校准

网络时间的获取是通过向第三方服务器发送GET请求获取并解析出来的。 在本篇博客中&#xff0c;网络时间的获取是一种自动的行为&#xff0c;当系统成功连接WiFi获取到网络天气后&#xff0c;系统将自动获取并解析得到时间和日期&#xff0c;为了减少误差每两分钟左右进行一次校…

web平台—apache

web平台—apache 1. 学apache前需要知道的知识点2. apache详解2.1 概述2.2 工作模式2.3 启动apache网站整体流程2.4 相关文件保存位置2.5 配置文件详解 3. apache配置实验实验1&#xff1a;设置apache的目录别名实验2&#xff1a;apache的用户认证实验3&#xff1a;虚拟主机 (重…

江门MES制造执行系统:助力工厂实现智能化管理

江门MES制造执行系统(MES)在工厂实现智能化管理方面发挥着重要作用&#xff0c;以下是它的一些助力方面&#xff1a; 实时监控与控制&#xff1a;江门MES系统可以实时监控生产过程中的各个环节&#xff0c;包括设备状态、生产进度、质量指标等&#xff0c;帮助工厂管理人员及时…