R语言数据分析案例28-对数据集可视化和T检验

一、分析主题:

本分析旨在对数据集进行可视化和 T 检验,以探索数据集中的变量之间的关系和差异。通过可视化数据,我们可以直观地了解数据的分布和趋势,而 T 检验则可以帮助我们确定这些差异是否具有统计学意义。

二、具体分析

对一组数据,进行T-test,保存分析结果,并绘制柱状图

读取数据:

df <- read.csv("C:/Users/Administrator/Desktop/画图t检验r/penguins.csv")
df# 执行 T 检验
# 对数据进行筛选,去除 sex 列中的缺失值
df1<-df[!is.na(df$sex), ]
t_test_result <- t.test(bill_length_mm ~ sex, data = df1)
t_test_result

 数据集和完整代码

选择 bill_length_mm 特征进行 T 检验,并根据 sex 列来进行分组。接下来,将保存分析结果并绘制柱状图来展示两组样本的 bill_length_mm 均值差异

df1 <- df[!is.na(df$sex), ]:这行代码的目的是创建一个新的数据框 df1,其中移除了 sex 列中的缺失值 NA。!is.na(df$sex) 用于判断 sex 列中是否存在缺失值,并使用 [ ] 筛选出不包含缺失值的行。

t_test_result <- t.test(bill_length_mm ~ sex, data = df1):这是执行 Student's t-test 的部分。t.test() 函数的参数是一个公式,bill_length_mm ~ sex 表示要比较的数值型变量是 bill_length_mm,而分组的因子是 sex。这里的 data = df1 指定了数据来源是 df1 数据框。

t_test_result:这行代码会打印出执行 Student's t-test 后的结果。结果中包含了 t 统计量的数值、p 值以及检验的置信区间等信息。

接下来可视化

# 绘制柱状图
ggplot(df1, aes(x = sex, y = bill_length_mm, fill = sex)) +geom_bar(stat = "summary", fun = "mean", position = "dodge") +labs(title = "Bill Length Comparison by Sex",x = "Sex", y = "Bill Length (mm)") +theme_minimal() +scale_fill_manual(values = c("male" = "blue", "female" = "red"))  # 自定义颜色

ggplot(df1, aes(x = sex, y = bill_length_mm, fill = sex)):使用 ggplot2 创建一个基础图形对象。df1 是数据框,aes() 函数中设置 x 轴为 sex,y 轴为 bill_length_mm,并根据 sex 进行分组。fill = sex 表示用性别进行填充。

geom_bar(stat = "summary", fun = "mean", position = "dodge"):添加柱状图层。stat = "summary" 表示用于计算统计摘要数据,fun = "mean" 表示用平均值来绘制柱状图。position = "dodge" 表示柱状图按性别分组并并列显示。

labs(title = "Bill Length Comparison by Sex", x = "Sex", y = "Bill Length (mm)"):添加图表的标题和坐标轴标签。

接下来选择 flipper_length_mm 特征进行单因素方差分析,并绘制相应的图表

anova_result 变量将包含ANOVA的分析结果,其中包括不同物种对 flipper_length_mm 的影响是否显著。如果想要查看ANOVA结果的具体信息,你可以直接打印 anova_result 变量,它将显示ANOVA分析的摘要信息。

ANOVA 结果通常包含 F 值、p 值以及其他统计指标

绘制箱线图叠加散点图

# 绘制箱线图叠加散点图
ggplot(df1, aes(x = species, y = flipper_length_mm, fill = species)) +geom_boxplot() +geom_jitter(position = position_jitter(width = 0.3), color = "black", size = 2) +labs(title = "Flipper Length Comparison by Species",x = "Species", y = "Flipper Length (mm)") +theme_minimal() +scale_fill_manual(values = c("Adelie" = "blue", "Biscoe" = "green", "Dream" = "red"))  # 自定义颜色

ggplot(df1, aes(x = species, y = flipper_length_mm, fill = species)):创建一个基础图形对象。df1 是数据框,aes() 函数中设置 x 轴为 species,y 轴为 flipper_length_mm,并根据 species 进行分组。fill = species 表示用不同的物种进行填充。 

三、小结

  1. 数据集可视化:通过绘制柱状图、折线图、箱线图等图表,我们可以直观地展示数据的分布和趋势。例如,柱状图可以用于比较不同类别之间的数量差异,折线图可以用于展示时间序列数据的变化趋势,箱线图可以用于展示数据的离散程度和异常值。可视化数据可以帮助我们发现数据中的模式和趋势,从而更好地理解数据。

  2. T 检验:T 检验是一种常用的统计方法,用于比较两个或多个样本的均值是否存在显著差异。通过计算 T 统计量和 P 值,我们可以确定这些差异是否具有统计学意义。在进行 T 检验时,我们需要确保样本的独立性、正态性和方差齐性。如果这些条件不满足,我们可能需要使用其他统计方法或进行数据转换。

通过对数据集进行可视化和 T 检验,我们可以更好地理解数据的分布和趋势,以及变量之间的关系和差异。这些分析结果可以为进一步的研究和决策提供参考。在进行数据分析时,我们应该根据数据的特点和研究目的选择合适的可视化方法和统计方法,并对结果进行合理的解释和讨论。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/27648.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【字符函数】

接下来介绍部分字符函数测试 2. 字符转换函数 1.字符分类函数 1.1iscntrl 注&#xff1a;任何控制字符 检查是否有控制字符 符合为真 int main() {int i 0;char str[] "first line \n second line \n";//判断是否遇到控制字符while (!iscntrl(str[i])){p…

【Java】多态、final关键字、抽象类、抽象方法

多态(Polymorphism) 【1】多态跟属性无关&#xff0c;多态指的是方法的多态&#xff0c;而不是属性的多态。 【2】案例代入&#xff1a; public class Animal {//父类&#xff1a;动物&#xff1a; public void shout(){ System.out.println("我是小动物&am…

Qt 非圆角图片裁剪为圆角图片

将Qt非圆角图片裁剪为圆角图片,步骤如下&#xff1a; 1、按照原始图片尺寸定义一张透明的新图形 2、使用画家工具在新图形上绘制一个圆角矩形线路 3、绘制图片 4、使用圆角矩形切割图片边角 封装成函数如下&#xff1a; QPixmap Widget::getRoundedPixmap(const QPixmap srcPix…

Vue引入element-plus-04

我们这次开发是使用vue的脚手架来进行开发,前面我们已经使用过最原生的方式去编写我们的vue的语法,从今天开始就使用vue的脚手架,但是前提是你需要用于node的环境 在我们开始之前&#xff0c;我们至少需要有node npm是什么&#xff1f; npm是一个强大的包管理工具&#xff0c;它…

Halcon 多相机统一坐标系

小杨说事-基于Halcon的多相机坐标系统一原理个人理解_多相机标定统一坐标系-CSDN博客 一、概述 最近在搞多相机标定等的相关问题&#xff0c;对于很大的场景&#xff0c;单个相机的视野是不够的&#xff0c;就必须要统一到一个坐标系下&#xff0c;因此我也用了4个相机&#…

人工智能ChatGPT的多种应用:提示词工程

简介 ChatGPT 的主要优点之一是它能够理解和响应自然语言输入。在日常生活中&#xff0c;沟通本来就是很重要的一门课程&#xff0c;沟通的过程中表达的越清晰&#xff0c;给到的信息越多&#xff0c;那么沟通就越顺畅。 和 ChatGPT 沟通也是同样的道理&#xff0c;如果想要 …

推荐系统三十六式学习笔记:原理篇.矩阵分解10|那些在Netflix Prize中大放异彩的推荐算法

目录 缘起矩阵分解为什么要矩阵分解1 基础的SVD算法2 增加偏置信息3 增加历史行为4 考虑时间因素 总结 我们先前聊过推荐系统中的经典问题&#xff0c;其中有一类就是评分预测。平心而论&#xff0c;评分预测问题只是很典型&#xff0c;其实并不大众。毕竟在实际的应用中&#…

最新情侣飞行棋高阶羞羞版,解锁私密版情侣小游戏,文末有福利!

今天要跟大家聊聊一种特别有意思的游戏——情侣飞行棋羞羞版。别急着脸红&#xff0c;这可是专为情侣设计的游戏&#xff0c;让你们在轻松愉快的氛围中&#xff0c;增进了解&#xff0c;加深感情。 谈恋爱&#xff0c;不就是两个人在一起&#xff0c;做些有趣的事情吗&#xf…

Opus从入门到精通(七)Opus编码基础之认识声音

Opus从入门到精通(七)Opus编码基础之认识声音 前面我们分析完Opus的编解码api使用,封装原理等,接下来我们准备分析Opus编码原理.Opus编码是一个复杂的工作,我们需要做一些基本铺垫,包括认识声音,压缩编码基础. 认识音频有助于我们了解音频特征,不仅对语音有助于我们理解编码技…

2021年9月电子学会青少年软件编程 中小学生Python编程等级考试三级真题解析(判断题)

2021年9月Python编程等级考试三级真题解析 判断题&#xff08;共10题&#xff0c;每题2分&#xff0c;共20分&#xff09; 26、readline()执行结果为字符串&#xff0c;readlines()执行结果为列表 答案&#xff1a;对 考点分析&#xff1a;考查文件读操作&#xff0c;readli…

【leetcode--同构字符串】

要求&#xff1a;判断两个字符串的形式是不是一致&#xff0c;即是不是AABC或者ABBBCC这种。 trick&#xff1a;使用set&#xff08;&#xff09;结合zip&#xff08;&#xff09;。 set&#xff08;&#xff09;用法&#xff1a;用于创建一个不包含重复元素的集合 zip&#…

环保绩效评级:ABCD四个等级,你的企业处于哪个水平?

在当下社会&#xff0c;环保问题越来越受到人们的关注和重视。企业作为经济活动的重要参与者&#xff0c;其环保绩效评级直接关系到环境保护的成效。朗观视觉将详细解析环保绩效评级的ABCD四等级&#xff0c;帮助读者了解不同等级的特点和评判标准&#xff0c;进而引导企业提高…

大模型扫盲系列——初识大模型

本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析&#xff0c;帮助读者初步了解大模型。 近年来&#xff0c;随着计算机技术和大数据的快速发展&#xff0c;深度学习在各个领域取得了显著的成果。为了提高模型的性能&#xff0c;研究者们不断尝试增加模型…

MySQL损坏,使用data恢复数据

MySQL损坏&#xff0c;重装MySQL使用data文件恢复数据库 1.清空相关注册表(清空安装残留)2.下载合适MySQL版本(与损坏数据库版本相同)3.数据恢复4.Windows server MySQL备份bat5.设置Windows定时执行 # 初始化安装 mysqld -install# 查看数据初始化密码 mysqld --initialize --…

工业 UI 风格,展现独特魅力

工业 UI 风格&#xff0c;展现独特魅力

Mysql之不使用部署在k8s集群的Mysql而是选择单独部署的Mysql的原因

测试准备&#xff1a; 线程组&#xff1a;并发数100&#xff0c;持续时间2min 两个请求&#xff1a;使用k8s集群中的mysql的wordpress对应端口30011 使用单独部署的mysql的wordpress的对应端口为30022 访问同一个博客 测试结果&#xff1a; 汇总报告&#xff1a; 响应时间图&…

HTML静态网页成品作业(HTML+CSS+JS)——游戏天天酷跑网页(4个页面)

&#x1f389;不定期分享源码&#xff0c;关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 &#x1f3f7;️本套采用HTMLCSS&#xff0c;使用Javacsript代码实现图片切换轮播&#xff0c;共有4个页面。 二、…

Linux---系统的初步学习【 项目二 管理Linux文件和目录】

项目二 管理Linux文件和目录 2.1项目知识准备 ​ 文件是存储在计算机上的数据集合。在Windows系统中&#xff0c;我们理解的文件可以是文本文档、图片、程序、音乐、视频等。在Linux中&#xff0c;一切皆文件&#xff0c;也就是除了Windows中所理解的文件&#xff0c;目录、字…

xgo 原理探索

Go 单测 mock 方案 Mock 方法原理依赖优点缺点接口 Mock为依赖项定义接口&#xff0c;并提供接口的 Mock 实现。需要定义接口和 Mock 实现。灵活&#xff0c;遵循 Go 的类型系统&#xff1b;易于替换实现。需要更多的样板代码来定义接口和 Mock 实现。Monkey Patching&#xf…

NOSQL -- ES

第三个我们比较常用的NOSQL类型的数据库 --- ES 介绍: ES的全称(Elasticsearch) ES是一个分布式全文搜索的引擎 也就是我们平常在购物, 搜索东西的时候常用的, 就是一个ES的类型, 分布式全文搜索引擎 查询原理: 1>分词: 在查询之前, 其会将一些数据拆分开, 按照词进行拆分…