R语言计算:t分布及t检验

t分布理论基础

t分布也称Student’s t-distribution,主要出现在小样本统计推断中,特别是当样本量较小且总体标准差未知时,用于估计正态分布的均值。其定义基于正态分布和 X 2 X^{2} X2分布(卡方分布)。如果随机变量X服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),而 Y Y Y服从自由度为 n n n的卡方分布,且 X X X Y Y Y相互独立,那么变量 T = Y n T = \sqrt{\frac{Y}{n}} T=nY 服从自由度( v v v)为 n n n t t t分布,其形状会随着自由度的变化而变化,t分布的形状会随自由度的变化而变化,当自由度较小时,t分布曲线较为平坦,且尾部较高,随着自由度的增加,t分布曲线逐渐接近正态分布曲线。
通常在大样本且假设总体标准差是已知的情况下使用正态分布,在小样本且总体标准差未知的情况下使用 t t t分布,特别是在进行假设检验和估计总体均值时。
t t t分布计算公式
T = X ˉ − μ S n . T = \sqrt{\frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}}. T=n SXˉμ .
其中:
X ˉ \bar{X} Xˉ:样本均值;
μ \mu μ:假设的总体均值;
S S S:样本标准差;
n n n:样本大小.

t检验理论基础

t t t检验利用 t t t分布的性质来判断样本均值之间的差异是否显著, t t t检验是一种统计假设检验方法,它利用t分布理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。t检验通常用于检验样本均值与某个已知值或两个样本均值间是否存在显著差异的统计方法,在进行 t t t检验时,会计算出一个 t t t统计量,该统计量服从 t t t分布。
单样本t检验
用于检验单个样本的均值是否与已知的某个值存在显著差异
t = x ˉ − μ 0 s / n . t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}. t=s/n xˉμ0.
其中:
x ˉ \bar{x} xˉ是样本均值,
μ 0 \mu_0 μ0是假设的总体均值,
s s s是样本标准差,
n n n是样本量。

双样本t检验
用于检验两个独立样本的均值是否存在显著差异。
t = x ˉ 1 − x ˉ 2 s 1 2 n 1 + s 2 2 n 2 . t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}. t=n1s12+n2s22 xˉ1xˉ2.
其中:
x ˉ 1 \bar{x}_{1} xˉ1 x ˉ 2 \bar{x}_{2} xˉ2:两个样本的均值;
s 1 、 s_{1}、 s1s_{2}$:两个样本的标准差;
n 1 n_{1} n1 n 2 n_{2} n2分别是两个样本的样本量。

配对样本t检验
用于检验两个相关样本(同一组对象在不同条件下的测量值)。
t = d ˉ − μ d s d / n . t = \frac{\bar{d} - \mu_d}{s_d/\sqrt{n}}. t=sd/n dˉμd.
其中:
d ˉ \bar{d} dˉ:差值的均值;
μ d \mu_d μd:假设的差值均值(通常为0);
s d s_d sd:差值的标准差;
n n n:配对数据的数量。

R语言实现

使用R语言绘制 t t t分布曲线图

# 设置自由度  
df <- 5  curve(dt(x, df), from = -5, to = 5, xlab = "t值", ylab = "概率密度",   main = paste("t分布曲线图 (df =", df, ")"), col = "blue", lwd = 2)  
grid(col="gray", lty="dotted")  
abline(v=0, col="gray") 
abline(h=0, col="gray")
polygon(c(-5, seq(-5, 5, length=200), 5),   c(0, dt(seq(-5, 5, length=200), df), 0),   col="lightblue", border=NA)

生成图形
在这里插入图片描述
t t t分布单尾曲线图

df <- 5  # t > 0
curve(dt(x, df), from = 0, to = 5, xlab = "t值", ylab = "概率密度",   main = paste("t分布单尾曲线图 (df =", df, ")"), col = "blue", lwd = 2, xlim = c(0, 5))  
grid(col = "gray", lty = "dotted")  
polygon(c(0, seq(0, 5, length = 200), 5),   c(0, dt(seq(0, 5, length = 200), df), 0),   col = "lightblue", border = NA)

在这里插入图片描述
t t t分布双尾曲线图

df <- 5  curve(dt(x, df), from = -5, to = 5, xlab = "t值", ylab = "概率密度",   main = paste("t分布双尾曲线图 (df =", df, ")"), col = "blue", lwd = 2)  
grid(col = "gray", lty = "dotted")  
# t < -2 
polygon(c(-5, seq(-5, -2, length = 200), -2),   c(0, dt(seq(-5, -2, length = 200), df), 0),   col = "blue", border = NA)  
polygon(c(2, seq(2, 5, length = 200), 5),   c(0, dt(seq(2, 5, length = 200), df), 0),   col = "blue", border = NA)

在这里插入图片描述 单样品t检验

单样品t检验用于检验单个样本的均值与已知的某个值(通常是理论值或标准值)是否有显著差异。

# 检验数据的均值是否与某个已知值(比如10)有显著差异
data <- c(9.8, 10.2, 9.9, 10.1, 10.0, 9.7, 10.3)print(t.test(data, mu = 10))

输出

	One Sample t-testdata:  data
t = 0, df = 6, p-value = 1
alternative hypothesis: true mean is not equal to 10
95 percent confidence interval:9.80021 10.19979
sample estimates:
mean of x 10 

根据输出的报告可以看出:
t值=0,样本均值与假设的均值(在这里是10)之间没有差异。
自由度=6,对于单样本t检验, d f = n − 1 df = n - 1 df=n1 n n n是样本数量。
p值=1,不能拒绝样本均值与10没有显著差异的原假设。
置信区间=95%。

双样品t检验
用于比较两个独立样本的均值是否存在显著差异。

# 现有两组独立的数据,比较这两组数据的均值是否有显著差异
data1 <- c(9.8, 10.2, 9.9, 10.1, 10.0)
data2 <- c(9.5, 9.6, 9.7, 9.9, 9.8, 10.0, 9.7, 9.8)print(t.test(data1, data2))

输出

	Welch Two Sample t-testdata:  data1 and data2
t = 2.7584, df = 8.7335, p-value = 0.02279
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:0.04401691 0.45598309
sample estimates:
mean of x mean of y 10.00      9.75 

根据输出的报告可以看出:
t值=2.7584,在双样本t检验中,t值用于衡量两组数据的均值之间的差异,相对于它们的合并标准误差来说是否显著。
自由度=8.7335,对于双样本t检验,使用Welch公式对两个样本的大小和方差进行调整计算得出。
p值=0.02279,这小于常用的显著性水平0.05,两组数据的均值存在显著差异。
置信区间=95%。
根据R语言的输出报告显示,可以拒绝两组数据均值相同的原假设。

配对样品t检验

配对样品t检验用于比较同一组观测对象在不同条件下的测量值是否存在显著差异。

# 现有一组观测对象在两种不同条件下的测量值,检验这两种条件下测量值的均值是否有显著差异
data1 <- c(5.1, 5.5, 5.3, 5.6, 5.4)
data2 <- c(4.8, 5.0, 5.2, 5.4, 5.1)print(t.test(data2, data1, paired = TRUE))

输出

Paired t-testdata:  data2 and data1
t = -4.2212, df = 4, p-value = 0.01347
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:-0.46416853 -0.09583147
sample estimates:
mean difference -0.28 

t值=-4.2212,在配对t检验中,t值用于衡量配对观测值之间的差异是否显著,第一组数据的均值小于第二组。
自由度=4。
p值=0.01347,由于p值小于常用的显著性水平0.05,我们可以拒绝两组数据的均值差异为0的原假设,认为两组数据的均值存在显著差异。
置信区间=95%,对于两组数据的均值差异,有95%的信心认为这个差异在-0.46416853到-0.09583147之间。
样本估计=-0.28。配对数据中计算出的实际均值差异。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/817565.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

冯诺依曼体系结构+操作系统

操作系统篇 文章目录 一、冯诺依曼体系结构(1) 硬件数据流动角度&#xff0c;在数据层面&#xff1a;(2)程序运行为什么要加载到内存&#xff1f; 二、操作系统(Operator System)(1) Why 要有操作系统&#xff1f;(2)如何理解 “管理” &#xff1f; 一、冯诺依曼体系结构 /*-…

springCloudAlibaba集成seata实战(分布式事物详解)

一、分布式事务 1. 事务介绍 1.1 基础概念 事务&#xff1a;保证我们多个数据库操作的原子性&#xff0c;多个操作要么都成功要么都不成功 事务ACID原则 A&#xff08;Atomic&#xff09;原子性&#xff1a;构成事务的所有操作&#xff0c;要么都执行完成&#xff0c;要么全部…

三次握手与四次挥手到底是怎么回事?

三次握手和四次挥手是TCP/IP协议中建立和断开连接的关键步骤&#xff0c;它们是保证可靠通信的重要机制。这里将探讨这两个概念&#xff0c;并解释它们背后的原理。 三次握手 三次握手用于建立TCP连接&#xff0c;它由客户端和服务器之间发送的三个报文组成&#xff1a; 第一次…

市场份额第一:SmartX 领跑 23全年中国超融合软件市场

日前&#xff0c;IDC 发布《中国软件定义存储&#xff08;SDS&#xff09;及超融合存储系统&#xff08;HCI&#xff09;市场季度跟踪报告&#xff0c;2023 年第四季度》&#xff0c;详解中国区超融合发展趋势、市场份额规模以及厂商占比。 IDC 数据显示&#xff0c;2023 年全…

高防IP的技术实现

1. 分布式架构&#xff1a;高防IP采用分布式架构部署&#xff0c;将流量均匀分散到多个服务器上进行处理&#xff0c;以达到承载大流量攻击的能力。这样可以减轻单个服务器的负载压力&#xff0c;提高抗攻击能力。 架构设计&#xff1a; - 前端负载均衡器&#xff1a;用于接…

rust使用print控制台打印输出五颜六色的彩色红色字体

想要在控制台打印输出彩色的字体&#xff0c;可以使用一些已经封装好的依赖库&#xff0c;比如ansi_term这个依赖库&#xff0c;官方依赖库地址&#xff1a;https://crates.io/crates/ansi_term 安装依赖&#xff1a; cargo add ansi_term 或者在Cargo.toml文件中加入&#…

带洞平面三角分割结果的逆向算法

先标不重复点&#xff0c;按最近逐个插入。 只说原理。 不带洞的 1 2 4 2 3 4 两个三角形 结果 1 2 3 4 无重复 无洞 1 2 6 1 2 3 6 1 2 3 7 6 1 2 3 4 7 6 1 2 3 4 5 7 6 1 2 3 4 1 5 7 6 1 2 3 4 1 6 5 7 6 最终结果 1 2 3 4 1 6 5 7 6 按重复分割 1 2 3…

自定义滚动条样式:前端实现跨浏览器兼容

&#x1f31f; 前言 欢迎来到我的技术小宇宙&#xff01;&#x1f30c; 这里不仅是我记录技术点滴的后花园&#xff0c;也是我分享学习心得和项目经验的乐园。&#x1f4da; 无论你是技术小白还是资深大牛&#xff0c;这里总有一些内容能触动你的好奇心。&#x1f50d; &#x…

好好开始文生图

基于transformer 以前UNET架构&#xff0c;基于卷积&#xff0c;现在把卷积换成transformer Diffusion transformer 数据更少&#xff0c;文本数据就要更优质 训好了&#xff0c;通过增加额外模块&#xff0c;提高文本质量 如果给的文本时粗粒度的&#xff0c;那么生成的图片…

【mac】【python】新建项目虚拟环境后,使用命令pip出现错误:zsh: command not found: pip

【mac】【python】新建项目虚拟环境后&#xff0c;使用命令pip出现错误&#xff1a;zsh: command not found: pip 问题描述&#xff1a; 拉取或者创建新的python项目时&#xff0c;为项目添加了新的解释器&#xff0c;创建啦虚拟环境&#xff0c;但是执行pip命令的时候找不到命…

LeetCode 面试经典150题 202.快乐数

题目&#xff1a; 编写一个算法来判断一个数 n 是不是快乐数。 「快乐数」 定义为&#xff1a; 对于一个正整数&#xff0c;每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为 1&#xff0c;也可能是 无限循环 但始终变不到 1。如果这个过程 结…

《前端面试题》- JS基础 - 伪数组

第一次听说伪数组这个概念&#xff0c;听到的时候还以为是说CSS的伪类呢&#xff0c;网上一查&#xff0c;这东西原来还是个很常见的家伙。 何为伪数组 伪数组有两个特点&#xff1a; 具有length属性&#xff0c;其他属性&#xff08;索引&#xff09;为非负整数但是却不具备…

C ++ 和 C语言的优缺点分别是什么?

C语言&#xff0c;它简直就是编程世界的一块磐石。简洁、直接&#xff0c;让人一眼就能明白它想干嘛。它的运行速度快&#xff0c;接近硬件操作&#xff0c;特别适合那些需要直接与硬件打交道的场景。但就是因为这种接近硬件的特性&#xff0c;C语言在抽象层次上就显得有点捉襟…

【MCU开发规范】:MCU的性能测试

MCU的性能测试 前序性能评判方法MIPSCoreMark EEMBC其他参考 前序 我们平时做MCU开发时&#xff0c;前期硬件选型&#xff08;选那颗MCU&#xff09;基本由硬件工程师和架构决定&#xff0c;到软件开发时只是被动的开发一些具体功能&#xff0c;因此很少参与MCU的选型。 大部分…

Harbor Deployment (Helm)

文章目录 Harbor Deployment (Helm)前期准备创建stl证书 Harbor 部署推送镜像 Harbor Deployment (Helm) Helm 部署 Harbor需要使用共享存储&#xff0c;docker-compose 部署使用单台宿主机存储。 前期准备 创建stl证书 # 模拟域名&#xff0c;公司可以申请内部域名 # VIP bi…

linux(ub)-redis环境部署

1.下载redis包 wget http://download.redis.io/releases/redis-7.0.5.tar.gz 2.解压缩&#xff1a; tar -zxvf redis-7.0.5.tar.gz 3.安装gcc&#xff1a;sudo apt-get install gcc 4. 编译&#xff1a;cd redis-7.0.5 make make make install 5. cd /usr/local/bin/ 6. mkdir …

spring xml 集成Redission集群

1、引入redission <jackson-databind.version>2.8.2</jackson-databind.version><jackson-core.version>2.8.2</jackson-core.version><dependency><groupId>org.redisson</groupId><artifactId>redisson</artifactId>&…

财务软件有哪些优势?

提高准确性 财务软件可以提高会计做账的准确性&#xff0c;相对于人工计算的繁琐复杂&#xff0c;软件通过程序计算&#xff0c;可以大大降低出错率。而且财务软件有很多自动化功能&#xff0c;财务软件有结账自动结转损益、银行现金不能为负数等等功能、年末自动结转本年利润等…

SSL证书和IP证书的区别

SSL证书是一种用于保障网络传输安全的数字证书&#xff0c;它通过为网站提供加密服务&#xff0c;确保用户与网站之间交换的数据不被第三方截取或篡改。IP证书是一种用于验证和保护IP地址的数字证书。它是通过将IP地址与其所有者的身份信息相联系&#xff0c;从而确保IP地址的真…

哪种裤子比较百搭?显高显瘦的男生裤子分享

选到合适的裤子才能穿得好看以及舒服。可是市面上也出现了不少各种裤子质量达不到标准的负面新闻&#xff0c;为了能够选到合适的裤子&#xff0c;我自费购买了多个品牌的裤子测评。之后我知道很多网红品牌为了压低成本&#xff0c;用料和做工都很差&#xff0c;于是我总结了五…