R实验 非参数性检验

实验目的:

掌握列联表检验(Pearson c2独立性检验),掌握Fisher精确独立性检验,初步掌握三维列联表条件独立性检验;

掌握三个相关性检验:Pearson相关性检验,Spearman秩相关检验,Kendall秩相关检验。

实验内容:

(习题6.11)在高中一年级男生中抽取300名考察其两个属性:B是1500米长跑,C是每天平均锻炼时间,得到4 × 3列联表,如下表所示。试对 a = 0.05,检验B与C是否独立。

300名高中学生体育锻炼的考察结果

1500 米

长跑记录

锻炼时间

合计

2小时以上

12小时

1小时以下

5"01'5"30'

45

12

10

67

5"31'6"00'

46

20

28

94

6"01'6"30'

28

23

30

81

6"31'7"00'

11

12

35

58

合计

130

67

103

300

解:提出假设:

H0:1500米长跑纪录与锻炼时间相互独立

H1:1500米长跑纪录与锻炼时间相关

源代码及运行结果:(复制到此处,不要截图)

> x<-c(45,12,10,46,20,28,28,23,30,11,12,35)> y<-matrix(x,nc=3,byrow = T)> chisq.test(y)

Pearson's Chi-squared test

data:  y

X-squared = 40.401, df = 6, p-value = 3.799e-07

结论:P值远小于0.05,拒绝原假设,即1500米长跑记录与锻炼时间相关。

(习题6.12)为研究分娩过程中使用胎儿电子监测仪对剖腹产率有无影响,对5824例分娩的经产妇进行回顾性调查,结果如下表所示,试进行分析。

5824例经产妇回顾性调查结果

剖腹产

胎儿电子监测仪

合计

使用

未使用

358

229

587

2492

2745

5237

合计

2850

2974

5824

解:提出假设:

H0:分娩过程中使用胎儿电子监测仪对剖腹产率无影响

H1:分娩过程中使用胎儿电子监测仪对剖腹产率有影响

源代码及运行结果:(复制到此处,不要截图)

> a<-c(358,229,2492,2745)> b<-matrix(a,nc=2,byrow = T)> chisq.test(b)

Pearson's Chi-squared test with Yates' continuity

correction

data:  b

X-squared = 37.414, df = 1, p-value = 9.552e-10

结论:P值远小于0.05,拒绝原假设,即分娩过程中使用胎儿电子监测仪对剖腹产率有影响。

(习题6.13)为比较两种工艺对产品的质量是否有影响,对其产品进行抽样检查,其结果如下表所示。试进行分析。

两种工艺下产品质量的抽查结果

合格

不合格

合计

工艺一

3

4

7

工艺二

6

4

10

合计

9

8

17

解:提出假设:

H0:两种工艺产品的质量相互对立

H1:两种工艺产品的质量相关

源代码及运行结果:(复制到此处,不要截图)

> c<-c(3,4,6,4)> d<-matrix(c,nc=2,byrow = T)> fisher.test(d)

Fisher's Exact Test for Count Data

data:  d

p-value = 0.6372

alternative hypothesis: true odds ratio is not equal to 1

95 percent confidence interval:

 0.04624382 5.13272210

sample estimates:

odds ratio

  0.521271

结论:P值(=0.637)>0.05,接受原假设,即两种工艺产品的质量无相关性。

(习题6.14)一所大学去年收到 21 位男生和 63 位女生的求职信,结果聘用了 10 位男生和 14位女生 (1) 分析这所大学在招聘方面是否存在性别差异;(2) 根据学院详细分类数据如下表所示,再研究该大学在招聘方面是否存在性别差异。

某大学去年的招聘情况

申请者

教育学院

管理学院

工程学院

被聘

被拒

被聘

被拒

被聘

被拒

男性

2

8

5

0

3

3

女性

12

48

1

0

1

1

解:

(1)提出假设:

H0:这所大学在招聘方面没有存在性别差异

H1:这所大学在招聘方面存在性别差异

源代码及运行结果:(复制到此处,不要截图)

> r<-matrix(c(10,11,14,49),nc=2,byrow = T)> chisq.test(r)

Pearson's Chi-squared test with Yates' continuity

correction

data:  r

X-squared = 3.8111, df = 1, p-value = 0.05091

结论:P值为0.0509接近0.05,这意味着存在一些证据表明这所大学在招聘方面存在性别差异,但结果并不十分显著

(2)提出假设:

H0:这所大学在招聘方面没有存在性别差异

H1:这所大学在招聘方面存在性别差异

源代码及运行结果:(复制到此处,不要截图)

> r<-array(c(2,12,8,48,5,1,0,0,3,1,3,1),dim = c(2,2,3))> mantelhaen.test(r)

Mantel-Haenszel chi-squared test without continuity

correction

data:  r

Mantel-Haenszel X-squared = 0, df = 1, p-value = 1

alternative hypothesis: true common odds ratio is not equal to 1

95 percent confidence interval:

 0.2269314 4.4066187

sample estimates:

common odds ratio

结论:P值>0.05,接受原假设,即这所大学在招聘方面没有存在性别差异

(习题6.15)下表(数据存放在 score.data 文件中)列出某高中 18 名学生某门课程的高考成绩和模拟考试成绩,这组数据能否说明高考成绩与模拟考试成绩是相关的?

高考成绩和模拟考试成绩

学号

高考
成绩

模考
成绩

学号

高考
成绩

模考
成绩

学号

高考
成绩

模考
成绩

1

87

90

7

78

65

13

90

100

2

76

98

8

91

90

14

92

97

3

77

92

9

76

84

15

100

97

4

85

87

10

100

92

16

100

95

5

89

87

11

96

100

17

90

94

6

83

62

12

96

98

18

99

100

提示:显然应该优先考虑Pearson相关检验。但用Pearson相关检验,必须先进行正态性检验。严格来说,应该检验两个总体的联合分布是否服从正态分布(可利用第三方程序包,如vmnormtest程序包中的mshapiro.test()函数),但在实际使用时,通常是分别对两个总体单独进行正态性检验。如果不符合正态性,改用Spearman相关检验。

解:(1)正态性检验

提出假设:

H0:两个总体的联合分布服从正态性分布

H1:两个总体的联合分布不服从正态性分布

源代码及运行结果:(复制到此处,不要截图)

> X <- read.table("C:/Users/黄培滇/Desktop/R语言生物统计学/chap06/score.data", header = TRUE)

> shapiro.test(X$高考)

Shapiro-Wilk normality test

data:  X$高考

W = 0.91202, p-value = 0.0934

> shapiro.test(X$模拟)

Shapiro-Wilk normality test

data:  X$模拟

W = 0.77174, p-value = 0.0006223

结论:高考P值大于0.05,接受原假设,即高考成绩服从正态分布,但模拟P值远小于0.05,拒绝原假设,即模拟成绩不服从正态分布,因此总体联合不服从正态分布

(2)相关检验

提出假设:

H0:高考成绩与模拟考试成绩相互独立

H1:高考成绩与模拟考试成绩相关

源代码及运行结果:(复制到此处,不要截图)

> X <- read.table("C:/Users/黄培滇/Desktop/R语言生物统计学/chap06/score.data", header = TRUE)> cor.test(X$高考,X$模拟,method = "spearman")

Spearman's rank correlation rho

data:  X$高考 and X$模拟

S = 462.82, p-value = 0.02615

alternative hypothesis: true rho is not equal to 0

sample estimates:

      rho

0.5223728

结论:P值远小于0.05,拒绝原假设,即高考成绩与模拟考成绩相关

(习题6.16)调查某大学学生每周学习时间与得分的平均等级之间的关系,现抽查10个学生的资料如下:

学习时间

24

17

20

41

52

23

46

18

15

29

学习等级

8

1

4

7

9

5

10

3

2

6

其中等级10表示最好,1表示最差。试用秩相关检验(Spearman检验和Kendall检验)分别分析学习时间与学习等级有无关系。

解:(1)用Spearman秩检验方法

提出假设:

H0:学习时间与学习等级相互独立

H1:学习时间与学习等级相关

源代码及运行结果:(复制到此处,不要截图)

> a<-c(24,17,20,41,52,23,46,18,15,29)> b<-c(8,1,4,7,9,5,10,3,2,6)> cor.test(a,b,method = "spearman")

Spearman's rank correlation rho

data:  a and b

S = 10, p-value < 2.2e-16

alternative hypothesis: true rho is not equal to 0

sample estimates:

      rho

0.9393939

结论:P值远小于0.05,拒绝原假设,即学习时间与学习等级相关

(2)用Kendall秩检验方法

源代码及运行结果:(复制到此处,不要截图)

> a<-c(24,17,20,41,52,23,46,18,15,29)> b<-c(8,1,4,7,9,5,10,3,2,6)> cor.test(a,b,method = "kendall")

Kendall's rank correlation tau

data:  a and b

T = 41, p-value = 0.0003577

alternative hypothesis: true tau is not equal to 0

sample estimates:

      tau

0.8222222

结论:P值远小于0.05,拒绝原假设,即学习时间与学习等级相关

思考:

在对四格表的问题进行独立性检验时,Pearson c2统计量的自由度是多少?一般地,在对于I 行J 列的列联表进行独立性检验时,Pearson c2统计量的自由度是多少?

在对四格表的问题进行独立性检验时,Pearson c2统计量的自由度是1,在对于I 行J 列的列联表进行独立性检验时,Pearson c2统计量的自由度是(I-1)*(J-1)。

在样本数较小时(指单元的期望频数小于4),需要用__Fisher精确________检验来完成独立性检验,该检验是建立在____超几何分布________分布的基础上。在R软件中,做该检验的函数是__fisher.test()________。

Mantel - Haenszel 检验是针对一类特殊的三维列联表(2×2×k)设计的,在R软件中,做该检验的函数是____mantlhaen.test()___________。

相关性检验有哪三种方法?其中哪两种是非参数检验方法?

Pearson相关检验

Spearman相关检验

Kendall相关检验

两个样本的相关系数的绝对值越接近于1,能否说明两个样本所在的总体的相关性越强?为什么?

不能。相关系数的绝对值大小只能说明两个变量之间的线性关系程度,但不能说明相关性的强度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/840224.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++ | Leetcode C++题解之第110题平衡二叉树

题目&#xff1a; 题解&#xff1a; class Solution { public:int height(TreeNode* root) {if (root NULL) {return 0;}int leftHeight height(root->left);int rightHeight height(root->right);if (leftHeight -1 || rightHeight -1 || abs(leftHeight - rightH…

10.3.k8s的附加组件-图形化管理工具dashboard

目录 一、dashboard介绍 二、部署安装dashboard组件 1.下载dashboard本地文件 2.修改nodeport的端口范围 3.创建和查看dashboard 4.电脑浏览器访问测试 5.token登录方式登录dashboard 5.1.查看dashboard的token 5.2.继续查看用户token的secrets资源详细信息 5.3.复制…

【Linux】icmp_seq=1 Destination Host Unreachable

执行ping 命令提示&#xff1a;From 192.168.XX.XX icmp_seq1 Destination Host Unreachable 这个错误消息通常表示以下几种情况之一&#xff1a; 网络连接问题&#xff1a;目标主机可能没有连接到网络&#xff0c;或者网络中的某个路由器无法将数据包转发到目标主机。 目标主…

Kafka之【存储消息】

Kafka之【存储消息】

推荐算法教程(个人总结)

推荐算法是一类用于推荐系统的算法&#xff0c;通过分析用户行为和偏好&#xff0c;向用户推荐个性化的内容或产品。常见的推荐算法包括协同过滤&#xff08;Collaborative Filtering&#xff09;、基于内容的推荐&#xff08;Content-Based Filtering&#xff09;、矩阵分解&a…

Python库之Scrapy的高级用法深度解析

Python库之Scrapy的高级用法深度解析 引言 Scrapy是一个强大的Web爬虫框架&#xff0c;它提供了丰富的功能和灵活的扩展性&#xff0c;使得在Python中编写爬虫变得简单而高效。本文将深入探讨Scrapy的高级用法&#xff0c;帮助读者充分利用Scrapy的强大功能。 目录 引言Scr…

软考--软件设计师-刷题总结

一、数据结构 贪心算法 归并排序将问题先分解、再处理、再合并的方式采用了分治法的思想 分治法&#xff1a;将一个大问题分成若干个小问题 希尔排序&#xff1a; 定义一个 i 变量指向这一组的第二个数据&#xff0c;定义一个 j 变量指向 i - gap 的位置。 将 i 下标的值放到…

leetcode热题100.完全平方数(动态规划进阶)

前言 作者&#xff1a;晓宜 &#xff0c;大厂准入职小白 最近毕业论文快搞完了&#xff0c;打算把之前坚持的hot100系列文章更完&#xff0c;帮助大家更好的通过面试和笔试&#xff0c;都拿到大厂offer&#xff0c;大家快跟着刷起来呀。 从今天起立一个flag&#xff0c;每天更新…

那些网络安全上的事实,很多人不见得知道!

明月发现不少小白对网络安全的认知几乎为零&#xff0c;甚至明月还碰到一个说 VPN 能彻底隐匿自己的&#xff0c;至于现在这帮动不动就利用 DDos/CC 攻击被人网站来推销境外高防服务器、高防 CDN 的老鼠屎们更是网络安全知识白痴的水平&#xff0c;破坏和攻击的水平完全取决于能…

AI爆文写作:如何写出令人看一眼就想点击的爆款标题?

一、好标题要素(以公众号文章为例) 1. 热点、名人:热点事件、名人自带流量 董宇辉最新演讲刷屏:孩子未来20年的差距,是这样拉开的》 《读懂了杨绛,你就不再抱怨人生》 《江西彩礼38.8w上热搜:好的婚姻,不是侃价钱,而是看家庭》 2 悬疑:带着疑问,或反常识的观点,…

mac版本Phpstudy本地环境安装Discuz教程【2024】

此方法适用于m1版本的mac版本Phpstudy本地环境安装Discuz&#xff0c;当然同样使用更高版本的mac端。网上各种安装教程参差不齐&#xff0c;根本解决不了小白的入门需求&#xff0c;以下是最新且直接明了的安装教程。 Phpstudy本地环境安装Discuz教程&#xff1a; 1、安装Phps…

c++ vector实现出现的一些问题

目录 前言&#xff1a; 浅拷贝问题: typename指定类型&#xff1a; 前言&#xff1a; 最近学习了c vector的使用&#xff0c;然后也自己实现了一下vector的部分重要的功能。然后在其中出现了一些问题&#xff0c;在这就主要记录一下我解决哪些bug。 浅拷贝问题: 在实现res…

第四十三天 | 416.分割等和子集 1049.最后一块石头的重量|| 494.目标和

题目&#xff1a;416.分割等和子集 思路&#xff1a;只要找到集合里能够出现sum/2的子集总和&#xff0c;就算是可以分割成两个相同元素和子集了。 1.dp[j]含义&#xff1a;背包容量为j时&#xff0c;放进物品后&#xff0c;背的最大重量为dp[j] 那么如果背包容量为target&a…

分类网络中one-hot的作用

在分类任务中&#xff0c;使用神经网络时&#xff0c;通常需要将类别标签转换为一种合适的输入格式。这时候&#xff0c;one-hot编码&#xff08;one-hot encoding&#xff09;是一种常见且有效的方法。one-hot编码将类别标签表示为向量形式&#xff0c;其中只有一个元素为1&am…

2024年顶级算法-黑翅鸢优化算法(BKA)-详细原理(附matlab代码)

黑翅鸢是一种上半身蓝灰色&#xff0c;下半身白色的小型鸟类。它们的显著特征包括迁徙和捕食行为。它们以小型哺乳动物、爬行动物、鸟类和昆虫为食&#xff0c;具有很强的悬停能力&#xff0c;能够取得非凡的狩猎成功。受其狩猎技能和迁徙习惯的启发&#xff0c;该算法作者建立…

PS —— 精修图像

PS —— 精修图像 修复污点修复画笔工具修复画笔工具 美白滤镜去杂锐化加杂减淡和锐化工具 我觉得今天这篇博客&#xff0c;无论是男同胞还是女同胞&#xff0c;都要熟练掌握&#xff08;哈哈哈哈…) 今天我们来学习如何精修图像&#xff0c;精修图像一般分为几步——修复&…

面试准备【面试准备】

面试准备【面试准备】 前言面试准备自我介绍&#xff1a;项目介绍&#xff1a; 论坛项目功能总结数据库表设计注册功能登录功能显示登录信息功能发布帖子评论私信点赞功能关注功能通知搜索网站数据统计热帖排行缓存 论坛项目技术总结Http的无状态cookie和session的区别为什么要…

1、什么是模块化,为什么要模块化?2、衡量模块独立的定性标准是什么?用自己的话表达其含义3、如何理解信息隐藏和局部化?用自己的话或者例子表达其含义

1. 模块化是指将一个大型系统划分为多个相互独立、功能单一的模块或组件的过程。模块化的目的是为了提高系统的可维护性、可扩展性和可重用性。通过模块化&#xff0c;系统的各个功能模块可以独立开发、测试和维护&#xff0c;降低了系统的复杂度&#xff0c;提高了开发效率和代…

shell文本三剑客——awk命令【☆】

目录 一、akw原理 二、命令格式 三、常用变量 四、awk的用法 1.输出整行内容 2.按字段输出文本内容 3.按列输出文件内容 FS变量为列分隔符 4.awk的三个模式 5. awk ‘控制语句条件 {操作}’ 文件 6.awk的数组 7.awk的应用 一、akw原理 逐行读取文本&#xff0c;默认…

const的了解

const详解_解const-CSDN博客 本文内容学习自上面的文章&#xff0c;ta写的非常好&#xff0c;非常感谢&#xff01;&#xff01;&#xff01; 1.const成员函数&#xff1a;该函数不可以修改该对象的任何成员变量 class T { public:int i;int j; public:void fun() const; //…