卡方检验法+matlab,【T】显著性检验(2)—卡方检验法

该博文已整理到新地址:

记数数据统计法

在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。

有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力

水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等

少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。

卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。

在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样

本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性

及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常

是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难

于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项

措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能

代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,

势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断

时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。

卡方拟合性检验

卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检

验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(fo)与理论次数(

fe,又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为:

x2=∑(fo-fe)2/fe

这是卡方检验的原始公式,其中当fe越大(fe≥5),近似得越好。显然fo与fe相差越大,

卡方值就越大;fo与fe相差越小,卡方值就越小;因此它能够用来表示fo与fe相差的程度。

根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况:

卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

拟合性检验的零假设是观测次数与理论次数之间无差异。其中理论次数的计算一般是根

据某种理论,按一定的概率通过样本即实际观测次数来计算。这里所说的某种理论,可能是

经验规律,也可能是理论分布。确定理论次数是卡方检验的关键。

拟合性检验自由度的确定与两个因素有关:一是分类的项数,二是在计算理论次数时

所用统计量或约束条件的个数,这两者之差即为自由度。由于一般情况下,计算理论次数时

只用到“总数”这一统计量,所以自由度一般是分类的项数减1。但在对连续数据分布的合

度检验中,常常会用数据个数、平均数、标准差等统计量来计算理论次数,所以此时的自由

度应从总分类项中减去更多的个数。按照检验中理论次数的定义不同,拟合性检验有以下集

中应用。

检验无差假设

所谓无差假设,是指各项分类的实计数之间没有差异,也就是说各项分类之间的概率相

等(均匀分布),因此理论次数完全按概率相等的条件来计算。即任一项的理论次数都等于

总数/分类项数。因此自由度也就等于分类项数减1。

例1:随机地将麻将色子抛掷300次,检验该色子的六个面是否均匀。结果1-6点向上的次数依次是,43,49,56,45,66,41。

解:每个类的理论次数是

300/6 = 50,代入公式:

x2=∑(fo-fe)2/fe=(43-50)2/50+……+(41-50)2/50=8.96<

x20.05(5)=11.1

因此,在0.05的显著性水平下,可以说这个色子的六面是均匀的。

例2:随机抽取60名高一学生,问他们文理要不要分科,回答赞成的39人,反对的21人,问对分科的意见是否有显著的差异。

解:如果没有显著的差异,则赞成与反对的各占一半,因此是一个无差假设的检验,于

是理论次数为60/2=30,代入公式:

x2=∑(fo-fe)2/fe=(39-30)2/30+……+(21-30)2/30=5.4>

x20.05(1)=3.84

所以对于文理分科,学生们的态度是有显著的差异的。

检验假设分布的概率

例3:在英语四级考试中,某学生做对了80个四择一选择题中的28题,现在要判断该

生是完全凭猜测做题。

解:假如该生完全凭猜测做题,那么平均而言每道题做对的可能性是1/4,因此80个题

中平均而能做对80/4=20题,代入公式有:

x2=∑(fo-fe)2/fe=(28-20)2/20+……+(52-60)2/60=4.27>

x20.05(1)=3.84

因此,该生可能会做一些题。

独立性检验

卡方检验还可以用于检验两个或两个以上因素(各有两项或以上的分类)之间是否相互影响的问题,这种检验称为独立性检验。例如要讨论血型与性格的关系,血型有A、B、AB、

O四类,性格采用心理学上的A型性格来划分,即有A型和B型两种,每个人可能是它们

之间交叉所形成的8种类型中的一种,那么倒底它们之间有不有关系,就可以用卡方独立性

检验。

卡方独立性检验用于检验两个或两个以上因素(各有两项或以上的分类)之间是否相互

影响的问题。所谓独立,即无关联,互不影响,就意味着一个因素各个分类之间的比例关系,

在另一个因素的各项分类下都是相同的,比如在血型与性格关系中,如果A型性格人群中

各血型的比例关系,与B型性格人群中各血型的比例关系相同,就可能说血型与性格相互

独立,当然这里的“两者比例相同”在统计的意义下,应表述为“两比例差异不超过误差范围”,因为就算总体之间相互独立,收集到两个比例完全相同的样本的可能是很小很小的,甚至是不可能的。相反,若一个因素各个分类之间的比例关系,在另一个因素的各项分类下是不同的,则它们之间相关。假如A型性格中A型血的比例高于B型性格中A型血的比例,而且达到显著水平,那么就可以说血型与性格之间相关,不相互独立。

卡方独立性检验的零假设是各因素之间相互独立。因此理论次数的计算也是基于这一假设,具体计算时,采用列联表的方式,后面将举例说明。

例1:某校对学生课外活动内容进行调查,结果整理成下表,表中彩色格子里的数是原始数据的汇总数,括号内的数是理论次数(是按下面将要介绍的原理计算得来的),此外的是原始数据。

性别

(因素2)

课外活动内容(因素1)

小计和(fx)

体育

文娱

阅读

男生

21(15.3)

11(10.2)

23(29.5)

55

女生

6(11.7)

7(7.8)

29(22.5)

42

小计和(fy)

27

18

52

97

由于所有学生参加三项活动的比例是27:18:52,因此如果课外活动的选择与性别没有关

系的话,男女生参加这三项活动的比例也应是这同一比例,而男女各自的人数可以计算,所

以每格内的理论次数的计算方法如下:

男生中

参加体育活动的理论人数:55×27/97=15.3

参加文娱活动的理论人数:55×18/97=10.2

参加阅读活动的理论人数:55×52/97=29.5

女生中

参加体育活动的理论人数:42×27/97=11.7

参加文娱活动的理论人数:42×18/97=

7.8

参加阅读活动的理论人数:42×52/97=22.5

我们将行列的小计和分别用fx 和 fy 来表示,总人数用 N 来表示时,上述计算理论

次数的方法可以表示为: feij =

fxi× fyj/N

所以,卡方独立性检验的公式可以表示如下,其中最后一个式子比较便于计算,fxy

示每格的原始数据。

x2=∑(fo-fe)2/fe=∑(fxy-fxfy/N)2/(fxfy/N)=

N(∑∑fxy2/fxfy-1)

由于在计算理论次数时,用了按每个因素分类的小计和(fx 和 fy,其个数分别记为R

个和 C 个),和总和 N ,而总和又可由按每个因素分类的小计和计算得来,因此若从总

分类个数R×C中减去

R+C,则将总和重复减去了,因此要补

1 个自由度回来,所以最终

独立性检验的自由度表示为:

df=R*C-R-C+1=(R-1)(N-1)

上述例题最终计算得:

X2=(21-15.3)2/15.3+……+(29-22.5)2/22.5=8.355

df = (3-1)(2-1) = 2,而χ20.05(2)

= 5.99,所以在0.05的显著性水平下,拒绝零假设,即可

以认为性别与课外活动内容有关联,或者说男女生在选择课外活动上存在显著的差异。

ps:

现在理解了卡方怎么用,但是他是怎么跟卡方分布联系起来的呢??

参考资料:

http://www.chinaz.com/web/2011/0728/202092.shtml

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/360117.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【OAuth】快速入门

一、引言 1、什么是OAuth2.0&#xff1f; OAuth 2.0是一个关于授权的开放网络协议&#xff0c;允许用户授权第三方应用访问其在服务提供商上存储的资源&#xff08;如照片、视频、联系人列表&#xff09;&#xff0c;而无需将用户名和密码提供给第三方应用。OAuth 2.0在第三方应…

脚本解决.NET MVC按钮重复提交问题

见于&#xff1a;Avoiding Duplicate form submission in Asp.net MVC by clicking submit twice 脚本代码&#xff1a; $(document).on(invalid-form.validate, form, function () {var button $(this).find(input[type"submit"]);setTimeout(function () {button.…

== 与 === 介绍与区别

操作符&#xff1a; 要是两个值类型不同&#xff0c;返回false 要是两个值都是number类型&#xff0c;并且数值相同&#xff0c;返回true 要是两个值都是stirng&#xff0c;并且两个值的String内容相同&#xff0c;返回true 要是两个值都是true或者都是false&#xff0c;返回tr…

jert oracle 统计说明,Oracle JET简单入门(一)Oracle JET介绍

Oracle JET (Oracle Javascript Extension Toolkit)是一款 Oracle 的 JavaScript 拓展工具包。简单来说 Oracle JET 是一个一堆好用的前端工具结合体。Oracle JET 文档链接 http://docs.oracle.com/middleware/jet310/jet/developer/toc.htmOracle JET支持 Model-View-ViewMod…

Why you have so few friends?

Why you have so few friends?十个原因告诉你&#xff1a;为什么你的朋友那么少1. You Complain A Lot 你总是抱怨 If you’re constantly complaining about your job, lack of money, or unfair life, people won’t care to spend a lot of time with you. Complaining g…

查看oracle自动优化,使用索引查询更快,优化器为何不能自动识别

本帖最后由 〇〇 于 2015-12-24 12:17 编辑有如下查询&#xff0c;不加hint时&#xff0c;优化器自己选择的执行计划是走全表扫描&#xff0c;花费时间很长&#xff0c;但加hint强制让大表走skip index时间很短&#xff0c;根据传统的理解&#xff0c;引导列上重复出现的值越少…

javascript: 数组

var a[1,2,3] >a[0] 1 >a[1] 2 >a[2] 3 >a[3] undefined >a[-1] undefined for循环遍历每个元素 for(var key in a){console.log(a[key]);} 1 2 3 数组对象对应的方法(method) >a.length//数组元素个数 3>a.push(4)//在数组最后追加元素4>a[1, 2, 3, 4…

SELECT语句使用JDBC和Hibernate批量获取

介绍 现在&#xff0c;我已经介绍了Hibernate对INSERT &#xff0c; UPDATE和DELETE语句的批处理支持&#xff0c;是时候分析SELECT语句结果集的批量提取了。 JDBC ResultSet提供了一个客户端代理游标&#xff0c;用于获取当前语句的返回数据。 执行该语句后&#xff0c;必须将…

linux 更改父进程名称,[Linux进程]在父进程和子进程中分别修改变量

/*这是一个调用fork函数创建一个子进程&#xff0c;然后分别打印输出子进程和父进程中的变量的实例*/#include #include #include #include int glob 6; //外部变量int main(void){int var; //内部变量pid_t pid; //文件标识符var 88;//内部变量printf("…

Spring环境的搭建与测试 (spring2.5.6)

这里是采用的视频里面的spring版本 下载spring2.5.6&#xff0c; 然后进行解压缩&#xff0c;在解压目录中找到下面jar文件&#xff0c;拷贝到类路径下 dist\spring.jar lib\jakarta-commons\commons-logging.jar 上边两个是基本的jar包。。 如果使用了切面编程(AOP),还需要下列…

linux 多核 系统时钟,Linux中的时间

1. Linux中time相关概念1.1 real time指的是实际流逝的时间&#xff0c;又称为Wall Clock Time(墙上时间)。比如&#xff0c;time命令统计出的real time指的是该进程从开始运行到运行结束所消耗的时间。在这段时间内不仅仅执行了该进程&#xff0c;其他进程的时间片也得到了轮转…

经纬度 在线计算距离

http://www.storyday.com/wp-content/uploads/2008/09/latlung_dis.html 转载于:https://www.cnblogs.com/sgdkg/p/3558112.html

如何使用Hibernate批处理INSERT和UPDATE语句

介绍 JDBC长期以来一直为DML语句批处理提供支持。 默认情况下&#xff0c;所有语句都一个接一个地发送&#xff0c;每个语句都在单独的网络往返中发送。 批处理使我们能够一次性发送多个语句&#xff0c;从而节省了不必要的套接字流刷新。 Hibernate将数据库语句隐藏在事务后写…

【ASP.NET Web API教程】5.4 ASP.NET Web API批处理器

【ASP.NET Web API教程】5.4 ASP.NET Web API批处理器 原文:【ASP.NET Web API教程】5.4 ASP.NET Web API批处理器注&#xff1a;本文是【ASP.NET Web API系列教程】的一部分&#xff0c;如果您是第一次看本系列教程&#xff0c;请先看前面的内容。 Batching Handler for ASP.N…

linux 查看系统组账号密码是什么,Linux 用户与组管理详解(system-config-users 命令行)...

用户与组管理用户相关文件组账号相关文件用户和组管理软件&#xff1a;基于命令行的用户和组管理创建用户查看用户信息删除用户修改用户信息为用户创建密码更改用户密码信息创建组删除组查看当前登录到系统的用户用户与组管理什么是用户&#xff0c;用户是人吗&#xff1f;用户…

C++中指针和引用的选择

何时使用引用和指针1. 尽可能使用引用传递参数2. 尽可能的使用const来保护引用和指针3. 在可以使用引用的时候不要使用指针4. 不要试图给引用重新赋值&#xff0c;使之指向另一个变量&#xff0c;这是不可能的&#xff08;因为引用是变量的别名&#xff0c;和变量是统一的&…

linux 7 没有权限访问,[CentOS 7系列]文件或目录的权限与属性

在开始今天的话题之前&#xff0c;我们首先来回顾下ls命令。在ls命令中参数“-l”会显示出来目标的详细信息&#xff0c;如下所示&#xff1a;[rootserver02~]#ls-l/tmp/总用量4-rwx------.1rootroot8365月2706:19ks-script-ogzDFAdrwxr-xr-x.5rootroot755月3005:26testdrwxr-x…

POJ 2386 Lake Counting DFS水水

http://poj.org/problem?id2386 题目大意&#xff1a; 有一个大小为N*M的园子&#xff0c;雨后积起了水。八连通的积水被认为是连接在一起的。请求出院子里共有多少水洼&#xff1f; 思路&#xff1a; 水题~直接DFS&#xff0c;DFS过程把途中表示水洼的W改为‘.&#xff0c;看…

linux没有root密码xshell,LINUX终端免密登陆(以Xshell为例)

1&#xff0c;工具-新建用户密钥生成向导linux2&#xff0c;密钥类型选择&#xff1a;RSA&#xff0c;而后下一步shell3&#xff0c;输入密钥名称和密码ssh4&#xff0c;公钥格式为SSH-OpenSSH,保存为文件(后缀为pub)(记录此文件目录)工具二&#xff0c;登陆在须要免密登陆的主…

ActionBar之style出现Cannot resolve symbol 'Theme' 错误

今天 2014/03/08 00:49 刚刚升级 android studio 到了 0.5.0 版本&#xff0c;修复了许多 bug&#xff0c;包含当前这个问题&#xff0c;之前一直困扰我很久&#xff0c;莫名奇妙的提示主题样式找不到&#xff0c;无法解析&#xff0c; 后来一直谷歌发现很多人都认为是 IDE 的b…