[内容导读]
本章的内容在课程中具有承上启下的重要作用。一方面,相关系数是反映与描述一组数据的概括性特征量数,只不过这里的数据是二元变量的观测数据。另一方面,对相关系数内容的理解与掌握,是建立在散点图、平均数、离差、标准差与方差等 内容的基础上的 。另外,相关分析的思想方法对于学习与研究后续章节有关教育测验理论或考试理论具有重要的作用。
本章重要的知识点有:相关系数的统计学意义与解释;积差相关系数计算方法、等级相关系数计算方法,点双列相关计算方法及结果解释。本章的难点是点双列相关系数的计算思想方法和结果的解释。本章公式较多,容易混淆,在学习本章内容时,不要死记硬背公式,应当在理解统计学相关概念及相关分析的思想方法基础上,通过阅读教材内容,系统掌握在不同情形下计算相关系数的方法。考虑到计算相关系数的计算工作量一般较多,因此,考生可更加关注本章内容中的具体例子,领会数据的特点及计算相关系数的再配合做适量的练习,以加深理解。
第一节 相关的统计学意义
一、对相关现象的感觉
教育工作者常发觉,许多教育现象之间或教育行为之间存在着一定的相互联系。例如,在学习行为上,隐隐约约地表现出这么一些特点:学生的数学成绩和物理成绩之间关系密切,似乎许多数学成绩优秀的学生在物理科目上的成绩大多也是优秀的,许多数学水平中等的学生在物理科目上的学习水平大多数也是中等的,许多数学成绩较差的学生物理科目上的学习成绩大多也是较差的。这说明数学成绩和物理成绩之间确定存在一种“ 水涨船高、水落船低 ”的互相关联的趋势。当然,并不是所有事物之间都有这么一种相同的明显的关联趋势。比如,数学成绩与语文成绩之间或语文成绩与化学成绩之间,其相互关联的趋势就不是那么明显可察。而另外一些教育现象,例如对学习材料的复习次数与遗忘量之间的关系,其遗忘量在一定范围内随着复习次数的增加而减小。可见,行为变量或现象之间存在着种种不同模式不同程度的联系。
二、相关的意义及相关系数的初步认识
直线性相关是所有关联模式中最简单的一种,有关联的两个变量各自以大体均等的速度变化着。若以平面坐标散点图来理解,直线性相关意指:两个变量的成对观测数据在平面直角坐标系上描点构成的散点图分布的教点会环绕在某一条直线附近。
统计学上用相关系数来定量描述两个变量之间的直线性相关的强度与方向。如果相互关联着的两变量,一个增大另一个也随之增大,一个减小另一个也随之减小,变化方向一致,就称两变量之间有正相关。如果相互关联着的两变量,一个增大另一个反而减小,变化方向相反,就称叫两变量之间有负相关。如果这种关联十分紧密,一个变量有了某种程度的变化,另一个也有十分类似程度的变化,那么就叫相关的强度大;否则,就叫相关的强度小。相关系数用r表示,r在-1和+1之间取值。相关系数r 的绝对值大小(即),表示两个变量之间的相关强度;相关系数r的正负号,表示相关的方向,分别是正相关和负相关;若相关系数r=0,称零线性相关,简称零相关;相关系数 =1时,表示两个变量是完全相关,这时,两个变量之间的关系成了确定性的函数关系,这种情况在行为科学与社会科学中是极少存在的。
一般说来,若观测数据的个数足够多的话,计算出来的相关系数r 就会更真实地反映客观事物之间的本来面目。通常是,当0.7<1,称为高相关;当0.4时,称为中等相关;当0.2时,称为低相关;当时,称极低相关或接近零相关。
三、由散点图认识相关情况
上面我们以经说过直线性相关去的含义,是以平面坐标散点图来理解,我们还可以从相关散点图的几何分布形态来认识相关的强度与方向,如果散点图形杂乱无章,没有显示出向某个方向延伸的情形,则说明相关程度很低;如果散点图分布形成一个边界不规则的椭圆,则说明两个变量存在中等程度的相关;若这里的椭圆越扁长,则相关程度越高。倘若散点图几乎形成一条直线,则说明相关系数接近1或-1。至于相关的方向,则可以通过散点椭圆图形的长轴所在直线的斜率来判断。从左下方往右上方延伸的情形是正相关;从左上方往右下方延伸的情形是负相关。这样,我们可以从散点图的分布情况,初步判断两个变量之间的相关情况。
由于事物之间联系的复杂性,在实际研究中,通过统计方法确定出来的相关系数r即使是高度相关, 我们在解释相关系数的时候,还要结合具体变量的性质特点和有关专业知识进行。两个高度相关的变量,它们之间可能具有明显的因果关系;也可能只具有部分因果关系;还可能没有直接的因果关系,其数量上的相互关联,只是它们共同受到其他第三个变量所支配的结果。除此之外,相关系数r接近零,这只是表示这两个变量不存在明显的直线性相关模式,但不能肯定地说这两个变量之间就没有规律性的联系。通过散点图我们有时会发现,两个变量之间存在明显的某种曲线性相关,但计算直线性相关系数时,其r值往往接近零。对于这一点,读者应该有所认识。
在统计学教科书中,除非特别说明,直线性相关一般情况下就称相关; 直线性相关系数就称相关系数。 相关系数的计算方法多种多样,本章主要学习积差相关、等级相关和点双列相关。这些相关分析方法在行为科学研究以及在教育与心理测量研究中有广泛的应用。