教育统计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二节积差相关

研究两种现象,两种行为或两个事物,一句话,研究两个变量之间的相关情况时,积差相关是应用最普遍、最基本的一种相关分析方法,尤其适合于对两个连续变量之间的相关情况进行定量分析。

一、积差相关概念及基本公式

英国著名统计学家皮尔逊(K Pearson)跟随英国著名科学家高尔顿(F Galton)在合作研究有关人类身高遗传问题的过程中,提出了“回归”的概念以及积差相关分析方法。

对于两个连续的变量(比率变量或等距变量),例如父辈的身高变量和子辈的身高变量之间有什么连带关系;学生的体重与身高变量之间有什么连带关系;不同学科成绩之间有什么样的相互关联;人的智力发展水平同学业成就之间相关程度如何等等,通过观测研究,可以用积差相关分析的方法,定量地描述两个变量之间的相关强度与方向。

设有两个变量X和Y ,其n个观测点的成对数据不妨记为

。基于这些成对的观测数据,我们可以计算成对的观测数据离差均值,即有:

式中:

基于上述观测数据离差值乘积所得结果进行相关分析的方法,称为积差相关。计算积差相关系数的基本公式是:

式中:表示双变量(X,Y)数据之间的积差相关系数;

是各对观测数据的离差值乘积之和;

是变量X观测数据离差值自乘积之和,即离差平方和;同理可知,是变量Y的离差平方和。

因此,积差相关系数基本公式(4-1)也可以用下式表达:

二、积差相关系数计算方法

积差相关系数基本公式(4-1)和公式(4-2)结构对称,容易掌握,但在具体计算时,其计算量却不少,需要分步计算,最后综合。主要步骤归纳起来是:

(1)计算平均和;

(2)计算离差值和;

(3)计算各对离差值乘积以及乘积之和;

(4)计算数据的离差平方和,即;

(5)计算数据的离差平方和,即;

(6)把上述有关结果代入公式(4-1)或公式(4-2),求出。

为了有条不紊地计算相关系数,通常采用列表的方式逐个计算,这也便于检查是否计算出错以及错在何处。设计的表格一般要有7个栏目,分别记录有关数据,而在表格的最后一行进行总计。下面举一例子,说明积差相关系数的基本计算方法。

[例1] 随机观测15名高一学生在语文推理测验X和数字推理测验Y上的成绩(两个测验的满分均为70分),其结果如表4-1中第1、第2栏所示,试求该两个测验分数之间

的积差相关系数。

[分析计算] 根据公式(4-1)及上述归纳步骤进行表上操作。

第一,准备一个表格如表4-1,共7个栏目,从左到右依次登载有关数据

和。

第二,在表4-1最底端空出一行,用以登载有关数据连加和的结果,从左到右依次是

第三,从已知的15对观测数据出发,根据公式(4-1)的结构,先计算出和 ,

和,并把这4个数据登记在最后一行所对应的总计格子里。

第四,按表4-1结构内容,从左到右,逐个栏目地完成有关计算,最终得到需要的数据,依次是

第五,在表格外面,把第四步得到的三个数据代入公式(4-1)或公式(4-2),计算出积差相关系数。

一般说来,上述各步计算都可借助计算器来进行。

表4-1 计算积差相关系数表格法示例1

从表4-1中的计算数据可知:

=2495.60;=6072.9335;=2875.600

因此,这15名高一学生在语言推理测验X和数字推理测验Y上的测验分数积差相关系数是:

可见,这两个推理测验分数之间有较高的正相关。

三、利用原始数据直接计算积差相关系数

如同第二章介绍标准差S的计算有两种方法一样,除了根据基本公式计算外,还可以不通过计算平均数及离差值而直接利用原始数据计算积差相关系数。

事实上,从公式(4-1)或公式(4-2)出发,通过一系列代数演算与化简,就可得到积差相关系数据的另一种计算公式,如下:

公式(4-3)是利用原始数据和,直接计算积差相关系数的公式。

式中:是成对观测数据的乘积之和;是X变量观测数据之和;是Y 变量观测数据之和;是两组数据各自求和之后的乘积;是X变量观测数据平方后的连加和;是Y变量观测数据平方后的连加和。

下面以一个例子来说明这种方法的计算。

[例2] 假定10名小学生的期末语文考试成绩和数学考试成绩如表4-2中的第2栏和第3栏中的数据所示,试求语文成绩和数学成绩之间的相关系数。

[分析计算] 我们通常把学生的考试成绩看成是连续变量,只不过实际观测分数大多是取整数。因此,这是需要计算积差相关系数。类似上例的计算方法,可以把整个计算过程归纳成如下几个有序的步骤:

(1)可设计一个表格共6个或5个栏目,从左到右依次登记学生编号(或数据编号),

, 和。

(2)把成对的观测数据(),(),…,()分别登记在第2栏和第3栏中。本例共有10对观测数据,即n=10。

(3)把表4-2的最后一行留出足够的空格,以记录各栏目数据的连加和数。

(4)先计算,把结果分别写在表4-2第2栏和第3栏的最后总计格子里。

(5)逐个计算原始数据,和,依次登记在相尖的空格位置上。为了避免计算上的疏忽,最好是按竖的方向,一个栏目一个栏目地计算。

(6)计算连加和数据:并把它们登记在表4-2第4栏、第5栏及第6栏最底端的总计格子里。

就本例表4-2中的计算结果可知:

n=10;=756;=837;=57352;=70245;=63369 把上述数据代入公式(4-3)可得:

表4-2 计算积差相关系数表格法示例2

63369 =

=

可见,从这10个学生的语文考试成绩和数学考试成绩得到的积差相关系数r=0.48来看,这两个科目成绩之间存在着中等程度的正相关。

值得指出的是,相关系数的观测值r跟抽样数据的容量有关。观测数据越多,其相关系数r值就越稳定,因而,真实性也相对越大。若抽样数据容量较小,计算相关系数r 值的抽样误差也越大。因此,解释相关系数时要考虑上述这些因素。若想要有较大的信心去认识相关系数的真实性,就要采用推断统计的方法,对观测得到的相关系数进行必要的统计检验。这些内容将在本书第十章有关章节内容中加以介绍。

第三章参数估计及性质

§3.1 参数估计的提出

相关文档
最新文档