第十章-统计分析方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章统计分析方法
统计分析方法,作为一种科学的研究方法,在课题数据的收集、整理和分析等方面起着重要的作用,正越来越为众多研究者所采用。
鉴于统计分析思想较为复杂,具体的统计分析方法名目繁多,难以概全,本章旨在删繁就简,着眼实用,介绍最基本的统计思想及统计方法。
第一节统计分析方法概述
一、统计分析的内涵
统计,顾名思义即将信息统括起来进行计算的意思,它是对数据进行定量处理的理论与技术。
统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。
凡资料是以数据形式呈现,需要与数字打交道的,统计分析便必不可少。
统计分析方法常与实验、观察、测量、调查所得结果相联系,为研究作出正确的结论提供科学的途径和方法,是研究者从事科学研究的必备工具之一。
二、统计分析方法的特征
采用统计分析方法进行教育研究,是研究达到高水平的客观要求,应用统计分析方法进行科学研究,有以下几个基本特征:
1.科学性
统计分析方法以数学为基础,具有严密的结构,需要遵循特定的程序和规范,从确立选题、提出假设、进行抽样、具体实施,一直到分析解释数据,得出结论,都须符合一定的逻辑和标准。
2.直观性
现实世界是复杂多样的,其本质和规律难以直接把握,统计分析方法从现实情境中收集数据,通过分数、次序、频数等直观、浅显的量化数字及简明的图表表现出来,这些数据的处理,将我们的研究与客观世界紧密相连,从而提示和洞悉现实世界的本质及其规律。
3.可重复性
可重复性是衡量研究质量与水平高低的一个客观尺度,用统计分析方法进行的研究皆是可重复的。
从课题的选取、抽样的设计,到数据的收集与处理,皆可在相同的条件下进行重复,并能对研究所得的结果进行验证。
三、统计分析方法的局限
统计分析方法有其自身的优势与局限,正确认识其优势和局限,二者同样重要。
统计分析方法的局限,归结起来,主要有下列几点:
1.现实生活极其复杂,诸多因素常常纠缠交错在一起,仅靠统计分析方法去控制和解释这些因素及其相互关系,是不全面、不深刻的。
2.统计分析方法的运用是有条件的,它依赖于数据资料本身的性质、统计方法的适用程度和研究者对统计原理及统计技术的理解、掌握程度与应用水平。
方法选择不当,往往易得出错误的结论。
3.统计决断以概率为基础,既然是概率,就存在误差,因而可以说,统计决断的结论并非绝对正确。
例如,从样本统计量推断总体参数的信息时,由于我们的推断建立在一定的概率基础上,我们没有百分之百的把握认为推断是正确的;当我们在0.95概率基础上比较两个总体平均数是否相等并认为它们之间存在或不存在显著差异时,从可靠度上看,我们决断错误的可能性尚有5%。
四、统计分析方法的主要内容
统计分析方法,按不同的分类标志,可划分为不同的类别,而常用的分类标准是功能标准,依此标准进行划分,统计分析可分为描述统计和推断统计。
1.描述统计
描述统计是将教育研究中所得的数据加以整理、归类、简化或绘制成图表,以此描述和归纳数据的特征及变量之间的关系的一种最基本的统计方法。
描述统计主要涉及数据的集中
σ)、相关系数(r)等。
趋势、离散程度和相关强度,最常用的指标有平均数(X)、标准差(
X
2.推断统计
推断统计指用概率形式来决断数据之间是否存在某种关系及用样本统计值来推测总体特征的一种重要的统计方法。
推断统计包括总体参数估计和假设检验,最常用的方法有Z χ检验等。
检验、t检验、2
描述统计和推断统计二者彼此联系,相辅相成,描述统计是推断统计的基础,推断统计是描述统计的升华。
具体研究中,是采用描述统计还是推断统计,应视具体的研究目的而定,如研究的目的是要描述数据的特征,则需描述统计;若还需对多组数据进行比较或需以样本信息来推断总体的情况,则需用推断统计。
例如,我们在某幼儿园大班开展一项识字教改实验,期末进行一次测试,并对测试所得数据进行统计分析。
如果我们只需了解该班儿童识字的成绩(平均数及标准差)及其分布,此时,应采用描述统计方法;若我们还需进一步了解该实验班与另一对照班(未进行教改实验)儿童的识字成绩有无差异,从而判断教改实验是否有效时,我们除了要对两个班的成绩进行描述统计之外,还需采用推断统计方法。
五、统计分析的基本步骤
统计分析,大致可分为如下三个步骤:
1.收集数据
收集数据是进行统计分析的前提和基础。
收集数据的途径众多,可通过实验、观察、测量、调查等获得直接资料,也可通过文献检索、阅读等来获得间接资料。
收集数据的过程中除了要注意资料的真实性和可靠性外,还要特别注意区分两类不同性质的资料:一是连续数据,也叫计量资料,指通过实际测量得到的数据,如对儿童身高、体重测量所得的数值,或在考试测验中所得的分数等;二是间断数据,也叫计数资料,指通过对事物类别、等级等属性点计所得的数据,如儿童男女的人数,学习成绩在优、良、中、及格、不及格各个等级中的人数等。
2.整理数据
整理数据就是按一定的标准对收集到的数据进行归类汇总的过程。
由于收集到的数据大多是无序的、零散的、不系统的,在进入统计运算之前,需要按照研究的目的和要求对数据进行核实,剔除其中不真实的部分,再分组汇总或列表,从而使原始资料简单化、形象化、系统化,并能初步反映数据的分布特征。
3.分析数据
分析数据指在整理数据的基础上,通过统计运算,得出结论的过程,它是统计分析的核心和关键。
数据分析通常可分为两个层次:第一个层次是用描述统计的方法计算出反映数据集中趋势、离散程度和相关强度的具有外在代表性的指标;第二个层次是在描述统计基础上,用推断统计的方法对数据进行处理,以样本信息推断总体情况,并分析和推测总体的特征和规律。
第二节统计表与统计图
数据收集完成之后,就要进入数据整理阶段,此时常用统计表与统计图。
一、统计表
与数据的类型(间断型与连续型)相对应,统计表包括频数表(或频数百分比表,频数累积百分比表)和频数分布表(或累积频数分布表)。
1.频数表
频数表(或频数百分比表,频数累积百分比表)指反映间断型变量各类型频数(或频数百分比,频数累积百分比)的统计表。
例如,幼儿园某班有20名幼儿,其中男幼儿18名,女幼儿2名,则该班幼儿男女生情况统计表为:
表10-1 幼儿园某班男女幼儿人数统计表
2.频数分布表
频数分布表(或累积频数分布表)指反映连续型变量各组数据频数(或累积频数)分布的统计表。
其制作方法是先将数据从小至大顺序排列并按—定间距进行分组,然后分别计算各组的频数(或累积频数)并列成表格。
例如,幼儿园某班幼儿30名,其中男幼儿12名,女幼儿18名,30名小朋友的智商分别为:
97 90 98 102 104 102 105 102 100 113 115 112 113 112 115
114 116 114 112 115 118 124 123 123 125 126 128 130 132 131
从上述数据可看出,该班小朋友的智商最低为90,最高为132,以10为间距将其分成
5组,制定分布表为:
二、统计图
与间断型和连续型数据相对应,统计图主要包括直条图、直方图等。
l.直条图
直条图是用来描述间断变量频数的统计图。
变量的频数用直条的长度来表示。
对上例,该班小朋友的性别用直条图表示如图10—1所示。
复印书中图9-1
2.直方图
直方图是用来描述连续变量频数分布的统计图。
用直方图描述连续变量的频数分布,其方法为先对变量取值进行分组,并计算各组的频数,然后用直方条的面积来表示各组的频数。
对上例,该班小朋友智商(IQ)分布用直方图表示为如图10—2所示。
图10—2 幼儿园某班30名幼儿智商分布直方图
第三节 描述统计
在教育研究过程中,在收集了大量的观测数据后,首先应对数据的特征进行描述。
描述数据,常用的统计量有平均数、标准差、标准分数、相关系数等。
一、平均数
平均数是用来描述数据分布集中趋势的一个统计量,常用符号X 来表示,它是一组观测值的总和除以该数目所得的商来计算,定义公式为:
n
X X ∑=
式中,X 代表平均数
∑表示累加求和 X 表示具体的观察值 n 表示观察值个数
例如:某幼儿园50名幼儿珠心算测试成绩总分为4010,则该班平均分应为:
20.8050
4010
==
=
∑n
X X
二、方差和标准差
方差和标准差描述一组数据的差异情况和离散程度的统计量。
方差或标准差越小,表明数据的离散程度越小,数据分布越集中整齐;反之,方差或标准差越大,表明数据离散程度越大,数据分布越参差不齐。
方差指观测值与平均数差异平方和的算术平均数,常用符号X
2σ来表示,其计算:公
式为:
()2
22
2⎪⎭
⎫
⎝⎛∑-∑=-=
∑n X n X n
X X X
σ
式中,X
2σ
代表方差
X 代表平均数
∑表示累加求和
X ,X 2分别表示原始数据及其平方 n 表示观察值个数
标准差等于方差的算术平方根,常用符号X σ来表示,其计算公式为:
X σ=
()
n
X X ∑-2
式中,X σ代表标准差
如,数据80、90、50、60、70, 其平均数705
70
60509080=++++=
X
方差2005
)7070()7060()7050()7090()7080(222222
=-+-+-+-+-=X
σ
标准差14.14200==
X σ。
标准差在计算数据时,我们常使用到计算机或计算器,现以计算器(型号为CASIO fx-82MS, fx-270MS ,fx-83MS ,fx-85MS ,fx-300MS ,fx-350MS ,)为例说明平均数与标准差的计算步骤:
1、清零(清除计算器里以往存贮的数据):Shift CLR 1 =
2、设置“SD ”统计模式(单变量统计模式) : MODE 2
3
4(原始数据平方和
∑2
X
) 结果为
∑=255002
X
(原始数据之和
∑X ) 结果为∑=350X
(容量n) 结果为
n=5
(平均数X ) 结果为70=X
(标准差X σ) 结果为X σ=14.14 将标准差X σ平方后 (方差X
2σ
) 结果为X
2σ
=200
三、标准分数
我们知道,对单组数据的大小进行比较,可直接比较观察值(原始分数)的大小;然而,要比较两组(或多组)数据的大小,由于各自的平均数和标准差有所不同,仅从原始分数中我们很难得出科学结论。
如,已知某次期末考试全班数学和物理的平均分分别为65和80,标准差分别为5和10,某生数学得了70分,物理得了75分,问这两个分数孰高孰低?从原始分数角度看,数学70比物理75低,然而,由于两科考试的内容及难度不一,各自的平均分及标准差有所不同,同一分数在不同的科目中所具有的价值及表示的意义也就不一样,数学70在班级中属较高水平,而物理75在班级中的水平为中下,这说明该生数学成绩比物理成绩要好。
为解决不同数组的比较问题,我们引入另一分数——标准分数。
标准分数又称Z 分数,是以标准差为单位来表示原始分在一组数据中所处相对位置的统计量。
Z 分数的大小由观测值与平均数之差除以标准差来表示,其计算公式为:
x
X
X Z σ-=
式中,Z 代表标准分数
X 、X σ分别代表平均数、标准差
例如:甲乙两幼儿在语言、常识、计算测试中的成绩见下表,试分析谁的总成绩较好。
表10—3 甲乙两幼儿语言、常识、计算测试成绩比较表
从上表可看出:虽然幼儿乙的原始分数高于幼儿甲,但是通过和样本比较,将不可比的原始分数转换成标准分数,幼儿甲平均标准分是0.6167,幼儿乙平均标准分是0.4167,幼儿甲三科成绩标准分之和比幼儿乙高,说明幼儿甲的总成绩比幼儿乙好。
四、相关系数
相关指变量之间的相互关系和联系程度,其大小常用相关系数来表示。
相关系数取值介于-1.00~1.00之间,其值的正负及大小反映了变量之间变化的方向和关系的紧密程度。
按相关系数的正负符号来分,相关分为正相关、负相关和零相关。
正相关表示一变量发生变化时,另一变量也发生同方向的变化。
如身高与体重的关系是正相关,对幼儿来说,身高增加,体重也随之增加;又如练习量与效果的关系也是正相关,幼儿跳绳、拍球的练习量增加了,在跳绳、拍球活动中的得分随之提高。
负相关表示—个变量发生变化时,另一变量发生反方向的变化。
如幼儿身体健康水平与缺勤率的关系是负相关,身体越健康,缺勤率越低,反之,身体状况越差,缺勤率也就越高;又如练习量与错误率的关系也是负相关,幼儿练习量越多,其错误率也就越低。
零相关表示变量之间线性关系上相互独立,彼此没有关系,一变量变化并不一定引起另一变量的相应变化。
如身高与学业成绩的关系是零相关,幼儿身体越高,其学业成绩未必就越好或越差;又如幼儿的性格与其胖瘦的关系也属零相关。
外向的幼儿,可能较胖,也可能较瘦,内向的幼儿,也可能胖,也可能瘦。
相关系数绝对值的大小表示变量关系的密切程度,绝对值越接近l ,表示两变量的关系越密切;绝对值越接近于0,表示两变量的关系越疏远。
按绝对值的大小,相关可分为高度相关、中度相关和低度相关。
绝对值在0.7及以上的,称为高度相关;在0.3~0.7之间的,称为中度相关;0.3以下的,称为低度相关。
计算相关系数的方法很多,对于不同的数据类型,应采用不同的相关计算方法。
在教育研究中,最常用的相关是积差相关。
当两个变量是连续的、成对的且变量的总体接近正态分布时,变量的关系常用积差相关来表示,其符号为r ,计算公式为:
()()()()
∑∑∑∑∑∑∑---=
n
Y Y n X X n Y X XY r 2
2
2
2
,
式中,r 表示积差相关系数 ∑表示累加求和
XY 表示X 与Y 的积
X 和Y 分别表示变量X 和变量Y 的平均数
x σ和y σ分别表示变量X 和变量Y 的标准差
n 表示变量X 和变量y 的成对数目
例如,10名5岁幼儿在语言x 和常识y 上的得分如下表第2、3列所示,求两者的相关程度。
表10—4 10名5岁幼儿语言与常识的成绩表
从上表可求出,语言与常识的积差相关系数r
90.010
/8647492010/83870440
10/864838727612
2
=--⨯-=
r ,
两者存在高相关。
除此之外,我们也可用计算机或计算器,现以计算器(CASIO fx-82MS ,fx-270MS fx-83MS ,fx-85MS ,fx-300MS ,fx-350MS )为例说明相关系数的计算步骤:
1.设置统计模式
(出现“REG ”可以计算相关系数)
2.清零(清除计算器里以往存贮的数据)
3.输人数据
88
87 85
84
81 76 85 94 92 92 4、r 计算统计值
得r 相关系数 r=0.90
在计算积差相关的过程中,研究者首先要注意其使用条件: 1、连续性数据——两列变量都是由测量获得的连续变量。
2、呈正态分布——两列变量的总体呈正态分布,或接近正态分布,至少是单峰对称分布。
3、数据必须成对,数据与数据间独立。
4、呈线性关系。
5、要排除共变因素的影响。
6、样本容量要大于等于30。
在使用相关过程中,研究者需要明确如下三点:
①相关系数表示两个变量之间的关系程度,当两变量相关时,只表明二者之间存在某种联系,但并不说明二者之间必然存在因果关系。
例如儿童的语言与计算有相关,这不能说明语言的好坏是导致计算好坏的原因,或计算的好坏是导致语言好坏的原因,二者相关完全有可能是第三因素影响所致,如可能是儿童智力水平的影响。
②相关系数是用来衡量变量之间相关程度大小的统计量,它不代表一变量对另一变量直接作用的比例。
如要用相关系数来解释一变量对另一变量影响的百分比,需要用决定系数(决定系数等于相关系数的平方)这一指标。
如,知道幼儿语言与常识的相关系数为0.80,不能认为常识的差异有80%是由语言的差异引起,而只能说:常识的差异有64%(=0.802)可由语言的差异来解释。
③运用公式计算得到的积差相关系数是样本相关系数,至于总体相关系数是否相关,显著性如何,必须经过统计假设检验才能正式确定。
(统计假设检验部分专门介绍)
第四节推断统计
推断统计是在描述统计的基础上,在一定可靠性水平上,根据样本的统计量对总体参数进行推断的统计方法。
在教育研究中,涉及的总体包含的个体数目较大,我们不可能对所有个体逐一进行考察,而通常依照某种抽样思想从总体中随机抽取一定数目的样本进行研究,然后根据样本的信息推断总体的情况,这样的统计方法叫做推断统计。
假设检验是常用的推断统计方法,它指研究者利用样本信息,根据一定的概率,对总体参数或分布的某一假设进行拒绝或保留的决断。
假设检验包括参数检验与非参数检验。
平均数差异显著性检验是常见的参数检验;卡方 )检验是常见的非参数检验。
(2
在进行平均数差异显著性检验时,我们首先应对样本两个方面的信息进行考查:
1.样本的性质,看两样本是相关样本还是独立样本;
相关样本包括两种情况:(1)同一组被试在某项测验前测与后测中所获得的两组测验结果;(2)根据一定条件,将被试一一配对,分别编入实验组与对照组,并对两组被试实施不同的实验处理之后,用同一测验所获得的测验结果。
2.样本的容量(样本中个体的数目),看样本是大样本还是小样本。
在统计上,我们常将两样本容量皆大于30(即n1>30且n2>30)的样本称为大样本;如两样本中有一样本的容量小于或等于30(即n1≤30或n2≤30),我们称这样的样本为小样本。
对两平均数差异进行显著性检验,对于不同的样本性质和样本容量,我们所采用的检验方法也不尽相同。
—、相关样本平均数差异显著性检验
1、同一组情况
中教育研究中,我们常会遇到同一组情况。
如,要检验某种新教学方法的有效性,我们采用“单组前测——后测”实验方法,在未实施该教学方法之前先对某群体进行测试(前测),然后采用新的教学方法,经过—段时间,对同样的群体再进行一次测试(后测),并比较两次测试的结果,若后测结果明显好于前测结果,则认为该方法有效;否则,认为该方法无效。
例如,要检验集中训练法对幼儿识字能力的影响,我们随机抽取15名幼儿作为研究对象。
在训练前后分别进行一次测试,结果如表10—5中第2、3列所示,问集中训练法是否有效?
表10—5 10名幼儿在接受集中训练法前后的识字成绩
问:男女成绩有无差异?
检验步骤及方法为:
①提出假设: 211210:,:μμμμ≠=H H
H 0表示零假设,指假设总体与真实总体无差异的假设。
此例中,这一零假设是假设幼儿训练前识字成绩的总体平均数与训练后识字成绩的总体平均数相等;
H l 表示备择假设,指假设总体与真实总体有差异的假设。
此例中,这一备择假设是假设幼儿训练前识字成绩的总体平均数与训练后识字成绩的总体平均数不相等。
②选择检验统计量并计算其值 对于小样本,由于总体标准差未知,两样本平均数之差与两相应总体平均数之差的离差统计量呈t 分布,因而用t 作为检验统计量。
1
2212
2
1
2
2
1--+-=
n r X X t x x x x σσσ
σ
其中,1X ,2X 分别表示两样本的平均数。
本例中分别表示训练前与训练后的识字平均成绩;
式中,1x σ,2x σ分别表示两样本的标准差。
本例中分别表示训练前与训练后识字成绩
的标准差;
r 表示相关系数。
本例中表示训练前后识字成绩的相关系数; n 表示样本个数。
本例中为10。
计算表10-5中数据,得1X =74.90、2X =81.20,1x σ=5.63、2x σ=6.06、r=0.82,将其代入上式,得:
35.51
1006
.663.582.0206.663.520
.8190.741
22
2
212
2
1
2
2
1-=-⨯⨯⨯-+-=
--+-=
n r X X t x x x x σσσ
σ
③确定检验形式
检验形式有双侧检验和单侧检验两种形式。
当有资料表明两总体平均数存在差异时用单侧检验;当无资料表明两总体平均数是否存在差异时,用双侧检验。
对于该例,由于没有资料说明集中训练前后幼儿的识字水平,孰高孰低,于是采用双侧检验形式。
④统计决断
进行统计决断,需要遵循一定的规则。
下面是t 检验的统计决断规则:
表10—6 t 检验统计决断的规则
根据自由度df=n-1=10-1=9,查t 值表(附表1),表中,df 表示自由度,P (2)代表双侧检验时的显著性水平,P(1)代表单侧检验时的显著性水平。
本例使用双侧检验,在0.01显著性水平上,自由度df 为9的临界值25.301.0)9(=t ,01.0)9(25.335.5t t =>=,则零假设出现的概率P<0.01,根据上表所示t 检验统计决断规则,在0.01显著性水平上拒绝零假设而保留备择假设,其结论为:集中训练前后幼儿的识字量间存在极显著性差异。
由于训练后的平均分高于训练前,说明训练有显著效果。
2.配对组情况
除了同—组,我们也常用到配对组。
例如,我们想知道,对幼儿进行常识教学,是采用计算机辅助教学法好呢,还是采用情境教学法好?
首先,我们选取100名幼儿,并根据智力、年龄等条件基本相同的原则,将其一一配对为50对,组成A 、B 两组;然后,对A 组施以计算机辅助教学,对B 组施以情境教学,—段时期之后,对两组幼儿进行常识测试,得到如下测试结果(见表10-7):
表10—7 A 、B 两组幼儿的常识测试结果
问:幼儿常识教学中,采用计算机辅助教学法和采用情境教学法之间有无显著差异? 检验步骤为: ①提出假设
211210:,:μμμμ≠=H H
Ho 表示零假设,本例中是说A 、B 两组幼儿常识的总体平均成绩相等; H1表示备择假设,本例中是说A 、B 两组幼儿常识的总体平均成绩不相等。
②选择检验统计量并计算其值 两总体标准差未知,两样本平均数之差与两相应总体平均数之差的离差统计量呈t 分布;而对于大样本,t 分布接近Z 分布,于是可用Z 作为检验统计量。
1
2212
2
1
2
2
1--+-=
n r X X Z x x X X σσσ
σ
式中,1X ,2X 分别表示两样本的平均数。
本例中分别表示A 、B 两组常识的平均成绩;
1X σ,2X σ分别表示两样本的标准差。
本例中分别表示A 、B 两组常识分数的标准差;
r 表示相关系数。
本例中表示A 、B 两组常识分数的相关系数; n 表示成对样本数目。
本例中为50。
将表9—7中数据代入上式,得:
94.01
5061
.1152.1082.0261.1152.1060
.7550.762
2
=-⨯⨯⨯-+-=
Z
③确定检验形式
由于没有资料说明计算机辅助教学法和情境教学法在幼儿常识教学中的效果谁好谁差,于是采用双侧检验。
④统计决断
本例中采用双侧Z 检验,其统计决断规则为:
表10—8 双侧Z 检验统计决断的规则
本例中,|Z|=0.94<1.96=Z 0.05,则P>0.05,根据上表所示双侧Z 检验统计决断规则,在0.05显著性水平上保留零假设而拒绝备择假设。
其结论为:A 、B 两组幼儿常识成绩无显著性差异,在幼儿常识教学中,采用计算机辅助教学法和采用情境教学法的效果一样。
二、独立样本平均数差异显著性检验
教育研究中,除了相关样本,还有独立样本。
要比较独立样本的平均数差异,需要使用独立样本平均数差异显著性检验。
1.独立大样本平均数差异显著性检验 例如,要比较中美两国幼儿的计算能力,我们从两个总体中分别随机抽取2000名和1500名幼儿,并对其计算能力进行测试,结果如下:
表10—9 中美幼儿计算能力测试结果
检验步骤为:
①提出假设:211210:,:μμμμ≠=H H
H 0表示零假设,本例中是说中美两国幼儿计算能力的总体平均成绩相等;
H 1表示备择假设,本例中是说中美两国幼儿计算能力的总体平均成绩不相等。
②选择检验统计量并计算其值
对于大样本,两样本平均数之差与两相应总体平均数之差的离差统计量接近正态分布,因而可用Z 作为检验统计量。
1
1
22
12
2
12
1
-+
--=
n n X X Z X
X
σσ
式中,1X 、2X 分别表示两样本的平均数。
本例中分别表示中、美两国幼儿计算能力的平均成绩;
1X σ、2X σ分别表示两样本的标准差。
本例中分别表示中、美两国幼儿计算能力的标
准差;
n 1、n 2分别表示两样本的个数。
本例中分别表示中、美两国幼儿的样本数目,分别为2000和1500。
将上表数据代入上式,得:
19.21
150070
.201200030.2290.7650.781
1
2
2
22
12
2
12
1
=-+
--=
-+
--=
n n X X Z X
X
σσ。