16考研复习心理统计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计:描述统计:统计图表:次数分布表、累加次数分布图、直方图、条形图。

集中量数:算术平均数、中数、众数。

差异量数:离差与平均差、方差与标准差、变异系数。

相对量数:百分位数、百分等级、标准分数。

相关量数:积差相关、等级相关、肯德尔等级相关、点二列相关、Φ相关。

推断统计:概率与概率分布:正态分布、二项分布、t 分布、F 分布、卡方分布。

参数估计:点估计、区间估计
假设检验:参数检验:t 检验、方差分析、回归分析 非参数检验:卡方检验等
一、量表的类型与数据的类型
二、各种分布形式及其特点
1.正态分布 Z 分数计算,11单选
当样本量足够大时,我们会发现生活中许多变量的分布都近似于正态曲线,因此有“上帝偏爱正态分布”一说。

正态分布是一种最常见、应用最广的连续随机变量的概率分布。

(1)特点
a 正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数实际上对应于同一个数值。

b 中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯。

拐点位于正负1个标准差处,曲线两端向靠近横轴处不断延伸,但始终不会与横轴向
数据类型 单样本问题 独立样本比较 相关样本比较 多组样本的比较
相关问题
独立样本 重复测量
等 距 型 总体正态分布 单样本t/z 检验 独立样本t/z 检验
相关样本t 检验 独立样本方差分析 重复测量方差分析 Pearson
积差相关 分布形态未知 大样本下的相应的t/z 检验 大样本下的相应的t/z 检验 大样本下的相应的t 检验
转化为顺序型 转化为顺序型 顺序型 符号检验法 曼-惠特尼 U 检验
维尔克松 T 检验
克-瓦氏单向 方差分析 弗里德曼
双向等级
方差分析
Spearman 等级相关 命名型
χ2
匹配度检验
χ2
独立性检验
符号检验法 χ2
独立性检验 Φ相关
交。

c正态曲线下面积为1,平均数的垂线将曲线下的面积分为相等的两部分。

面积可以视为概率,其值为每一横坐标值(X加减一定标准差)的随机变量出现的概率。

d正态分布是一族分布。

它随随机变量的平均数、标准差的大小与单位的不同而有不同的分布形态。

但任何一般的正态分布都可以转化为标准正态分布。

在标准正态分布中,μ=0,σ2=1。

在Z=0时,标准正态曲线达到最大值,Z=±1两点是曲线的拐点。

e各差异量数值相互间有固定比率。

f曲线下标准差与概率(面积)有一定数量关系。

平均数上下各延伸一个标准差,包括总面积的68.26%;在正负1.65个标准差之间包括总面积的90%;正负1.96个标准差之间包括总面积的95%;正负2.85个标准差之间,包括总面积的99%;在3标准差之间,包括总面积的99.74%;4个则是99.99%。

要判断一组数据是否正态分布,需要进行正态分布检验,具体方法有X2检验中的吻合度检验、皮尔逊偏态量数法、偏态峰态量数描述法等。

(2)应用
a化等级评定为测量数据。

具体步骤为:①根据各等级被评者的数目求各等级的人数比;
②求各等级比率值的中间值;③求各等级中点以上的累加比率;○4用累加比率查正态表求Z值,该Z分数就是各等级代表性的测量值;○5求被评者所得评定等级的测量数据的算术平均数,即为每个被评定者的综合评定分数。

b确定题目的难易。

原理是假设一个测验中不同难易题目的分布是正态的,即一个测验中通过较大和较小的题目很少,而通过率居中的题目较多。

具体步骤为:①计算各个题目的通过率;②用0.5减去通过率,不计正负号,获得正态分布表中的概率值;③依照p值查正态表中相应的Z值,通过率大于50%的Z值记为负值,通过率小于50%记正值;○4将查表得到的Z分数加5(假定正负5个标准差包括了全体),便可以得到从0至10的十进制的难度分数。

c在分组或等级评定时确定人数。

具体步骤为:①将6个标准差(假定正负3个标准差包括了全体)除以分组的或等级的数据,得到Z分数等距。

②查正态分布表,从Z求p,即各等级或各组在等距的情况下应有的比率。

③将比例乘以欲分组的人数,便得到各等级或分组应有的人数。

最后调整居中组人数,使各组人数总和与总数相等。

d 依据Z 分数求概率,即已知标准分数求面积。

e 从概率求Z 分数,即从面积求标准分数值。

f 已知概率或Z 值,求概率密度,即正态曲线的高。

2.二项分布
二项分布:对于一个事件有两种可能A 和B ,但我们对这一事件观察n 次,事件A 发生的总次数的概率分布就是二项分布。

(1)特点
二项分布是一种具有广泛用途的离散型随机变量的分布,又叫贝努里分布。

其必须满足以下条件:a 任何一个试验恰好有两个结果;b 共有n 次试验,并且n 是预先给定的整数;c 每次试验各自独立;d 某结果出现的概率在任何一次试验中都是固定的。

即任何一次试验中成功或失败的概率保持相同,但成功与失败的概率可以相等也可以不等。

(2)性质
a 二项分布是离散型分布,概率直方图是跃阶式。

当p=q 时,图形是对称的;当p ≠q 时,直方图呈偏态,p>q 和p<q 时的偏斜方向相反。

如果n 很大,即使p ≠q ,偏态也会逐渐降低,最终呈正态分布。

二项分布的极限为正态分布。

当p<q 且np ≧5时,或p>q 且nq ≧5时,二项分布就可以当作正态分布的一个近似形。

在分布中,p=0.5,而n 为无限大。

b 二项分布的均值μ、方差σ2
和标准差σ分别为:
pn μ= 2
npq σ= npq σ=
3.t 分布
t 分布是一种左右对称,峰态比较高狭,分布形状随样本容量n-1的变化而变化的一族分布。

t 分布是一种与方差无关而与自由度有关的分布,很类似正态分布,我们可以将正态分布看作t 分布当自由度为正无穷时的特例。

总体分布为正态,方差未知时,样本平均数的分布为t 分布:
1
/--=n s X t μN
x
s ∑=2
t 分布与δ(方差)无关而与n-1(自由度)有关,t 分布的自由度用符号ν或df 表示,一般为n-1,即样本量减1.自由度是指任何变量中可以自由变化的数目,是t 分布密度函数中的参数ν,它代表t 分布中独立随机变量的数目,故曰自由度。

t 分布有以下特点:
a 以平均值0为中心,左右对称的单峰分布,在左侧t 为负值,在右侧t 为正值;
b 变量取值在负无穷到正无穷之间;
c 当样本趋近于正无穷时,t 分布为正态分布,方差为1;当n-1>30以上时,t 分布接近正态分布,方差大于1,其随n-1的增大而趋近于1;当n-1<30时,t 分布与正态分布相差较大,随n-1减少,离散程度越大,t 分布的中间变低但尾部变高。

4.F 分布
如果有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出χ2
,则:
2
112
22
df F df χχ=
更多情况下,我们所计算的F 两样本取自相同总体,此时可将上式化简为:
122121
n n s F s --=
F 分布的特点:
(1)F 分布的形态是正偏态分布,它分布曲线随分子、分母的自由度不同而不同,随df 1和df 2的增加而逐渐趋于正态分布;
(2)F 总为正值,因为F 是两个方差之比;
(3)当分子自由度为1时,分母自由度为任意时,F 值与分母自由度相同的t 值的平方相等。

(4)F 分布的倒数性质:)(12121/1F df df df df F ---=αα)( 5.χ2
分布
χ2
分布的构造是从一个服从正态分布的总体中每次抽去n 个随机变量,计算其平方和之后标准化的一个分布。

分布曲线下的面积都是1,但伴随着n 取值的不同,自由度改变,曲线分布形状不同,而当自由度趋近于正无穷时χ2
分布即为正态分布,因此其于t 分布一样都是一族分布,而正态分布都是其中的特例。

()
2
22
X μχσ-=

6.样本平均数分布
样本分布是指样本统计量的分布,是统计推论的重要依据。

样本平均数分布是指从基本随机变量为正态的总体中,采用有放回随机抽样的方法,每次从这个总体中抽取大小为n
的一个样本,计算出它的平均数,然后将这些个体放回总体中,再次抽取n 个个体,又可计算出另一个平均数,如此反复,可计算出无限多个平均数,这无限多次抽取后所有平均数的可能值所形成的概率分布就是样本平均数分布。

(1)总体正态分布,且方差σ2
已知
总体分为正态或接近正态,方差已知,样本平均数和方差的分布为正态分布,且样本平
均数分布的平均数X μ、方差2
X σ与总体平均数μ、方差σ2
有如下关系:
μμ=X n
2
2
X
σσ=
由上可知,样本平均数的分布的平均数与总体分布的平均数相等,样本平均数的方差与总体方差成正比,且与样本容量成反比,样本容量越大,方差越小。

(2)总体非正态分布,但方差σ2
已知
此时,若样本足够大时(n>30),其样本平均数的分布为渐近正态分布。

接近正态分布的程度与样本容量n 及总体偏斜程度有关。

样本n 越大,总体偏斜越小,接近程度越好。

样本平均数分布的平均数、方差与总体平均数、方差也有与上述相同的关系。

(3)总体分布为正态,方差未知则为t 分布
(4)总体分布为非正态,方差未知且n>30则近似为t 分布
7.样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下关系:
22
2
222s s s s X n
X n
σ
σσσ
σσ==
==
三、各种检验方法的适用条件 (假设检验、卡方检验、非参数检验)
(一)假设检验
可以说,每一个实验的存在,仅仅是为了给事实一个反驳虚无假设的机会。

——R.A.Fisher 参数估计和参数假设检验的共同之处是利用样本信息对总体进行某种推断,且使用的统计量也一样。

在统计学中,通过样本统计量得出的差异做出一般性结论,判断总体参数之
间是否存在差异,这种推论过程称作假设检验。

它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设。

假设检验包括参数检验和非参数检验。

若进行假设检验时,总体的分布形式已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。

若对总体分布形式所知甚少,需要对未知函数形式及其他特征进行假设检验,通常称之为非参数假设检验。

1.假设检验的原理
1.1假设与假设检验
假设检验是统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异。

假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。

统计学中的一般专指对总体参数所做的假定性说明。

在进行任何一项研究时,都需要根据已有的经验和理论对研究结果事先做出一种预期性假设,我们称为科学假设,又叫备择假设,记作H1。

在统计学中,不对H1的真实性做直接检验,而是检验与其对立的假设,即虚无假设,或称零假设,记作H0。

假设检验的目的就是要判断虚无假设H0是否正确,决定接受还是拒绝原假设H1。

虚无假设和备择假设相互排斥,并且只有一个正确。

虚无假设是统计推论的出发点。

对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。

一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设。

备则假设:因变量的变化、差异是由于自变量的作用,往往是我们对研究结果的预期,用H1表示。

虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在,观察到的差异只是随机误差在起作用,用H0表示。

1.2小概率原理
假设检验的基本思想是概率性质的反证法。

即假设虚无假设为真,然后检验虚无假设的真实性。

在假定虚无假设为真的情况下,虚无假设被判断为假的几率十分渺小,我们称之为小概率事件。

但如果这种小概率事件依然会在一次试验中出现,则表明此事件不可能为小概率事件,也就推翻了虚无假设为真的假定。

此时,要接受备择假设。

反之,小概率事件没有出现,则要接受虚无假设,但这并不意味着虚无假设是成立的。

(小概率事件在一次试验中几乎是不可能发生的。


1.3假设检验中的两类错误
(本部分内容请参照实心信号检测论对照来看。

——MJ注)
总体的情况往往是未知的,根据样本推断总体,有可能犯两类错误:(1)当虚无假设正确时,我们拒绝了它所犯的错误,这类错误也叫弃真错误,即I类错误,这类错误的概率以α表示,因此也叫α错误。

研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有”。

(2)当虚无假设是错误的时候,我们没有拒绝所犯的错误,这类错误为取伪错误,即II类错误,这类错误的概率用β表示,故也叫β错误。

假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂”。

在实际问题中,一般总是控制犯I类错误的概率α,使H0成立时犯I类错误的概率不超过α。

在这种原则下的统计假设问题称为显著性检验。

两类错误的关系:(1)α+β不一定等于1。

α与β是在两个前提下的概率。

α的前提是“H0为真”;β的前提为“H0为假”。

(2)在其他条件不变的情况下,α与β不可能同时减小或增大。

许多情况需要在规定α的同时尽量减小β。

最直接的方法就是增大样本容量。

1-β反映着正确辨认真实差异的能力。

统计学中称(1-β)为统计检验力。

表5-1 假设检验中的两类错误
真实情况判断结果
接受H0拒绝H0
H0为真正确概率1-α(击中)弃真概率α(第一类错误)(漏报)H0为假取伪概率β(第二类错误)(虚报)正确概率1-β(正确否定)
1.4单侧检验和双侧检验
只强调差异不强调方向性的检验叫双侧检验,显著性百分等级为α/2。

强调某一方向的检验叫单侧检验,显著性的百分等级为α。

两者的区别:
(1)问题的提法不同。

双侧检验的提法是:μ和已知常数μ0是否有显著差异?
单侧检验的提法是:μ是否显著地高于已知常数μ0?
(2)建立假设的形式不同。

双侧检验的虚无假设假设和备择假设为:H0:μ=μ0,H1:μ≠μ0。

单侧检验的虚无假设和备择假设为:H0:μ≦μ0,H1:μ>μ0。

或H0:μ≧μ0,H1:μ
<μ0。

(3)否定的区域不同。

双侧检验否定区域为|Z|>Z α/2,而单侧检验查表得Z α。

一定要根据研究目的所规定的方向性来确定使用何种检验。

对于同样的显著性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯β错误的概率较小,我们也说它的检验效力更高。

1.5假设检验的步骤
(1)提出虚无假设和备择假设。

(2)选择适当的检验统计量。

(3)确定检验的方向性并规定显著性水平。

(4)搜集样本数据,计算检验统计量的值。

(5)做出统计决策。

可以有两种方法做出统计决策。

a 将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝虚无假设(原假设);b 由步骤(5)的检验统计量计算p 值,利用p 值确定是否拒绝虚无假设(原假设)。

2.样本与总体平均数差异的检验
在假设检验的步骤中,关键在于确定适当的统计量。

其他过程中的变化较少。

(1)总体平均数的显著性检验中,当总体正态分布且方差已知,采用:
obs X
X z μσ-=
其中0
X n
σσ=
0μ和0σ分别为总体的平均数和方差
(2)总体平均数的显著性检验中,当总体正态分布而方差未知,采用t 检验,以样本方差估计总体方差,选择的统计量为:
0obs X X t s μ-=
其中X S s n
=而1SS
S n =- S 为用样本和方估算出的总体方差。

(3)总体平均数的显著性检验中,当总体为非正态分布,且样本容量大于30时,可以选择近似Z 检验。

总体方差已知时Z ‵=Z ;总体方差未知时:Z ‵=t 。

3.两样本平均数差异的检验 3.1独立样本
(1)两总体方差已知:2
22
1
2
1
2
1n n X X Z σ
σ
+
-=
(2)两总体方差未知,且方差相等:)
(22
12
12122
221
12
1n n n n n n s n s n X X t ∙+-++-=
自由度df=n 1+n 2-2。

(3)两总体方差未知,且方差不等: 222
12
1'X X SE SE X X t +-=
其中,n
s n
2
12
SE -=
此时分布的自由度为:
)()1(12
222
2122
11
X X X SE SE SE k n k n k df +=++= (4)两总体方差未知,且方差不等:也同样使用22
212
1
'X X SE
SE X X t +-=
但这时要计算出临界值。

计算方法略。

(5)当n 1和n 2都是大样本数据时,可以不管总体方差是否相等,应用公式: 2
21
1
21
2121n s
n s
X X Z n n --+
-=
3.2相关样本
两种方法:(1)应用原始数据计算。

构造新的数据i i i X X d 21-=,d 的分布可以看作是从d 总体中抽取的一个样本平均数,因而统计量)
1()
(2
2--
=
∑∑n n n d d d
t 服从自由度为n-1
的t 分布。

(2)应用两组样本的相关系数计算。

两总体方差已知,n
r X X Z 2
122
2
12
12σσσσ-+-=

两总体方差未知时,)1(1
22
122
21
21-=--+-=
n df n s rs s s X X t 。

3.3总体非正态分布
如果两样本容量大于30可以近似使用Z ‵检验。

12
obs obs D X
X X Z t σ-==
这是两样本平均数检验的通用公式,所不同的仅在于标准误的计算 (1)总体方差已知 ①独立样本
2
212
1
2
D X n n σσσ=
+
②相关样本
22
1212
2D X r n
σσσσσ+-=
其中r 为两组变量之间的相关系数
(2)总体方差未知
①独立样本(方差差异不显著时)
221122121212
2D X
n s n s n n n n n n σ++=⋅+-
②相关样本
a.相关系数未知:()()
2
2
1D X d d
n
n n σ-
=
-∑∑其中d 为每一对对应数据之差
b.相关系数已知:22
1212
21
D X s s rs s n σ+-=
- 4.方差齐性的检验
方差齐性检验就是从两个样本方差的有关数据信息来推断两总体方差的差异是否显著。

通常使用齐性检验时方差都是未知的,因此要用样本方差的无偏估计量来推论总体方差。


用的检验统计量为212
1小
大--=n n
s s F ,其自由度为1-=大大n df 和1-=小小n df 的F 分布。

且F ≧1,
它的否定域总在右侧。

注意,此时的检验为单侧检验。

(H 0:<1,H 1:≧1#?#)
4.1样本方差与总体方差
当从正态分布的总体中随机抽取容量为n 的样本时,其样本方差与总体方差比值服从χ
2
分布:
2
220ns χσ=由自由度1df n =-查χ2表,依据显著性水平判断
4.2两个样本方差之间
A 独立样本
22s F s =大
小其中当两样本自由度相差不大时可用n s 代替n-1s
查表时11221,1df n df n =-=-
B 相关样本 ()2212
22
212412
s s t s s r n -=--其中2df n =-
5.相关系数的显著性检验(?)
5.1积差相关(即用样本的相关检验总体的相关)
a.当ρ=0时:212r
t r
n =--其中2df n =-,r 为样本的积差相关系数。

(此时,虚无假
设为H 0:ρ=0。

这里ρ为总体的相关系数)
b.当ρ≠0时:先通过查表将r 和ρ转化为费舍Z r 和Z ρ然后进行Z 检验
1
3r Z Z Z n ρ
-=-
5.2等级相关和肯德尔W 系数
在总体相关系数为零时:查各自的相关系数表,判定样本相关显著.
5.3相关系数差异的显著性检验
(1)r 1和r 2分别由两组彼此独立的被试得到。

这时将两相关系数进行费舍Z r 的转化。

进行Z 检验。

(2)两样本的相关系数由同一组被试算得ρ12,ρ23,ρ13。

目的是检验ρ
12与ρ13的差
异。

(二)卡方检验
2χ检验是一种非参数检验方法,对数据的总体分布形态不做任何假设。

2χ检验能够处
理一个因素两项或多项分类的实际观测频数与理论频数分布是否一致的问题,或说有无显著差异问题。

所谓实际频数是指在实验或调查中得到的计数资料,又称为观察频数理论频数是指根据频数原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数,又称为期望次数。

A 2
χ的基本公式 2χ检验的基本公式为()
22o e e f f f χ-=∑
其中o f 为观察次数;e f 为理论期望次数。

公式的适用范围要求观察彼此之间独立,并且单位格的理论期望次数不能小于5(小于5时可与相邻的组合并)。

在拟合度检验中,理论次数一般是根据某种理论,按一定的概率计算而来。

在独立性检验中,如果两个变量或两个样本无关联时,理论次数是各个单元格对应的两个边缘次数的积除以总次数。

B 2
χ检验的假设
(1)分类相互排斥,互不包容。

(2)观测值相互独立。

在实际研究中,让观测值的总数等于实验中不同被试的总数,要求每个被试只有一个观测值,这是确保观测值相互独立最安全的做法。

(3)期望次数的大小。

为了努力使2χ分布成为2χ值合理准确的近似估计,每一个单元格中的期望次数至少在5个以上。

当单元格的次数过少时,处理方法有四种:第一,合并单元格;第二,增加样本数量;第三,去除样本;第四,使用矫正公式。

1.拟合度检验
拟合度检验主要用来检验一个因素多项分类的实际观测次数与理论次数是否接近。

当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。

拟合的检验的研究假设是实际观察数与理论次数之间的差异明显,虚无假设为实际观察数与理论次数之间无差异或相等。

它涉及的是某总体的分布是否与某种分布相符合,不涉及总体参数问题。

1.1检验无差别假说
无差别假说是指各项分类的实际计数之间没有差异,也就是说假设各项分类之间的机会相等,或概率相等,因此,理论次数完全按概率相等的条件计算。


分类项数
总数理论次数1⨯= 1.2检验假设分布的概率
与上面检验无差别假说的差别主要在于理论次数的计算。

在检验假设分布的概率时,是按事先假定的理论分布计算各项分类应有的概率再乘以总数,便得到各项分布的理论次数。

事先假定的理论分布可以是正态分布、二项分布、泊松分布等。

如果事先假设的分布不是理论分布而是经验分布,也可以按此经验分布计算概率,在乘以总数便可得到理论次数。

在获得了理论次数以后,只要连同观察次数一同带入χ2的基本公式,便可以获得χ2值,而后就可进行χ2检验。

1.3连续变量分布的吻合性检验
利用χ2统计量来检验连续变量观测数据次数分布是否服从某一理论分布模型时,最为常见的是检验总体是否正态。

此时,统计检验的虚无假设和研究假设可以这样建立:
H 0:观测数据的次数分布与正态分布没有显著差异;
H 1:观测数据的次数分布与正态分布具有显著差异。

具体步骤可详细参见张敏强主编《教育与心理统计学》第237~240页的例题,以及张厚粲等编著的《现代心理与教育统计学》第336~337页的例题。

2.独立性检验,11简答
独立性检验主要用于两个或两个以上因素多项分布的计数分析,也就是研究两类变量之间关联性或依存性。

如果两个因素是非独立的(即χ2值显著),则称这两个变量之间有关联或有交互作用存在。

从另一方面讲,如果想了解一自变量不同分类是否在另一自变量的多项分类上有差异或有一致性。

2.1一般问题与步骤
(1)统计假设。

独立性检验的虚无假设是两个因素(或多因素)之间是独立的或无关联的,备择假设是两因素(或多因素)之间有关联。

(2)理论次数的计算。

理论次数e f 的通式可表示为: N f f f yi
xi e =
其中,xi f 表示每一行的和,yi f 表示每一列的和。

(3)自由度的确定。

设R 为每一行的分类项数,C 为每一列的分类数目,则自由度为
)1)(1(--=C R df 。

(4)统计方法的选择。

一般应用独立性检验的场合,独立性样本居多,用χ2
检验的基本公式计算: ∑-=e e f f f 2
02
)(χ 也可用下式计算χ2值: )1(202∑-=yi
xi i f f f N χ 其中,i f 0是每一格的实记数。

xi f 是与i f 0对应的行的总数,称为边缘次数。

yi f 是与i f 0对应的那一列的总数,也是边缘次数。

N 为总的观察数目。

(5)结果与解释。

如果计算的χ2值小于从χ2
表中查到的临界值,则接受虚无假设,即认为两个因素无关联;反之则认为有关联。

2.2三种独立性检验的具体计算方法
(1)四个表独立性检验公式为: ))()()(()(2
2
D B C A D C B A BC AD N ++++-=χ 当四个表中的两个因素A 、B 相关而非独立时,需使用下列公式: D A D A +-=22
)(χ 式中A 、D 为四格表中两次试验或调查中分类项目不同的那两个格的实计次数。

如果因素一与因素二两道题目,A 便表示作对题目一但没有作对题目二的人,D 代表作对题目二但没作对题目一的人。

注意:与上述计算独立样本公式中的A 、D 不同。

另外样本较小时应使用公式矫正。

(2)R ×C 表独立性检验。

参见“一般问题与步骤”。

(3)多重列联表的独立性检验。

当变量的类别在两个以上时,就要用多重列联表分析方法,将其中一个变量作为分层变量或控制变量,也就是将三因子列联表拆分为两因子列联表,分别计算,再加以比较
(三)非参数检验
参数检验的优点和缺点。

相关文档
最新文档