甘怡群《心理与行为科学统计》笔记和习题详解(第16~21章)【圣才出品】
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.计算 2 值:
。
4.根据 df=C-3 查临界值 2 。
注意:正态分布匹配度检验中,自由度应该在类目数的基础上减去 3。因为正态分布中
总数、平均数和标准差受到了限制。
5.比较实际 2 值与临界值,并作出判断。
二、χ2 独立性检验 (一)基本概念和适用情境 1.概念
2 独立性检验是为了检验两个类目型或顺序型变量是否相关的 2 检验。
各类别比例来确定。
(2) 2 统计量的计算
其中,fo 指的是观察次数,fe 指的是期望次数。
2 实际上就是各单位格的观察次数与期望次数之差的平方除以期望次数的商之和。各 个单位格的 2 值具有可加性。如果单位格的 2 值越大,则说明该因素对整个统计检验的显 著性贡献越大。如果 2 值为 0,那就说明观察和期望的完全吻合。
2.适用情况
① 2 独立性检验是检验行和列的两个变量彼此有无关联的一种统计方法,它适用于命
名型变量和顺序型变量。
② 2 独立性检验不仅适用于 2×2 的列联表,还适用于各因素多水平的情况。假设因素 A 分为 r 个水平,而因素 B 分为 c 个水平,可以将 2 独立性检验的数据结构概括为表 16-1:
(2)非参数检验中最常见的一种方法—— 2 检验。 按研究目的,适用情境和计算方法的不同,分为 2 匹配度检验和 2 独立性检验两种。
3.二者的区别 (1)应用情况 ①参数检验通常用于等比和等距型数据; ②非参数检验适用于顺序型变量(如排名)和命名型变量。 (2)检验功效 ①非参数检验的功效低于参数检验,它没有参数检验敏感。因此,很多参数检验可以检 验出显著差异的地方,如果用非参数检验则不会得到显著差异。 ②用顺序型变量或者命名型变量来代替原始数据,这种做法损失了很多信息。 (二)基本概念和适用情境
1 / 78
圣才电子书
www.100xuexi.com
1. 2 匹配度检验
十万种考研考证电子书、题库视频学习平台
2 匹配度检验是用样本数据来检验总体分布的形状或比率,以确定与假设的总体性质
的匹配度,它是对分布的检验。如考查在医生职业中,男的多还是女的多?
2. 2 匹配Baidu Nhomakorabea检验的前提和限制
(1)观察彼此之间应该是独立的;
②由于随着自由度的增加,卡方的临界值也会增加。
(3) 2 分布中自由度 df 的确定 在 2 匹配度检验中,自由度 df 是由类目数 C 决定的。由于受到样本总数 n 的约束,
可以独立变化的维度比数据 C 要少一个,因此自由度为:df=C-1。
3. 2 检验的具体步骤
(1)提出虚无假设和备择假设,即 H0:和 H1; (2)根据虚无假设,计算期望值;
(3)根据公式计算 2 ; (4)根据自由度 df=C-1,查 2 临界表得到临界值; (5)比较观测值和临界值:如果 2 的观测值大于临界值,则应该拒绝虚无假设;反
之,则接受虚无假设。
(四)正态分布匹配度检验
1.提出虚无假设和备择假设:
H0:该样本所在的总体服从正态分布
H1:该样本所在的总体不服从正态分布
圣才电子书
www.100xuexi.com
十万种考研考证电子书、题库视频学习平台
第 16 章 X2 检验
16.1 复习笔记
一、 2 匹配度(拟合优度)检验
(一)参数检验与非参数检 1.参数检验 参数检验的共同前提是总体是正态分布;如果检验涉及两个总体,两总体须方差同质。 2.非参数检验 (1)非参数检验对总体的分布情况要求低,也不要求对总体的参数进行假设,在参数 检验的假设无法满足时,可以运用非参数检验。非参数检验也称为分布不限定检验。
分为不同水平即可。
④ 2 独立性检验也要求观察彼此独立和单位格期望值不小于 5。
(二)计算方法
1.确定 2 独立性检验的虚无假设。 2.计算 2 独立性检验中的期望次数。某单位格的期望次数与该单位格所在行的和之
比,等于该单位格所在列的和与全部总和之比,用公式表达如下:
。
3.计算卡方值:
。
4.确定自由度 df:自由度设定为行和列的水平数各减 1 之后的乘积:df=(R-1)(C-1)。
2.计算各组别的期望次数:先
计算出 z 分数;再查正态分布表得到对应的
3 / 78
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
概率;由样本总数与概率的乘积计算出期望次数。
注意(合并数据):一般,当某组的期望次数小于 5 时,需要将该组与相邻的组合并,
得到相加的期望次数。如果还不到 5。就要继续合并,直到大于或等于 5 为止。
(3)将计算得到的 2 与查表所得的临界值进行比较,并得出结论 2. 2 分布
2 / 78
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
(1) 2 值是一系列平方和相加,因此没有负值。 (2)典型的 2 分布是正偏态。 ① 2 分布概率密度图形的形状并不取决于样本数目,而是取决于自由度 df:随着自由 度的增加, 2 分布的偏态越来越不严重,即尾部逐渐增厚。 当虚无假设成立时,数据的观察次数和理想次数之间差异很小, 2 值也比较小;如果 虚无假设不成立,那么 2 值会比较大,更加靠近 2 分布的尾端。
5.根据自由度,查表得到临界值 。
6.将观测值与临近值进行比较,并作出判断。
表 16-1 2 独立性检验的数据结构
4 / 78
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
③有时变量虽为等距型,但若不符合 Pearson 相关的统计前提(如正态分布、两变量
间的线性关系),也可以用 2 独立性检验来进行统计。这时只需将变量的原始等距型数据划
(2)每个单位格的期望次数都不小于 5,即 fe≥5。
(三)计算方法
1. 2 值的计算
(1)期望次数与观测次数
根据题目的具体要求确定检验的假设。这些假设的频次也就是期望次数,如果是比例,
就乘以样本容量 n 得到期望次数。
①如果是考查样本中不同类别的大小是否均衡,就应该采用均匀分布作为期望次数;
②如果考查某个样本的不同类别的比例是否符合总体的类别比例,期望次数就由总体的