心理与教育统计学第10章 卡方检验
《教育统计学》期末复习资料总结
第十章卡方检验第一节卡方及其分布一.卡方检验的特点卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所做的假设检验,即根据样本的频数分布来推断总体的分布。
它与前面所讲的测量数据的假设检验的不同在于:1.测量数据的假设检验,其数据属于连续变量,而卡方检验的数据属于点计而来的间断变量。
2.测量数据所来自的总体要求呈正态分布,而卡方检验的数据所来自的总体分布是未知的。
3.测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验;卡方检验在多数情况下是对总体分布的假设检验。
所以,卡方检验属于自由分布的非参数检验,凡可以应用比率进行检验的资料,都可以用卡方检验。
二.卡方检验统计量1.卡方检验统计量的基本形式为:f0表示实际频数,ft表示理论频数,∑表示总和例题一:从某校随机抽取50个学生,其中男生27人,女生23人,问该校男女生人数是否相同?解:根据男女生人数相同的假设,其理论频数应为50/2=25.于是卡方值就等于各组实际频数和理论频数差的平方与理论频数之比,再求其和。
2.卡方值的特点:可加性;永为正值;值的大小随实际频数与理论频数差的大小而变化(差越小,样本分布与假设理论分布越一致)。
三.的抽样分布一切可能个样本卡方值的频数分布,就形成了一个实验性的卡方抽样分布。
卡方分布的两个特点:呈正偏态,右侧无限延伸,但永不与基线相交;随自由度的变化而形成一簇分布形态。
自由度越小,偏斜度越大,自由度越大,分布形态越趋于对称。
第二节单向表的卡方检验把实得的点计数据按一种分类标准编制成表就是单向表。
卡方检验统计决断原则:一.按一定比率决定理论频数的卡方检验二.一个自由度的卡方检验1.各组ft>=5的情况2某组ft<5的情况当df=1,其中只要有一个组的ft<5,就要用亚茨连续性校正法,即在每一组实际频数与理论频数差数的绝对值平方之前,各减去0.5。
即三.频数分布正态性的卡方检验检验步骤:提出假设计算卡方值统计决断第三节双向表的卡方检验(双因素的卡方检验)把实得的点计数据按两种分类标准编制成的表就是双向表。
教育与心理统计学第十章:卡方检验
B因素
类别1 ( B1) 类别2 (B 2) 合计
A因素
类别1 类别2 ( A 1) ( A 2)
N A1N B1/ Nt
N A 2N B1/ Nt
N A 2N B2/ Nt
N A 2N B2/ Nt
合计 N 2 B1 N B2
N A1
N A2
Nt
六、小期望次数的连续性校正
当单元格的人数过少时,处理的方法有四种: 1、单元格合并 2、增加样本数 3、去样本法 4、使用校正公式
3、同质性检验——检验不同人群总体在某一个变量的 反应是否具有显著性差异。
三、 χ2检验的基本思想
首先假设H0 成立,计算出χ2值,它表示观察值与理论 值之间 的偏离程度。根据χ2分布, χ2统计量以及自由 度可以确定在H0 成立的情况下获得当前统计量及更极 端情况的概率P。
如果P 很小,说明观察值和理论值偏离程度太大,应 当拒绝原假设,表示比较资料之间有显著性差异;否 则就不能拒绝原假设,尚不能认为样本所代表的实际 情况与理论假设有差别。
(二)相关样本四格Hale Waihona Puke Χ2 检验例题:10—11
(一)独立样本的四格表χ2检验
K2
n(ad bc)2
,
(a b)(c d )(a c)(b d )
其中n a b c d为样本容量。
因素A
因素B
分类1 分类2 合计
分类1
a c a+c
分类2
b d b+d
合计
a+b c+d N= a+b+ c+d
独立样本四格表χ2检验应掌握两种计算方法
一、独立性检验的一般问题与步骤
北大心理统计知识点总结统计-第十章卡方和二项检验
统计第十章卡方和二项检验一卡方检验下面的数据用什么统计方法?下面的数据用什么统计方法?参数与非参数检验⏹参数检验⏹用于等比/等距型数据⏹对参数的前提:正态分布和方差同质⏹非参数检验⏹不用对参数进行假设⏹对分布较少有要求,也叫distribution-free tests⏹用于类目/顺序型数据⏹没有参数检验敏感,效力低⏹因此在二者都可用时,总是用参数检验卡方匹配度检验⏹定义⏹用样本数据检验关于总体分布的形状或比率假设。
检验样本的分布比率与假设的总体分布的比率匹配度。
⏹是对次数分布的检验⏹研究情境⏹在医生职业中,男的多还是女的多?⏹在三种咖啡中,哪种被国人最喜欢?⏹在北京大学中,各国留学生的比例有代表性吗?卡方匹配度的虚无假设(1)⏹无偏好假设⏹分类之间没有差异⏹例如对保洁公司的洗发水品牌的爱好卡方匹配度的虚无假设(2)⏹与参照群体无差异⏹60%哈佛学生对本部食堂的伙食满意,40%哈佛学生对本部食堂的伙食满意。
⏹哈佛学生对1食堂的伙食的满意度是否与对2食堂的满意度是否有差异?观察次数⏹观察次数⏹样本中分到某一类别的个体的数目。
每个个体只能分到一个类别。
⏹用人格量表对被试施测后将被试分成3类期望次数⏹由虚无假设和样本的大小决定卡方匹配度检验的公式⏹χ2= ∑[(f0-f e)2/ f e]⏹ f e=pn⏹df =C-1⏹F0:观察次数⏹ f e :期望次数⏹C:类目的个数⏹Χ2:统计量卡方分布的性质(1)⏹卡方分布不是一个对称的分布,正偏态⏹随着自由度的增加越来越对称卡方分布的性质(2)⏹卡方的值是0或者是正数,不可能是负数。
⏹自由度(n-1)不同,卡方分布也就不同。
因此,卡方分布是一系列的曲线。
随着自由度的增加越来越接近对称。
卡方值⏹卡方值越小,越接近零,虚无假设正确的可能性越大,观察次数和期望次数之间越接近⏹类别的数量对临界值的影响⏹临界区域(Critical Region)例子1(数据虚构)⏹对保洁公司的洗发水使用者的爱好在品牌上是否有差异?调查了90人例1的解答step1虚无假设H0:保洁公司洗发水的消费者对3种品牌的偏好没有差异。
第十章卡方检验
2 检验的基本公式,
表,确定其差异是否显著。(常用的方法)
其关键步骤是计算理论次数与确定自由度。 (1)将实际次数分布的统计量代入所选的理论分布函数方程,求各分组 区间的理论频率,然后乘以总数得各分组区间的理论次数;
16 (2)将分组的数目减去计算理论次数时所用统计量的数目即自由度。
[例10-5] 表10-2所列资料是 552 名中学生的身高次数分布,问这些学生的 身高分布是否符合正态分布?
3、去除样本法; 4、使用校正公式。
7
第二节
察次数分布与某理论次数是否有差别。
配合度检验
配合度检验(goodness of fit test)主要用于检验单一变量的实际观
它检验的内容仅涉及一个因素多项分类的计数资料,是一种单因素检验 (one-way test)。
一、配合度检验的问题
(一)统计假设
2、根据各组的理论次数与实际次数计算
2 值,得 2 3.905
3、确定自由度。本题共分 11 组,在计算理论次数时,对最高组和最低
组两极端次数进行了合并,合并后为 9 组。在计算理论次数的过程中共用到
平均数、标准差、总数 3 个统计量,故本题的自由度 df=9-3=6 。 4、查
2 表,得 02.05 12.6, 02.01 16.8
表10-2
身高 分组 169 ~ 166 ~ 163 ~ 160 ~ 157 ~ 154 ~ 151 ~ 148 ~ Xe 170 167 164 161 158 155 152 149 fo 2 7 22 57 110 124 112 80
书中数字错!
552 名学生身高的理论次数分布及卡方检验
x 15.38 12.38 9.38 6.38 3.38 0.38 -2.62 -5.62 Z 3.03 2.44 1.85 1.26 0.67 0.07 -0.52 -1.11 y 0.0040 0.0203 0.0720 0.1840 0.3187 0.3979 0.3484 0.2154 p 0.0023 0.0120 0.0426 0.1088 0.1885 0.2354 0.2061 0.1274 fe 1 7 24 60 104 130 114 70
第十章统计卡方检验.ppt
二、单因素的2检验(配合度检验)(P297)
赞成 39
反对 21
解: (1)提出假设: H0:fo= fe H1: fo fe
(2)计算检验统计量
2 fo fe 2 (39 30)2 (21 30)2 5.4
fe
30
30
(3)查2分布表,确定临界值:
• 已经统计出小学生识字的优秀率为0.2,及 格率为0.7(不包括优秀在内),不及格率 为0.1,现在进行识字教学的改革实验,实 验后随机抽取了500名学生进行测试,结果 有123人达到优秀水平,有346人达到及格 水平,有31人没有及格。问识字教学的改 革实验是否有显著性效果?
第二节 独立性检验(二因素的2检验)
值表中找到临界值 。
(五)做出接受虚无假设或拒绝虚无假设的统计决策。其原 则是:
• 1.当公式(10.1)所确定的实得 值大于临界 时,可拒绝 虚无假设(H 0),并接受备择假设。
• 2.当公式(8.1)所确定的实得 值小于临界值 时,便没有 充分理由拒绝虚无假设(H 0),故暂认为虚无假设是成立 的,把虚无假设先接受下来。
2 0.05(1)
3.84
2 0.01(1)
6.63
(4)统计决断:02.05(1)
2
2 0.01(1)
0.01 p 0.05
故拒绝虚无假设,接受备择假设,即高中生对文 理分科的意见差异显著。
•
2
检验的假设(p293)
– 分类相互独立,互不包容
– 观测值相互独立
– 期望次数的大小
自学能力
实际观察次数(f0) 15
理论次数(fe又称
18
《卡方检验》课件
制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
心理与教育统计学课件(张厚粲版)ch10卡方检验共49页
15、机会是不守纪律的。——雨果
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿
心理与教育统计学课件(张厚 粲版)ch10卡方检验
11、战争满足了,或曾经满足过人的 好斗的 本能, 但它同 时还满 足了人 对掠夺 ,破坏 以及残 酷的纪 律和专 制力的 欲望。 ——查·埃利奥 特 12、不应把纪律仅仅看成教育的手段 。纪律 是教育 过程的 结果, 首先是 学生集 体表现 在一切 生活领 域—— 生产、 日常生 活、学 校、文 化等领 域中努 力的结 果。— —马卡 连柯(名 言网)
拉
60、生活的道路一旦选定,就要勇敢地 走到底 ,决不 ห้องสมุดไป่ตู้头。 ——左
第十章卡方检验
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验
检验的步骤:
(2)计算χ2值
本例df=1,两组的理论频数均为ft=38>5。
2
f0 ft 2
ft
表10.4 喜欢与不喜欢体育人数的χ2值计算表
f0 ft f0-ft (f0-ft)2 (f0-ft)2/ ft
喜欢 50 38 12 144 3.79 不喜欢 26 38 -12 144 3.79
f0 ft 2
求χ2=5.202
ft
29
第二节 单向表的卡方(χ2)检验
三、频数分布正态性的χ2检验 检验的步骤: (3)统计决断 正态性χ2检验的自由度df=K-3。K是合并后保留下来的组数。 df=7-3=4。 自由度df=K-3的原因: 1单向表的χ2检验受到∑(f0-ft)=0一个因子的限制。 2应用Z=(X-X)/ σX的公式计算理论频数时,运用了X和 σX两
12 16 4
3.5
12.25 12.25/16=0.77
非团员 8 4 4
3.5
12.25
12.25/4=3.06
总和 20 20
χ2=3.83
25
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 检验的步骤: (3)统计决断 根据df=1,查χ2值表,χ2(1)0.05=3.84, 由于χ2=3.83<3.84=χ2(1)0.05,则P>0.05, 于是保留H0而拒绝H1。 其结论为:该校共青团员的比率与全区没有显著性差异。
4
第一节 卡方(χ2)及其分布
比率和比率之差的假设检验,是对二项分布数据的假设检验。 ——处理一个因素分成两类, ——或者两个因素,每个因素都分为两类的资料。 ——最多只能同时比较两组比率的差异。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](卡方检验)
圣才电子书 十万种考研考证电子书、题库视频学习平台
两个母总体是同质的,反之,则说这两个母总体是异质的。
3.比率的显著性检验与 2 检验的哪些应用有相同功能?
答:在只有两项分类的 2 检验与比例的显著性检验相同。在比率显著性检验时,先将 所关心的某一性质的实计数换算成比率 p , p 1 q , q 为非某一性质分类的次数比率。若
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 10 章 卡方检验
1.对于计数数据的统计分析方法有哪些? 答:可用于计数数据的统计分析方法有: 2 检验、配合度检验、四个表独立检验、多 重列联表分析等。
2. 2 检验法在计数数据的分析中有哪些应用? 答: 2 检验因研究的问题不同,可以细分为多种类型,如配合度检验、独立性检验、 同质性检验等等。 (1)配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近, 这种 2 检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验 又可称为正态吻合性检验。 (2)独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有 独立性的问题。两个因素是指所要研究的两个不同事物。例如性别与对某个问题的态度是否 有关系,这里性别是一个因素,分为男女两个类别,态度是另一个因素,可分为赞同、不置 可否、反对等多种类别。各因素分类的多少视研究的内容及所划分的分类标志而定。这种类 型的 2 检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独立),如果再加入 另一个变量的影响,即探讨三个变量之间关系时,就必须使用多维列联表分析方法。 (3)同质性检验主要目的在于检定不同人群母总体在某一个变量的反应是否具有显著 差异。当用同质性检验检测双样本在单一变量的分布情形,如果两样本没有差异,就可以说
(心理统计-)第十章卡方检验
2008心理统计——X2 检验
21
二、配合度检验的应用
• (2)检验假设分布的概率 假设某因素各分类的次数分布为正态分布,检
验实际频数与理论上期望的结果之间是否有显 著差异。
2010-11-15
2008心理统计——X2 检验
22
例10.3 某班学生50人,体检结果按一定标准划分为 甲、乙、丙三类,各类人数分别为:甲类16人, 乙类24人,丙类10人,问该班学生的身体状况 是否符合正态分布?
最后一组和前一组合并,总组数为9。
9
2=
fi - ei 2
3.905, 在计算理论次数的过程中共用到平均数,
i1 ei
标准差和总数三个统计量,故本题的自由度为df 9 - 3=6,
查卡方分布表,02.05 (6) 12.6,
2
2 0.05
,
p
0.05,
故差异不显著,即552名中学生的身高分布
2010-11-15
2008心理统计——X2 检验
33
不同性别饮酒类型构成比比较 性别 淡啤酒 普通啤酒 黑啤酒 合计
男
20
40
20
80
女
30
合计 50
30
10
70
70
30
150
2010-11-15
2008心理统计——X2 检验
34
一、基本步骤
(一)假设 (二)计算理论频数 (三)确定自由度
(四)计算检验统计量 2 值
2010-11-15
2008心理统计——X2 检验
11
两组降低颅内压有效率的比较
组别 有效
无效
合计
有效率(%)
试验组 99(90.48) a 5(13.52) b 104 (a+ b)
统计心理-第十章 卡方检验
对这些计数资料的统计分析,2检不验能用前几章2检的验统计方法,
则需要使用本章所介绍的
。应用
分析计数数
据时 ,2检对验计数数据总体的分布形态不作任何假设,因此
被视为是非参数检验方法的一种。
第一节 2 检验 概述
一、 2 和 2 检验的意义 2检验方法能处理一个因素两项或多项分类的实际
一、独立性检验的一般问题
• 2检验主要研究两个因素或两个以上因素多项
分类的计数资料的独立性问题。如果两个因素 中的一个因素有R类,另一个因素有C类,这 种表称之为R×C表,即二维列联表。特殊的 列联表是2×2表。因素若是多于两个,这种表 称为多维表,多维列联表的分析较为复杂,本
二、无差假说的检验
• 无差假说是指各项分类的次数没有差异,即假 设各项分类之间的机会均等,或概率相等。因 此,理论次数完全按概率相等的条件计算,其 公式为:
fe
总
数
分
1 类
项
数
例8 随机抽取60名学生,问他们高中要不要文理分科,回答赞 成的39人,反对的21人,问对分科的意见有无显著差异?
解:
观察频数与理论频数分布是否相一致问题,或者说有无显 著差异问题。
所谓实际频数简称实计数或实际数,是指在实验或 调查中得到的计数资料,又称为观察频数。
理论次数是指根据概率原理、某种理论、某种理论 次数分布或经验次数分布计算出来的次数,又称为期望次
数。2是实计数据与理偏论离数程据度的. 指标
其基本公:式 2 为 f0 fe 2 fe
-1.11 .2154 .12746 70
-1.70 .0940 .05562 31
-2.29 .0289 .01710 9
第10章--卡方检验-(Chi-PPT课件
例题:某学校对学生的课外活动内容进行调查,结果 整理成下表:
-
18
应用举例一
女性 男性 总和
自我知觉
总和
过轻
过重
419
1995
2414
(786.78)(1627.22)
959
855
1814
(591.22)(1222.78)
1378
1995 1938.67
56.33 3173.41
1.37
5816 5816
0
2297.1 3
df=3-1=2 查表,0.05水平上临界值为5.99,故……
df=3-1=2 查表, 0.01水平上临界值为9.21
-
15
三、卡方独立性检验
(一)适用材料 主要用于两个或两个以上因素多项分类的计数资料
分析。如果要研究的两个自变量之间是否具有独 立性或有无关联或有无“交互作用”的存在,就 要应用卡方独立性检验。 如果两个子变量是独立的,无关联的,就意味着对 其中一个自变量来说,另一个自变量的多项分类 次数上的变化是在取样误差的范围之内。假如两 个因素是非独立,则称两变量有交互作用。
第十二章 非参数检验
-
1
一、参数与非参数检验
参数检验 用于等比/等距型数据 参数检验的前提:正态分布和方差同质
非参数检验 不用对参数进行假设 对分布较少有要求,也叫distributionfree tests 用于名义/顺序型数据
-
2
参数统计和非参数统计优缺点
• 参数统计 优点:
对资料的分析利用充分 统计分析的效率高
于等与临界值才显著),使用9或3均可 • 接受虚无假设
第10章心理统计学 χ2检验
2. 计 算
表15-4 老年教师健康状况的χ2检验计算表
fo
ห้องสมุดไป่ตู้fe
fo fe fo fe 2
fo fe 2
fe
好 15 13.5 1.5 2.25
0.167
中 23 27.0 -4.0 16.0
0.593
差 16 13.5 2.5 6.25
0.463
总 和 54 54
1.22
2.选择检验统计量并计算
对点计数据进行差异检验,可选择χ2检验
f e理论频数=总数
1 分类项数
60
1 2
30
计算
表15-2 学生对分科意见的χ2检验计算表
赞成
fo
fe
fo fe fo fe 2
fo fe 2 fe
39 30 9
81
2.7
反对 21 30 -9
解:该题的理论频数应按假设的正态分布概率计算。 按正态分布,±3σ可认为包括全体,各类所占的 横坐标应该相同(6σ÷3=2σ)
因此各类人数所占比例为
+
【例10-4】根据以往的经验,某校长认为高中生升学的
男女比例为2:1,今年的升学情况是男生85人,女生35人, 问今年的男女生比例是否符合校长的经验?
2.独立性检验(test of independence)
是用来检验两个或两个以上因素各种分类 之间是否有关联或是否具有独立性的问题
这种类型的χ 2 检验适用于探讨两个变量 之间是否具有关联 ( 非独立 ) 或无关
( 独立 ). 如果再加入另一个变量的影 响 , 即探讨三个变量之间关系时 , 就必 须使用多维列联表分析方法(略)。
北大心理统计知识点总结统计第十章 卡方和二项检验
统计第十章卡方和二项检验一卡方检验下面的数据用什么统计方法?下面的数据用什么统计方法?参数与非参数检验⏹参数检验⏹用于等比/等距型数据⏹对参数的前提:正态分布和方差同质⏹非参数检验⏹不用对参数进行假设⏹对分布较少有要求,也叫distribution-free tests⏹用于类目/顺序型数据⏹没有参数检验敏感,效力低⏹因此在二者都可用时,总是用参数检验卡方匹配度检验⏹定义⏹用样本数据检验关于总体分布的形状或比率假设。
检验样本的分布比率与假设的总体分布的比率匹配度。
⏹是对次数分布的检验⏹研究情境⏹在医生职业中,男的多还是女的多?⏹在三种咖啡中,哪种被国人最喜欢?⏹在北京大学中,各国留学生的比例有代表性吗?卡方匹配度的虚无假设(1)⏹无偏好假设⏹分类之间没有差异⏹例如对保洁公司的洗发水品牌的爱好卡方匹配度的虚无假设(2)⏹与参照群体无差异⏹60%哈佛学生对本部食堂的伙食满意,40%哈佛学生对本部食堂的伙食满意。
⏹哈佛学生对1食堂的伙食的满意度是否与对2食堂的满意度是否有差异?观察次数⏹观察次数⏹样本中分到某一类别的个体的数目。
每个个体只能分到一个类别。
⏹用人格量表对被试施测后将被试分成3类期望次数⏹由虚无假设和样本的大小决定卡方匹配度检验的公式⏹χ2= ∑[(f0-f e)2/ f e]⏹ f e=pn⏹df =C-1⏹F0:观察次数⏹ f e :期望次数⏹C:类目的个数⏹Χ2:统计量卡方分布的性质(1)⏹卡方分布不是一个对称的分布,正偏态⏹随着自由度的增加越来越对称卡方分布的性质(2)⏹卡方的值是0或者是正数,不可能是负数。
⏹自由度(n-1)不同,卡方分布也就不同。
因此,卡方分布是一系列的曲线。
随着自由度的增加越来越接近对称。
卡方值⏹卡方值越小,越接近零,虚无假设正确的可能性越大,观察次数和期望次数之间越接近⏹类别的数量对临界值的影响⏹临界区域(Critical Region)例子1(数据虚构)⏹对保洁公司的洗发水使用者的爱好在品牌上是否有差异?调查了90人例1的解答step1虚无假设H0:保洁公司洗发水的消费者对3种品牌的偏好没有差异。
现代心理与教育统计学(张厚粲)课后习题答案资料
现代心理与教育统计学(张厚粲)课后习题答案(2011-03-25 10:54:43)转载第一章绪论(略)第二章统计图表(略)第三章集中量数4、平均数约为36.14;中位数约为36.635、总平均数为91.726、平均联想速度为5.27、平均增加率约为11%;10年后的毕业人数约有3180人8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7第四章差异量数5、标准差约为1.37;平均数约为1.196、标准差为26.3;四分位差为16.687、5cm组的差异比10cm组的离散程度大8、各班成绩的总标准差是6.039、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76第五章相关关系5、应该用肯德尔W系数。
6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。
7、这两列变量的等级相关系数为0.97。
8、上表中成绩与性别有很强的相关,相关系数为0.83。
9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。
10、测验成绩与教师评定之间有一致性,相关系数为0.87。
11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。
12、肯德尔一致性叙述为0.31。
第六章概率分布4、抽得男生的概率是0.355、出现相同点数的概率是0.1676、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.167、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185 8、两个正面,两个反面的概率p=6/16=0.375;四个正面的概率p=1/16=0.0625;三个反面的概率p=4/16=0.25;四个正面或三个反面的概率p=0.3125;连续掷两次无一正面的概率p=0.18759、二项分布的平均数是5,标准差是210、(1)Z≥1.5,P=0.5-0.43=0.07(2)Z≤1.5,P=0.5-0.43=0.07(3)-1.5≤Z≤1.5,p=0.43+0.43=0.86(4)p=0.78,Z=0.77,Y=0.30(5)p=0.23,Z=0.61,Y=0.33(6)1.85≤Z≤2.10,p=0.482—0.467=0.01511、(1)P=0.35,Z=1.04(2)P=0.05,Z=0.13(3)P=0.15,Z=-0.39(4)P=0.077,Z=-0.19(5)P=0.406,Z=-1.3212、(1)P=0.36,Z=-1.08(2)P=0.12,Z=0.31(3)P=0.125,Z=-0.32(4)P=0.082,Z=-0.21(5)P=0.229,Z=0.6113、各等级人数为23,136,341,341,136,2314、T分数为:73.3、68.5、64.8、60.8、57、53.3、48.5、46.4、38.2、29.515、三次6点向上的概率为0.054,三次以上6点向上的概率为0.06316、回答对33道题才能说是真会不是猜测17、答对5至10到题的概率是0.002,无法确定答对题数的平均数18、说对了5个才能说看清了而不是猜对的19、答对5题的概率是0.015;至少答对8题的概率为0.1220、至少10人被录取的概率为0.1821、(1)t0.05=2.060,t0.01=2.784(2)t0.05=2.021,t0.01=2.704(3)t0.05=2.048,t0.01=2.76322、(1)χ20.05=43.8,χ20.0,1=50.9(2)χ20.05=7.43,χ20.0,1=10.923、(1)F0.05=2.31,F0.01=3.03(2)F0.05=6.18,F0.01=12.5324、Z值为3,大于Z的概率是0.0013525、大于该平均数以上的概率为0.0826、χ2以上的概率为0.1;χ2以下的概率为0.927、χ2是20.16,小于该χ2值以下概率是0.8628、χ2值是12.32,大于这个χ2值的概率是0.2129、χ2值是15.92,大于这个χ2值的概率是0.0730、两方差之比比小于F0.05第七章参数估计5、该科测验的真实分数在78.55—83.45之间,估计正确的概率为95%,错误概率为5%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
题。这种类型的
2
检验适用于探讨两个变量之间
是否具有关联(非独立)或无关(独立),如果
再加入另一个变量的影响,即探讨三个变量之间
关系时,就必须使用多维列联表分析方法。
Χ2检验的类别
(三)同质性检验
同质性检验的主要目的在于检定不同人群母 总体在某一个变量的反应是否具有显著差异。
当用同质性检验检测双样本在单一变量的分 布情 形,如果两样本没有差异,就可以说两个母 总体是同质的,反之,则说这两个母总体是异质 的。
Χ2检验的假设
(一)分类相互排斥,互不包容
2检验中的分类必须相互排斥,这样每一个观测
值就会被划分到一个类别或另一个类别之中。此 外,分类必须互不包容,这样,就不会出现某一 观测值同时划分到更多的类别当中去的情况。
Χ2检验的假设
(二)观测值相互独立 各个被试的观测值之间彼此独立,这是最基本的 一个假定,如一个被试对某一品牌的选择对另一 个被试的选择没有影响。 注意:当讨论列联表时,独立性假定是指变量之 间的相互独立。这种情况下,这种变量的独立性 正在被检测。而观测值的独立性则是预先的一个 假定。
数。
要求: fe ≥ 5
四、小期望次数的连续性校正
运用
2
检验时,有一个特殊的要求,单元
格的理论次数不得小于5,小于5时可能违反统
计基本假设,导致统计检验值要大于5,
否则 2 检验的结果偏差非常明显。
当单元格的人数过少时,处理的方法有四种: 1.单元格合并法 2.增加样本数 3.去除样本法 4.使用校正公式
(一)配合度检验
配合度检验主要用来检验一个因素多项分类 的实际观察数与某理论次数是否接近。
这种 2检验方法有时也称为无差假说检验。
当对连续数据的正态性进行检验时,这种检验又 可称为正态吻合性检验。
Χ2检验的类别
(二)独立性检验
独立性检验是用来检验两个或两个以上因素
各种分类之间是否有关联或是否具有独立性的问
Χ2检验的假设
(三)期望次数的大小有规定 为了努力使 2分布成为 2值合理准确的近似
估计,每一个单元格中的期望次数应该至少在5 以上。一些更加谨慎的统计学家提出了更严格的 标准,当自由度等于1时,在进行 2检验时,每 一个单元格的期望次数至少不应低于10,这样才 能保证检验的准确性。
Χ2检验的类别
2
2
此时,χ2分布的自由度为df =n-1。
χ2分布曲线
0.25
相 0.2 对 频0.15 数
0.1
n=1 n=4 n=10
0.05
0
显而易见,χ2检 验主要应用的是右 侧概率
n=20
χ2
χ2分布的特点
⑴、χ2分布呈正偏态,曲线的右侧无限延伸,但 不与基线相交。 ⑵、χ2值都是正值。 ⑶、χ2分布的和也是χ2分布。 ⑷、χ2分布随自由度的变化而不同。自由度越小, 曲线偏斜度越大;自由度越大,分布形态越趋于 对称。
第二节 配合度检验
配合度检验(goodness of fit test)主要 用于检验单一变量的实际观察次数分布与某理论 次数是否有差别。由于它检验的内容仅涉及一个 因素多项分类的计数资料,故可以说是一种单因 素检验(One-way test)。
一、配合度检验的一般问题
(一)统计假设 统计假设如下:
在正态分布的适合性检验,受到三个条件的限制, 其自由度为
df k 3
(三)理论次数的计算规则
数据分布以其理论概率为依据,这时的理论次 数等于总次数乘以某种属性出现的概率,即
fe Np
理论次数的计算,一般是根据某种理论,按一 定的概率通过样本即实际观察次数计算。某种理论 有经验概率,也有理论概率,如二项分布、正态分 布等。
二、配合度检验的应用
(一)检验无差假说 无差假说,是指各项分类的实计数之间没有差
异,也就是假设各项分类之间的机会相等,或概 率相等,因此理论次数完全按概率相等的条件计 算。即:
1
理论次数=总数× 分类项数
例10-1:随机抽取60名学生,询问他们在高 中是否需要文理分科,赞成分科的39人,反对 分科的21人,问他们对分科的意见是否有显著 差异?(p298)
第十章 2 检验
第一节 2检验的原理
χ2检验(chi-square test)是专门用于计数 数据的统计方法。 由于这类数据在整理时,常常以列联表 (contingency table)或交叉表(cross tabulation)呈现,因此这种分析方法又被 称为列联表分析或交叉表分析。
一、χ2检验及其特点
1.χ2分布
χ2分布是统计学中应用较多的一种抽样分 布。
χ2值是从同一总体中随机抽取的无限多个
容量为 n 的样本数据的平方和或标准分数
的平方和,即 2 X 2 或
2
X
2
2
此时χ2分布的自由度为df=n。
如果正态总体的平均数未知,需要用样本平均数
作为总体平均数的估计值,这时公式变为:
2 X X 2 n S 2
H0:
f
0
f
e
0或
f
0
f
e
H1:
f
o
f
0或
e
f
0
f
e
基本公式:
2
(
f
0
f
f
)2
e
e
(二)自由度的确定
自由度确定的一般原则是:以相互独立的类别数k (或C)减去所受的限制数,即:
df k M
在各种适合性检验中,如果理论次数只受到总和的限
制,即受 f0 fe 的限制,则自由度为:
df k 1
三、 2 检验的基本公式
2 检验的统计原理,是比较观察值与理论值
的差别: 1.如果两者的差异越小,检验的结果越不容易
达到显著性水平; 2.两者的差异越大,检验的结果越可能达到显
著性水平,就可以下结论拒绝虚无假设而接受备 择假设。
基本公式如下:
2
f 0 f e 2
fe
其中 f 0 表示实际观察次数, fe表示某理论次
χ2检验
χ2检验用于对点计而来的离散型数据资料进行 假设检验,对总体的分布不做要求,也不对总体 参数进行推论。χ2检验主要是对总体的数据分 布进行假设检验,因此属于自由分布的非参数检 验。
χ2值的特点
⑴、χ2值具有可加性; ⑵、χ2永远是正值;
理论频数也 称为期望次数。
⑶、χ2的大小随实际频数与理论频数差的大小而 变化。两者之差越小,说明样本分布与假设的理 论分布越一致;两者之差越大,说明样本分布与 假设的理论分布越不一致。