心理与教育统计学课件(张厚粲版)ch10卡方检验
教育与心理统计学第十章:卡方检验
B因素
类别1 ( B1) 类别2 (B 2) 合计
A因素
类别1 类别2 ( A 1) ( A 2)
N A1N B1/ Nt
N A 2N B1/ Nt
N A 2N B2/ Nt
N A 2N B2/ Nt
合计 N 2 B1 N B2
N A1
N A2
Nt
六、小期望次数的连续性校正
当单元格的人数过少时,处理的方法有四种: 1、单元格合并 2、增加样本数 3、去样本法 4、使用校正公式
3、同质性检验——检验不同人群总体在某一个变量的 反应是否具有显著性差异。
三、 χ2检验的基本思想
首先假设H0 成立,计算出χ2值,它表示观察值与理论 值之间 的偏离程度。根据χ2分布, χ2统计量以及自由 度可以确定在H0 成立的情况下获得当前统计量及更极 端情况的概率P。
如果P 很小,说明观察值和理论值偏离程度太大,应 当拒绝原假设,表示比较资料之间有显著性差异;否 则就不能拒绝原假设,尚不能认为样本所代表的实际 情况与理论假设有差别。
(二)相关样本四格Hale Waihona Puke Χ2 检验例题:10—11
(一)独立样本的四格表χ2检验
K2
n(ad bc)2
,
(a b)(c d )(a c)(b d )
其中n a b c d为样本容量。
因素A
因素B
分类1 分类2 合计
分类1
a c a+c
分类2
b d b+d
合计
a+b c+d N= a+b+ c+d
独立样本四格表χ2检验应掌握两种计算方法
一、独立性检验的一般问题与步骤
现代心理与教育统计学(张厚粲)课后习题答案
现代心理与教育统计学(张厚粲)课后习题答案第一章绪论(略)第二章统计图表(略)第三章集中量数4、平均数约为36.14;中位数约为36.635、总平均数为91.726、平均联想速度为5.27、平均增加率约为11%;10年后的毕业人数约有3180人8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7第四章差异量数5、标准差约为1.37;平均数约为1.196、标准差为26.3;四分位差为16.037、5cm组的差异比10cm组的离散程度大8、各班成绩的总标准差是6.039、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76第五章相关关系5、应该用肯德尔W系数。
6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。
7、这两列变量的等级相关系数为0.97。
8、上表中成绩与性别有很强的相关,相关系数为0.83。
9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。
10、测验成绩与教师评定之间有一致性,相关系数为0.87。
11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。
12、肯德尔一致性叙述为0.31。
第六章概率分布4、抽得男生的概率是0.355、出现相同点数的概率是0.1676、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.167、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.1858、两个正面,两个反面的概率p=6/16=0.375;四个正面的概率p=1/16=0.0625;三个反面的概率p=4/16=0.25;四个正面或三个反面的概率p=0.3125;连续掷两次无一正面的概率p=0.18759、二项分布的平均数是5,标准差是210、(1)Z≥1.5,P=0.5-0.43=0.07(2)Z≤1.5,P=0.5-0.43=0.07(3)-1.5≤Z≤1.5,p=0.43+0.43=0.86(4)p=0.78,Z=0.77,Y=0.30(5)p=0.23,Z=0.61,Y=0.33(6)1.85≤Z≤2.10,p=0.482—0.467=0.01511、(1)P=0.35,Z=1.04(2)P=0.05,Z=0.13(3)P=0.15,Z=-0.39(4)P=0.077,Z=-0.19(5)P=0.406,Z=-1.3212、(1)P=0.36,Z=-1.08(2)P=0.12,Z=0.31(3)P=0.125,Z=-0.32(4)P=0.082,Z=-0.21(5)P=0.229,Z=0.6113、各等级人数为23,136,341,341,136,2314、T分数为:73.3、68.5、64.8、60.8、57、53.3、48.5、46.4、38.2、29.515、三次6点向上的概率为0.054,三次以上6点向上的概率为0.06316、回答对33道题才能说是真会不是猜测17、答对5至10到题的概率是0.002,无法确定答对题数的平均数18、说对了5个才能说看清了而不是猜对的19、答对5题的概率是0.015;至少答对8题的概率为0.1220、至少10人被录取的概率为0.1821、(1)t0.05=2.060,t0.01=2.784(2)t0.05=2.021,t0.01=2.704(3)t0.05=2.048,t0.01=2.76322、(1)χ20.05=43.8,χ20.0,1=50.9(2)χ20.05=7.43,χ20.0,1=10.923、(1)F0.05=2.31,F0.01=3.03(2)F0.05=6.18,F0.01=12.5324、Z值为3,大于Z的概率是0.0013525、大于该平均数以上的概率为0.0826、χ2以上的概率为0.1;χ2以下的概率为0.927、χ2是20.16,小于该χ2值以下概率是0.8628、χ2值是12.32,大于这个χ2值的概率是0.2129、χ2值是15.92,大于这个χ2值的概率是0.0730、两方差之比比小于F0.05第七章参数估计5、该科测验的真实分数在78.55—83.45之间,估计正确的概率为95%,错误概率为5%。
(心理统计学-1)(张厚粲主编) 绪论
推论统计
假设检验 参数检验 非参数检验 样本选择与分配 实验误差与分析 方差分析 协方差分析 回归分析 因子分析 ……
心理统计学(绪论) 17
实验设计
2010-09-20
第三节 心理与教育统计学的发展
一、政治算术-------社会经济统计
产生于17世纪中叶的英国,主要代表人物是威廉• 配第(William Patty,1623--1687年)和约瀚•格郎 特(John Graunt,1620-1674年)。
2010-09-20 心理统计学(绪论) 3
案例1:
研究某地2003年出生的男孩,截止到2011年3月男
孩的身高、体重、智力水平等发育情况及患有智障、 孤独症情况。假如该地存活的男孩有10万人,如何 进行?
2010-09-20
心理统计学(绪论)
4
案例2: 比较我校不同专业在校大学生的心理健康 状况、幸福度,请做出科学可行的设计。
第一章绪论第一章绪论?统计方法在心理和教育科学研究中的作用?心理与教育统计学的内容20100920心理统计学绪论10?心理与教育统计学的发展?心理与教育统计的基础概念重点掌握本章重点内容?数据的分类?统计学常用基本概念20100920心理统计学绪论11第一节统计方法在心理和教育科学研究中的作用第一节统计方法在心理和教育科学研究中的作用一心理与教育统计的定义与性质二心理与教育科学研究数据的特点一心理与教育统计的定义与性质二心理与教育科学研究数据的特点20100920心理统计学绪论12三学习心理与教育统计应注意的事项一心理与教育统计的定义与性质心理与教育统计是专门研究如何运用统计学原理与方法搜集整理分析心理与教育科学研究中获得的随机性数据资料并根据这些数据资料传递的信息进行科学推论是专门研究如何运用统计学原理与方法搜集整理分析心理与教育科学研究中获得的随机性数据资料并根据这些数据资料传递的信息进行科学推论找出心理与教育活动规律的一门学科
张厚粲《现代心理与教育统计学》(第三版)教材辅导书-教材精讲-第十章 卡方检验【圣才出品】
又可称为正态吻合性检验。
2.独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有
独立性的问题。两个因素是指所要研究的两个不同事物。例如性别与对某个问题的态度是
否有关系,这里性别是一个因素,分为男女两个类别,态度是另一个因素,可分为赞同、
不置可否、反对等多种类别。各因素分类的多少视研究的内容及所划分的分类标志而定。 这种类型的 2 检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独立),如
另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽
然很小,但在可以接受的标准范围内,只有一个类别的理论次数低于 1。此时,一个简单
的处理原则是设法使每一个类别的理论次数都不要低于 1,分类中不超过 20%的类别的理
论次数可以小于 5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避 免使用近似的 2 检验。
(二) 2 检验的类别 2 检验因研究的问题不同,可以细分为多种类型,如配合度检验、独立性检验、同质
2 / 26
圣才电子书
性检验等等。
十万种考研考证电子书、题库视频学习平 台
1.配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近, 这种 2 检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验
的是列联表中每项分类单元格中的实计数与理论次数。 3.一旦 2 值大于某一临界值,即可获得显著的统计结论。这个临界值是由某一特定
的差异性。理论或总体的分布状况,用统计的期望值来表示。 2 检验的统计原理,是比较
观察值与理论值的差别,如果两者的差异越小,检验的结果越不容易达到显著性水平;两
者的差异越大,检验的结果越可能达到显著性水平,就可以下结论拒绝虚无假设而接受备
心理与教育统计(ppt)
第四节 心理与教育统计基础概念
• 一、数据类型 • 二、变量、观测量、随机变量 • 三、总体、样本与个体 • 四、次数、比率、频率与概率 • 五、参数和统计量
一、数据类型
• (一)从数据的观测方法和来源划分,研究数据可区分为计数 数据和测量数据两大类
• (二)根据数据反映的测量水平,可把数据区分为称名数据、 顺序数据、等距数据和比率数据四种类型
(一)学习心理与教育统计学要注意的几个问题
–要克服畏难情绪 –重点掌握各种统计方法使用的条件 –要做一定的练习
(二)应用心理与教育统计方法时要切记的要点
–克服“统计无用”与“统计万能”的思想,注意科研 道德
• “统计无用”:不能根据数字的表面直接得出结论。 • “统计万能”:不能改变事物的本来面目,把“规律”
• 连续数据(continuous data):指任意两个数据点之间 都可以细分出无限多个大小不同的数值。如年龄、长 度、重量、自信的分数等。
• 离散数据在数轴上表示一点
• 连续数据在数轴上表示一段距离
二、变量、观测量、随机变量
• 变量(variables):指心理与教育实验、观察、调查中想要获 得的数据。数据获得前用“X”表示,即为一个可以取不同数 值的物体的属性或事件,其数值具有不确定性,因而称它为变 量。
创造出来。
–正确选用统计方法,防止误用和乱用统计
一项研究的价值受制于多种因素
• 研究问题本身是否有价值 • 研究问题在心理与教育统计领域的理论与实践意义 • 研究过程中对实验变量控制的程度 • 反映变量观测的准确可靠程度 • 分析实验数据的统计方法是否恰当等等
–注意:在研究中重点应该放在研究问题的提出和研究 设计上面
• 顺序数据(ordinal data):是指既无相等单位,也无绝对零点 的数据,是按事物某种属性的多少或大小,按次序将各个事物 加以排列后获得的数据资料。如学习成绩的优良中差;个子的 高中低;名次、等级等。
心理与教育统计学PPT课件
17
第17页/共28页
第三节 心理与教育统计学的发 • 心理与教育统计在我国的发展与应用(p.17): 展 • 统计方法的引入
• 受挫时期 • 复苏和发展
18
第18页/共28页
• 一、数据类型 第四节 心理与教育统计基础概 念 • 不同类型的数据,适用的统计方法不同。
12
第12页/共28页
推论统计
• 主要研究如何通过局部数据所提供的信息,推论总体的情形。 • 具体包括:
• 1、总体参数的估计方法(参数、非参数) • 2、假设检验(计数数据和测量数据)
13
第13页/共28页
实验设计
• 研究如何科学地、经济地以及更有效地进行实验。 • 作为一个严谨的实验研究,在实验以前就要对研究的步骤、被
• 心理与教育科学研究数据与结果多用数字形式呈现; • 研究数据具有随机性和变异性; • 研究数据具有规律性(随观测次数增加,呈现出一定规律); • 心理与教育科学研究的目标是通过部分数据来推测总体特征;
• 举例:测智商
6
第6页/共28页
第一节 统计方法在心理与教育科学研究中的 作• 三用、学习心理与教育统计应注意的事项。
量(variables)。
• 与变量相反的是常数(constant)。
• 观测值
• 变量一但确定了某个值,就称这个值为某一 变量的观测值(observation)。
• 随机变量
• 在测查前不能预料取到什么值的变量,称为
随机变量(random variables)。
23
第23页/Байду номын сангаас28页
数据的精确值问题
9
第9页/共28页
心理与教育统计学课件(张厚粲版)ch10卡方检验共49页
15、机会是不守纪律的。——雨果
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿
心理与教育统计学课件(张厚 粲版)ch10卡方检验
11、战争满足了,或曾经满足过人的 好斗的 本能, 但它同 时还满 足了人 对掠夺 ,破坏 以及残 酷的纪 律和专 制力的 欲望。 ——查·埃利奥 特 12、不应把纪律仅仅看成教育的手段 。纪律 是教育 过程的 结果, 首先是 学生集 体表现 在一切 生活领 域—— 生产、 日常生 活、学 校、文 化等领 域中努 力的结 果。— —马卡 连柯(名 言网)
拉
60、生活的道路一旦选定,就要勇敢地 走到底 ,决不 ห้องสมุดไป่ตู้头。 ——左
心理与教育统计学第10章 卡方检验
题。这种类型的
2
检验适用于探讨两个变量之间
是否具有关联(非独立)或无关(独立),如果
再加入另一个变量的影响,即探讨三个变量之间
关系时,就必须使用多维列联表分析方法。
Χ2检验的类别
(三)同质性检验
同质性检验的主要目的在于检定不同人群母 总体在某一个变量的反应是否具有显著差异。
当用同质性检验检测双样本在单一变量的分 布情 形,如果两样本没有差异,就可以说两个母 总体是同质的,反之,则说这两个母总体是异质 的。
Χ2检验的假设
(一)分类相互排斥,互不包容
2检验中的分类必须相互排斥,这样每一个观测
值就会被划分到一个类别或另一个类别之中。此 外,分类必须互不包容,这样,就不会出现某一 观测值同时划分到更多的类别当中去的情况。
Χ2检验的假设
(二)观测值相互独立 各个被试的观测值之间彼此独立,这是最基本的 一个假定,如一个被试对某一品牌的选择对另一 个被试的选择没有影响。 注意:当讨论列联表时,独立性假定是指变量之 间的相互独立。这种情况下,这种变量的独立性 正在被检测。而观测值的独立性则是预先的一个 假定。
数。
要求: fe ≥ 5
四、小期望次数的连续性校正
运用
2
检验时,有一个特殊的要求,单元
格的理论次数不得小于5,小于5时可能违反统
计基本假设,导致统计检验值要大于5,
否则 2 检验的结果偏差非常明显。
当单元格的人数过少时,处理的方法有四种: 1.单元格合并法 2.增加样本数 3.去除样本法 4.使用校正公式
(一)配合度检验
配合度检验主要用来检验一个因素多项分类 的实际观察数与某理论次数是否接近。
这种 2检验方法有时也称为无差假说检验。
现代心理与教育统计学培训课件
➢ 离散变量:数个数 ➢ 连续变量:温度、体重、分数漳 州 师 范 学 院,2006
2 数据的搜集
THE METHOD AND TECHNIQUE OF STATISTICS
数据的计量我们清楚啦,下面是数据 从何而来
数据最初的来源是直接的调查和试验 但是从使用数据者的角度看,可分:
张厚粲.心理与教育统计学〔M〕.北京:北京师 范大学出版社,2004,10
王见定.社会统计学与数理统计学的统一〔M〕. 北京:中国经济出版社,2006,5
戴维.K.希尔德布兰德.社会统计方法与技术 〔M〕.北京:社会科学文献出版社,2005,6
卢淑华.社会统计学〔M〕.北京:北京大学出版 社,2000,10
漳 州 师 范 学 院,2006
3.2 数据分组
THE METHOD AND TECHNIQUE OF STATISTICS
数据分组:按照数据的某种特征分组 分组标准:品质标准、数量标准 按照数量标准分组可以分为:单变量分
组、组距分组 按照组距分组:
➢ 组数:不要太多,不要太少。一般取5- 15组
漳 州 师 范 学 院,2006
3.1 数据的审核
THE METHOD AND TECHNIQUE OF STATISTICS
对于直接数据应该从完整性和准确性两 个方面审核数据。
➢ 完整性:是否有调查遗漏——回收率 ➢ 准确性:有效问卷——有效率
对于间接数据出了考查完整性和准 确性,还要审核适应性、时效性等, 滞后数据提供滞后信息,可能已经 失去研究意义。
1637 2397 4236 5120 5500 3941
22831
漳 州 师 范 学 院,2006
2.2 调查方法
现代心理与教育统计学 第八章-假设检验(张厚粲)
—1.96 接受H0 1.96
5、计算样本统计量的值
Z=
X-0 0
110 100 16
50 2 16
4.42
n
50
6、作出统计决策
Z=4.42>1.96, 所以Z落入拒绝区域,应推翻H0,接受 H1。即该班的智力水平与常模有显著差异。
第二节 平均数的显著性检验
Ⅱ型错误
α错误 正确
β 错误
(二)两类错误的关系
1. + ≠ 1 原因:与是两个前提下的概率。 即是拒绝原假设H0时犯错误的概率,这时前提是
H0为真; 是接受原假设H0时犯错误的概率,这时前提是H0
为伪。
H0为真, 即 μ 0=μ 1 的分布
+ ≠ 1
H1为真, 即 μ 0≠μ 1 的分布
(四)单侧与双侧检验
1.双侧检验:只强调差异,不管大小。 检验假设为: H0——零假设: μ 1=μ 0 H1——备择假设:μ 1≠μ 0
0.025
0.025
μ0
2.单侧检验:强调大小。 检验假设形式一: H0——零假设: μ 1≤μ 0 H1——备择假设:μ 1 >μ 0
条件分析 总体正态,方差已知,样本>30,单侧检验Z检验。
解:
(1)建立假设
Ho: 1 0 ,早期教育儿童智力低于一般儿童 H1: 10 ,早期教育儿童智力高于一般儿童
(2)计算标准误和检验值
标准误: SE 0 15 1.793
X n 70
检验值:Z X 0 103.3 100 1.84
μ0
0.05
2.单侧检验:强调大小。 检验假设形式二: H0——零假设: μ 1≥μ 0 H1——备择假设:μ 1 <μ 0
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](卡方检验)
圣才电子书 十万种考研考证电子书、题库视频学习平台
两个母总体是同质的,反之,则说这两个母总体是异质的。
3.比率的显著性检验与 2 检验的哪些应用有相同功能?
答:在只有两项分类的 2 检验与比例的显著性检验相同。在比率显著性检验时,先将 所关心的某一性质的实计数换算成比率 p , p 1 q , q 为非某一性质分类的次数比率。若
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 10 章 卡方检验
1.对于计数数据的统计分析方法有哪些? 答:可用于计数数据的统计分析方法有: 2 检验、配合度检验、四个表独立检验、多 重列联表分析等。
2. 2 检验法在计数数据的分析中有哪些应用? 答: 2 检验因研究的问题不同,可以细分为多种类型,如配合度检验、独立性检验、 同质性检验等等。 (1)配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近, 这种 2 检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验 又可称为正态吻合性检验。 (2)独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有 独立性的问题。两个因素是指所要研究的两个不同事物。例如性别与对某个问题的态度是否 有关系,这里性别是一个因素,分为男女两个类别,态度是另一个因素,可分为赞同、不置 可否、反对等多种类别。各因素分类的多少视研究的内容及所划分的分类标志而定。这种类 型的 2 检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独立),如果再加入 另一个变量的影响,即探讨三个变量之间关系时,就必须使用多维列联表分析方法。 (3)同质性检验主要目的在于检定不同人群母总体在某一个变量的反应是否具有显著 差异。当用同质性检验检测双样本在单一变量的分布情形,如果两样本没有差异,就可以说
心理与教育统计学课件张厚粲版ch卡方检验
一、独立性检验的一般问题
• 二维列联表的独立性检验的一般步骤:
1. 建立假设:H0:二因素之间是独立的或无关 联;H1:二因素之间是有关联的或者说差异 显著。(一般多用文字表述而很少用统j
fRi fCj 1213
N
3. 确定自由度: d fR 1 C 1
第一,单元格合并法。
配合研究目的,适当调 整变量分类方式,将部 分单元格予以合并。
第二,增加样本数。
如无法改变分类方式又 想获得有效样本,最佳 方法是直接增加样本数 。
第三,去除样本法。样 本无法增加,次数偏低 的类别又不具有分析与 研究价值时,
可将该类被试去除,但 研究的结论不能推论到 这些被去除的母总体中 。
10
例10 的计算: 解:正态分布的基线上四等份,每等份= (3σ+3σ)/4=1.5σ
概率P
f0
fe
优 0.49870.4332 7 3.5
0.06550.07
良 0 .430 3 .42 322 21.5
f0 fe
3.5 0.5
f0 fe 2
fe
3.5
0.01
中
0.43
18 21.5 -3.5
3
第一节 2 检验 概述
三、小期望次数的连续 性校正
运用 2检验时,要求各单元格 的理论次数不得小于 5,小于 5时可能违反基本假设,
导致统计检验高估的情 形出现。通常需要有 80% 以上的单元格理论值要 大于 5,否
则 2检验的结果偏差非常明 显。
当单元格的人数过少时 ,处理的方法有四种:
15
五、两项分类且某类理论次数小于5的 连续性校正
• 当只有两项分类(自由度为1)并且某项的理 论次数小于5时,比率的检验不能用正态近似, 而应用二项分布概率计算。若用 检验 2,就 要运用耶茨(yetes)连续性校正法,即在每一 组实际频数与理论频数差数的绝对值平方之前, 各减去0.5,用公式表示:
现代心理与教育统计学ppt课件
四、概率论的起源与发展
最早刊登有原始的概率论问题的数学书的作者 叫L.Pacioli(1445-1510)
G.Cardano(1501-1576) 从数学上研究了各种 赌博方法写出了《赌博者手册》
17世纪Pascal和Fermat提出了“概率”(描述 某一事件发生的可能性)的概念,发展了排列 组合理论和集合论
对概率论进行了重要的研究并使之成为数学的 一个分支的是瑞士的大数学家伯努利 (J.Bernoulli,1654-1705)。
de Moivre(1667-1754)所著的《偶然论》一书 中除了有类似于伯努利大数法则以外,还有关于 概率的更精确的计算法 。
Galton研究了平均值的偏差问题和回归问题,是统 计方法上的一大进步。
Pearson继承和发展了Galton的统计思想。他一生致 力于生物测量学、优生学、遗传学的统计方法研究; 他创造了许多统计学用语,如频度分布、频度分布 函数、回归、相关、拟合度等概念;今天的描述统 计学中大部分内容都是Pearson整理出来的;他与 Galton,Weldon在1901年开创了Biometrika杂志。
现代心理与教育统计学
教材:张厚粲,徐建平编著.心理与教育统计 学,北京师范大学出版社,2004年版
参考书目:
张敏强主编.教育与心理统计学.人民教育出版 社,2002年版
柯惠新等编著.统计分析法,北京广播学院出 版社,2003年版
王孝玲编著.教育统计学,华东师范大学出版 社,2001年版
第一节统计学发展史简介
(主要内容) 一、统计学的定义 二、统计学的起源 三、统计学的古老称谓 四、概率论的起源与发展 五、19世纪的统计――凯特勒的功绩 六、描述统计学的发展 七、推断统计的诞生 八、推断统计的应用 九、现代统计学
第10章--卡方检验-(Chi-PPT课件
例题:某学校对学生的课外活动内容进行调查,结果 整理成下表:
-
18
应用举例一
女性 男性 总和
自我知觉
总和
过轻
过重
419
1995
2414
(786.78)(1627.22)
959
855
1814
(591.22)(1222.78)
1378
1995 1938.67
56.33 3173.41
1.37
5816 5816
0
2297.1 3
df=3-1=2 查表,0.05水平上临界值为5.99,故……
df=3-1=2 查表, 0.01水平上临界值为9.21
-
15
三、卡方独立性检验
(一)适用材料 主要用于两个或两个以上因素多项分类的计数资料
分析。如果要研究的两个自变量之间是否具有独 立性或有无关联或有无“交互作用”的存在,就 要应用卡方独立性检验。 如果两个子变量是独立的,无关联的,就意味着对 其中一个自变量来说,另一个自变量的多项分类 次数上的变化是在取样误差的范围之内。假如两 个因素是非独立,则称两变量有交互作用。
第十二章 非参数检验
-
1
一、参数与非参数检验
参数检验 用于等比/等距型数据 参数检验的前提:正态分布和方差同质
非参数检验 不用对参数进行假设 对分布较少有要求,也叫distributionfree tests 用于名义/顺序型数据
-
2
参数统计和非参数统计优缺点
• 参数统计 优点:
对资料的分析利用充分 统计分析的效率高
于等与临界值才显著),使用9或3均可 • 接受虚无假设
第十章 卡方检验 教育统计与分析教学课件
双变量关系的假设检验
变量关系的显著性检验类型
定类 定序 定距
定类
卡方类测量 (卡 方 检 验 )
定序
卡方类测量 (卡 方 检 验 ) Spearm an 相
关系数 (Z 检 验 )
定距
方差分析 (F 检 验 )
Spearm an 相 关 系数
(Z 检 验 ) Pearson 相 关
四格表的独立性检验
独立样本
相关样本
缩减公式卡方 值的计算
校正卡方 值的计算
缩减公式卡方 值的计算
校正卡方 值的计算
独立样本四格表卡方检验
高二40个学生数学测验成绩如下表所示, 问男女学生数学成绩有无本质差异?
男 女 总和
80分以上 80分以下
总和
a=18
b=6
a+b=24
c=10 a+c=28
d=6 b+d=12
相关样本四格表的独立性检验
• 124个学生
1000米长跑,
训练一个月前
后两次测验达 标情况如下表 所示,问一个 月的训练是否
第 一
达 标
次 测 验
未 达 标
有显著效果?
第二次测验 达标 未达标
a=61
b=19
c=33
d=11
1.缩减公式卡方值的计算
2 b c2
bc
2.校正公式
当df 1,两个相关样本四中格 b表 c30或bc50
卡方检验的SPSS实现过程
• 配对卡方检验〔频数表〕 • 1.单击Data->Weight Cases…〔加权〕命令,
将“count〞调入右侧“Rrequency Variable 〞文本框中,单击“OK〞。 • 2.单击Analyze-> Classify->Descriptive Statistics: Crosstabs… • 然后在“Statistics〞中选中“Chi-square 〞与“McNemar〞 • 按“OK〞按钮输出结果。
现代心理与教育统计学 张厚粲 课后习题答案
现代心理与教育统计学(张厚粲)课后习题答案第一章绪论(略)第二章统计图表(略)第三章集中量数4、平均数约为36.14;中位数约为36.635、总平均数为91.726、平均联想速度为5.27、平均增加率约为11%;10年后的毕业人数约有3180人8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7第四章差异量数5、标准差约为1.37;平均数约为1.196、标准差为26.3;四分位差为16.037、5cm组的差异比10cm组的离散程度大8、各班成绩的总标准差是6.039、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76第五章相关关系5、应该用肯德尔W系数。
6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。
7、这两列变量的等级相关系数为0.97。
8、上表中成绩与性别有很强的相关,相关系数为0.83。
9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。
10、测验成绩与教师评定之间有一致性,相关系数为0.87。
11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。
12、肯德尔一致性叙述为0.31。
第六章概率分布4、抽得男生的概率是0.355、出现相同点数的概率是0.1676、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.167、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.1858、两个正面,两个反面的概率p=6/16=0.375;四个正面的概率p=1/16=0.0625;三个反面的概率p=4/16=0.25;四个正面或三个反面的概率p=0.3125;连续掷两次无一正面的概率p=0.18759、二项分布的平均数是5,标准差是210、(1)Z≥1.5,P=0.5-0.43=0.07(2)Z≤1.5,P=0.5-0.43=0.07(3)-1.5≤Z≤1.5,p=0.43+0.43=0.86(4)p=0.78,Z=0.77,Y=0.30(5)p=0.23,Z=0.61,Y=0.33(6)1.85≤Z≤2.10,p=0.482—0.467=0.01511、(1)P=0.35,Z=1.04(2)P=0.05,Z=0.13(3)P=0.15,Z=-0.39(4)P=0.077,Z=-0.19(5)P=0.406,Z=-1.3212、(1)P=0.36,Z=-1.08(2)P=0.12,Z=0.31(3)P=0.125,Z=-0.32(4)P=0.082,Z=-0.21(5)P=0.229,Z=0.6113、各等级人数为23,136,341,341,136,2314、T分数为:73.3、68.5、64.8、60.8、57、53.3、48.5、46.4、38.2、29.515、三次6点向上的概率为0.054,三次以上6点向上的概率为0.06316、回答对33道题才能说是真会不是猜测17、答对5至10到题的概率是0.002,无法确定答对题数的平均数18、说对了5个才能说看清了而不是猜对的19、答对5题的概率是0.015;至少答对8题的概率为0.1220、至少10人被录取的概率为0.1821、(1)t0.05=2.060,t0.01=2.784(2)t0.05=2.021,t0.01=2.704(3)t0.05=2.048,t0.01=2.76322、(1)χ20.05=43.8,χ20.0,1=50.9(2)χ20.05=7.43,χ20.0,1=10.923、(1)F0.05=2.31,F0.01=3.03(2)F0.05=6.18,F0.01=12.5324、Z值为3,大于Z的概率是0.0013525、大于该平均数以上的概率为0.0826、χ2以上的概率为0.1;χ2以下的概率为0.927、χ2是20.16,小于该χ2值以下概率是0.8628、χ2值是12.32,大于这个χ2值的概率是0.2129、χ2值是15.92,大于这个χ2值的概率是0.0730、两方差之比比小于F0.05第七章参数估计5、该科测验的真实分数在78.55—83.45之间,估计正确的概率为95%,错误概率为5%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
10
例10 的计算: 解:正态分布的基线上四等份,每等份= (3σ+3σ)/4=1.5σ
概率P
0.4987 − 0.4332 = 0.0655 ≈ 0.07 0.4332 ≈ 0.43
f0
fe
f0 − fe
( f 0 − f e )2
fe
优 良 中 差 合计
7 22 18 3 50
3.5 21.5 21.5 3.5 50
解: fe = 60× 0.5 = 30 (1)建立假设H0 : f0 = fe = 30; H1 : f0 ≠ fe :
(2)计算 值: χ = ∑ χ
2 2
( f0 − fe ) = (39− 30) + (21− 30)
2 2
2
(3)统计决断df = 2 −1 =1;查表得 χ(21).05 = 3.84, χ(21).01 = 6.63 : :
15
五、两项分类且某类理论次数小于5的 连续性校正
• 当只有两项分类(自由度为1)并且某项的理 论次数小于5时,比率的检验不能用正态近似, χ2 而应用二项分布概率计算。若用 检验,就 要运用耶茨(yetes)连续性校正法,即在每一 组实际频数与理论频数差数的绝对值平方之前, 各减去0.5,用公式表示:
χ =∑
2
( f0 − fe
fe
− 0.5)
2
16
例12 有一学校共评出10名优秀学生班干部, 其中男生3名,女生7名,问优秀学生班干 部是否存在男女性别差异? 解:假设无性别差异,则p=q=0.5,那么男 女应各有5人,这时需要使用亚茨校正公 式。 2 2
5 5 2 df = 1查表得 : χ (1)0.05 = 3.84 Q 0.9 < 3.84,∴ P > 0.05 故优秀学生班干部中, 不存在男女性别差异.
第十章
χ 2检验
前面几章所讲的总体平均数、方差的统计推断等内 容,均是针对连续性数据的。但在教育和心理研究中, 有时需研究的问题是按一定的性质划分为不同的类别, 然后统计各类别中的人数或个数,即需要用到计数资料。 例如,将人按照性别划分为“男”、“女”;将学生按 照学习成绩的优劣划分为“优”、“良”、“中”、 “差”等,然后对各类别分别有多少,占多大的比例等。 对于这些计数资料的统计分析,不能用前几章的统计方 2 2 法,则需要使用本章所介绍的 。应用 χ 检验 χ 检验 分析计数数据时,对计数数据总体的分布形态不作任何 假设,因此检验 被视为是非参数检验方法的一 χ2 种。
12
四、连续变量分布的吻合性检验
• 理论次数: f e = pi × N • 自由度:
df = 组数 − 计算理论次数时所用统计量的数
例11 表12-5所列资料是552名中学生的身高次数 分。问这些学生的身高是否符合正态分布?
13
例11解:表12-5 理论曲线的配合度检验
身高 组中 实际 分组 值XC 次数
5
第二节 配合度检验
一、配合度检验的意义 2 配合度检验是应用 χ 检验方法的一种,主要用 于检验实际观测次数与某理论次数是否有差别的情 况。它适用一个因素多项分类的计数资料,所以又 2 χ 2 检验。 称做单因素分类 χ 检验或单向表的 进行配合度检验,应当注意自由度的确定和理论 自由度的确定和理论 次数的计算。 次数的计算。 1. 配合度检验自由度确定与下列两个因素有关:一是 实验或调查中分类的项数;二是计算理论次数时, 用到的统计量的个数。自由度 资料分类的数目-计 自由度=资料分类的数目 自由度 资料分类的数目- 算理论次数时所用的统计量的个数。 算理论次数时所用的统计量的个数 2. 理论次数的计算,一般是根据某种理论,按一定的 概率通过样本即观测次数计算。通常用到无差假说、 正态分布、二项分布等理论模型。
Q 2.11 < 5.99,∴ P > 0.05 故该校老教师中, 健康状况好,中, 差三种人数无显著差异.
9
三、频数分布是否符合正态性的 χ 检验
2
检验还可以检验某些实得次数是否合乎正 态分布。不过,在计算时,要注意把常态分布 的概率,转换为理论次数的数值。即要用常态 分布的概率乘以总次数得出理论次数的分配。 • 例10 对50名学生进行操行评定 中18人,差3人,试检验其分布的形式是否合 乎正态分布?
6
二、无差假说的检验
• 无差假说是指各项分类的次数没有差异,即假 设各项分类之间的机会均等,或概率相等。因 此,理论次数完全按概率相等的条件计算,其 公式为:
1 f e = 总数 × 分类项数
7
例8 随机抽取60名学生,问他们高中要不 要文理分科,回答赞成的39人,反对的21 人,问对分科的意见有无显著差异?
169166163160157154151148145142139170 167 164 161 158 155 152 149 146 143 140 2 7 22 57 110 124 112 80 25 8 4
离差
15.38 12.38 9.38 6.38 3.38 0.38 -2.62 -5.62 -8.62 -11.62 -14.62
17
χ =
2
( 3 − 5 − 0.5)
+
( 7 − 5 − 0.5)
= 0.9
第三节 独立性检验
χ 2 检验的又一重要应用,它 • 独立性检验也是
主要用于两个或两个以上因素多项分类的计数 资料分析。如果想研究两个(或两个以上因素) 2 之间是否具有独立性或有无关联,就要用 χ 检验独立性检验。 • 如果两个因素是独立的,即无关联,就意味着 当其中一个因素变化时,另一个因素的变化是 在取样误差的范围之内;反之,如果两个因素 是非独立,即有关联或称有交互作用存在,当 其中的一个自变量(因素)变化时,另一个因 素的变化就超过了取样误差的范围。
1
第一节 χ 检验 概述
2
χ 2 和 χ 2检验的意义 一、
χ 2检验 方法能处理一个因素两项或多项分类的实际观
察频数与理论频数分布是否相一致问题,或者说有无显著 差异问题。所谓实际频数简称实计数或实际数,是指在实 验或调查中得到的计数资料,又称为观察频数。理论次数 是指根据概率原理、某种理论、某种理论次数分布或经验 次数分布计算出来的次数,又称为期望次数。
H1 : 健康状况好,中, 差三种人数不相同
(2)计算χ 2值 : 根据零假设, 其理论频数为 : f e = 54 = 18
3
(15 − 18)2 + (23 − 18)2 + (16 − 18)2 χ2 =
18 18 18
= 2.11
(3)统计决断 : df
= 3 − 1 = 2, 查表得, χ (2 )0.05 = 5.99 2
χ 2是实计数据与理论数据偏离程度的指标.
其基本公式为 : χ = ∑
2
( f 0 − f e )2
fe
2
第一节 χ 检验 概述
2
二、χ 2检验的假设 (一)分类相互排斥,互不包容 (二)观测值相互独立 在实验研究中,让观测值的总数等于实验中不同被试的总数,要求 每个被试只有一个观测值,这是确保观测值相互独立最安全的做法。 (三)期望次数的大小 为了努力使χ 2分布成为χ 2值合理准确的近似估计,每一个单元格中 的期望次数应该至少在5个以上。 当自由度等于1时,在进行χ 2检验时,每一个单元格的期望次数至少 不应低于10,这样才能保证检验的准确性。 在理论次数较小的特殊的四个表中,应运用一个精确的多项检验来 避免使用近似的χ 2检验。
3.5 0.5 -3.5 -0.5
3.5 0.01 0.57 0.07 4.15
11
0.43 0.07
例10的计算(续)
由上表得:
χ 2 = 4.15
df = 4 − 1 = 3, 查表得 : χ (23 )0.05 = 7.81 Q 4.15 < 7.81,∴ P > 0.05 故50名学生的操行评定, 其人数接近正态分布.
19
一、独立性检验的一般问题
• 二维列联表的独立性检验的一般步骤: 1. 建立假设:H0:二因素之间是独立的或无关 联;H1:二因素之间是有关联的或者说差异 显著。(一般多用文字表述而很少用统计符 号) f R ⋅ fC 2. 计算理论次数: f = K (12 − 13)
.090
χ 2 = 14.905 3
N = 552, X = 154.62, S = 5.07
∑ f e = 552
例11 解(续)
• 如果两端的组中的理论次数均有小于5的,则 需要将相邻的理论次数合并至大于5。本题共 分11组,两端均有理论次数小于5,上端二组 合并为一组,下端二组合并为一组,然后将实 χ 2值,本题由上 际次数也相应合并之后,再求 χ 面解得:2 = 3.905 。 2 χ (26 ).05 = 12.6 • df=9-3=6,查 χ 值表得: 因为3.903<12.6,所以P>0.05,差异不显著。 故这552名中学生的身高分布符合正态分布。
p= Z分 查表 Y Y⋅ i 数
fe =
S p× N
1 7 24 60 104 130 114 70 31 9 2
( f0 − fe )
fe .125
.167 .150 .471 .277 .035 1.429 1.161
2
3.03 0.004 .00237 2.44 .00203 .01201 1.85 .0720 .04260 1.26 .1840 .10888 0.67 .3187 .18858 .07 .3979 .23544 -0.52 .3484 .20615 -1.11 .2154 .12746 -1.70 .0940 .05562 -2.29 .0289 .01710 -2.88 .0067 .00396