教育统计与测量 第3章 推断统计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
与性别无关
所谓方差分析(analysis of variance) ,是关 于k(k≥3)个样本平均数的假设测验方法,是将总 变异剖分为各个变异来源的相应部分,从而发 现各变异原因在总变异中相对重要程度的一种 统计分析方法。 在方差分析中,存在两种变异,一种叫做 组间变异,另一种叫做组内变异。引起组间变 异的原因有两种,一种是任何实验都无法避免 的随机误差,一种是实验效应,即实验因素的 作用。
t
X
X
n >30
n 1
Leabharlann Baidu
t
X
X
n
某校二年级学生期中英语考试成绩,其平均分数为 73分,标准差为17分。期末考试后,随机抽取20 人的英语成绩,其平均分数为79.2分。问二年级学 生的英语成绩是否有显著性进步?
t X 79 .2 73 1.63 17 19
第一节
正态分布 第二节 总体平均数的估计 第三节 几种常用统计检验方法 第四节 方差分析
Y
N e 2
( x )2 2 2
Y
1 e 2
Z2 2
已知Z值求面积
Z=0至某一Z值 两个Z值之间 某一Z值以上或者以下的面积
已知面积,求Z值
Z=0以上或以下某一面积相对应Z值 正态曲线上端或下端某一面积对应Z值 求正态曲线中央部位某一面积对应的Z值
问题的分析 检验的步骤
◦ 首先假设学生新、旧教法的教学效果不存在差异(H0) ◦ 检验假设是否成立。差异大否定原假设,差异小肯定原假 设。 ◦ 选择和计算统计量。 ◦ 判定标准:P<5%或 P<1%
假设检验不可能绝对准确,它也可能犯错误。 所犯的错误有两种类型:一类错误是原假设H0为真 却被我们拒绝了。犯这种错误的概率用α来表示, 所以也称作α错误或弃真错误。另一类错误是原假 设为伪,却被我们接受了,叫做第二类错误,犯这 种错误的概率用β来表示 ,所以也称作β错误或取 伪错误。 自然,人们希望犯这两类错误的概率越小越好 。但对于一定的样本容量n ,不能同时做到犯这两 类错误的概率都很小。如果减小α错误,就会增大 犯β错误的机会;若减小β错误,也会增大犯α错误 的机会。
计算t值
n 1
查表:df=n-1=19, t(19)0.05=2.093 结论:不存在显著性进步
检验两个样本平均数与其各自代表的总体的差异是 否显著。 双总体t检验分为两类:
◦ 配对t检验(Paired-Samples t Test) 用于检验两个相关样本的平均数与其各自代表的总体的 差异是否显著。分两种情况: (1)自身不同处理结果的检验, (2)同一总体配对后不同处理结果的检验。 ◦ 两组独立样本的t检验(Independent-Samples t Test) 用于检验两个独立样本的平均数与其各自代表的总体的 差异是否显著。
Z X
n
69 66 1.09 11 .7 18
判断:与1.96比较
检验两个独立大样本的平均数的差异是否显著。
Z
X1 X 2
2 X1
n1
2 X2
n2
高一学生英语测验成绩见表。问男女生英语测验成 绩有无显著性差异。
性别 男 女
人数n 180 160
平均分数 76.2 78.2
对170名男女学生进行一项心理测验,其中全体学生 对某问题回答的结果如表所示。问男女学生对这个问 题的回答有无显著性差异。
另一类数据
合格
一类 数据 男生 女生 22 18
不合格
88 42
合计
110 60
合计
40
130
170
2×2列联表下的一般结构
另一类数据 B1 A1 a c a+c B2 b d b+d 合计 a+b c+d N=a+b+c+d
一类数据
合计
A2
计算公式
N (ad bc) 2 2 (a b)(c d )( a c)(b d )
对170名男女学生进行一项心理测验,其中全体学生 对某问题回答的结果如表所示。问男女学生对这个问 题的回答有无显著性差异。
另一类数据
合格
一类 数据 合计 男生 女生 22 18 40
一般可以认为引起组内变异的原因是随机 因素的影响,于是我们用组内MSw去描述组内变 异,以组间方差MSb去描述组间变异。然后以 组内方差为尺度去衡量组间方差,即计算F值 (F=MSb/MSw)。若组间方差大小和组内方差 差不多,或者更小,则认为引起组间变异的原 因主要是随机因素的影响,试验效应不显著; 相反则试验效果显著。
一、原始分数的局限性
(1)相同测验,分值的差异不等值 物理 物理 物理 物理 90 80 60 50 (2)不同测验的分值不等值 语文 外语 物理 数学 90 90 80 80 (3)可比性差、不同测验的分数不具有可加性
二、标准分数
标准分数的定义
Z
X X
Z分布
抽样分布的概念:抽样分布是指某种统计量(如平 均数和标准差)的概率分布。 抽样有无数种结果,每种结果都会有相应的统计量 ,这样这些统计量就构成了概率分布。
从某校高中应届毕业生中抽54人进行体检,健康状况属于良 好的有15人,中等的有23人,差的有16人。问该校高中应 届毕业生健康状况好、中、差的人数比率是否是1:2:1? 第一步:建立建设H0:好、中、差的人数比率是否是1:2:1 第二步:计算理论频数和χ2值 , 2 1
f e1 f e3 54
当然,使α、β 同时变小的办法也有,这就是增大 样本容量。但样本容量不可能没有限制,否则就会 使抽样调查失去意义。因此,在假设检验中,就有 一个对两类错误进行控制的问题。 一般地说,哪一类错误所带来的后果越严重,危害 越大,在假设检验中就应当把哪一类错误作为首要 的控制目标。但在假设检验中,大家都在执行这样 一个原则,即首先控制犯α错误原则。从前面假设 检验的步骤中我们会发现,步骤之三“规定显著性 水平”就体现了这样的原则。这样做的原因主要有 两点,一个是大家都遵循一个统一的原则,讨论问 题就比较方便。但这还不是最主要的。最主要的原 因在于,从实用的观点看,原假设是什么常常是明 确的,而备择假设是什么则常常是模糊的。
从总体中随机抽出容量为n的一切可能样本的平均 数的平均数等于总体的平均数。 容量为n的平均数在抽样分布上的标准差等于总体 标准差除以n的方根。 从正态总体中,随机抽取的容量为n的一切可能样 本平均数的分布也呈正态分布;即使总体不呈正态 分布,如果样本容量较大,则样本平均数的抽样分 布也接近于正态分布。(中心极限定理)
t
X1 X 2
x x 2r x x
2 2
1 2 1
2
n 1
注意:t检验和z检验都要是方差齐的情况下, 总体都要求正态分布
用于检验两个相互独立的样本方差是否存在差异
一种研究多项分类计数数 据的统计方法。通常用于: 1、检验一个因素两项或多项 分类的实际观察数与某理论 次数分布是否相一致。 2、检验两个或者两个以上因 素各有多项分类之间是否存 在关联或者是否独立。 3、适用于计数资料的检验。
1.以0为中心,左右对称的单峰分布; 2.t分布是一簇曲线,其形态变化与n(确切地说与自由 度ν)大小有关。自由度ν越小,t分布曲线越低平;自由 度ν越大,t分布曲线越接近标准正态分布(u分布)曲线 ,如图.
一、统计检验的一般概念 例:某学校高中一年级试用一种新 的语文教学法,已知用原来的教学法,语 文考试的平均分数为79分(μ)标准差为 11分(σ)。使用新教学法后,从一年级 全体学生中随机抽取了30人(n),其平 均成绩为84分(X )。问:新、旧教法的 教学效果是否存在差异。
经过方差分析所得的F值能表明各样本所取 自的总体均值之间的差异显著情况,但各对平 均数间何者显著,何者不显著尚未得知,因此 在F检验后,对各样本平均数之间仍需进行分析 比较,有必要进行各个平均数差异的显著性检 验。 等级数a:平均数从小到大排列的顺序中, 每对平均数间包含的组数(包括被比较的两个 组在内)。 1.完全随机设计的q检验 2.随机区组设计的q检验
1.完全随机设计的方差分析 为了检验某一个因素多种不同水平间差异的 显著性,可从同一个总体中随机抽取被试,再 随机的分入各实验组,施以各种不同实验处理 之后,用方差分析法进行分析。 2.随机区组设计的方差分析 在检验某一因素多种不同水平之间差异的显 著性时,为了减少被试间个别差异对结果的影 响,把从同一个总体中抽取的被试按条件相同 的原则分成各个组,使每个区组内的被试尽量 保持同质,或是同组被试反复作不同实验处理。
从某校高一学生中随机抽取60人进行调查,问他们高中要不 要实行文理分科,回答赞成的39人,反对的21人,问该校 高中生对实行文理分科的态度是否显著性差异? 第一步:建立建设H0: f0=fe=30 第二步:计算理论频数和χ2值
( f 0 f e ) 2 (39 30 ) 2 (21 30 ) 2 2 5.4 fe 30 30
总体平均数的参数估计是指由样本平均数对总体平 均数进行的估计,它分为点估计和区间估计。 点估计是指用某一样本的平均数的值来估计总体平 均数的值。 区间估计是指以样本平均数的抽样分布为理论依据 ,按一定概率要求,由样本平均数的值来估计总体 平均数所在的区间范围。
总体标准差已知或总体标准差未知但n>30 总体标准差未知且n<30
( f0 fe ) fe
2
2
这里:
f0
实得次数 理论次数
fe
又称为配合度检验,用于检验一个因素两项或多项
分类的实际观察数与某理论次数分布是否相一致 。统计假设为: H0: f0-fe=0; 或 f0=fe H1: f0-fe≠0; 或 f0 ≠ fe
如果χ2》 02.05 ,拒绝H0 , 此时推论错误的概率为0.05
样本标准差 11.50 10.50
Z
X1 X 2
2 X
1
n1
2 X
2
76.2 78.2 11.5 2 10.50 2 180 160
1.425
n2
Z 1.96
无显著性差异
三、t检验
◦ 单总体t检验
检验一个样本平均数与一个已知的总体平均数的差异是否显著。 适用于:t分布;n < 30的样本。 检验统计量: n < 30
不合格
88 42 130
合计
110 60 170
N (ad bc) 2 2 (a b)(c d )( a c)(b d ) 170 (22 42 88 18) 2 40 130 110 60 2.1577
df=1,
(21) 0.05 3.84
第三步: 推断 查χ2值 df=2-1=1, , 5.4>3.84, P<0.05, 原假设不成立。
(21) 0.05 3.84
检验双向分类数据结构中两类分类特征或 属性之间是否具有独立性。 按惯用计算方法的不同,这种检验通常又 可分为2×2列联表下的χ2检验以及r×k列 联表下的χ2检验
2
4
13.5
f e 2 54
4
27
2 第三步: 推断 查χ2值 df=k-1=3-1=2, ( 2) 0.05 5.99 , 1.22<5.99, P>0.05, 原假设成立。
( f 0 f e ) 2 (15 13.5) 2 (23 27 ) 2 (16 13.5) 2 1.22 fe 13 .5 27 13 .5
三、Z检验
◦ 单总体Z检验
检验一个样本平均数与一个已知的总体平均数是否存在显 著差异。 计算统计量为: X Z
n X :样本平均数、μ:总体平均数 σ:总体标准差、n :样本数 判断标准:Z<还是>1.96
如果Z< 1.96,接受假设; 如果Z >1.96,拒绝假设。
某小学历届毕业生汉语拼音测验的平均分数为66 分,标准差为11.7。现用同样的试题测验应届毕业 生,并从中随机抽18份试卷,算得平均份为69分 。问该校应届与历届毕业生汉语拼音测验成绩是否 一样?