教案_第七章 假设检验
第七章假设检验
第一节 第二节 检验 假设检验的一般问题 总体均值, 总体均值,比例和方差的假设
学习目标
1. 了解假设检验的基本思想 2. 掌握假设检验的步骤 3. 能对实际问题作假设检验
第一节 假设检验的一般问题
一,假设检验的概念 二,假设检验的步骤 三,假设检验中的小概率原理 四,假设检验中的两类错误 五,双侧检验和单侧检验
拒绝域 置信水平
α
1-α 接受域 H0值 样本统计量
临界值
6,右侧检验(显著性水平与拒绝域 ) 右侧检验( 抽样分布
置信水平 拒绝域 1-α 接受域 H0值 观察到的样本统计量 样本统计量
α
临界值
抽样分布
1-α 接受域 H0值
置信水平 拒绝域
α
临界值
样本统计量
第二节 总体均值,比例和方差的假设检验
1,原假设为真时拒绝原假设 , 2,会产生一系列后果 , 3,第一类错误的概率为α ,第一类错误的概率为α
被称为显著性水平 第二类错误(取伪错误) (二)第二类错误(取伪错误)
1,原假设为假时接受原假设 , 2,第二类错误的概率为β ,第二类错误的概率为β
(三)列表
H0: 无罪
假设检验就好 像一场审判过程
2,确定假设的步骤 例如问题为: 检验该企业生产的零件平均长度为4厘米 步骤: (1)从统计角度陈述问题 ( = 4) 1 (2)从统计角度提出相反的问题 ( ≠ 4) 必需互斥和穷尽 (3)提出原假设 ( = 4) (4)提出备择假设 ( ≠ 4) 有 ≠ 符号
3,双侧检验(例子) 双侧检验(例子)
1,原假设与备择假设是一个完整事件组. 2,通常先确定备择假设,再定原假设. 3,等号总放在原假设. 4,两者的选择本质上带有主观色彩. 5,假设检验的目的主要是收集证据拒绝原 假设.
假设检验大学教案
教学目标:1. 理解假设检验的基本概念和原理。
2. 掌握单样本和双样本假设检验的方法。
3. 能够运用假设检验解决实际问题。
教学重点:1. 假设检验的基本概念和原理。
2. 单样本和双样本假设检验的方法。
教学难点:1. 假设检验中的显著性水平、P值和置信区间。
2. 实际问题中的假设检验应用。
教学过程:一、导入1. 通过实例介绍假设检验在科学研究、经济统计、质量控制等领域的应用。
2. 引导学生思考:如何判断一个现象或结论是否具有统计学上的显著性?二、基本概念和原理1. 介绍假设检验的基本概念,如原假设、备择假设、显著性水平、P值、置信区间等。
2. 解释假设检验的原理,包括零假设检验和备择假设检验。
3. 讲解假设检验的基本步骤,如提出假设、选择检验方法、计算检验统计量、确定显著性水平、做出决策等。
三、单样本假设检验1. 介绍单样本假设检验的适用条件。
2. 讲解单样本t检验和z检验的方法,包括计算公式、步骤和注意事项。
3. 通过实例演示单样本假设检验的应用。
四、双样本假设检验1. 介绍双样本假设检验的适用条件。
2. 讲解双样本t检验和F检验的方法,包括计算公式、步骤和注意事项。
3. 通过实例演示双样本假设检验的应用。
五、实际问题中的假设检验应用1. 引导学生思考实际问题中的假设检验问题。
2. 讲解如何将实际问题转化为假设检验问题,并选择合适的检验方法。
3. 通过实例演示实际问题中的假设检验应用。
六、总结与拓展1. 总结假设检验的基本概念、原理和方法。
2. 强调假设检验在实际问题中的应用。
3. 拓展学习内容,如假设检验的局限性、误差分析等。
教学评价:1. 学生能够正确理解假设检验的基本概念和原理。
2. 学生能够运用单样本和双样本假设检验解决实际问题。
3. 学生能够对实际问题中的假设检验问题进行分析和决策。
教学反思:1. 教师应注重引导学生理解假设检验的基本原理,而不是单纯记忆公式和步骤。
2. 教师应结合实际案例,帮助学生将抽象的数学理论应用于实际问题。
第七章 假设检验
第七章假设检验第一节假设检验的基本知识一、假设陈述1、原假设/虚无假设:用H表示,常常是根据已有资料得出的,稳定、保守的经验性看法,没有充分根据是不会被推翻的。
2、备选假设/研究假设:与原假设对立的假设,用H1表示,经过抽样调查后,获得证据希望予以支持的假设。
二、假设检验的基本原理——小概率原理小概率原理:一次观察中小概率事件被认为不可能发生;如果一次观察出现了小概率事件,合理的想法应该是否定原有事件具有小概率的说法。
小概率原理在假设检验中的运用:抽取一个样本并计算出检验统计量,如果在原假设成立的条件下这个统计量几乎不可能发生,则拒绝原假设而接受备选假设。
反之,如果计算出的统计量发生的可能性不太小,则接受原假设。
即在原假设下,检验统计量是小概率事件则拒绝原假设。
例1:某市场有100位摊贩,根据以往统计,其中非本地居民占10%,现随机抽取10人调查,发现5个都不是本地人,则原有统计结果是否成立?解:H:100人中10个是非本地人。
计算在原假设成立的情况下,抽取5人都是非本地人的概率:P= C105 C905/C10010<10-4可见,出现5名非本地人的结果概率极其小,但一次实验就出现了,所以怀疑原假设的真实性,拒绝原假设。
三、拒绝域与显著性水平1、显著性水平α,在原假设成立条件下,统计检验中规定的小概率的数量界限,常用的有α=0.10,0.05,0.01。
2、接受域和拒绝域根据原假设画出统计量的分布,以Z分布为例。
如果把拒绝原假设的小概率α事件定在分布的右侧尾部,则右侧面积代表的概率即显著性水平,Zα是临界值。
如果检验统计量值Z>Zα,则应拒绝原假设;如Z<Zα,则接受原假设。
以Zα为临界值,左边为接受域,右边为拒绝域。
也可把α定在左边或两边。
α1、双边检验如果拒绝域放在抽样分布的两侧,每侧拒绝域的概率分别为α/2,假设抽样本分布以0为对称,则P(|Z|>Z α/2)= α;双边检验的假设如下:H 0: μ=μ0H 1: μ≠-Z α/2 Z α/2如果检验统计量|Z|>Z α/2,则拒绝原假设,否则接受。
第七章假设检验教案资料
第七草假设检验第七章假设检验一、教材说明本章主要介绍统计假设检验的基本概念和基本思想、正态总体参数的统计假设的显著性检验方法.01、本章的教学目的与要求(1)使学生了解假设检验的基本概念;(2)使学生了解假设检验的基本思想;(3)使学生掌握假设检验的基本步骤;(4)使学生会计算检验的两类错误,搞清楚两类错误的关系;(5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定;(6)使学生灵活运用所学知识解决实际问题。
2、本章的重点与难点本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定。
二、教学内容下面主要分3节来讲解本章的主要内容。
§ 7.1假设检验的基本概念对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,运用数理统计的分析方法,检验这种假设是否成立,从而决定接受或拒绝“假设:这一统计推断过程,称为假设检验。
1.引例我们先举一个简单的实例来说明假设检验的基本思想及推理方法例1:某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布.且知标准差为0.015千克.当机器正常时,其均值为0.5千克,某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(千克):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?分析:用和分别表示这一天袋装糖重总体X的均值和标准差,则X ~ N( ,0.0152),其中未知。
问题:已知总体X^N( , 2),且°0.015,根据样本值判断0.5还是0.5。
提出两个对立假设H。
:0 0.5 (原假设或零假设)和已:0(备择假设).再利用已知样本作出判断是接受假设H °(拒绝假设比),还是拒绝假设H。
(接受假设H)如果作出的判断是接受H。
,贝U 0即认为机器工作是正常的,否则,认为是不正常的.因为X是的无偏估计量,所以,若H0为真,则|x 0不应太大,X —X—— ~N(0,1),衡量x 0的大小可归结为衡量——吉的大小。
概率论与数理统计教案假设检验
概率论与数理统计教案-假设检验第一章:假设检验概述1.1 假设检验的定义与作用引导学生理解假设检验的基本概念解释假设检验在统计学中的重要性1.2 假设检验的基本步骤介绍假设检验的基本步骤,包括建立假设、选择显著性水平、计算检验统计量、确定决策规则和给出结论1.3 假设检验的类型解释单样本假设检验、两样本假设检验和方差分析等不同类型的假设检验第二章:单样本假设检验2.1 单样本Z检验介绍单样本Z检验的适用场景和条件解释Z检验的计算方法和步骤2.2 单样本t检验介绍单样本t检验的适用场景和条件解释t检验的计算方法和步骤2.3 单样本秩和检验介绍单样本秩和检验的适用场景和条件解释秩和检验的计算方法和步骤第三章:两样本假设检验3.1 两样本t检验介绍两样本t检验的适用场景和条件解释两样本t检验的计算方法和步骤3.2 两样本秩和检验介绍两样本秩和检验的适用场景和条件解释两样本秩和检验的计算方法和步骤3.3 配对样本t检验介绍配对样本t检验的适用场景和条件解释配对样本t检验的计算方法和步骤第四章:方差分析4.1 方差分析的适用场景和条件解释方差分析的适用场景和条件,包括完全随机设计、随机区组设计和析因设计等4.2 方差分析的计算方法介绍方差分析的计算方法,包括总平方和、组间平方和和组内平方和的计算4.3 方差分析的判断准则解释F检验的判断准则和显著性水平的确定第五章:假设检验的扩展5.1 非参数检验介绍非参数检验的概念和适用场景解释非参数检验的计算方法和步骤5.2 假设检验的优化方法介绍自助法和贝叶斯方法等假设检验的优化方法5.3 假设检验的软件应用介绍使用统计软件进行假设检验的方法和技巧第六章:卡方检验6.1 卡方检验的基本概念介绍卡方检验的定义和作用解释卡方检验在分类数据分析中的应用6.2 拟合优度检验解释拟合优度检验的概念和计算方法举例说明拟合优度检验在实际中的应用6.3 独立性检验解释独立性检验的概念和计算方法举例说明独立性检验在实际中的应用第七章:诊断性统计与效果量分析7.1 诊断性统计的概念介绍诊断性统计的定义和作用解释诊断性统计在教学评估中的应用7.2 效果量的计算方法介绍效果量的定义和计算方法解释不同效果量指标的含义和应用7.3 效果量分析的实际应用举例说明效果量分析在教学研究中的具体应用第八章:多重比较与事后检验8.1 多重比较的概念介绍多重比较的定义和作用解释多重比较在实验数据分析中的应用8.2 事后检验的方法介绍事后检验的概念和计算方法解释不同事后检验方法的原理和应用8.3 多重比较与事后检验的实际应用举例说明多重比较与事后检验在实际研究中的应用第九章:贝叶斯统计与贝叶斯推断9.1 贝叶斯统计的基本概念介绍贝叶斯统计的定义和特点解释贝叶斯统计与经典统计的区别9.2 贝叶斯推断的计算方法介绍贝叶斯推断的计算方法和步骤解释贝叶斯推断在实际中的应用9.3 贝叶斯统计软件应用介绍使用贝叶斯统计软件进行数据分析的方法和技巧第十章:假设检验的综合应用与案例分析10.1 假设检验在医学研究中的应用举例说明假设检验在医学研究中的具体应用10.2 假设检验在社会科学研究中的应用举例说明假设检验在社会科学研究中的具体应用10.3 假设检验在商业数据分析中的应用举例说明假设检验在商业数据分析中的具体应用重点和难点解析重点环节1:假设检验的定义与作用假设检验是统计学中的核心内容,理解其定义和作用对于后续的学习至关重要。
东华大学《概率论与数理统计》课件 第七章 假设检验
1. 2为已知, 关于的检验(U 检验 )
在上节中讨论过正态总体 N ( , 2 ) 当 2为已知时, 关于 = 0的检验问题 :
假设检验 H0 : = 0 , H1 : 0 ;
我们引入统计量U
=
− 0 0
,则U服从N(0,1)
n
对于给定的检验水平 (0 1)
由标准正态分布分位数定义知,
~
N (0,1),
由标准正态分布分位点的定义得 k = u1− / 2 ,
当 x − 0 / n
u1− / 2时, 拒绝H0 ,
x − 0 / n
u1− / 2时,
接受H0.
假设检验过程如下:
在实例中若取定 = 0.05, 则 k = u1− / 2 = u0.975 = 1.96, 又已知 n = 9, = 0.015, 由样本算得 x = 0.511, 即有 x − 0 = 2.2 1.96,
临界点为 − u1− / 2及u1− / 2.
3. 两类错误及记号
假设检验是根据样本的信息并依据小概率原
理,作出接受还是拒绝H0的判断。由于样本具有 随机性,因而假设检验所作出的结论有可能是错
误的. 这种错误有两类:
(1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称做第一类错误, 又叫弃
设 1,2, ,n 为来自总体 的样本,
因为 2 未知, 不能利用 − 0 来确定拒绝域. / n
因为 Sn*2 是 2 的无偏估计, 故用 Sn* 来取代 ,
即采用 T = − 0 来作为检验统计量.
Sn* / n
当H0为真时,
− 0 ~ t(n −1),
Sn* / n
由t分布分位数的定义知
概率论与数理统计教案假设检验
概率论与数理统计教案-假设检验一、教学目标1. 理解假设检验的基本概念和原理;2. 学会使用假设检验方法对样本数据进行推断;3. 掌握假设检验的类型、步骤和判断准则;4. 能够运用假设检验解决实际问题。
二、教学内容1. 假设检验的基本概念和原理假设检验的定义假设检验的目的是什么假设检验的基本原理2. 假设检验的类型单样本检验双样本检验配对样本检验3. 假设检验的步骤建立假设选择检验统计量确定显著性水平计算检验统计量的值做出判断4. 假设检验的判断准则拒绝域和接受域检验的拒绝准则检验的接受准则5. 假设检验的应用实例应用假设检验解决实际问题实例分析与解答三、教学方法1. 讲授法:讲解假设检验的基本概念、原理、类型、步骤和判断准则;2. 案例分析法:分析实际问题,引导学生运用假设检验方法解决问题;3. 互动教学法:提问、讨论、解答学生提出的问题,促进学生理解和掌握知识;4. 练习法:布置课后作业,让学生巩固所学知识,提高运用能力。
四、教学准备1. 教案、教材、课件等教学资源;2. 投影仪、电脑等教学设备;3. 课后作业及答案。
五、教学过程1. 导入新课:回顾上一节课的内容,引入假设检验的基本概念和原理;2. 讲解假设检验的基本概念和原理,阐述其目的是什么;3. 讲解假设检验的类型,引导学生了解各种类型的假设检验;4. 讲解假设检验的步骤,让学生掌握进行假设检验的方法;5. 讲解假设检验的判断准则,使学生明白如何做出判断;6. 分析实际问题,引导学生运用假设检验方法解决问题;7. 布置课后作业,让学生巩固所学知识;8. 课堂小结,总结本节课的主要内容和知识点。
教学反思:在教学过程中,要注意引导学生理解和掌握假设检验的基本概念、原理和步骤,并通过实际问题让学生学会运用假设检验方法。
要关注学生的学习反馈,及时解答他们提出的问题,提高他们的学习兴趣和积极性。
六、教学评估1. 评估方式:课后作业、课堂练习、小组讨论、个人报告2. 评估内容:学生对假设检验基本概念的理解学生对假设检验类型和步骤的掌握学生对假设检验判断准则的应用学生解决实际问题的能力七、课后作业1. 完成教材后的练习题2. 选择一个实际问题,运用假设检验方法进行分析和解答3. 总结本节课的主要内容和知识点,写下自己的学习心得八、课堂练习1. 例题解析:分析教材中的例题,理解假设检验的步骤和判断准则2. 小组讨论:分组讨论课后作业中的问题,共同解决问题,交流学习心得3. 个人报告:选取一个实际问题,进行假设检验的分析和解题过程报告九、教学拓展1. 假设检验的扩展知识:学习其他类型的假设检验方法,如非参数检验、方差分析等2. 实际应用案例:搜集更多的实际问题,进行假设检验的分析和解答3. 软件操作实践:学习使用统计软件进行假设检验,提高数据分析能力十、教学计划1. 下一节课内容预告:介绍假设检验的扩展知识和实际应用案例2. 学习任务布置:预习下一节课的内容,准备相关问题和建议3. 课后自学计划:鼓励学生自主学习,深入了解假设检验的方法和应用教学反思:在完成本节课的教学后,要关注学生的学习情况,及时解答他们提出的问题,并提供必要的辅导。
第七章假设检验
二、率的χ2检验
结 束
第四节 均数的假设检验
第四节 均数的假设检验
第四节 均数的假设检验
第四节 均数的假设检验
第四节 均数的假设检验
第四节 均数的假设检验
第四节 均数的假设检验
第四节 均数的假设检验
第五节 标准差的假设检验
第五节 标准差的假设检验
例1方差齐性检验
第六节 率的假设检验
一、率的u检验 二、率的χ2检验
第二节 假设检验步骤
三、确定显著性水平求出临界值 显著性水平,根据研究对象的性质、精度要求等具体情况确定,一般 情况取0.05或0.01。当值确定后,根据检验所用的统计量表查出相应的临 界值。 四、检验结论 以检验统计量与临界值的比较作出统计结论。 如果检验统计量的值落在接受域内,接受无效假设,检验结论为差异无 显著性;如果检验统计量的值落在拒绝域内,拒绝无效假设,检验结论为差 异有显著性。 将概率比较得出检验结论: 当 P(H0) > 检验结论为在水平上差异无显著性 当 P(H0) ≤ 检验结论为在水平上差异有显著性
第三节 单侧检验与双侧检验
第三节 单侧检验与双侧检验
第三节 单侧检验与双侧检验
单侧检验与双侧检验的异同 相同点 无效假设H0、计算统计量公式、判断差异是否具有显著性 方法、犯第一类错误弃真的概率等均相同。 不同点 (1)单检否定域在分布的一侧,双检否定域在分布的两侧; (2)单检的备择假设H1不能省,双检可以省; (3)单检临界值小于双检临界值,更易得出差异具有显著性 的结论,且犯第二类错误纳伪的概率比双检小。
第七章
假设检验
比对----生物识别“以貌取人”
生物特征分为两大类:指纹、手形、面相、 虹膜、视网膜、耳廓、脉搏、血管、DNA、骨 骼等身体特征;签字、语音、行走步态等行为 特征。
第七章 假设检验
第七章假设检验【教学要求】要求掌握假设检验的的基本思想和基本步骤;能够理解假设检验的两类错误及其关系;熟练掌握总体平均数、总体成数和总体方差的各种假设检验方法;利用P-值进行假设检验【知识点】假设检验、两类错误、总体平均数、总体成数、总体方差【本章重点】理解假设检验的基本思想和基本步骤;能够理解假设检验的两类错误及其关系;熟练掌握总体平均数、总体成数和总体方差的各种假设检验方法。
【本章难点】总体平均数、总体成数和总体方差的各种假设检验方法。
【教学内容】7.1 假设检验的基本思想(小概率事件在一次实验中不会发生)前一章中我们讨论了如何根据样本去得到总体的分布所含参数的优良估计.以这样得到的估计值作为参数的已知值得到的一个总体必须跟真实的总体作比较,考察它们之间是否在统计的意义上相合。
显然,这种比较只能在样本的基础上进行。
怎么比较才能得到一个有较大把握的结论呢?这就是我们这章所要讲的统计假设检验问题。
一、假设检验的一个实际问题问题7.1.1 一种零件采用自动生产线生产,零件的寿命(单位:小时)服从正态分布(2000,4000)N。
现在工厂改良了生产技术,假设零件的寿命仍服从正态分布且方差不变。
为检验零件的寿命是否有提高,质检人员在某天生产的零件中随机抽取40个进行检验,测得平均寿命为2020小时。
试问在新技术下生产的零件寿命是否得到了提高?现在的问题就是要判断新技术下零件的平均寿命2000μ>?还是与以前一样依然是2000小时?如果是前者,我们说新产品寿命有显著提高;若是后者,就是说没有。
我们把任意一个有关未知分布的假设称为统计假设或简称假设。
上面的问题中我们把两种情况用假设来表示。
假设2000μ=表示新技术下零件寿命没有显著增加;假设2000μ>表示新技术下零件寿命有显著提高。
我们把第一个假设作为原假设,用符号0:2000H μ=表示;第二个假设作为备择假设,用符号1:2000H μ>表示。
第七章 假设检验
若统计量的值落在否定域内(包括临界 值),说明H0与样本描述的情况有显著差异, 应该否定原假设;若该值落在接受域内,就 说明H0与样本描述的情况无显著差异,则应 接受原假设。 本例Z值为2.5落入拒绝域,故拒绝原假设, 认为08年国有单位职工月平均工资与07年相 比有显著差异。
15
end
三、假设检验中的两类错误 假设检验是依据样本信息进行判断,是由部 分来推断整体,因而不可能绝对准确,可能 犯错误。
end
0.55 0.60
三、总体方差的假设检验 ( 2检验)
1. 检验一个总体的方差或标准差 2. 假设总体近似服从正态分布 3. 检验统计量服从 2分布
( n 1) s 2 ~ ( n 1) 2 0
Байду номын сангаас2 2
假设的总体方差
34
end
【例 6-9】啤酒生产企业采用自动生产线灌 装啤酒,每瓶的装填量为 640ml ,但由于 受某些不可控因素的影响,每瓶的装填量 会有差异。此时,不仅每瓶的平均装填量 很重要,装填量的方差同样很重要。如果 方差很大,会出现装填量太多或太少的情 况,这样要么生产企业不划算,要么消费 者不满意。假定生产标准规定每瓶装填量 的标准差不应超过 4ml 。企业质检部门抽 取了10瓶啤酒进行检验,得到的样本标准 差为s=3.8ml。试以0.05的显著性水平检验 装填量的标准差是否符合要求? 方差检验经常是右侧检验
17
end
第二节总体参数的假设检验
总体参数假设检验就是检验已知分布形 式的总体某些参数是否与事先所做的假 设存在显著性差异,又称为显著性检验。 主要包括对总体均值、总体比例和总体 方差的假设检验。
18
end
一、总体均值的假设检验
07第七章 假设检验
{Z z0.01}是
一小概率事件
拒绝域 W Z : Z z0.01 2.33 .
X 给定显著水平 =0.01,若使得 P k =, n X 21 则有 P k , ( 2) n 由式()得:k z . 1
20
四、求解参数假设检验问题的步骤
1、根据实际问题的要求,提出原假设 H 0 及备选 假设 H1 . 选择 H 0 , H1 使得两类错误中导致后果严重的 错误成为第一类错误. 2、给出显著水平 拒绝域.
,选择合适的统计量,确定
3、根据样本值,求出检验统计量的值,作出决策.
21
提出 假设
根据统计调查的目的, 提出 原假设H0 和备选假设H1 作出 决策
因此,衡量 x 0 的大小,可归结为衡量 x 0 的大小.
8
n
选择适当的正数k,使样本的观察值 x满足 x 0 U k n 时,就接受原假设H 0 . 否则,即当 U k时,就拒绝原假设H 0 .
应该用什么原则来确定这个量的合理界限?即怎样求k?
注意到,
不等式 x 0
2
拒绝 域
2
假设检验的步骤
Step1 提出假设. Step2 构造拒绝域,依据假设和常用的统计量. Step3 进行检验.
注意:不否定H0并不是肯定H0一定对,而只是说差 异还不够显著,还没有达到足以否定H0的程度.
所以假设检验又叫 “显著性检验” 如果显著性水平α取得很小,则拒绝域也会比较小, 其产生的后果是: H 0难于被拒绝. 如果在α很小的情况下, H0仍被拒绝了, 则说明实 际情况很可能与之有显著差异.
可用x与0的差距 x 0 来判断原假设H 0是否成立.
第七章 假设检验(F检验与卡方检验)
• F检验
– 方差齐性检验 – 两个独立样本的方差齐性检验
• F检验
– – – – – 提出待检验的假设H0和H1 S12 确定并计算统计量 F S 2 2 根据df1和df2值,对给定的显著性水平α 建立拒绝虚无假设的规则 作出统计决策
• 将检验统计量的值与拒绝规则所指定的临界值相比 较,确定是否拒绝虚无假设
i 1 • 则2服从自由度为n的2(n)分布,记为 2~2(n)。
xi2
2
n
2的特点
• (1) 2是一个正偏态分布,n越大,曲线越趋于对称(趋于 正态分布),n越小,曲线越不对称。 • (2) 2值都是正值。
• (3)若X1,X2,…,Xm相互独立,且Xi~ 2(ni),i=1,2,…,m,则 X=X1+X2+Xm~ 2(n),其中n=n1+n2+…+nm。
性别 男生 女生 合计 录取人数 10(9) 8(9) 18 未录取人数 80(81) 82(81) 162 合计 90 90 180
对平均数差异的显著性检验的理论前提是假设两 个总体的方差是相同,或至少没有显著性差异。 Z检验和t检验 对两个总体的方差是否有显著性差异所进行的检 验称为方差齐性检验,即必须进行F检验。
F分布
• 若有两个服从正态分布的总体N1(μ1,σ1),N2(μ2,σ2)。检 验σ1和σ2是否有显著性差异? • 在方差分析中,需要检验某个因素是否对指标有显著 的作用时需要F分布来解决。 • 设有两个总体X,Y,已知X~2(n1),Y~2(n2),并且 X与Y相互独立,则称随机变量F,所服从的分布为第 一自由度为n1,第二自由度为n2的F分布,记为F~F (n1,n2)。
• • 若自由度df=1,α=0.900,查2分布表可知P(2>0.02)=0.900 记20.900(1)=0.02
第七章假设检验
第七章 假设检验一、教材说明本章主要讲假设检验的基本思想与概念、正态总体参数的假设检验这2节的内容. 1、本章的教学目的与要求(1)使学生了解假设检验的基本概念; (2)使学生了解假设检验的基本思想; (3)使学生掌握假设检验的基本步骤;(4)使学生会计算检验的两类错误,搞清楚两类错误的关系;(5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定;(6)使学生灵活运用所学知识解决实际问题. 2、本章的重点与难点本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定.二、教学内容下面主要分2节来讲解本章的主要内容.§7.1 假设检验的基本思想与概念教学目的:要求学生了解假设检验的基本思想,理解假设检验的基本概念,认识假设检验问题,熟悉假设检验的基本步骤.教学重点:基本概念,假设检验的基本步骤. 教学难点:基本概念的理解.教学内容:本节内容包括假设检验的基本概念,假设检验的基本步骤. 7.1.1 假设检验的基本概念1.统计假设、原假设、备择假设把任意一个有关未知分布的假设统称为统计假设,简称假设.例7.1.1 某厂生产的合金强度服从正态分布)16,(θN ,其中θ的设计值为不低于110(Pa ),为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa ),某天从生产中随机抽取25块合金,测得强度值为2521,,,x x x ,其均值为)(108Pa x =,问当时生产是否正常?如果生产是正常进行的,则合金平均强度不低于110(Pa ),而合金强度服从)16,(θN ,故平均强度110≥θ,如果生产不正常,则110<θ.现在的问题是据样本得到的信息来判断110≥θ还是110<θ,此问题不是参数估计问题,而是一假设检验问题.这样对未知参数,提出两个对立的假设:称110:0≥θH 为原假设,110:1<θH 为备择假设.通常将不应轻易加以否定的假设做为原假设,以0H 记,当0H 被拒绝时而接受的假设称为备择假设,用1H 表示.2.参数假设、非参数假设参数假设:总体分布类型已知,对分布中的未知参数的假设. 非参数假设:不同于参数假设的其他假设(包括对母体分布函数的类型及分布的某些特征的假设).我们的任务就是根据样本得到的信息,在原假设0H 与备择假设1H 两者中做出一个判断:拒绝还是接受0H .7.1.2 假设检验的基本步骤1、建立假设依据实际问题建立一对假设,例7.1.1的假设为110:110:10<≥θθH vsH2、选择检验统计量,给出拒绝域形式在0H 与1H 两者中做出一个选择,也即完成一次判断,必须建立一个检验法则,而由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量.一般而言,检验统计量的选择应该使在0H 、1H 分别成立时,统计量的值有较大差异,从而能够做出判断.在例7.1.1中,样本均值x 就是一个很好的检验统计量,它是总体参数θ的无偏估计.样本均值x 愈大,意味着总体均值θ也大;样本均值愈小,意味着总体均值θ也小.由于样本的随机性,只有当x 小到一定程度,则应认为原假设0H 不正确.故在样本均值x 的取值中有一个临界值C (待定),使得当C x ≤时,认为0H 不正确,也即拒绝0H ,此时称}:{C x x W ≤=为该检验的拒绝域,当C x >时,认为0H 正确,则接受0H ,对应的}:{C x x W >=为该检验的接受域.一般地,使原假设0H 被拒绝的样本观测值所在区域称为拒绝域,记为W ,从而规定:当W x x n ∈),,(1 时,拒绝0H ;当W x x n ∈),,(1 时 ,接受0H .从而一个拒绝域W 唯一确定一个法则.3、选择显著性水平 α 通常=α0.05,0.01,0.1.4、给出拒绝域W利用统计量),,(1n x x T ,使得01),,((H W x x T P n ∈ 为真)α=5、做判断将样本观测值代入检验统计量,看该统计量的值是否落入拒绝域W ,当W x x T n ∈),,(1 时,拒绝0H ,当W x x T n ∉),,(1 时,接受0H .三、假设检验的两类错误与势函数 1、两类错误对给出的拒绝域W ,由于样本的随机性,我们做出的判断不可能100%正确,它可能会犯两类错误:第一:0H 为真时,W x x n ∈),,(1 ,从而拒绝0H .这种错误称为第一类错误,其发生的概率称为犯第一类错误的概率或拒真概率,通常记为α,即α=P (拒绝0H 0H 为真)=01),,((H W x x T P n ∈ 为真)=01],),,[(Θ∈∈θθW x x P n第二:在0H 不真时,W x x n ∈),,(1 ,从而接受0H .这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或受伪概率,通常记为β,即β=P (接受0H 0H 不真)=01),,((H W x x T P n ∈ 不真)=111],),,[(1]),,[(Θ∈∈-=∈θθθW x x P W x x P n n2、势函数定义7.1.1 设检验问题1100::Θ∈Θ∈θθH vs H 的拒绝域为W ,则样本观测值),,(1n x x 落入拒绝域W 内的概率称为该检验的势函数,即101],),,[()(Θ⋃Θ=Θ∈∈=θθθW x x P g n其中10,ΘΘ是参数空间两个互不相交的子集. 注 由以上α、β及势函数的定义知⎩⎨⎧Θ∈-Θ∈=10),(1),()(θθβθθαθg3、两类错误的关系对例7.1.1,}:{c x x W ≤=,故)4()44(][)(θθθθθ-Φ=-≤-=≤=c c c x P c x P g ,从而犯两类错误的概率)(θα,)(θβ分别为:0),54()(Θ∈-Φ=θθθαc1),54(1)(Θ∈-Φ-=θθθβc从而当α减少时,c 也减少,而c 的减少必导致β的增大;当β减少时,c 会增大,而c 的增大必导致α的增大,故得到两类错误的关系:(1)在样本容量n 一定时,α、β不能同时小,α的增大必导致β的减少;α的减少必导致β的增大;(2)要使α、β同时小,则必须n 充分大,但这又是不现实的.为此,采用折中的方法:控制α,使β尽量小,但有时这样的检验也不存在,从而我们只控制α,而不管β,此时求拒绝域W 只涉及原假设0H ,而不管备择假设1H .4、水平为α的显著性检验 定义7.1.2 对检验问题1100::Θ∈Θ∈θθH vs H ,如果一个检验满足对任意的0Θ∈θ,都有αθ≤)(g则称该检验是显著性水平为α的显著性检验,简称水平为α的检验. 在例7.1.1 取=α0.05,则110≥∀θ有05.0)54()(≤-Φ=θθc g ,由于)(θg 是θ的减函数,故只须05.0)54110()110(=-Φ=c g ,即05.0)]110(45[=-Φc从而684.108645.18.0110645.1)110(4595.0)]110(45[=⨯-=⇒=-⇒=-Φc c c 拒绝域为}684.108:{≤=x x W ,又因为684.108108<=x ,所以拒绝0H ,认为该日生产不正常.§7.2 正态总体参数假设检验教学目的:理解和掌握单个以及两个正态总体均值的假设检验的方法与思想,掌握正态总体方差检验的方法.教学重点:检验方法的掌握,检验方法思想的理解. 教学难点:检验方法的掌握.教学内容:本节内容包括单个正态总体均值的假设检验,两个正态总体均值差的检验,正态总体方差的检验.参数假设检验常见的有三种基本形式 (1)0010::H vs H θθθθ≤>(2)0010::<H vs H θθθθ≥ (3)0010:=:H vs H θθθθ≠一般来说,对这三种假设采取的检验统计量是相同的,差别在拒绝域上.当备择假设1H 在原假设0H 一侧时的检验称为单侧检验,当备择假设1H 分散在原假设0H 两侧时的检验称为双侧检验.(1),(2)是单侧检验,(3)是双侧检验.7.2.1 单个正态总体均值的假设检验设n x x x ,,,21 是来自正态总体),(2σμN 的样本,对均值μ考虑如下的检验: 0100::μμμμ>≤H vs H (1) 0100::μμμμ<≥H vs H (2) 0100::μμμμ≠=H vs H (3)一 2σ已知时的u 检验对单侧检验(1),由于x 是μ的无偏估计,选取统计量u=故当样本均值x 不超过设定均值0μ时,应接受0H ,而当样本均值x 超过设定均值0μ时,应拒绝0H ,但由于样本的随机性,x 比0μ大一点就拒绝0H 似乎不当,只有当x 比0μ大到一定程度时拒绝0H 才是恰当的.故存在临界值c ,拒绝域12{(,,,);}n W x x x u c =≥ ,常简记为{}u c ≥.若要求水平为α,则c 应满足0()=P u c μα≥,因为21~(,)x N nμσ,故0μμ=时~(0,1)x u N =知1c u α-=,所以拒绝域1{;}W u u u α-=≥.该检验用的检验统计量是u 统计量,一般称为u 检验. 易验证1{;}W u u u α-=≥是检验0100::μμμμ>≤H vs H 的显著性水平为α的检验.类似地对0100::μμμμ<≥H vs H 的显著性水平为α的拒绝域{;}W u u u α=<;0100::μμμμ≠=H vs H 的显著性水平为α的拒绝域12{;}W u u u α-=≥.例7.2.1 从甲地发送一个讯号到乙地,设乙地接受到的讯号值是一个服从正态分布)2.0,(2μN 的随机变量,其中μ为甲地发送的真实讯号值.现甲地重复发送同一讯号5次,乙地接受到的讯号值为8.05 8.15 8.2 8.1 8.25设接受方有理由猜测甲地发送的讯号值为8,问能否接受该猜测?=α0.05 分析 此时正态分布的方差已知,对均值进行检验,利用U —检验. 解 总体2~(,0.2)X N μ ,待检验的原假设0H 与备择假设分别为1H :01:8:8H vs H μμ=≠.这是一个双侧检验问题,检验的拒绝域为12{;}u u uα-≥,取0.975=0.05,=1.96u α,计算得=8.15,15-8)/0.2=1.68x u ,u 值未落入拒绝域内,故不能拒绝原假设,及接受原假设,可认为猜测成立.2、σ未知时的t 检验若2σ未知,则上述的随机变量x u =不再是统计量,自然我们要用2σ的无偏估计2211()1n ii s x x n ==--∑代替2σ,此时有0()x t s μ-=,且0μμ=时~(1)t t n =-,类似于2σ已知时均值μ的检验问题的讨论得到:0100::μμμμ>≤H vs H 的水平为α的拒绝域为1{;(1)}W t t t n α-=≥- 0100::μμμμ<≥H vs H 的水平为α的拒绝域为{;(1)}W t t t n α=≤-0100::μμμμ≠=H vs H 的水平为α的拒绝域为12{;(1)}W t t tn α-=≥-例7.2.2 某厂生产的某种铝材的长度服从正态分布,其均值设定为240cm ,现从该厂抽取5件产品,测得其长度为(单位:cm )239.7 239.6 239 240 239.2试判断该厂此类铝材的长度是否满足设定要求?=α0.05分析 此时正态分布的方差未知,对均值进行检验,利用T —检验. 解 略.综上,关于单个正态总体均值的假设检验问题可汇总成如下的表:7.2.2 两个正态总体均值差的检验设m x x x ,,,21 是来自总体X 服从),(211σμN 的样本,n y y y ,,,21 是来自总体Y 服从),(222σμN 的样本,且两样本相互独立,考虑如下的三种检验:0:0:211210>-≤-μμμμH vs H (1)0:0:211210<-≥-μμμμH vs H (2)0:0:211210≠-=-μμμμH vs H (3)主要分两种情况讨论.12,σσ已知时的两样本u 检验此时21μμ-的估计y x -的分布完全已知,),(~222121nmN y x σσμμ+--,由此可采用u 检验法,检验统计量为x yu =在21μμ=时,~(0,1)x yu N =.检验的拒绝域取决于备择假设的形式.上述三对假设检验的拒绝域分布为:1{;}W u u u α-=≥ {;}W u u u α=<12{;}W u u uα-=≥σσσ==21但未知时的两样本t 检验在22221σσσ==未知时,类似于单个正态总体方差未知时均值的检验,我们仍用2σ的无偏估计代替2σ,而此时可以证明2σ的无偏估计为:2222211(1)(1)1[()()]22m n x y wi i i i m s n s s x x y y m n m n ==-+-=-+-=+-+-∑∑ 于是有~(2)x y t t m n =+-从而检验统计量为x yt =在021=-μμ时,)2(~11-++-=n m t nm S y x T w.上述三对假设检验的拒绝域分布为:1{;(2)}W t t t m n α-=≥+-{;(2)}W t t t m n α=≤+-12{;(2)}W t t tm n α-=≥+-例7.2.3 某厂铸造车间为提高铸件的耐磨性而试制了一种镍合金铸件以取代铜合金铸件,从两种铸件中各抽取一个容量分别为8和9的样本,测得其硬度(一种耐磨性指标)为:镍合金 76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34铜合金 73.66 64.27 69.34 71.37 69.77 68.12 67.27 68.07 62.61 根据专业经验,硬度服从正态分布,且方差保持不变,试在显著性水平=α0.05下判断镍合金的硬度是否有明显提高? 解 略.一、 单个正态总体方差的2χ检验设总体),(~2σμN X ,n x x x ,,,21 是来自该总体的样本,对方差2σ考虑如下的三种检验:221220::σσσσ>≤H vs H (1) 221220::σσσσ<≥H vs H (2)2212020::σσσσ≠=H vs H (3)1、均值μ未知时方差的检验由于μ未知,2211()1n ii s x x n ==--∑是2σ的无偏估计,且202σσ=有)1(~)1(22022--=n S n χσχ对于显著性水平α,对应上述三种假设检验的拒绝域分布为:2221{;(1)}W n αχχχ-=≥- 222{;(1)}W n αχχχ=≤-22212{;(1)W n αχχχ-=≥-或222(1)}n αχχ≤-例7.2.4 某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过0.0162kg .现从某天生产的钢板中随机抽取25块,得其样本方差2S =0.0252kg .问该天生产的钢板重量的方差是否满足要求?=α0.05.解 略.2、均值μ已知时方差的检验此时,检验统计量取为20212)(σμχ∑=-=ni ix,且220σσ=时)(~)(220212n xni iχσμχ∑=-=故对均值μ已知时方差的三种检验,我们只需将均值μ未知时方差的三种检验中2χ—分布的自由度变一下就可得到检验的拒绝域.)二 两个正态总体方差比的F 检验设m x x x ,,,21 是来自总体X 服从),(211σμN 的样本,n y y y ,,,21 是来自总体Y 服从),(222σμN 的样本,且两样本相互独立,考虑如下的三种检验:2221122210::σσσσ>≤H vs H (1) 2221122210::σσσσ<≥H vs H (2) 2221122210::σσσσ≠=H vs H (3) 此处21,μμ均未知,22,x y s s 分别表示总体X 、Y 的样本方差,易知221()x E s σ=,222()yE s σ= 从而建立检验统计量22xys F s =当2212σσ=时,22~(1,1)xys F F m n s =--,此时,上述三个检验的拒绝域分别为:)}1,1(;{1--≥=-n m F F F W α )}1,1(:{--≤=n m F F F W α)1,1(:{21--≥=-n m FF F W α或)}1,1(2--≤n m F F α例7.2.5 甲、乙两台机床加工零件,零件的直径服从正态分布,总体方差反映了加工的精度,为比较两台机床的加工精度有无区别,现从各自加工的零件中分别抽取7件产品和8件产品,测得直径为:X (机床甲) 16.2 16.4 15.8 15.5 16.7 15.6 15.8Y (机床乙) 15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0 取 =α0.05. 解 略.)1)1§7.3 其他分布参数的假设检验教学目的:了解指数分布参数的假设检验,比例的检验,大样本检验,会解决简单的实际问题.教学重点:对于检验方法的理解. 教学难点:解决简单的实际问题.教学内容:本节内容包括指数分布参数的假设检验,比例p 的检验,大样本检验,检验的p 值.7.3.1 指数分布参数的假设检验设n x x x ,,,21 是来自指数分布1()Exp θ的样本,现考虑关于θ的如下检验问题:0010::H vs H θθθθ≤>,拒绝域的自然形式是={}W x c ≥,下面讨论x 的分布.考虑θ的充分统计量x ,在0=θθ时,0=1=~(,1)ni i nx x Ga n θ∑,由咖玛分布的性质可知2202=~(2)nxn χχθ,于是可用2χ作为检验统计量并利用2(2)n χ的分位数建立检验的拒绝域221-={(2n)}W αχχ≥.类似可得,对关于θ的另两种检验问题:0010::<H vs H θθθθ≥, 0010:=:H vs H θθθθ≠检验统计量仍是2χ,拒绝域分别是22={(2n)}W αχχ≤,22221-22={(2n)(2n)}W ααχχχχ≤≥或.例7.3.1 设我们要检验某种元件的平均寿命不小于6000h ,假定元件寿命为指数分布,现取5个元件投入试验,观测到如下5个失效时间(h ) 395 4094 119 11572 6133 解:这是一个假设检验问题,检验的假设为 01:6000:<6000H vs H θθ≥经计算=4462.6x ,故检验的统计量为201044626===7.43776000xχθ, 若取=0.05α,查表得20.05(10)=3.94χ,由于220.05>(10)χχ,故接受原假设,可以认为平均寿命不低于6000h.7.3.2 比例p 的检验比例p 可看做某时间发生的概率,即看作二点分布(1,)b p 中的参数.作n 次独立重复试验,以x 记该事件发生的次数,则~(n,)x b p . 现考虑如下单边假设检验问题 0010::H p p vs H p p ≤>,找一个0c ,使得00--0000==+1(1-)>>(1-)nni n ii n i i c i c n n p p p p i i α⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭∑∑,0=+1c c 可得水平为α的检验.对检验问题0010::<H p p vs H p p ≥,检验的拒绝域为={x }W c ≤,c 为满足-00=0(1-)ci n ii n p p i α⎛⎫≤ ⎪⎝⎭∑的最大正整数. 对检验问题0010:=:H p p vs H p p ≠,检验的拒绝域为12={x x c }W c ≤≥或,1c 为满足1-00=0(1-)2c i n i i n p p i α⎛⎫≤ ⎪⎝⎭∑的最大正整数,2c 为满足2-00=c (1-)2ni n i i n p p i α⎛⎫≤ ⎪⎝⎭∑的最小正整数.例7.3.2 某厂生产的产品优质品率一直保持在40%,近期对该厂生产的该类产品抽检20件,其中优质品7件,在=0.05α下能否认为优质品率仍保持在40%?解:这是一个假设检验问题,以p 表示优质品率,以x 表示20件产品中的优质品数,则~(20,)x b p ,待检验的原假设为01:=0.4:0.4H p vs H p ≠,拒绝域为12={x x c }W c ≤≥或,下求1c ,2c .由于(3)=0.0160<0.P x P x ≤≤,故取1=3c ,又由于(11)=0.0565>0.025>(12)=0.0210P x P x ≥≥,故取2=12c ,拒绝域为={x 3x 12}W ≤≥或由于观测值没有落入拒绝域,故接受原假设.7.3.2 大样本检验设12,,,n x x x 是来自某总体的样本,该总体均值为θ,方差为θ的函数,记为2σθ(),则对下列三类假设检验问题:(1)0010::H vs H θθθθ≤>; (2)0010::<H vs H θθθθ≥, (3)0010:=:H vs H θθθθ≠.在样本容量n 充分大时,利用中心极限定理2~(,()/n)x N θσθ故在0=θθ时.可采用检验统计量(0,1)u N,对应上述三类假设检验问题的拒绝域分别为1-={u}W uα≥,={u}W uα≤,1-2={}W u uα≥.例7.3.3例7.3.47.3.4 检验的p值例7.3.5 略从例7.3.5可以看到,对同一个假设检验问题,若取不同的显著水平α,会得到不同的结论,0.0179是能用观测值2.10做出“拒绝H”的最小的显著性水平,这就是p值.定义7.3.1 在一个假设检验问题中,利用观测值能够做出拒绝原假设的最小显著性水平称为检验的p值.引进检验的p值的概念有如下好处:(1)它比较客观,避免了事先确定显著水平.(2)由检验的p知与人们心目中的显著性水平α进行比较可以很容易做出检验的结论:如果pα≥,则在显著性水平α下拒绝H;如果<pα,则在显著性水平α下应接受H.例7.3.6 设nxxx,,,21是来自(1,)bθ的样本,要检验如下假设0010::H vs Hθθθθ≤>设检验的显著性水平为α,则检验的拒绝域为={}iW x c≥∑,在得到观测值0=i x t∑后,计算={}ip P x tθ≥∑,就是检验的p值.例如,00=40,=0.1,=8n tθ,则40397334040=1-0.9-0.10.9--0.10.9=0.0419 17p⎛⎫⎛⎫⨯⨯⎪ ⎪⎝⎭⎝⎭,若取=0.05α,则>pα,应拒绝原假设.例7.3.7 略§7.4 分布拟合检验教学目的:了解有限离散总体分布的拟合检验、列联表的独立性检验和正态性检验.教学重点:列联表的独立性检验和正态性检验.教学难点:解决简单的实际问题.教学内容:本节内容包括总体分布只取有限个值的情况,列联表的独立性检验.正态性检验.前面讨论的检验问题都是在总体分布形式已知的前提下对分布的参数建立假设并进行检验,它们都属于参数假设检验问题.这一节我们对总体分布的形式建立假设并进行检验,这一类检验问题统称为分布的拟合检验,属于非参数假设检验.7.4.1 总体分布只取有限个值的情况设总体X 可以分成k 类,记为12,,,k A A A ,现对该总体做了n 次观测,k 个类出现的频数分别为12,n ,,n k n ,且=1=ki i n n ∑,要检验的假设为0:P(A )=,=1,2,,.i i H p i k (7.4.1)=1=1,p0.ki ii p ≥∑其备择假设是(7.4.1)诸等式不全成立.下面我们分两种情况讨论7.4.1的检验问题. 一 诸i p 均已知如果0H 成立,则对每一类i A ,其频率in n与概率i p 应较接近.据此,选用检验统计量22=1(-)=ni i i i n np np χ∑,可证明在0H 成立时,对充分大的n ,2χ近似服从自由度为-1n 的2χ分布.因此,对给定的显著性水平0<<1)αα(,该检验的拒绝域为221-={(-1)}W k αχχ≥. 例7.4.1 二 诸i p 不完全已知诸i p =1,2,,.i k 可由(<)r r k 个未知参数1,,r θθ 确定,即1=),i=1,k.i i r p p θθ (,, 为对假设(7.4.1)做检验,由样本给出诸i θ,=1,2,,r.i 的最大似然估计^^1,,r θθ ,再给出诸i p ,=1,2,,.i k 的最大似然估计^^^1=),r i i p p θθ (,,取检验统计量 ^22^=1(-)=ki i i in n p n p χ∑,可证明2χ近似服从自由度为k-r-1的2χ分布.因此,对给定的显著性水平0<<1)αα(,该检验的拒绝域为221-={(--1)}W k r αχχ≥.例7.4.27.4.2 列联表的独立性列联表是将观测数据按两个或更多属性(定性变量)分类时所列出的频数表. 一般,若总体中的个体可按两个属性,A B 分类, A 有r 个类1,,r A A , B 有c 个类1,,B c B ,从总体中抽取大小为n 的样本,设其中有ij n 个个体既属于A 类,又属于B 类,ij n 称为频数,将r c ⨯个ij n 排列为一个r 行c 列的二维列联表,简称r c ⨯表.对二维列联表,提出假设“,A B 两属性独立”,即0:=p p ,=1,2,,r,j=1,2, c.ij i j H p i 取检验统计量^22^=1=1(-)=rcij ij i j ijn n p n p χ∑∑,则在原假设成立时,2χ近似服从自由度为-(+-2)-1=(-1)(-1)rc r c r c 的2χ分布,其中^ij p 是ij p 的最大似然估计.因此,对给定的显著性水平0<<1)αα(,该检验的拒绝域为221-={((-1)(c-1))}W r αχχ≥. 例7.4.37.4.3 正态性检验用来判断总体分布是否为正态分布的检验方法称为正态性检验. 一正态概率纸概率纸是一种具有特殊刻度的坐标纸.使用这种坐标纸即可以很快判断总体分布的类型又能粗略地估计总体的参数,是检验总体分布的一种简单工具.正态概率纸是一张刻有直角坐标的图纸,它的横坐标轴的刻度是均匀的,表示观察值,纵坐标轴的刻度是不均匀的,表示概率,具体的刻度是按标准正态分布换算出来的,即在普通的直角坐标xot 的纵坐标轴(t 轴)上原坐标为t 的点刻度为du et u t2221)(-∞-⎰=Φπ,例如纵轴上,原坐标为1处的刻度为8413.0)1(=Φ,原坐标为2处的刻度为9772.0)2(=Φ,原坐标为-1处的刻度为1587.0)1(=-Φ,但习惯上,在正态概率纸上的纵坐标轴上标明的数字是换算出的刻度的100倍,又由于x 是在+∞∞-~取值,概率不可能为0,也不可能为1,故一般概率纸的纵轴的刻度都是从99.99~01.0.例7.4.4 随机选取10个零件,测得其直径与标准尺寸的偏差如下: 9.4 8.8 9.6 10.2 10.1 7.2 11.1 8.2 8.6 9.6 利用正态概率纸作正态性检验的步骤如下:1. 首先把样本观察值按从小到大的次序排列:(n)(2)(1)x x x ≤≤≤ 9.6 9.810.1 10.2 11.1具体数据为 7.2 8.2 8.6 8.8 9.42. 对每一个i ,计算修正的频率n ,,2,1i ),25.0n /()375.0i (F i=+-=结果为12345F =0.061F =0.159F =0.256F =0.354F =0.451 ,,,,,678910F =0.549F =0.646F =0.743F =0.841F =0.939 ,,,,3. 将点n ,,2,1i ),F ,x (i (i)=逐一点在正态概率纸上 4. 判断若诸点在一条直线附近,则认为该样本来自正态总体;若诸点明显不在一条直线附近,则认为该样本不是来自正态分布总体.如果从正态概率纸上确认总体是非正态分布时,可对原始数据进行变换后再在正态概率纸上描点,若变换后的点在正态概率纸上近似在一条直线附近,则可认为变换后的数据来自正态分布,这样的变换称为正态性变换.常用的正态性变换有:对数变换,倒数变换和根号变换.例7.4.5 利用对数变换二 夏皮洛-威尔克检验夏皮洛-威尔克检验也简称W 检验,这个检验当850n ≤≤时可以使用,过小样本对偏离正态分布的检验不太有效.W 检验是建立在次序统计量的基础上,将n 个独立观测值按非降次序排列,记为(1)(2)(n)x ,x ,,x ,检验统计量为2=1=122=1=1[(-)(-)]=(-)(-)n ni i i i n niii i a a x x W a a x x ∑∑∑∑,系数12,,,n a a a 在样本容量为n 时有特定的值,可查附表.系数12,,,n a a a 还具有性质:+1-=-,=1,2,,[]2i n i n a a i2=1=1=0,=1n ni ii i a a∑∑故可将统计量简化为[]22(+1-)()=12()=1[(-)]=(-)n i n i i i ni i a x x W xx ∑∑,可以证明,在原假设成立,即总体分布为正态分布时,W 的值应该接近1,因此在显著性水平α下,如果统计量W 的值小于其α分位数,则拒绝原假设,即拒绝域为{}W W α≤. 例7.4.6 略。
第七章 假设检验
例3的计算
n 1 20 1 X 0 16 15.6 t 1 SE X 0.4 当 0.05时, df 20 1 19时, ③判断结果:
0.4
t(19)0.05 2 2.093
因为1<2.093,所以,P>0.05,差异不显著。 故该幼儿园4岁男童平均体重与正常男童平均体 重无显著差异。
㈠假设
假设:是根据已知理论与事实对研究对象所
作的假定性说明。假设检验中一般有两个 相互对立的假设,即零假设和备择假设。 ⑴零假设是研究者根据样本信息期望拒绝的 假设,以H0表示。 ⑵备择假设与零假设相互排斥,是研究者根 据样本信息期望证实的假设,以H1表示。
㈡假设检验的原理
小概率原理
• 假设检验的基本思想就是基于“小概率事 件在一次试验中不可能发生”这一原理。
在实际研究中何时用单侧检验何时用双侧检验, 一定要根据研究目的所规定的方向性来确定。 应该用单侧检验的问题,若使用双侧检验, 其结果一方面可能使结论由“显著”变为“不显 著”,另一方面也增大了 错误。 反之,若使用双侧检验的问题若用单侧来检 验,虽然减小了 错误,但是使无方向性的问 题人为地成为单方向问题,这也有悖于研究目的。
⒈两总体分布为正态,且方差已知
解:⒈建立假设: H 0 : 1 2 , H1 : 1 2 ⒉计算检验的统计量: 2 12 2 1.85 2 1.78 2 SE DX n1 n2 30 25
第二节 平均数差异显著性检验
一、平均数差异显著性检验的类型与条件 ㈠平均数差异显著性检验的类型 ⒈单总体平均数差异显著性检验,也叫平均数的 显著性检验。 ⒉双总体平均数差异显著性检验,也叫平均数差 异的显著性检验。 ㈡平均数差异显著性检验的前提条件 ⒈被检验的样本应是随机样本; ⒉总体分布为正态分布。
第七章假设检验
第三节
u检验
u检验(u test ),亦称z检验(z test) 大样本均数(率)与总体均数(率)比较的u检 验、 两个大样本均数(率)比较的u检验 一、大样本均数比较的u检验 二、大样本率的u检验
一、大样本均数比较的u检验
假定样本数据服从正态分布 ,当总体标准差 未知时,可用样本标准差作为估计值 这里的总体均数一般是指已知的理论值、标准 值或经过大量观察所得到的稳定值,记作µ 0 (或记为 )
两个样本率p1、p2的差值服从正态分布
u p1 p2
1 2
p p
2 2 p p p p 1 (1 1 ) / n1 2 (1 2 ) / n2
1 2 1 2
样本率p介于0.1~0.9之间,每组例数大于60 例
n1 p1 n2 p2 ˆ0 n1 n2
两样本均数比较的u检验
该检验方法适用于完全随机设计中两组 计量资料差别的比较 两样本均数差值服从正态分布
u Leabharlann 1 X 2X1X2
X
1X2
2 2 2 2 X / n 1 1 2 / n2 X2 1
当总体标准差未知,两组例数均超过30
ˆX
1X2
亦称样本率与总体率的比较的u检验,这里的 总体率一般是指已知的理论值、标准值或经大 量观察所获得的稳定值。
例7–3 全国调查的调查结果,学龄前儿童营 养性贫血患病率为23.5%。某医院为了解当
地学龄前儿童能够营养性贫血患病情况,对
当地1396例学龄前儿童进行了抽样调查,查
出营养性贫血患儿363例,患病率为26.0%。
ˆp p
1
2
1 1 ˆ0 (1 ˆ0 )( ) n1 n2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计学》教案
第七章假设检验
教学目的:介绍假设检验的基本思想、步骤和规则,两类错误的概念,以及重要总体参数的检验方法。
基本要求:通过本章学习要求同学们理解假设检验的基本思想、规则和两类错误的概念,掌握假设检验的步骤和总体均值、成数、方差的检验方法。
重点和难点:假设检验的基本思想、规则和两类错误的概念。
教学内容:§1假设检验的一般问题§2 一个正态总体的参数检验§3二个正态总体的参数检验§4假设检验中的其它问题
学时分配:4学时
主要参考书目:
1、陈珍珍等,统计学,厦门:厦门大学出版社,2003年版
2、于磊等,统计学,上海:同济大学出版社,2003年
3、徐国强等,统计学,上海:上海财经大学出版社,2001年版
思考题:
1、请阐述假设检验的步骤
2、假设检验的结果是接受原假设,是否表明原假设是正确的?
3、如何构造检验统计量?
§1假设检验的一般问题
教学内容
一、假设检验的概念
1.概念
⏹事先对总体参数或分布形式作出某种假设
⏹然后利用样本信息来判断原假设是否成立
2.类型
⏹参数假设检验----检验总体参数
⏹非参数假设检验----检验总体分布形式
3.特点
⏹采用逻辑上的反证法
⏹依据统计上的小概率原理----小概率事件在一次试验中不会发生
二、假设检验的步骤
▪提出原假设和备择假设
▪确定适当的检验统计量
▪规定显著性水平α
▪计算检验统计量的值
▪作出统计决策
三、假设检验中的小概率原理
在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。
因为我们拒绝发生错误的可能性至多是α
四、假设检验中的两类错误
1. 第一类错误(弃真错误)
⏹原假设为真时,我们拒绝了原假设
⏹第一类错误的概率为α
2. 第二类错误(取伪错误)
⏹原假设为假时,我们接受了原假设
⏹第二类错误的概率为 β
⏹比第一类错误更容易发生
即接受原假设很容易发生
五、Neyman和Pearson检验原则
在控制犯第一类错误的概率α条件下, 尽可能使犯第二类错误的概率β减小。
该原则的含义是, 原假设要受到维护, 使它不致被轻易否定, 若要否定原假设, 必须有充分的理由---小概率事件发生了; 接受原假设, 只说明否定它的理由还不充分
六、双侧检验和单侧检验
教学方法
采用课堂教学方法
提问与讨论
1.在假设检验中显著性水平α有什么意义?
2.显著性水平α相同时,双侧检验和单侧检验的拒绝域是否相同?
板书设计
主要运用多媒体课件展示。
重要内容采用书写板书
§2一个正态总体的参数检验
教学内容
一、总体方差已知时的均值检验
1. 假定条件
⏹总体服从正态分布
⏹若不服从正态分布, 可用正态分布来近似(n≥30)
2. 原假设为:H0: μ=μ0;备择假设为:H1:μ≠μ0
或H0: μ≥μ0 H1:μ<μ0
或H0: μ≤μ0 H1:μ>μ0
3.使用z-统计量
二、例题
1.某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为μ0=0.081mm,总体标准差为σ= 0.025 。
今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.077mm。
试问新机床加工零件的椭圆度的均值与以前有无显著差异?(α=0.05)
2某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。
已知灯泡使用寿命服从正态分布,标准差为200小时。
在总体中随机抽取100只灯泡,测得样本均值为960小时。
批发商是否应该购买这批灯泡?(α=0.05)
三、总体方差未知时的均值检验
1. 假定条件
⏹总体为正态分布
⏹如果不是正态分布, 只有轻微偏斜和大样本(n≥30)条件下
2. 使用t统计量
四、例题
1.某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。
某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。
试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?
2.一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。
已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(α = 0.05)
五、总体比例的假设检验
1.在大样本条件下,样本比例p渐近服从正态分布
2.比例检验的z 统计量
六、例题
某研究者估计本市居民家庭的电脑拥有率为30%。
现随机抽查了200的家庭,其中68个家庭拥有电脑。
试问研究者的估计是否可信?(α = 0.05)
七、总体方差的检验
1. 检验一个总体的方差或标准差
2. 假设总体近似服从正态分布
3. 原假设为H0: σ2 = σ02
4. 检验统计量
八、例题
根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。
现从某日产品中随机抽取20根,测得样本方差为0.0042。
试判断该日纤度的波动与平日有无显著差异?
教学方法
采用课堂教学方法
提问与讨论
1.结合实例讨论,选取不同的显著性水平,会否影响检验结果
2.结合实例讨论,有些问题若将原假设与备择假设对调,检验结果为什么矛盾?
板书设计
主要运用多媒体课件展示。
重要内容采用书写板书
§3两个正态总体的参数检验
教学内容
一、两个总体均值之差的检验
1. 假定条件
⏹两个样本是独立的随机样本
⏹两个总体都是正态分布
⏹若不是正态分布, 可以用正态分布来近似(n1≥30和n2≥30)
2.原假设:H0: μ1- μ2 =0;备择假设:H1: μ1- μ2 ≠ 0
3.检验统计量
若两个总体方差已知,用Z统计量;若两个总体方差未知,用t统计量
二、例题
有两种方法可用于制造某种以抗拉强度为重要特征的产品。
根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。
从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得⎺x1 = 50公斤,⎺x2 = 44公斤。
问这两种方法生产的产品平均抗拉强度是否有显著差别?(α = 0.05)
三、两个总体比例之差的检验
对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂调查60人,18人参加技术培训。
乙厂调查40人,13人参加技术培训。
能否根据以上调查结果认为甲乙两厂工人参加技术培训的人数比例相同?(α = 0.05)
教学方法
采用课堂教学方法
提问与讨论
1.如何检验一个总体的均值大于另一个总体的均值?
2.如何检验一个总体的某个成数小于另一个总体的相应成数?
板书设计
主要运用多媒体课件展示。
重要内容采用书写板书
§4假设检验中的其它问题
教学内容
一、利用置信区间进行假设检验
置信区间对应接受域
二、例题
一种袋装食品每包的标准重量应为1000克。
现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。
已知这种产品重量服从标准差为50克的正态分布。
试确定这批产品的包装重量是否合格?(α = 0.05)
三、利用P-值进行假设检验
1.单侧检验
⏹若p-值≥α,接受H0
⏹若p-值< α, 拒绝H0
2.双侧检验
⏹若p-值≥α, 接受H0
⏹若p-值< α, 拒绝H0
四、例题
欣欣儿童食品厂生产的盒装儿童食品每盒的标准重量为368克。
现从某天生产的一批食品中随机抽取25盒进行检查,测得每盒的平均重量为⎺x = 372.5克。
企业规定每盒重量的标准差σ为15克。
确定P - 值并进行检验。
教学方法
采用课堂教学方法
提问与讨论
1.为什么说参数估计中的置信区间对应假设检验中的接受域?
2.什么是P 值??
板书设计
主要运用多媒体课件展示。
重要内容采用书写板书。