第七章----假设检验总结
教育统计学第七章假设检验

THANKS
感谢观看
和假设。
合理选择样本
选择具有代表性的样本是假设 检验的重要前提,样本的选择 应基于研究目的和研究对象的 特征。
正确理解数据
对收集到的数据进行正确理解 和分析,确保数据的准确性和 可靠性。
正确解读结果
对假设检验的结果进行正确解 读,避免误导或过度解读。
假设检验的局限性
样本代表性
由于样本是从总体中随机抽取的,因此可能存在样本代表性不足的问 题,导致假设检验的结果存在误差。
用于比较实际观测频数与期望 频数之间的差异。
回归分析
用于研究变量之间的关系,并 检验回归方程是否显著。
03
参数假设检验
单个总体参数的假设检验
定义
对单个总体参数的假设检验是检 验一个总体参数是否等于某个特
定值。
步骤
1. 提出假设;2. 确定检验统计量; 3. 确定临界值;4. 做出推断结论。
示例
检验某班级学生的平均成绩是否为 80分。
提高假设检验准确性的方法
增加样本量
增加样本量可以提高假设检验的准确性,降 低误差率。
考虑使用交叉验证
交叉验证可以减少模型过拟合和欠拟合问题, 提高假设检验的准确性。
选择适当的统计方法
根据研究目的和数据特征选择适当的统计方 法,可以更准确地检验假设。
注意控制实验误差
在实验过程中,应采取措施控制实验误差, 确保数据的准确性和可Байду номын сангаас性。
两个样本非参数检验
1 2 3
曼-惠特尼U检验
用于比较两个独立样本的平均值是否存在显著差 异。
威尔科克森符号秩检验
适用于比较两个独立样本的平均值是否存在显著 差异,特别是当其中一个样本的观测值不能进行 四则运算时。
第七章假设检验

第一节 第二节 检验 假设检验的一般问题 总体均值, 总体均值,比例和方差的假设
学习目标
1. 了解假设检验的基本思想 2. 掌握假设检验的步骤 3. 能对实际问题作假设检验
第一节 假设检验的一般问题
一,假设检验的概念 二,假设检验的步骤 三,假设检验中的小概率原理 四,假设检验中的两类错误 五,双侧检验和单侧检验
拒绝域 置信水平
α
1-α 接受域 H0值 样本统计量
临界值
6,右侧检验(显著性水平与拒绝域 ) 右侧检验( 抽样分布
置信水平 拒绝域 1-α 接受域 H0值 观察到的样本统计量 样本统计量
α
临界值
抽样分布
1-α 接受域 H0值
置信水平 拒绝域
α
临界值
样本统计量
第二节 总体均值,比例和方差的假设检验
1,原假设为真时拒绝原假设 , 2,会产生一系列后果 , 3,第一类错误的概率为α ,第一类错误的概率为α
被称为显著性水平 第二类错误(取伪错误) (二)第二类错误(取伪错误)
1,原假设为假时接受原假设 , 2,第二类错误的概率为β ,第二类错误的概率为β
(三)列表
H0: 无罪
假设检验就好 像一场审判过程
2,确定假设的步骤 例如问题为: 检验该企业生产的零件平均长度为4厘米 步骤: (1)从统计角度陈述问题 ( = 4) 1 (2)从统计角度提出相反的问题 ( ≠ 4) 必需互斥和穷尽 (3)提出原假设 ( = 4) (4)提出备择假设 ( ≠ 4) 有 ≠ 符号
3,双侧检验(例子) 双侧检验(例子)
1,原假设与备择假设是一个完整事件组. 2,通常先确定备择假设,再定原假设. 3,等号总放在原假设. 4,两者的选择本质上带有主观色彩. 5,假设检验的目的主要是收集证据拒绝原 假设.
《概率论与数理统计》第七章假设检验.

《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。
能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。
参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。
当然由于样本的随机性,这种推断只能具有⼀定的可靠性。
本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。
由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。
第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。
例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。
现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。
问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。
灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。
即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。
另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。
这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。
究竟是哪种情况与实际情况相符合,这需要作检验。
假如给定显著性⽔平05.0=α。
在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。
第7章 假设检验

第七章假设检验实例:一项新的减肥产品在广告中声称:服用该产品的第一周内,参加者的体重平均至少可以减轻8磅。
现随机抽取40位服用该减肥产品的样本,结果显示:样本的体重平均减少7磅,标准差为3.2磅。
假定显著性水平为0.05.问:该广告是否是属实的?消费者该不该信赖它呢?有人说大学中男生的学习成绩比女生好。
现从一个学校中随机抽取了25名男生和16名女生,对他们进行同样题目的测试,测试结果表明,男生的平均成绩为82分,标准差为10分;女生的平均成绩为78分,标准差为7分。
假定显著性水平为0.05,问:调查数据能否支持该人的结论?回答这些问题我们需要进行假设检验!一、假设检验的基本问题(一)假设检验的定义假设检验—也称显著性检验,它是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
(二)假设检验的基本思想假设检验的基本思想即小概率事件原理。
小概率事件原理——即小概率事件在一次试验中是几乎不可能发生的。
也就是说,如果提出的总体的某个假设是真实的,那么不利于或不可能支持这一假设的小概率事件A在一次试验中几乎是不可能发生的,要是在一次试验中事件A发生了,我们就有理由怀疑这一假设的真实性,并拒绝这一假设。
(三)假设检验的基本形式假设:1、原假设:通常将研究者想收集证据予以反对的假设,也称为零假设,用H0表示。
2、备择假设:通常将研究者想收集证据予以支持的假设,或称为研究假设,用H1表示。
根据备择假设有无特定的方向,可将假设检验的形式分为双侧检验和单侧检验。
(1)双侧检验——备择假设没有特定的方向性,并含有符号“”的假设检验;(2)单侧检验——备择假设具有特定的方向性,并含有符号“<”或“>”的假设检验; 在单侧检验中,根据研究者感兴趣的方向不同: 左侧检验:研究者感兴趣的备择假设方向为“<”的假设检验;右侧检验:研究者感兴趣的备择假设方向为“>”的假设检验。
单侧检验单侧检验左侧检验右侧检验假设检验的表达式假设原假设备择假设双侧检验00:θθ=H 01:θθ≠H 00:θθ≥H 01:θθ<H 00:θθ≤H 01:θθ>H例1:消费者协会接到消费者投诉,指控某品牌纸包装茶叶存在重量不足,有欺骗消费者之嫌。
第七章 假设检验

第七章假设检验第一节假设检验的基本知识一、假设陈述1、原假设/虚无假设:用H表示,常常是根据已有资料得出的,稳定、保守的经验性看法,没有充分根据是不会被推翻的。
2、备选假设/研究假设:与原假设对立的假设,用H1表示,经过抽样调查后,获得证据希望予以支持的假设。
二、假设检验的基本原理——小概率原理小概率原理:一次观察中小概率事件被认为不可能发生;如果一次观察出现了小概率事件,合理的想法应该是否定原有事件具有小概率的说法。
小概率原理在假设检验中的运用:抽取一个样本并计算出检验统计量,如果在原假设成立的条件下这个统计量几乎不可能发生,则拒绝原假设而接受备选假设。
反之,如果计算出的统计量发生的可能性不太小,则接受原假设。
即在原假设下,检验统计量是小概率事件则拒绝原假设。
例1:某市场有100位摊贩,根据以往统计,其中非本地居民占10%,现随机抽取10人调查,发现5个都不是本地人,则原有统计结果是否成立?解:H:100人中10个是非本地人。
计算在原假设成立的情况下,抽取5人都是非本地人的概率:P= C105 C905/C10010<10-4可见,出现5名非本地人的结果概率极其小,但一次实验就出现了,所以怀疑原假设的真实性,拒绝原假设。
三、拒绝域与显著性水平1、显著性水平α,在原假设成立条件下,统计检验中规定的小概率的数量界限,常用的有α=0.10,0.05,0.01。
2、接受域和拒绝域根据原假设画出统计量的分布,以Z分布为例。
如果把拒绝原假设的小概率α事件定在分布的右侧尾部,则右侧面积代表的概率即显著性水平,Zα是临界值。
如果检验统计量值Z>Zα,则应拒绝原假设;如Z<Zα,则接受原假设。
以Zα为临界值,左边为接受域,右边为拒绝域。
也可把α定在左边或两边。
α1、双边检验如果拒绝域放在抽样分布的两侧,每侧拒绝域的概率分别为α/2,假设抽样本分布以0为对称,则P(|Z|>Z α/2)= α;双边检验的假设如下:H 0: μ=μ0H 1: μ≠-Z α/2 Z α/2如果检验统计量|Z|>Z α/2,则拒绝原假设,否则接受。
第七章假设检验

引言
结论:企图肯定什么事情很难, 结论:企图肯定什么事情很难,而否定就容 易得多。 还记得上次那个例子吗? 易得多。 (还记得上次那个例子吗?两个人 住一起,其中有一个人病了, 住一起,其中有一个人病了,另一个人天天 给他熬药还端到他床前,三个月过去了, 给他熬药还端到他床前,三个月过去了,突 然有一天那个人忙得很, 然有一天那个人忙得很,把药熬好了就对卧 病在床的人说,你自己去喝吧, 病在床的人说,你自己去喝吧,卧病的人心 里想: 这个人怎么这么坏呢? 里想:“这个人怎么这么坏呢?”,他倒忘 了这个人对他的好, 了这个人对他的好,记住一个人的好总比记 住一个人的坏好,有时候想想, 住一个人的坏好,有时候想想,老师就像端 药的人,学生就是喝药的人,良药苦口, 药的人,学生就是喝药的人,良药苦口,我 也许一直是你们背后说你们的那个烂人, 也许一直是你们背后说你们的那个烂人,老 师也是弱势群体啊!!) 师也是弱势群体啊!!)
α
H 0 : µ ≤ 2% ↔ H 1 : µ > 2%
5-10
二、两种类型的错误
两类错误发生的概率 α与β之间是此消彼长的关系 接受
H0
拒绝
H0
H0
真实
判断正确 (1-α) ) 取伪错误( 取伪错误(第二类 错误或β 错误或 错误)
弃真错误( 弃真错误(第一 类错误或α 类错误或 错误 ) 判断正确 (1-β) )
第七章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 卡方检验
参数估计是利用样本信息推断未知的总体参数, 参数估计是利用样本信息推断未知的总体参数, 而假设检验是先对总体参数提出一个假设, 而假设检验是先对总体参数提出一个假设,然后利 用样本信息判断这一假设是否成立。 用样本信息判断这一假设是否成立。
概率论与数理统计假设检验小结

概率论与数理统计第7章假设检验
本章小结
01 知识点归纳
02 教学要求与学习建议
01 基本思想
基本步骤假设检验基本概念第一类错误第二类错误
类错误假设
检验正态总体
参数地单个正态总体均值与方差地检验假设检验 两个正态总体均值与方差地检验
01 知识点归纳
02 教学要求与学习建议
(1 理解显著性检验地基本思想,掌握假设检验地基本)步骤,了解假设检验可能产生地两类错误;
(2 掌握单个与两个正态总体地均值与方差地假设检验. )
基本思想
基本步骤假设检验基本概念记忆为主第一类错误第二类错误类错误假设
检验正态总体参数地
单个正态总体均值与方差地检验假设检验 两个正态总体均值与方差地检验假设检验与置信区间相对照:类型相仿;
检验统计量相当于枢轴量;置信区间相当于接受域.将两者结合在一起,便于记忆与掌握其内容.
概率论与数理统计
学海无涯,祝你成功!。
第七章 假设检验总结

第一节 假设检验基本思想 一、 假设检验问题的提出 例1 已知一个暗箱中有100个白色与黑色 球,不知各有多少个。现有人猜测其中有95 个白色球,是否能相信他的猜测呢? 他相当于提出假设: p=P(A)=0.05,A={任取一球是黑球}.
现随机从中抽出一个球, 发现是黑球, 怎样 解释这一事实?
•
什么是小概率?
概率是0~1之间的一个数,因此小概率就是接近 0的一个数,一般指概率在0.05以下的事件。 著名的英国统计家Ronald Fisher 把20分之1作 为标准,也就是0.05,从此0.05或比0.05小的概率都 被认为是小概率。Fisher没有任何深奥的理由解释他 为什么选择0.05,只是说他忽然想起来的
统 计 假 设 由随机误差导致 ——样本来自同一总体, 假设检验就是处理这一类 问题的一种科学方法. 非本质差异 1 2 它所根据的原理是小概率原理。 不是随机误差导致——样本来自另一总体, 假设检验
本质差异
1 2
用样本信息检验(推断)上述假设哪个正确?
二、小概率原理
• 假设检验所依据的基本原理是小概率原理。
P 10 ( 4) C (0.04) (1 0.04) 0.000业男性工 人的血红蛋白含量,算得其均数为 130.83g/L, 标准差为25.74g/L。问从事铅作业工人的血红 蛋白是否不同于正常成年男性平均值 140g/L ? 如果从事铅作业不会影响工人的血红蛋白 含量,则说明样本均数130.83g/L与总体均数 140g/L的差异是由抽样误差引起的,即 =0=140g/L,铅作业男性工人的平均血红蛋 白含量与正常成年男性的相等。
什么是小概率原理?
小概率原理——发生概率很小的随机事件(小概率事件) 在一次实验中几乎是不可能发生的。在一次试验中小概率 事件一旦发生,我们就有理由拒绝原假设。 根据这一原理,可以先假设总体参数的某项取值为真, 也就是假设其发生的可能性很大,然后抽取一个样本进行 观察,如果样本信息显示出现了与事先假设相反的结果且 与原假设差别很大,则说明原来假定的小概率事件在一次 实验中发生了,这是一个违背小概率原理的不合理现象, 因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。 检验中使用的小概率由研究者在检验前事先确定。
第七章假设检验

10
❖ 假设检验的基本思想是以小概率原理作为拒绝假设 H0的依据.
❖ 具体一点说,设有某个假设H0要检验,先假设H0是 正确的,在此假定下,构造一个概率不超过
α(0<α<1)的小概率事件A.
❖ 如果经过一次试验(一次抽样),事件A出现了,那 么人们自然怀疑假设H0的正确性,因而拒绝(否 定)H0.
2
❖ 例1 某药厂生产一种抗菌素,已知在正常生产情况 下,每瓶抗菌素的某项主要指标服从均值为23.0的 正态分布.某日开工后,测得5瓶的数据如下: 22.3,21.5,22.0,21.8,21.4,
❖ 问该日生产是否正常? ❖ 用X表示该日生产的一瓶抗菌素的某项主要指标.如
果已知X~N(μ,σ2)随机变量服从分布,那么问题 就是要检验假设“μ=23”是否成立.
8第Biblioteka 章 假设检验❖ 7.1 假设检验的基本概念 ❖ 7.1.2 假设检验的基本思想 ❖ 根据贝努里大数定律,在大量的重复试验中,某事
件A出现的频率依概率收敛事件A的概率,因而若某
事件A的概率α很小,则在大量的重复试验中,它
出现的频率应该很小.
9
❖ 根据贝努里大数定律,在大量的重复试验中,某事 件A出现的频率依概率收敛事件A的概率,因而若某
概率论与数理统 计
第七章 假设检验
1
第七章 假设检验
❖ 7.1 假设检验的基本概念 ❖ 7.1.1 问题的提出 ❖ 在前面的6.1.1中,讨论过对总体分布中的某些未知
参数或分布的形式作某种假设,然后通过抽取的样 本,对假设的正确性进行判断的问题,称为假设检 验问题. ❖ 同参数估计一样,假设检验是数理统计的主要内容 之一.在实际中,有很多这样的问题需要人们去解决.
东华大学《概率论与数理统计》课件 第七章 假设检验

1. 2为已知, 关于的检验(U 检验 )
在上节中讨论过正态总体 N ( , 2 ) 当 2为已知时, 关于 = 0的检验问题 :
假设检验 H0 : = 0 , H1 : 0 ;
我们引入统计量U
=
− 0 0
,则U服从N(0,1)
n
对于给定的检验水平 (0 1)
由标准正态分布分位数定义知,
~
N (0,1),
由标准正态分布分位点的定义得 k = u1− / 2 ,
当 x − 0 / n
u1− / 2时, 拒绝H0 ,
x − 0 / n
u1− / 2时,
接受H0.
假设检验过程如下:
在实例中若取定 = 0.05, 则 k = u1− / 2 = u0.975 = 1.96, 又已知 n = 9, = 0.015, 由样本算得 x = 0.511, 即有 x − 0 = 2.2 1.96,
临界点为 − u1− / 2及u1− / 2.
3. 两类错误及记号
假设检验是根据样本的信息并依据小概率原
理,作出接受还是拒绝H0的判断。由于样本具有 随机性,因而假设检验所作出的结论有可能是错
误的. 这种错误有两类:
(1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称做第一类错误, 又叫弃
设 1,2, ,n 为来自总体 的样本,
因为 2 未知, 不能利用 − 0 来确定拒绝域. / n
因为 Sn*2 是 2 的无偏估计, 故用 Sn* 来取代 ,
即采用 T = − 0 来作为检验统计量.
Sn* / n
当H0为真时,
− 0 ~ t(n −1),
Sn* / n
由t分布分位数的定义知
概率论与数理统计:第七章 假设检验

得拒绝域为 W = {u u }
其中, u = x μ0 σ/ n
U
=
X
σ
μ0
/n
ua/2
,则称 X 与m0的
差异是显著的,则拒绝H0
如果
U
ห้องสมุดไป่ตู้
=
X μ0 σ/ n
< ua/ 2
,则称 X 与m0的
差异是不显著的,则接受H0
x与μ 0有无显著差异的判断,
是在显著性水平α之下做出的。
厦大经院-国贸-2012秋季学期
关于显著性水平
是一个概率值,弃真概率;在后面“假设 检验的两类错误”再具体介绍;
H0称为原假设, H1称为备择假设
厦大经院-国贸-2012秋季学期
原假设
试图推翻的假设,又称“零假设”
表示为 H0
指定为 = , ,
如,H0:m = 3190
厦大经院-国贸-2012秋季学期
备择假设
通常是试图支持的假设
指定为: , > , <
表示为 H1,如 H1 : m < 3910 H1 : m ≠ 3910 H1 : m > 3910
2. 原假设H0不真, 观察值却落入接受域, 从而作出接受H0的判断,
这类错误“以假为真”,记为 错误 ,
犯第Ⅱ类错误的概率:
= P { 接受H0 | H0不正确 }
厦大经院-国贸-2012秋季学期
错误和 错误的关系
小, 就大
大, 就小
不能 同时减少 两类错误
当样本容量 n 一定,若减少第I类错误的概率, 第Ⅱ类错误的概率往往增大; 要使两类错误的概率都减小,只能增加样本容量。
在一次试验中, 小概率事件不会发生 。
第七章 假设检验

若统计量的值落在否定域内(包括临界 值),说明H0与样本描述的情况有显著差异, 应该否定原假设;若该值落在接受域内,就 说明H0与样本描述的情况无显著差异,则应 接受原假设。 本例Z值为2.5落入拒绝域,故拒绝原假设, 认为08年国有单位职工月平均工资与07年相 比有显著差异。
15
end
三、假设检验中的两类错误 假设检验是依据样本信息进行判断,是由部 分来推断整体,因而不可能绝对准确,可能 犯错误。
end
0.55 0.60
三、总体方差的假设检验 ( 2检验)
1. 检验一个总体的方差或标准差 2. 假设总体近似服从正态分布 3. 检验统计量服从 2分布
( n 1) s 2 ~ ( n 1) 2 0
Байду номын сангаас2 2
假设的总体方差
34
end
【例 6-9】啤酒生产企业采用自动生产线灌 装啤酒,每瓶的装填量为 640ml ,但由于 受某些不可控因素的影响,每瓶的装填量 会有差异。此时,不仅每瓶的平均装填量 很重要,装填量的方差同样很重要。如果 方差很大,会出现装填量太多或太少的情 况,这样要么生产企业不划算,要么消费 者不满意。假定生产标准规定每瓶装填量 的标准差不应超过 4ml 。企业质检部门抽 取了10瓶啤酒进行检验,得到的样本标准 差为s=3.8ml。试以0.05的显著性水平检验 装填量的标准差是否符合要求? 方差检验经常是右侧检验
17
end
第二节总体参数的假设检验
总体参数假设检验就是检验已知分布形 式的总体某些参数是否与事先所做的假 设存在显著性差异,又称为显著性检验。 主要包括对总体均值、总体比例和总体 方差的假设检验。
18
end
一、总体均值的假设检验
07第七章 假设检验

{Z z0.01}是
一小概率事件
拒绝域 W Z : Z z0.01 2.33 .
X 给定显著水平 =0.01,若使得 P k =, n X 21 则有 P k , ( 2) n 由式()得:k z . 1
20
四、求解参数假设检验问题的步骤
1、根据实际问题的要求,提出原假设 H 0 及备选 假设 H1 . 选择 H 0 , H1 使得两类错误中导致后果严重的 错误成为第一类错误. 2、给出显著水平 拒绝域.
,选择合适的统计量,确定
3、根据样本值,求出检验统计量的值,作出决策.
21
提出 假设
根据统计调查的目的, 提出 原假设H0 和备选假设H1 作出 决策
因此,衡量 x 0 的大小,可归结为衡量 x 0 的大小.
8
n
选择适当的正数k,使样本的观察值 x满足 x 0 U k n 时,就接受原假设H 0 . 否则,即当 U k时,就拒绝原假设H 0 .
应该用什么原则来确定这个量的合理界限?即怎样求k?
注意到,
不等式 x 0
2
拒绝 域
2
假设检验的步骤
Step1 提出假设. Step2 构造拒绝域,依据假设和常用的统计量. Step3 进行检验.
注意:不否定H0并不是肯定H0一定对,而只是说差 异还不够显著,还没有达到足以否定H0的程度.
所以假设检验又叫 “显著性检验” 如果显著性水平α取得很小,则拒绝域也会比较小, 其产生的后果是: H 0难于被拒绝. 如果在α很小的情况下, H0仍被拒绝了, 则说明实 际情况很可能与之有显著差异.
可用x与0的差距 x 0 来判断原假设H 0是否成立.
第七章 假设检验(F检验与卡方检验)

• F检验
– 方差齐性检验 – 两个独立样本的方差齐性检验
• F检验
– – – – – 提出待检验的假设H0和H1 S12 确定并计算统计量 F S 2 2 根据df1和df2值,对给定的显著性水平α 建立拒绝虚无假设的规则 作出统计决策
• 将检验统计量的值与拒绝规则所指定的临界值相比 较,确定是否拒绝虚无假设
i 1 • 则2服从自由度为n的2(n)分布,记为 2~2(n)。
xi2
2
n
2的特点
• (1) 2是一个正偏态分布,n越大,曲线越趋于对称(趋于 正态分布),n越小,曲线越不对称。 • (2) 2值都是正值。
• (3)若X1,X2,…,Xm相互独立,且Xi~ 2(ni),i=1,2,…,m,则 X=X1+X2+Xm~ 2(n),其中n=n1+n2+…+nm。
性别 男生 女生 合计 录取人数 10(9) 8(9) 18 未录取人数 80(81) 82(81) 162 合计 90 90 180
对平均数差异的显著性检验的理论前提是假设两 个总体的方差是相同,或至少没有显著性差异。 Z检验和t检验 对两个总体的方差是否有显著性差异所进行的检 验称为方差齐性检验,即必须进行F检验。
F分布
• 若有两个服从正态分布的总体N1(μ1,σ1),N2(μ2,σ2)。检 验σ1和σ2是否有显著性差异? • 在方差分析中,需要检验某个因素是否对指标有显著 的作用时需要F分布来解决。 • 设有两个总体X,Y,已知X~2(n1),Y~2(n2),并且 X与Y相互独立,则称随机变量F,所服从的分布为第 一自由度为n1,第二自由度为n2的F分布,记为F~F (n1,n2)。
• • 若自由度df=1,α=0.900,查2分布表可知P(2>0.02)=0.900 记20.900(1)=0.02
统计学第四版第7章假设检验(简)总结

~ 2 n 1
2 n 1 s 当H 为真时,统计量 2
2 n 1 s 20 10.0042 2 统计量的值 31.92
2
0.0025
2 0.10, 查 2分布表得 02.05 ( 19) 30.14, 0 19 10.12 .95
假设检验分为两类:参数检验、非参数检验/自
由分布检验
2
例1
消费者协会接到消费者投诉,指控品牌纸包装饮
料存在容量不足,有欺骗消费者之嫌。包装上标 明的容量为250毫升。消费者协会从市场上随机抽 取50盒该品牌纸包装饮品,测试发现平均含量为 248毫升,小于250毫升。这是生产中正常的波动, 还是厂商的有意行为?消费者协会能否根据该样 本数据,判定饮料厂商欺骗了消费者呢?
提出原假设和备择假设→根据抽样分布,计算样本统 计量→选择显著性水平α ,查表确定临界值→判断并 得出结论。
8
第一步:确定原假设与备择假设
: =255;
:
≠250
原假设H0:通常是研究者 想收集证据予以反对的假 设,也称为零假设
备择假设H1:通常是研究 者想收集证据予以支持的 假设,也称为研究假设。
3
例2
一种罐装饮料采用自动生产线生产,每罐
的容量是255ml,标准差为5ml。为检验每罐
容量是否符合要求,质检人员在某天生产
的饮料中随意抽取了40罐进行检验,测得每
罐平均容量为255.8ml。检验该天生产的饮
料容量是否符合标准要求。
4
例3
根据过去大量资料,某厂生产的产品的使
用寿命服从正态分布N(1020,1002)。现
第七章假设检验

第三节
u检验
u检验(u test ),亦称z检验(z test) 大样本均数(率)与总体均数(率)比较的u检 验、 两个大样本均数(率)比较的u检验 一、大样本均数比较的u检验 二、大样本率的u检验
一、大样本均数比较的u检验
假定样本数据服从正态分布 ,当总体标准差 未知时,可用样本标准差作为估计值 这里的总体均数一般是指已知的理论值、标准 值或经过大量观察所得到的稳定值,记作µ 0 (或记为 )
两个样本率p1、p2的差值服从正态分布
u p1 p2
1 2
p p
2 2 p p p p 1 (1 1 ) / n1 2 (1 2 ) / n2
1 2 1 2
样本率p介于0.1~0.9之间,每组例数大于60 例
n1 p1 n2 p2 ˆ0 n1 n2
两样本均数比较的u检验
该检验方法适用于完全随机设计中两组 计量资料差别的比较 两样本均数差值服从正态分布
u Leabharlann 1 X 2X1X2
X
1X2
2 2 2 2 X / n 1 1 2 / n2 X2 1
当总体标准差未知,两组例数均超过30
ˆX
1X2
亦称样本率与总体率的比较的u检验,这里的 总体率一般是指已知的理论值、标准值或经大 量观察所获得的稳定值。
例7–3 全国调查的调查结果,学龄前儿童营 养性贫血患病率为23.5%。某医院为了解当
地学龄前儿童能够营养性贫血患病情况,对
当地1396例学龄前儿童进行了抽样调查,查
出营养性贫血患儿363例,患病率为26.0%。
ˆp p
1
2
1 1 ˆ0 (1 ˆ0 )( ) n1 n2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设
双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
0 < 0
0 > 0
双侧检验
1、定义:只强调差异而不强调方向性的检验叫双侧检验。 例:某种零件的尺寸,要求其平均长度为10厘米,大于或小于 10厘米均属于不合格。
建立的原假设与备择假设应为
H0: 1 0(10) H1: 1 0(10)
H 0 : 1 0 H1 : 1 0 只关注1,0是否有差异,不关心 1比0大还是小
单侧检验(单尾):强调某一方向性的检验。
H 0 : 1 0 左侧检验 H1 : 1 0 H 0 : 1 右侧检验 H1 : 1
研究的问题
假设检验的思想
• 先对总体的参数或分布函数的表达式作出某种假设; • 然后构造出一个在假设成立条件下出现可能性甚小的事件(即小概率 事件); • 如果试验或抽样的结果使该小概率事件出现了,这与小概率事件原理 相违背,表明原来的假设有问题,应予以否定,即拒绝这个假设; • 若该小概率事件在一次试验或抽样中并未出现,就没有理由否定这个 假设,表明试验或抽样结果支持这个假设,这时假设与实验结果是一 致的,或者说可以接受这个假设。
(2)利用P值法
P值是指统计量值在分布曲线上所截取的剩余面积概率值,可由 计算机自动给出。 无论是双侧还是单侧检验问题: 当P≤α时,H0不成立; P>α时,H0成立
利用P值进行决策的准则
若Sig(或P值 )大于给定的显著性水平(等价于样本的 检验统计量小于对应于给定的显著性水平的临界值),则 接受原假设; 反之,若Sig(或P值 )小于给定的显著性 水平(等价于样本的检验统计量大于对应于给定的显著性 水平的临界值),则拒绝原假设。
方法1:总体方差已知时的检验
单样本均值的双尾 Z 检验 (2 已知)
• 1、假定条件 – 总体服从正态分布 – 若不服从正态分布, 可用正态分布来近似(n30) 2、原假设为:H0: =0; 备择假设为:H1: 0 使用z-统计量:
• 3.
z
x 0
n
~ N (0,1)
(实例)
6.假设检验中的两类错误
• 假设检验是依据样本提供的信息进行推断的,即由部分来推断总体,因而 假设检验不可能绝对准确,是可能犯错误的。 两类错误: • 错误(I型错误): H0为真时却被拒绝,弃真错误; • 错误(II型错误): H0为假时却被接受,纳伪错误。 假设检验中各种可能结果的概率: 接受H0 ,拒绝H1 1- (正确决策) (取伪错误) 拒绝H0,接受H1 (弃真错误) 1- (正确决策)
假设检验的一些基本概念
4.接受域与拒绝域
• 接受域:原假设为真时允许范围内的变动,应该接受原假设。 • 拒绝域:当原假设为真时只有很小的概率出现,因而当统计 量的结果落入这一区域便应拒绝原假设,这一区域便称作拒绝域。
例:=0.05时的接受域和拒绝域
假设检验的一些基本概念
5.双侧检验与单侧检验 双侧检验(双尾): 指只强调差异而不强调方向性的检验。
每隔一定时间,抽查若干罐 . 如每隔1小时,抽查5罐,得5 个容量的值X1,…,X5,根据这些值来判断生产是否正常. 方法: 事先对生产状况提出一个假设,然后利用样本
统计量的值检验提出的假设是否正确。
假设检验的提出
在实际中,我们对总体的概率分布或参数往往会作出某 种假设,所作假设可能是正确的,也可能是错误的,为 了判断所作的假设是否正确,就需要对提出的假设作出 进一步决策,具体做法如下: 从总体中抽取一定量的样本,根据样本的取值,按一定 原则进行检验,然后作出拒绝还是接受所作假设的决策。 假设检验就是作出这一决策的过程。
原假设:检验前对总体参数值所做的假设。一般为研究者想收 集证据予以反对的假设。 备择假设:与原假设相对立的假设。一般为研究者想收集数据 予以证实自己观点的假设。 两类假设建立原则 1、H0与H1必须成对出现 2、通常先确定备择假设,再确定原假设 3、假设中的等号“=”总是放在原假设中
假设检验的一些基本概念
显著性水平
2
2
2
Z 2
临界值
0
Z
临界值
假设检验是对我们所关心的却又是未知的总体参数先作出 假设,然后抽取样本,利用样本提供的信息,根据小概率原理
对假设的正确性进行判断的一种统计推断方法。
1、假设检验的过程 (提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 别无选择.
总体
我认为人口的平 均年龄是50岁
抽取随机样本
均值 X = 20
2、假设检验的步骤
1、提出原假设和备择假设 2、确定适当的检验统计量
3、规定显著性水平
4、计算检验统计量的值 5、作出统计决策
提出原假设和备择假设
1 、提出原假设与备择假设。H0 、H1是对立的,先将研究
者收集证据要证明的观点定为H1,再提出H0 。
2.检验统计量 • 用于假设检验问题的统计量称为检验统计量。 • 与参数估计相同,需要考虑: 总体是否正态分布; 大样本还是小样本; 总体方差已知还是未知。
假设检验的一些基本概念
3.显著性水平
• 用样本推断H0是否正确,必有犯错误的可能。 原假设H0正确,而被我们 拒绝,犯这种错误的概率用表示。把称为假设检验中的显著性水平 ( Significant level), 即决策中的风险。 • 显著性水平就是指当原假设正确时人们却把它拒绝了的概率或风险。 • 显著性水平是小概率事件的具体体现。 • 通常取=0.05或=0.01或=0.001, 那么, 接受原假设时正确的可能性 (概率)为:95%, 99%, 99.9%。
规定显著性水平
1 、常用的 值有0.01, 0.05, 0.10 2、 由研究者事先确定
作出统计决策
•
• •
(1)临界值比较法
双侧检验问题:用计算出的统计量的值与双侧临界值比较。 左尾检验问题:用计算出的统计量的值与左临界值比较。
•
右尾检验问题:用计算出的统计量的值与右临界值比较。
•
• • • •
– 建立的原假设与备择假设应为
•
H0: 1 0 1500 H1: 1 0 1500
右侧检验显著性水平与拒绝: 如果统计量值界于小于右临界值,则H0成立;如果大于右临 界值,则H0不成立
抽样分布
置信水平 拒绝域 1 -
a
接受域
H0值 样本统计量 临界值
观察到的样本统计量
假设检验的一些基本概念
.025
拒绝 H0
.025
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
-1.96
0
1.96
Z
*均值的单尾 Z 检验 (2 已知)
1. 假定条件 – 总体服从正态分布 – 若不服从正态分布,可以用正态分布来近似 (n30) 备择假设有<或>符号 使用z-统计量
2. 3.
z
x 0
2 、主要形式有三种
H0:0 1
H0: 1 0 H0 :1 0
H1: 01
H1 :1 0 H1 :1 0
双侧检验
右尾检验 左尾检验
确定适当的检验统计量并计算值
1、根据不同类型的问题选择统计量 均值、比例、方差 2 、选择统计量的方法与参数估计相同,需考虑 – – 是大样本还是小样本 总体方差已知还是未知
双侧检验的显著性水平与拒绝域 如果统计量值界于左、右临界值间,则H0成立;如果大于右 临界值或小于左临界值,H0不成立。
抽样分布
拒绝域 /2
置信水平
拒绝域
1-
/2
接受域
H0值 样本统计量
临界值
临界值
单侧检验
1、左侧检验:检验研究对象是否低于某一水平。 例如:改进生产工艺后,会使产品的生产时间降低到2小时 以下 – 建立的原假设与备择假设应为 H0: 1 0 H1: 1 0
单下尾检验(左侧检验)显著性水平与拒绝域 : 如果统计量值界于大于左临界值,则H0成立;如果小于左临 界值,H0不成立。
抽样分布
拒绝域
置信水平
1- 接受域
H0值 样本统计量
临界值
单侧检验
2、右侧检验:检验研究对象是否高于某一ቤተ መጻሕፍቲ ባይዱ平。 • 例:采用新技术生产后,将会使产品的使用寿命明显延长
到1500小时以上
与
(3)要想减少与,一个方法就是要增大样本容量n。
2 2 若增大n,在样本平均数的分布 X ~N ( , )中, 就会 n n 变小, 变小,则分布就瘦长, 从而减少了两种错误的 n 概率与。
假设检验的概念
拒绝域
接受域
拒绝域
Z
x n
__
Z统计量
1
2 2
第二节 单样本均值显著性检验 (One-sample test)
• 一、研究问题:
• 用从总体中抽取的一个样本的均值检验该总体均值是否等于某个
值。对应于社会研究中“均值类质量检验”问题,即必须有一个 总体报告值或标准值。 • 二、方法 • 方法1:总体方差已知时双侧检验、单尾(左尾、右尾)检验 • 方法2:总体方差未知时双侧检验、单尾(左尾、右尾)检验
n
~ N (0,1)
均值的单尾 Z 检验 (提出假设)
左侧:H0: 0 H1: < 0
拒绝 H0
右侧:H0: 0 H1: > 0
拒绝 H0
0
Z
0
Z
必须是显著地 低于 0,大 的值满足H0 ,不能拒绝
必须显著地大于0,小的 值满足 H0 ,不能拒绝