第五章假设检验
教育与心理统计学 第五章 假设检验考研笔记-精品
假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\
第五章假设检验
第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2. 熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p- 值检验;4. 掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验; 5. 能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理” ,对假设的正确性做出判断。
这种思维方法与数学里的“反证法” 很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0 的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件” 。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平 a 0<加1)作为小概率的界限,a的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
第五章-假设检验与回归分析
件,得到拒绝域;
步骤 4:明确或计算样本均值 x ,得到U 变量的观测值 u x 0 n 0
若观测值 u 落入拒绝域,则拒绝零假设 H 0 ,即接受备择假设 H1 ,
否则不能拒绝零假设 H 0 。
第五章 假设检验与回归分析 例1、 已知某面粉自动装袋机包装面粉,每袋面粉重量 Xkg
服从正态分布 N(25,0.02) ,长期实践表明方差 2 比较稳定,从
第五章 假设检验与回归分析
U 检验的步骤:
步骤 1:提出零假设 H 0 : 0 与备择假设 H1 ;
步骤 2:明确所给正态总体标准差 0 值、样本容量 n 的
值,当零假设 H 0 成立时,构造变量
U X 0 n ~ N(0,1) 0
第五章 假设检验与回归分析
步骤 3:由所给检验水平 的值查标准正态分布表求出对应 的双侧分位数 u 的值或上侧分位数 u 的值,构造小概率事
u
2
0.05, u 1.96 ,
2
第五章 假设检验与回归分析
x 0 n
12.5 12 1 100
5 u
2
1.96
故拒绝 H0 ,即认为产品平均质量有显著变化。
小结与提问:
理解假设检验的基本原理、概念;掌握假设检验的步骤。
课外作业:
P249 习题五 5.01, 5.02,5.03。
0.10,再在表中第一列找到自由度 m n 1 7 1 6 ,
其纵横交叉处的数值即为对应的 t 分布双侧分位数 t 1.943
2
,使得概率等式
PT 1.943 0.10
成立。这说明事件 T 1.943是一个小概率事件,于是得到
拒绝域
t 1.943
第五章 假设检验与回归分析
第五章假设检验
5.1.1 假设检验基本原理
假设检验的原理是逻辑上的反证法和统计上的小概 率原理 反证法:当一件事情的发生只有两种可能A和B, 如果能否定B,则等同于间接的肯定了A。 小概率原理:发生概率很小的随机事件在一次实 验中是几乎不可能发生的。
概率小到多小才算是“小”?通常用显
8.7 - 9
=
= 3.162
2.5 10
5.1.1 假设检验基本原理
3)确定拒绝域 • 在检验统计量抽样分布的尾部(1侧或2侧)中划定 一小概率区域,一旦计算的检验统计量的实际值落 入此区域,就否定原假设,接受备择假设。 • 这个小概率也称为显著性水平,用 表示 • 通常取 =5%或 =1%
双侧检验
单侧检验 左侧检验 右侧检验
H0 : = 0 H0 : 0 H0 : 0
备择假设
H1 : 0 H1 : < 0 H1 : > 0
5.1.2 假设检验相关概念
• 例(续) –左侧检验
1)假设: H0: 9, HA: < 9
2)检验统计量:同双侧检验, z = -3.162
5.1 假设检验的基本问题
5.1.1 假设检验基本原理
假设:对总体的某些未知的或不完全知道的性质所 提出的待考察的命题。
假设检验:对假设成立与否做出的推断。
5.1.1 假设检验基本原理
问题的提出 – 例 :某猪场称该场的猪在体重为100kg时的平均背膘厚度 为9mm。 – 问题:此说法是否正确?有4种可能性(假设)
概率论与数理统计
主讲:孟丽丽
概率部分 第一章 概率论基本概念 第二章 随机变量及其分布
统计部分 第三章 统计基础知识 第四章 参数估计 第五章 假设检验 第六章 方差分析 第七章 相关与回归
第五章 假设检验
Di
4.1 3.8
1.0
4.2
5 15.3 12.0
3.3
6 13.9 14.7 -0.8
7 20.0 18.1 1.9
8 16.2 13.8 2.4
9 15.3 10.9 4.4
作业(以下任选一道)
1、查阅近两年的心理学和教育学权威杂志各一套(例 如,可查阅这几个年度的《心理学报》和《教育研究》 各一套),对其论文中使用的统计方法进行一项描述
(两个样本的“t”检验) 五、相关系数的显著性检验 六、方差差异的显著性检验
假设检验的一般步骤
(1)建立虚无假设和备择假设
双侧检验为:H0:µ=µ0
H1:µ‡µ0
单侧检验为:H0:µ<=µ0 或 H0:µ>=µ0
H1:µ>µ0 或 H1:µ<µ0
(2)寻找合适的统计量及其抽样分布,并计算统计量
T’=-1.929;SE2=3.468;t’ a/2=2.049
练习题5
对9个被试进行两种夹角(15o,30o)的缪 勒—莱依尔错觉实验结果如下,问两种夹角的 情况下错觉量是否有 显著差异?
被试 1
2
3
4
15o 14.7 18.9
17.2 15.4
30o 10.6 15.1
16.2 11.2
Z1.84;SE1.793
两类错误
H0为真
接受H0 拒绝H0
正确 α错误
前提 H0为假 β错误 正确
总体平均数的假设检验例题1
全区统一考试物理平均分μo=50,标准差σo=10.某 校的一个班(n=41)平均成绩 X =52.5.问该班成 绩与全区平均成绩差异是否显著.
(总体正态,总体方差已知)
第五章-假设检验的功效与样本量
第五章假设检验的功效与样本量•当假设检验不拒绝H 0时,推断正确的概率称为检验功效。
•临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。
5.1 两类错误与功效1. 两类错误的概率H 0: μ=μ0, H 1: μ>μ0(5.1) 〔略〕Z =nX σμ0-(5.2) 〔略〕 •任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α(5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β(5.4a) 也可以理解为第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β(5.4b) •如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病)(α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病)(β) •两类错误的背景:拒绝H 0时可能犯第Ⅰ类错误不拒绝H 0时可能犯第Ⅱ类错误•两类错误的后果:第Ⅰ类错误可能将“真实无效误作有效〞∕误诊 第Ⅱ类错误可能将“真实有效误作无效〞∕漏诊 • 一般α, β的数值要在科研设计时事先确定2. 功效(power)• 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β(5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β(5.5)•功效就是真实有效的药物被发现的概率∕疾病被诊断出来的概率5.2 影响功效的四要素• 假设检验的功效至少受四个要素的影响,参看(5.2)式 nX σμ0-≥Z α(5.6) • 功效的影响因素为:δ=0μ-x ,σ,n ,αX ≥μ0+Z αn σ (5.7) 〔略〕• 现用X 分布图形来定性地讨论四要素对功效的影响1. 客观差异越大,功效越大X ~N(μ,σ2/n) (5.8) 〔略〕若H 0为真,X ~N(μ0,σ2/n) (5.9) 〔略〕若H 1为真,X ~N(μ0+δ,σ2/n) (5.10) 〔略〕2. 个体间标准差越小, 功效越大。
《统计学》第5章 假设检验
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
第五章假设检验与回归分析
第五章假设检验与回归分析本章主要介绍了假设检验和回归分析两种统计方法。
一、假设检验假设检验是通过收集样本数据来对总体参数的假设进行推断的一种统计方法。
假设检验的步骤如下:1.建立原假设和备择假设:原假设是需要进行检验的参数的假设值,备择假设是对原假设的一种否定或补充。
通常将备择假设设置为我们要验证的假设。
2.收集样本数据:根据样本数据进行统计分析,并计算出检验统计量。
3.确定显著性水平:显著性水平是拒绝原假设的最大错误概率,通常取0.05或0.014.计算拒绝域的临界值:根据显著性水平和自由度,在统计表中查找检验统计量的临界值。
5.比较检验统计量和临界值:如果检验统计量落在拒绝域内,则拒绝原假设,否则接受原假设。
二、回归分析回归分析是一种用于研究两个或多个变量之间关系的统计方法。
它可以用来建立一个变量对另一个变量的预测模型。
回归分析的步骤如下:1.收集数据:根据需要收集自变量和因变量的数据。
2.建立模型:选择适当的回归模型,将自变量和因变量进行数学表达。
3.估计参数:使用最小二乘法等方法,对模型参数进行估计。
4.检验模型:通过检验模型的显著性水平,确定模型是否合理。
5.利用模型:使用估计的模型来进行预测和分析。
回归分析可以分为简单线性回归和多元线性回归两种。
简单线性回归是指只有一个自变量和一个因变量之间的关系,多元线性回归是指有多个自变量和一个因变量之间的关系。
回归分析的应用非常广泛,可以用于市场营销、财务管理、经济预测等领域。
通过回归分析,可以找到影响因变量的主要因素,并对未来的变化进行预测。
总之,假设检验和回归分析是统计学中两种重要的方法。
假设检验用于对总体参数的假设进行验证,回归分析用于研究变量之间的关系。
这两种方法在实际应用中具有广泛的价值。
第五章 假设检验
0.05
结论:
改良后的新品种产量有显著提高
0
1.645
z
总体均值的检验
(大样本检验方法的总结)
假设 双侧检验 H0 : =0 H1 : 0 左侧检验 H0 : 0 H1 : <0 右侧检验 H0 : 0 H1 : >0
假设形式
已知:
统计量
z
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H0 置信水平
第 5章 假设检验
5.1 假设检验的基本问题 5.2 总体均值的检验 5.3 总体比例的检验
假设检验在统计方法中的地位
统计方法
推断统计
描述统计
参数估计
假设检验
5.1 假设检验的基本问题
是否法国人的地理知识要比美国 人丰富?
1988年7月28日的纽约时报上刊登了一篇有关 人们地理知识的文章。这篇文章中描述了一个 由国家地理协会委托GalluP公司所做的研究结 果。研究者们从一些国家抽取许多成年人并请 他们鉴别在一个地图上的16个地方(包括13个 国家、中非、波斯湾和太平洋);然后把每个 人答对的个数加起来。 四个国家的样本中答对的个数的均值为:美国 6.9;墨西哥 8.2;大不列颠 9.0;法国 9.2。
第五章 假设检验
应 用 统 计 第 五 章
6
解:设这台机床生产的所有零件平均直径的
真值为m 。如果m =10表明生产过程正常,如 果m >10或m <10,则表明机床的生产过程不正 常,研究者要检测这两种可能情况中的任何 一种。根据原假设和备择假设的定义,研究 者想收集证据予以证明的假设应该是“生产 过程不正常” 所以建立的原假设和备择假设 应为: H0: m =10 (生产过程正常) H1: m ≠10 (生产过程不正常)
第五章 假设检验
应 用 统 计 第 五 章
2
5.1 假设检验的基本原理 5.2 一个总体参数的检验 5.3 两个总体参数的检验(自习) 本章总结
5.1 假设检验的基本问题
应 用 统 计 第 五 章
3
5.1.1 假设的陈述 “假设”(hypothesis)就是对总体参数的具体
图5.1 显著性水平、拒绝域和临界值
置信水平(1–a)
应 用 统 计 第 五 章
15
拒绝域
a
拒绝域
拒绝域
a/2
临界值
a/2
o
(a)双侧检验
临界值
置信水平(1–a)
置信水平(1–a)
拒绝域
a
o 临界值 (b)左侧检验
o
临界值
(c)右侧检验
5.1.4 利用P值进行决策
应 用 统 计 第 五ห้องสมุดไป่ตู้章
16
如果原假设H0为真,所得到的样本结果会像
例5.1
应 用 统 计 第 五 章
5
一种零件的生产标准是直径应为10cm,为对
生产过程进行控制,质量监测人员定期对一 台加工机床进行检查,确定这台机床生产的 零件是否符合标准要求。如果零件的平均直 径大于或小于10cm,则表明生产过程不正常, 必须进行调整。试陈述用来检验生产过程是 否正常的原假设和备择假设。
第五章 假设检验
样本统计量
统计学
STATISTICS
显著性水平和拒绝域
(右侧检验 )
置信水平 拒绝H 拒绝H0
抽样分布
α
1-α
0
6 - 32
样本统计量 临界值
统计学
STATISTICS
决策规则
1. 给定显著性水平α,查表得出相应的临界 值zα或zα/2, tα或tα/2 2. 将检验统计量的值与α 水平的临界值进行 比较 3. 作出决策 双侧检验: 统计量I 临界值,拒绝H 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验: 临界值,拒绝H 左侧检验:统计量 < -临界值,拒绝H0 右侧检验: 临界值,拒绝H 右侧检验:统计量 > 临界值,拒绝H0
6 - 23
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
α/2
α/2
临界值
6 - 24
0
临界值
样本统计量
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
H0:µ = 某一数值 指定为 = 号,即 ≤ 或 ≥ 例如, 3190( 例如, H0:µ = 3190(克)
6-9
统计学
STATISTICS
什么是备择假设 什么是备择假设
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设 研究者想收集证据予以支持的假设 2. 也称“研究假设” 也称“研究假设” 3. 总是有符号 ≠, < 或 > 4. 表示为 H1 H1 : µ <某一数值,或µ >某一数值 某一数值, 例如, 例如, H1 : µ < 10cm,或µ >10cm 10cm, 10cm
第5章_假设检验
面向21世纪 课程教材
第五章
假设检验
第二节
某研究者估计本市居民家庭电脑拥有率为30%。现随机调查了200个家庭,其 中68家拥有电脑。试问研究估计是否可信?( =10%) 提出假设:原假设:Ho:P=0.3; 备择假设:Ha:p≠0.3
样本比例 P=m/n=68/200=0.34 由于样本容量相当大,因此可近似采用Z检验法 p p0 0.34 0.3 z 1.194 p (1 p ) 0.34 0.66 n 200
面向21世纪 课程教材
第五章
假设检验
第二节
2.方差检验过程 (1)提出原假设Ho和备择假设Ha。
2 H0 : 2 0
2 Ha : 2 0
(2)构造检验统计量:
(n 1) s 2
2
~
2
(n-1)
2 2分布。 在Ho成立的条件下,统计量 服从自由度为n-1的
(3)确定显著性水平。 (4)规定决策规则。 在双侧检验的情况下,拒绝区域在两侧,如果检验统计量大于右侧临界 值,或小于左侧临界值,则拒绝原假设。若是单侧检验,拒绝区域分布 在一侧,具体左侧还是右侧,可根据备择假设Ha的情况而定。 (5)进行判断决策。
面向21世纪 课程教材
第五章
假设检验
第二节
某厂采用自动包装机分装产品,假定每包重量报从正态分 布,每包标准重量为1000克,某日随机抽查9包,测得样本 平均重量为986克,标准差为24克,试问在0.05的检验水平 上,能否认为这天自动包装机工作正常?
;H 根据题意,提出假设: H0 : 1000 1: 1000
面向21世纪 课程教材
第二节 总体均值、比例和 方差的假设检验
统计学第5章 假设检验
假设检验
第 5 章
假设检验
• 5.1 假设检验的基本问题 • 5.2 一个总体参数的检验 • 5.3 两个总体参数的检验(自学)
5.1
假设检验的基本原理
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策
假设检验的基本概念
在实际工作中常会遇到这样的问题: (1)某药物在改进工艺后的疗效是否有提高? (2)假定总体服从某种分布是否成立? 如何通过抽检的样本对上述问题做出判断? 此时常常作出适当的假设,然后进行试验或 观测,得到统计样本,构造统计方法进行判断,以 决定是否接受这个假设。
1. 基本原理
小概率推断原理: 0 α 0.05 小概率事件 (概率接近0的事件),在一次试验中,实际上可认为 不会发生(这是人们长期积累起的普遍经验!).
2. 基本思想方法
采用概率性质的反证法: 先提出假设H0 , 再根 据一次抽样所得到的样本值进行计算. 若导致小 概率事件发生,则否认假设H0 ;否则,接受假设H0 . 下面结合实例来说明假设检验的基本思想.
H0 :π ≤30%
H1 :π >30%
提出假设 (练习)
• 某厂生产的化纤的纤度服从正态分布,纤 维纤度的标准均值为1.04。某天测得25根 纤维的纤度均值为x=1.39,检验与原来设 计的标准均值相比是否有所变化,要求的 显著性水平为α =0.05,则假设形式为: •
H0 :μ =1.04
H1 :μ ≠1.04
假设检验的基本思想
抽样分布 这个值不像 我们应该得 到的样本均 值 ... ... 如果这是 总体的假设 均值 = 50 H0
... 因此我们 拒绝假设 = 50
20
医学统计5第五章 假设检验
二、双侧检验和单侧检验
在进行t 检验时,如果其目的在于检验两个总体均数 是否相等,即为双侧检验。例如检验某种新降压药与常 用降压药效力是否相同?就是说,新药效力可能比旧药 好,也可能比旧药差,或者力相同,都有可能。
如果我们已知新药效力不可能低于旧药效力,例如 磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用 磺胺药,这时,无效假设为H0, 备择假设为H1: 1>2 , 统计上称为单侧检验。
第五章 假设检验
一、假设检验的基本思想
例:已知一般中学男生的心率平均数为74次/分钟, 标准差为6次/分钟,为研究经常参加体育锻炼的中学 生心脏功能是否增强,在某地区随机抽取常年参加体 育锻炼的男生100名,求得心率平均数为65次/分钟。
如果一个事件发生的概率很小,那么在只进行一次试 验时这个事件是“不会发生的”,一旦发生了,称其 为小概率事件。统计类错误
设H0:=0,H1:>0, =0.05, 将拒绝了正确的无效假设 H0 称为I 类错误(type I error):也称为假阳性错误,当实际上真的为0,即H0: =0原本是正确的,但由于偶然因素的影响,随机抽样时, 得 到 一个较 大 的检验 统 计量 t 值 ,故 t t, 时 , 则 P0.05 时,按所取检验水准 只能拒绝H0,接受H1,结 论为>0, 由于拒绝了实际上是正确的H0,此推断结论当 然是错误的,即犯了I 型错误。I 型错误的概率是=0.05。
本例是均数的比较,是将常年参加体育锻炼心率平均 数为65次/分钟(它代表的总体有一总体均数)与一般中学 男生的心率平均数为74次/分钟。
研究者可能有两种目的: – ① 推断两个总体均数有无差别。不管是常年参加体育锻
炼心率高于一般,还是常年参加体育锻炼心率低于一般, 两种可能性都存在,研究者同等关心,应当用双侧检验。 – ② 根据专业知识,已知常年参加体育锻炼心率不会低于 一般,或是研究者只关心常年参加体育锻炼心率是否高 于一般,不关心常年参加体育锻炼心率是否低于一般, 应当用单侧检验。
第五章_假设检验
? 如果实际非法赌博的金额远低于 $200 , 即H 0并不正确,但你运气欠佳,得到的样 本估计的均值十分接近 200 ,则你应该推 翻H 0。但样本数据却不足以推翻错误的假 设,此时你犯了型 II 的错误
检验统计量的值
检验统计量的值
第3步
确定显著性水平,计算 临界值及拒绝域
第3步
计算P值
第4步 作比较,并给出假设检 第6步 判断P值的大小,并给
验的结论
出假设检验的结论
单个总体的假设检验
? 单个总体均值检验
? 例解
? 某电子元件批量生产的质量标准为平均使用寿 命1200小时。某厂宣称他们采用一种新工艺生 产的元件质量大大超过规定标准。为了进行验 证,随机抽取了100件作为样本,测得平均使用 寿命1245小时,标准差300小时。在显著性水平 为0.05时,能否说该厂生产的电子元件质量显 著地高于规定标准?
? P-value 是不仅止于告诉我们在某一显著水平下是 否拒绝H 0,如果我们知道P-value = .002 则我们 知道H 0不但在.05 的显著水平下会被拒绝,在 .005 的水平下也会被拒绝
– 如果仅知道P-value =.04 ,则是否拒绝H 0可以由读 者来决定,如果某一研究人员决得.01才算显著, 则H 0不会被拒绝,如果将显著水平置于.05 ,则拒 绝
统计量部分的面积
? 被称为观察到( the observed significant level ) 的显著性水平
? P-value 告诉我们:「如果零假设为真,我们观
察到目前数据显示的检验统计量的概率有多高?」 如果这个概率很小,则我们可以拒绝零假设,因 为如果假设为真,则仅有很小的概率抽取任意的 随机样本会得到目前的观察值
第五章-假设检验
H0: 1500 H1: 1500
1-29
第二十九页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,改进生产工艺后,会使 产品的废品率降低到2%以下。检验这 一结论是否成立
研究者总是想证明自己的研究结论(废品率 降低)是正确的
H0: 355 H1: 355
1-28
第二十八页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,采用新技术生产后,将 会使产品的使用寿命明显延长到1500小 时以上。检验这一结论是否成立
研究者总是想证明自己的研究结论(寿命延 长)是正确的
备择假设的方向为“>”(寿命延长)
假设其中真有99个白球,摸 出红球的概率只有 1/100 ,
这是小概率事件。
➢小概率事件在一次试验中竟然发生了,不能不 使人怀疑所作假设的正确性,因此可以认为这 个盒子应该不是装有99个白球的那个盒子。
这个例子中所使用的推理方法,称为“带概率性
质的反证法”,或“概率反证法”。
2022/8/9
1-11
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-26
第二十六页,编辑于星期五:十八点 三十四分。
双侧检验 (显著性水平与拒绝域)
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-27
第二十七页,编辑于星期五:十八点 三十四分。
单侧检验
第五章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 假设检验第一节 假设检验中的基本概念和基本原理一、统计假设的概念统计假设,指的是和抽样手段联系在一起,并且依靠抽样数据来进行验证的假设。
统计假设的内容都是数量化了的,而且验证的依据都是凭借抽样调查所取得的资料,在抽取样本资料时,必须保证抽样的随机性。
假设⎩⎨⎧H H 10备择假设原假设原假设,又称为零假设。
它一般是根据已有的资料,或经过周密考虑后确定的、具有稳定性的、受保护的经验和看法。
因此,若没有充分根据, H 0是不会被轻易否定的。
备择假设,又称为研究假设。
经过抽样调查,若有充分根据否定原假设H 0,自然就得接受其逻辑对立面。
原假设H 0的逻辑对立面即为备择假设。
以总体均值μ的假设检验为例,根据问题的不同,假设检验可能有三种: 1、双边检验 H 0:μμ0=H1:μμ0≠2、右侧单边检验 H 0:μμ0=H1:μ>μ03、左侧单边检验 H 0:μμ0=H1:μ<μ二、假设检验的基本原理——小概率原理小概率原理可归纳为两个方面:一是可以认为小概率事件在一次观察中是不可能出现的;二是如果在一次观察中出现了小概率事件,那么,合理的想法是否定原来认为该事件具有小概率的看法。
假设检验的基本思想:经过随机抽样获得一个来自总体的样本,然后根据样本计算某个(或某几个)统计量的数值。
若在原假设H 0成立的条件下,该统计量数值的出现几乎是不可能的,就拒绝或否定原假设H 0,并接受它的逻辑对立面——备择假设H 1。
反之,如果在原假设H 0成立的条件下,该统计量数值出现的可能性不是很小的话,就没有理由拒绝原假设H 0。
三、假设检验中的统计量1、在原假设H 0成立的情况下,统计量中不应包含有未知参数,其数值应该是确定的。
2、所选用的统计量的分布应该是已知的,是有表可查的。
例如,对于正态总体均值μ的检验H 0:μμ0=,应选择的统计量为: =Z nX σμ-(σ2已知) t =nS X μ-(σ2未知)四、显著性水平α显著性水平α是假设检验中所规定的小概率的数量界限。
也就是在原假设H 0成立的条件下,判断统计量数值的出现是否是小概率事件的标准。
常用的标准有:05.0,1.0==αα或01.0=α。
五、临界值、接受域和拒绝域选定一个检验统计量后,在原假设H 0成立的条件下,就可画出统计量的分布。
再根据给定的显著性水平α,就可确定临界值、接受域和拒绝域。
比如,对于正态总体均值μ的双边检验H 0:μμ0=,在总体方差σ2已知的情况下,我们选择=Z nX σμ-为统计量;根据原假设H 0:μμ0=,就可以画出如图5-1-1所示的Z 统计量的分布。
图5-1-1 Z 统计量的分布由于双边检验把拒绝原假设H 0的小概率事件定在了统计量分布的两侧,因此,两侧尾部面积总和所代表的概率即为显著性水平α。
又由于Z 统计量的分布是对称的,所以每侧的概率都是2α。
查标准正态分布表可得:2)(αα=>Z Z P ,2)(2αα=-<Z Z P即 )(22Z Z Z P αα<<-= α-1根据假设检验的小概率原理,如果统计量的值Z Z Z Z c c 22αα-<>或,就应拒绝原假设H;反之,若统计量的值Z Z Z c 2αα<<-,就应接受原假设H 0。
因此,该双边检验以Z Z 22αα和-为临界值,两者之间的区域为接受域,两边为拒绝域。
六、双边检验和单边检验 (一)双边检验双边检验的假设形式为:H 0:μμ0=←→H 1:μμ0≠双边检验的拒绝域被定在了统计量分布的两侧。
若给定的显著性水平为α,则每侧拒绝域的概率应各为2α。
假定所选统计量为Z 统计量,则临界值Z 2α和显著性水平α有如下的关系式:)(22Z Z Z P αα<<-=α-1也就是说,该双边检验的拒绝域为:Z Z Z Z 22αα-<>或,如图5-1-3所示。
图5-1-3 双边检验的接受域、拒绝域(二)单边检验 l.右侧单边检验右侧单边检验的假设形式为:H 0:μμ0=←→H 1:μμ0>右侧单边检验把拒绝域定在了统计量分布的右侧。
若给定的显著性水平为α,则统计量分布右尾的概率应为α。
假定所选统计量为Z 统计量,则临界值Z α和显著性水平α有如下的关系式:αα=>)(Z Z P也就是说,该右侧单边检验的拒绝域为:Z Z α>,如图5-1-4所示。
图5-1-4 右侧单边检验的接受域、拒绝域2.左侧单边检验左侧单边检验的假设形式为:H 0:μμ0=←→H 1:μμ0<左侧单边检验把拒绝域定在了统计量分布的左侧。
若给定的显著性水平为α,则统计量分布左尾的概率应为α。
假定所选统计量为Z 统计量,则临界值-Z α和显著性水平α有如下的关系式:αα=-<)(Z Z P也就是说,该左侧单边检验的拒绝域为:Z Z α-<,如图5-1-5所示。
图5-1-5 左侧单边检验的接受域、拒绝域第二节 假设检验的步骤和两类错误一、假设检验的步骤1、根据实际问题作出假设,包括原假设H 0和备择假设H 1两部分;2、根据样本构造合适的统计量,并在原假设H 0成立的条件下确定统计量的分布;3、根据有关要求给定显著性水平α,并根据统计量的分布求出拒绝域和临界值;4、根据样本统计量的观测值进行判断。
若样本统计量的值落入统计量分布的拒绝域,则拒绝原假设H 0,接受备择假设H 1;反之,则接受H 0。
二、假设检验的两类错误 1、弃真错误弃真错误,又称为第一类错误,指的是否定了未知的真实状态,把正确的原假设H 0当成了假的而加以拒绝的错误。
这是在拒绝原假设H 0时可能出现的错误。
犯弃真错误的概率就是显著性水平α。
2、纳伪错误纳伪错误,又称为第二类错误,指的是接受了未知的不真实状态,把错误的原假设H 0当成了真的而加以接受的错误。
这是在接受原假设H 0时可能出现的错误。
犯纳伪错误的概率β的大小是不确定的。
它的数值大小取决于真实的μ和原假设中的μ的偏离程度△μμμ0-=。
μ∆越小, 犯纳伪错误的概率β越大;反之,△μ越大,β的数值就越小。
(β——下图中阴影部分的面积)在样本容量n 一定的情况下, 不可能同时减小犯两类错误的概率βα和。
要想同时减小犯两类错误的概率,就只能增加样本容量n 。
第三节 单总体假设检验一、大样本假设检验(一)大样本总体均值μ的假设检验在大样本情况下,总体均值μ的假设检验的统计量为:σμμσXX nX Z 0-=-=1、双边检验H 0:μμ0=H1:μμ0≠( 拒绝域为:Z Z Z Z 2αα-<>或 )2、右侧单边检验H 0:μμ0=H1:μ>μ( 拒绝域为:Z Z α> )3、左侧单边检验H 0:μμ0=H1:μ<μ( 拒绝域为:Z Z α-< )图5-3-1 大样本总体均值μ的假设检验例、某部门统计报表显示,该部门职工的人均月收入为1500元。
为检查统计报表的正确性,在该部门职工中抽查了60人,抽查结果为:元,1520=X 36=S 元,问该部门统计报表中的人均月收入是否正确(05.0=α)?解:本问题是在=α0.05下检验假设:H 0:1500=μ←→H 1:1500≠μ。
由于是大样本,所以应选用=Z ns X μ-作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。
查标准正态分布表可得Z Z 025.02=α=1.96。
因此,该双边检验的拒绝域为:96.196.1-<>Z Z 或。
根据抽样结果有,6036150015200-=-=nX Z σμ=4.303>1.96所以,拒绝原假设H 0,认为该部门的报表中的人均月收入不正确。
由假设检验的原理及方法可知,假设检验与区间估计其实是同一个问题的两种不同的表述方法,假设检验的接受域也正是区间估计的置信区间。
(二)大样本总体成数P 的假设检验大样本总体成数p 的假设检验的统计量为:nP Z P P P )1(ˆ0--=1、双边检验H:PP 0=H 1:PP 0≠( 拒绝域为:Z ZZ Z 22αα-<>或 )2、右侧单边检验H 0:P P 0=H1:PP 0>( 拒绝域为:Z Z α> )3、左侧单边检验H 0:P P 0=H1:PP 0<( 拒绝域为:Z Z α-< )图5-3-2 大样本总体成数P 的假设检验例、某县近年的高考升学率都保持在30%左右,为提高升学率,该县各校进行了一系列的教学改革。
为检查改革的成效,在该县今年的应届毕业生中抽查了100人,结果有38人考上大学。
请问该县各校的一系列教学改革是否取得成效(05.0=α)?解:本问题是在=α0.05下检验假设:H:%30=P ←→H 1:%30>P由于是大样本,所以应选用σPP PnpqP P Z ˆˆˆ-=-=作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。
查标准正态分布表可得Z Z 05.0=α=1.645。
因此,该右侧单边检验的拒绝域为:645.1>Z 。
根据有关数据,得 nP Z P P P )1(ˆ0--==100%70%30%30%38⨯-=1.746>1.645所以,拒绝原假设H 0,认为该县的教学改革取得了成效。
二、小样本假设检验在小样本情况下,检验统计量的分布与总体分布有关。
(一)单正态总体),(2σμN 的均值检验 1、σ2已知总体均值μ的假设检验的统计量为: σμμσXX nX Z 0-=-=(1)双边检验H 0:μμ0=H1:μμ0≠( 拒绝域为:Z Z Z Z 22αα-<>或 )(2)右侧单边检验H 0:μμ0=H1:μ>μ( 拒绝域为:Z Z α> )(3)左侧单边检验H 0:μμ0=H1:μ<μ( 拒绝域为:Z Z α-< )图5-3-3 单正态总体均值μ的假设检验(σ2已知)例、某厂生产的某种螺栓的直径(单位:mm )服从正态分布),20(2.12N ,设备维修后,从新生产的产品中随机抽查20个,测得X =21mm 。
若方差没有发生变化,问设备维修后,螺栓的直径有没有显著变化(05.0=α)?解:本问题是在=α0.05下检验假设:H:20=μ←→H 1:20≠μ由于是正态总体及小样本,且σ2已知,所以应选用=Z nX σμ-作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。
查标准正态分布表可得Z Z 025.02=α=1.96。
因此,该双边检验的拒绝域为:96.196.1-<>Z Z 或。
根据抽样数据,可得 202.120210-=-=nX Z σμ=3.727>1.96 所以,拒绝原假设H 0,认为设备维修后螺栓的直径发生了变化。