第5章 假设检验
计量经济学第5章假设检验
假设检验中的小概率原理
假设检验中的小概率原理
什么小概率? 1. 在一次试验中,一个几乎不可能发生的事
件发生的概率 2. 在一次试验中小概率事件一旦发生,我们
就有理由拒绝原假设 3. 小概率由研究者事先确定
5-17
假设检验中的小概率原理
由以往的资料可知,某地新生儿的平均体重为3190克,从今年的新生儿中随机 抽取100个,测得其平均体重为3210克,问今年新生儿的平均体重是否为 3190克(即与以往的体重是否有显著差异)?
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
5-56
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数分类中点击“统计”,在函数名的菜单下选
与原假设对立的假设 表示为 H1
5-12
确定适当的检验统计量
什么检验统计量?
1.用于假设检验决策的统计量 2.选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为 Z X 0 n
5-13
规定显著性水平(significant level)
(P-value)
1. 是一个概率值
2. 如果原假设为真,P-值是抽样分布中大
于或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检
验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检
验统计量部分的面积
3. 被称为观察到的(或实测的)显著性水平
5-44
双侧检验的P 值
第5章 假设检验
计量经济学讲义
22
读者或许发现:前面讨论的置信系数( 1- a) 就是1减去“犯第一类错误的概率a”,因此, 95%的置信系数表示接受零假设犯第一类 错误的概率至多为5%。 简言之, 5%的置信水平与95%的置信系数 的意义相同。
2011-2-22
计量经济学讲义
23
2011-2-22
计量经济学讲义
0 0
2011-2-22
计量经济学讲义
21
假设检验的标准或古典方法是:给定某一 水平的a,比如0 . 0 1或0 . 0 5,然后使检 验的功效最大,也即使b最小。这个求解过 程很复杂,有兴趣的同学可以参阅有关参 考书。 需要指出的是:在实际中,古典方法仅仅 给出了a值,而没有过多考虑b值。
2011-2-22
24
2011-2-22
计量经济学讲义
25
显著性检验
2011-2-22
计量经济学讲义
26
显著性检验
显著性检验(test of significance approach) 是一种两者择一的假设检验,但它却是完 备的。 显著性检验是一种较为简洁的假设检验方 法。 我们仍通过P/E一例说明这种检验方法的一 些基本要点。
2011-2-22 计量经济学讲义 36
显著水平的选择与p值
2011-2-22
计量经济学讲义
37
显著水平的选择与p值
假设检验的古典方法的不足之处在于选择a 的任意性。虽然一般常用的a值有1%、5% 和1 0%,但是这些值并不是固定不变的。 前面指出,只有在检查犯第一类错误和第 二类错误后果的时候,才选择相应的a 。 在实践中,最好是用p值(即,概率值),p 值(p value)也称为统计量的精确置信水平。 它可定义为拒绝零假设的最低置信水平。
第五章-假设检验与回归分析
件,得到拒绝域;
步骤 4:明确或计算样本均值 x ,得到U 变量的观测值 u x 0 n 0
若观测值 u 落入拒绝域,则拒绝零假设 H 0 ,即接受备择假设 H1 ,
否则不能拒绝零假设 H 0 。
第五章 假设检验与回归分析 例1、 已知某面粉自动装袋机包装面粉,每袋面粉重量 Xkg
服从正态分布 N(25,0.02) ,长期实践表明方差 2 比较稳定,从
第五章 假设检验与回归分析
U 检验的步骤:
步骤 1:提出零假设 H 0 : 0 与备择假设 H1 ;
步骤 2:明确所给正态总体标准差 0 值、样本容量 n 的
值,当零假设 H 0 成立时,构造变量
U X 0 n ~ N(0,1) 0
第五章 假设检验与回归分析
步骤 3:由所给检验水平 的值查标准正态分布表求出对应 的双侧分位数 u 的值或上侧分位数 u 的值,构造小概率事
u
2
0.05, u 1.96 ,
2
第五章 假设检验与回归分析
x 0 n
12.5 12 1 100
5 u
2
1.96
故拒绝 H0 ,即认为产品平均质量有显著变化。
小结与提问:
理解假设检验的基本原理、概念;掌握假设检验的步骤。
课外作业:
P249 习题五 5.01, 5.02,5.03。
0.10,再在表中第一列找到自由度 m n 1 7 1 6 ,
其纵横交叉处的数值即为对应的 t 分布双侧分位数 t 1.943
2
,使得概率等式
PT 1.943 0.10
成立。这说明事件 T 1.943是一个小概率事件,于是得到
拒绝域
t 1.943
第五章 假设检验与回归分析
第5章 假设检验
两类错误与显著性水平
两类错误
假设检验的依据是:小概率事件在一次试验中
很难发生. 但“很难发生”不等于“不发生”, 因而 假 假设检验是由局部推断总体,并且 设检验所作出的结论有可能是错误的. 这种错误
是在给定检验水平的前提下进行 有两类: (1)推断,接受还是拒绝原假设完全取 当原假设H0为真, 观察值却落入拒绝域, 而 决于样本值, 因此所作检验可能导 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 致两类错误的产生
小 结
•构造一个统计量来决定是“接受原假设,拒绝备选假 设”,还是“拒绝原假设,接受备选假设”。
•对不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计量的抽样分布以及由实际 问题中所确定的显著性水平,来进一步确定检验统计 量拒绝原假设的取值范围,即拒绝域:
– 在给定的显著性水平α下,检验统计量的可能取值范围被 分成两部分:小概率区域与大概率区域。小概率区域就是 概率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区域。
检验统计量与拒绝域
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对 检验统计量实际上是总体参数的点估计量, 原假设和备择假设作出决策的某个样本统 由于其随机性,需要进行标准化后,才能用 计量 作检验的标准,以反映点估计量与假设的总体
参数相比,相差多少个标准差 2. 对样本估计量的标准化结果 – 原假设H0为真
–
H0 :μ = 某一数值
指定为符号 ≤, =或≥ – 例如, H0 :μ =10cm
–
备择假设
(alternative hypothesis)
统计学导论 科学出版社 第五章 假设检验
右侧检验
或
H1 : µ > µ0
H1 : µ > µ0
确定适当的检验统计量
什么检验统计量? 什么检验统计量?
用于假设检验问题的统计量 选择统计量的方法与参数估计相同, 选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为
z= x − µ0
σ
n
选择显著性水平α,确定临界值
☺
☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
均值 ☺ ☺ X = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
µ = 50 H0
样本均值
假设检验应用举例
例1:抽样检验食品包装机工作是否正常 : 例2:由样本推断产品次品率是否超标 : 例3:研究黑人儿童是否有民族意识 : 例4:检验电池寿命波动性是否有显著变化 : 5: 例5:判断男女职工看电视时间是否有显著差异 例6:检验新工艺是否比旧工艺更好 : 例7:研究生活习惯是否影响血压 : 例8:检验两次地震间的天数是否服从指数分布 : 例9:比较两公司进货次品率,作出进货决策 :比较两公司进货次品率,
3、特点 、
采用逻辑上的反证法 依据统计上的小概率原理
第一节 假设检验的基本原理
一. 假设检验的一般思想 二. 假设检验的步骤 三. 假设检验的两类错误
假设检验的过程
(提出假设→抽取样本→作出决策) 提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 拒绝假设 别无选择. 别无选择
总体
(05)第5章 假设检验1
临界值: t0.05(35)=1.6896
拒绝H0
0.05
检验统计量:
t x 0 5275 5200 3.75
s / n 120 36
t0.05 (35) 1.6896
决策:拒绝H0 结论: 改良后的新品种产量有显著 提高
6 - 33 0 1.6896 z
6-7
统计学
STATISTICS
一个假设检验的例子
P112—【例3.33】
一个汽车电池制造商声称其最好的电池寿命的分布 为均值54个月,标准差为6个月。假设某一消费 组织决定购买50个这种电池作为样本检验电池的 寿命,以核实这一声明。
(1)假设这个制造商之所言是真实的,试描 述这50个电池样本的平均寿命的抽样分布。
STATISTICS
5.1 假设检验的基本原理
一、假设的陈述 二、显著性水平 三、统计量与拒绝域 四、利用P值进行决策
统计学
STATISTICS
5.1.1 假设的陈述
现实生活中,人们经常要对某个“假设”作出判断, 确定它是真的还是假的。在研究领域,研究者在 检验一种新的理论时,首先要提出一种自己认为 是正确的看法,即假设。
1 (1.53) 1 0.9370 0.0630
说明在显著性水平为0.05下不能判定汽车电池的 平均寿命不到54个月。但在显著性水平为0.1下可 以判定汽车电池的平均寿命不到54个月。
6 - 12
统计学
STATISTICS
原假设与备择假设
统计学
STATISTICS
原假设
(null hypothesis)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
《统计学》第5章 假设检验
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
第五章 假设检验(1)
关于平均数差异的显著性检验
一、两个总体都是正态分布,两个总体方差都已知。 (一)两个样本相互独立:(独立样本的Z检验) (二)两个相关样本:(相关样本的Z检验) 二、两个总体都是正态分布,两总体方差都未知。 (一)两个样本相互独立: 1.两个总体方差一致(独立样本的t检验) 2.两个总体方差不等,(柯克兰--柯克斯检验) (二)两个相关样本: 1.相关系数未知(相关样本的t检验) 2.相关系数已知(相关样本的t检验)
总体平均数的假设检验例题2
某心理学家认为一般司机的视反应时平均175毫 秒,有人随机抽取36名汽车司机作为研究样本进 行了测定,结果平均值为180毫秒,标准差25毫秒. 能否根据测试结果否定该心理学家的结论.(假定 人的视反应时符合正态分布)
X
总体平均数的假设检验例题3
某省进行数学竞赛,结果分数的分布不是正态, 总平均分43.5.其中某县参加竞赛的学生 168人,平均分45.1,标准差18.7,该县平均分 与全省平均分有否显著差异?
课堂练习4
医学上测定,正常人的血色素应该是每100毫升13克, 某学校进行抽查,37名学生血色素平均值为12.1克/ 毫升,标准差是1.5克/毫升,试问该校学生的血色素 是否显著低于正常值 ?
课堂练习5
12名被试作为实验组,经过训练后测量深度知觉,结 果误差的平均值为4厘米,标准差为2厘米;另外12名 被试作为控制组不加任何训练,测量结果,误差的平 均值为6.5厘米,标准差为2.5厘米,问训练是否明显 减小了深度知觉的误差?
例
某数学教育家随机抽取49名高一学生进行 ****教学法的教学改革实验研究。已知这些 学生原来所在的总体数学的平均水平为80分, 标准差为10分。经过一学期的教学改革实验 之后,这49名学生在统考中的数学平均成绩 为83分。问:教学改革是否改变了学生的数 学水平。
第五章 假设检验
样本统计量
统计学
STATISTICS
显著性水平和拒绝域
(右侧检验 )
置信水平 拒绝H 拒绝H0
抽样分布
α
1-α
0
6 - 32
样本统计量 临界值
统计学
STATISTICS
决策规则
1. 给定显著性水平α,查表得出相应的临界 值zα或zα/2, tα或tα/2 2. 将检验统计量的值与α 水平的临界值进行 比较 3. 作出决策 双侧检验: 统计量I 临界值,拒绝H 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验: 临界值,拒绝H 左侧检验:统计量 < -临界值,拒绝H0 右侧检验: 临界值,拒绝H 右侧检验:统计量 > 临界值,拒绝H0
6 - 23
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
α/2
α/2
临界值
6 - 24
0
临界值
样本统计量
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
H0:µ = 某一数值 指定为 = 号,即 ≤ 或 ≥ 例如, 3190( 例如, H0:µ = 3190(克)
6-9
统计学
STATISTICS
什么是备择假设 什么是备择假设
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设 研究者想收集证据予以支持的假设 2. 也称“研究假设” 也称“研究假设” 3. 总是有符号 ≠, < 或 > 4. 表示为 H1 H1 : µ <某一数值,或µ >某一数值 某一数值, 例如, 例如, H1 : µ < 10cm,或µ >10cm 10cm, 10cm
第5章_假设检验
面向21世纪 课程教材
第五章
假设检验
第二节
某研究者估计本市居民家庭电脑拥有率为30%。现随机调查了200个家庭,其 中68家拥有电脑。试问研究估计是否可信?( =10%) 提出假设:原假设:Ho:P=0.3; 备择假设:Ha:p≠0.3
样本比例 P=m/n=68/200=0.34 由于样本容量相当大,因此可近似采用Z检验法 p p0 0.34 0.3 z 1.194 p (1 p ) 0.34 0.66 n 200
面向21世纪 课程教材
第五章
假设检验
第二节
2.方差检验过程 (1)提出原假设Ho和备择假设Ha。
2 H0 : 2 0
2 Ha : 2 0
(2)构造检验统计量:
(n 1) s 2
2
~
2
(n-1)
2 2分布。 在Ho成立的条件下,统计量 服从自由度为n-1的
(3)确定显著性水平。 (4)规定决策规则。 在双侧检验的情况下,拒绝区域在两侧,如果检验统计量大于右侧临界 值,或小于左侧临界值,则拒绝原假设。若是单侧检验,拒绝区域分布 在一侧,具体左侧还是右侧,可根据备择假设Ha的情况而定。 (5)进行判断决策。
面向21世纪 课程教材
第五章
假设检验
第二节
某厂采用自动包装机分装产品,假定每包重量报从正态分 布,每包标准重量为1000克,某日随机抽查9包,测得样本 平均重量为986克,标准差为24克,试问在0.05的检验水平 上,能否认为这天自动包装机工作正常?
;H 根据题意,提出假设: H0 : 1000 1: 1000
面向21世纪 课程教材
第二节 总体均值、比例和 方差的假设检验
第五章 假设检验
• 设“| X -μ0 |≥K”为小概率事件,若给定α (α为很小的正数),K可由下式确定,令 • P{| X -μ0 | ≥ K }=α α为显著性水平 X 0 • T ~ t (n 1) t为检验统计量
s/ n
K X 0 于是, P{ X 0 K } P s/ n s/ n
K P{ X 0 K } P{ } s/ n s/ n P{T t (n 1)}
X 0
1- α
α
t α(n-1) 接受域 拒绝域
即t ≥t (n-1)时,拒绝H0,认为μ>μ0
类似地,检验-H0:μ≥μ0, H1:μ<μ0
P{T t (n 1)}
检验 小概率事件 发 生
提出原假设和备择假设
什么是原假设?(null hypothesis) 1. 待检验的假设,又称“0假设” 2. 研究者想收集证据予以反对的假设,或稳定、保守、 受到保护的经验看法 3. 总是有等号 , 或 4. 表示为 H0
– – –
H0: 某一数值 指定为 = 号,即 或 例如, H0: 250(克)
1、利用P 值进行决策
(1)单侧检验:若p值> ,不拒绝H0;若p值< , 拒绝H0。 (2)双侧检验:若p值> /2, 不拒绝H0;若p值< /2, 拒绝H0。 (在计算机软件中,通常只比较P同 的关系)
2、P 值检验法的优点
(1)结论对任何统计量均适用,不需要改变。 (2)在改变显著性水平时,无须重新计算p值。( 临界值法需要重新 计算临界值。)
抽样分布
拒绝域
置信水平
1- 接受域
第五章 对单个和两个总体平均数的假设检验
2
df1
2
df 2
1
df1 df2
2
df1 df2
(n1 1)S12 (n2 1)S2 2 n1 n2 2 n1 n2 2
(x1 x1 )2 (x1 x1 )2
(n1 1) (n2 1)
SS1 SS2 df1 df2
魏泽辉讲义
3
一、方差已知时μ 的假设检验
例 :某猪场称该场的猪在体重为100kg时的平均背膘厚度 为9±0.32 mm2。问如何检验该场的说法是否真确?(已
知该场猪的背膘厚服从正态分布)
• 由该场随机抽取了10头猪,测得它们在体重为100kg时的 平均背膘厚为8.7mm。
• 1)提出假设
H0 : 0,
魏泽辉讲义
5
3)确定否定域并作统计推断
若取 =5%,则 1 P(u0.05 z u0.05 ) 0.0
否定域 接受域 否定域
2.5% 95%
2.5%
-1.96
1.96
z = -3.1623 < -1.96 (落入)
接受备择假设
结论:该场猪的平均背膘厚与9mm差异显著6
5.1.2 t检验:总体方差未知
H 0:1 2 即犊牛和成年母牛之间血液中血糖含量无差异; H A:1 2 即犊牛和成年母牛之间血液中血糖含量有差异。
(2)计算检验统计量
12
2 2
=
15.642 12.072=3.3054
( X1X2 )
n1 n2
31
48
Z X1 X 2 =81.23-70.43=3.27
x1 x2 (1 1) (2 2 ) (1 2 ) (1 2 )
医学统计学课后案例分析答案:第5章 假设检验
第5章 假设检验案例辨析及参考答案案例5-1 为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的t 检验,随机抽取25名患者服用了新药,以常规药的疗效均值为0μ,进行t 检验,无效假设是0μμ=,对立假设是0μμ≠,检验水平α=1%。
结果t 值很大,拒绝了无效假设。
“拒绝了无效假设”意味着什么?下面的说法你认为对吗?(1)你绝对否定了总体均数相等的无效假设。
(2)你得到了无效假设为真的概率是1%。
(3)你绝对证明了总体均数不等的备择假设。
(4)你能够推论备择假设为真的概率是99%。
(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。
(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。
提示:就类似的问题,Haller 和Kruss (2002)在德国的6个心理系问了30位统计学老师、44位统计学学生和39位心理学家。
结果所有的统计学学生、35位心理学家和24位统计学老师认为其中至少有一条是正确的;10位统计学老师、13位心理学家和26位统计学学生认为第4题是正确的。
(见Statistical Science, 2005, 20(3):223-230.) 案例辨析 6个选择均不正确。
(1)可能犯Ⅰ类错误。
(2)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率。
(3)可能犯Ⅰ类错误。
(4)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率,而不是推论备择假设为真的概率是99%。
(5)在无效假设成立的条件下,就该例拒绝无效假设犯错误的概率是P 。
(6)在无效假设成立的条件下,还可能犯错误,并不是完全“可靠”的发现;1-α=99%是指无效假设成立的条件下不犯错误的概率是99%。
正确做法“拒绝了无效假设”意味着在无效假设成立的条件下,推断犯错误的概率为P。
案例5-2 某工厂生产的某医疗器械的合格率多年来一直是80.0%。
第5章 假设检验
总体比率的假设检验
在大样本情况下,样本比率近似服从正态分 布,即: (1 ) p ~ N(, ) n 将其标准化:
p Z= ~ N (0,1) (1 ) n
可用Z检验法对总体比率进行假设检验。
25
若采用双侧检验,即H0: = 0, H1: ≠ , 0 则临界值为-Z a/2和Z a/2, 当|Z |> Z a /2时,位于拒 拒绝区域,拒绝原假设;当|Z |≤ Z a /2时,位于接 受区域,接受原假设 0 若采用左侧检验,即H0: ≥ , H1: < ,则 0 临界值为-Z a, 当Z <-Z a 时,位于拒绝区域,拒 绝原假设;当Z ≥ -Z a 时,位于接受区域,接受原 假设 若采用右侧检验,即H0: ≤ , H1: > ,则 0 0 临界值为Z a, 当Z >Z a 时,位于拒绝区域,拒 绝原假设;当Z ≤ Z a 时,位于接受区域,接受原 假设
5
生产技术改革前,某种零件的平均长度为4cm, 即0=4cm,技术改革后,从全部生产的零件中随 机抽取100个,测得零件的平均长度为3.5cm。 判断:技术改革后零件的平均长度是否发生了显 著性的变化。在这个题目中,原假设和备择假设 该如何选取? 从样本可看出,研究者想证明的结论是零件的平 均长度发生了显著性的变化,因此备择假设确定 为: H1: ≠4cm,随之可确定原假设为: H0: =4cm,即所提的原假设和备择假设为: H0: =4cm, H1: ≠4cm
6
生产技术改革前,某种零件的平均长度为4cm, 即0=4cm,技术改革后,从全部生产的零件中随 机抽取100个,测得零件的平均长度为3.5cm。 判断:技术改革后零件的平均长度是否比以前偏 短。在这个题目中,原假设和备择假设该如何选 取? 从样本可看出,研究者想证明的结论是零件的平 均长度偏短,因此备择假设确定为: H1: < 4cm,随之可确定原假设为: H0: ≥4cm,即 所提的原假设和备择假设为: H0: ≥4cm , H1: <4cm
第-五-章--假设检验.
H1 0
双侧检验与单侧检验
(假设的形式)
假设 原假设
单侧检验 双侧检验
左侧检验 右侧检验
H0 : = 0 H0 : 0 H0 : 0
备择假设 H1 : ≠0 H1 : < 0 H1 : > 0
2、选择适当的统计量,并确定 其分布形式
1.Z
x 0
n
3.t
x 0
s
n
2.Z
x s
地加以拒绝的风险为0.05。
已知:0 125,0 150, n10030,x 120,0 0.05
?
证明: 45
H0 1200(0)
解 :H 0: 12 ,H 5 1:0 125
由 0 .0知 5 Z 1 1 .645
而 Zx 0 1125 00 1025 03.33 1.645
1、二者互为消长。
PZZ H0为真 PZZ H1为真
2、在检验中,对和 的选 择取决于犯两类错误所要付出的
代价。通常的做法是先确定。
3、若要同时减少和,或
给定α而使β减少,就必须增大样 本容量n。
4、 β的大小不仅与临界值有关, 而且还与原假设的参数值 0 与总体参
数的真实值 之间的差异大小有关。
已知: 0 500,n 50 30 x 510,s 8, 5%
?
求: 500
解 :H 0:5,0 H 10 :500
由 0.0知 5Z1.645
而Z x 0 510500
s
8
n
50
8.751.645 接受 H1,拒绝 H0
即在现有的显著性水平下,
可以认为装得太满.
三、正态总体、方差未知、 小样本
已知 :X~N100,?0,0 1000
医学统计5第五章 假设检验
二、双侧检验和单侧检验
在进行t 检验时,如果其目的在于检验两个总体均数 是否相等,即为双侧检验。例如检验某种新降压药与常 用降压药效力是否相同?就是说,新药效力可能比旧药 好,也可能比旧药差,或者力相同,都有可能。
如果我们已知新药效力不可能低于旧药效力,例如 磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用 磺胺药,这时,无效假设为H0, 备择假设为H1: 1>2 , 统计上称为单侧检验。
第五章 假设检验
一、假设检验的基本思想
例:已知一般中学男生的心率平均数为74次/分钟, 标准差为6次/分钟,为研究经常参加体育锻炼的中学 生心脏功能是否增强,在某地区随机抽取常年参加体 育锻炼的男生100名,求得心率平均数为65次/分钟。
如果一个事件发生的概率很小,那么在只进行一次试 验时这个事件是“不会发生的”,一旦发生了,称其 为小概率事件。统计类错误
设H0:=0,H1:>0, =0.05, 将拒绝了正确的无效假设 H0 称为I 类错误(type I error):也称为假阳性错误,当实际上真的为0,即H0: =0原本是正确的,但由于偶然因素的影响,随机抽样时, 得 到 一个较 大 的检验 统 计量 t 值 ,故 t t, 时 , 则 P0.05 时,按所取检验水准 只能拒绝H0,接受H1,结 论为>0, 由于拒绝了实际上是正确的H0,此推断结论当 然是错误的,即犯了I 型错误。I 型错误的概率是=0.05。
本例是均数的比较,是将常年参加体育锻炼心率平均 数为65次/分钟(它代表的总体有一总体均数)与一般中学 男生的心率平均数为74次/分钟。
研究者可能有两种目的: – ① 推断两个总体均数有无差别。不管是常年参加体育锻
炼心率高于一般,还是常年参加体育锻炼心率低于一般, 两种可能性都存在,研究者同等关心,应当用双侧检验。 – ② 根据专业知识,已知常年参加体育锻炼心率不会低于 一般,或是研究者只关心常年参加体育锻炼心率是否高 于一般,不关心常年参加体育锻炼心率是否低于一般, 应当用单侧检验。
第五章-假设检验
H0: 1500 H1: 1500
1-29
第二十九页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,改进生产工艺后,会使 产品的废品率降低到2%以下。检验这 一结论是否成立
研究者总是想证明自己的研究结论(废品率 降低)是正确的
H0: 355 H1: 355
1-28
第二十八页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,采用新技术生产后,将 会使产品的使用寿命明显延长到1500小 时以上。检验这一结论是否成立
研究者总是想证明自己的研究结论(寿命延 长)是正确的
备择假设的方向为“>”(寿命延长)
假设其中真有99个白球,摸 出红球的概率只有 1/100 ,
这是小概率事件。
➢小概率事件在一次试验中竟然发生了,不能不 使人怀疑所作假设的正确性,因此可以认为这 个盒子应该不是装有99个白球的那个盒子。
这个例子中所使用的推理方法,称为“带概率性
质的反证法”,或“概率反证法”。
2022/8/9
1-11
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-26
第二十六页,编辑于星期五:十八点 三十四分。
双侧检验 (显著性水平与拒绝域)
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-27
第二十七页,编辑于星期五:十八点 三十四分。
单侧检验
第五章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验
第五章 假设检验
第五章假设检验一、填空题:1. 就是事先对总体参数作出一个假设,然后利用样本信息判断该假设是否合理。
2.原假设和备择假设的关系是。
3.假设检验最常用的有三种情况:双侧检验、和。
4. 当总体方差已知,正态总体时,样本均值服从正态分布,选择的统计量为统计量。
5. 左侧检验的拒绝区域位于统计量分布的,右侧检验的拒绝区域位于统计量分布的。
6.假设检验中的两类错误是和。
二、单项选择题:1. 在假设检验中,原假设H0,备择假设H1,则称()为犯第一类错误A、H0为真,接受H0B、H0为真,拒绝H0C、H0不真,接受H1D、H0不真,拒绝H02. 按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。
若要检验该机实际运行状况是否符合设计标准,应该采用()。
A、左侧检验B、右侧检验C、双侧检验D、左侧检验或右侧检验3. 当样本统计量的观察值未落入原假设的拒绝域时,表示()。
A、可以放心地接受原假设B、没有充足的理由否定与原假设C、没有充足的理由否定备择假设D、备择假设是错误的4.进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会()。
A、都减少B、都增大C、都不变D、一个增大一个减小三、多项选择题:1. 关于原假设的建立,下列叙述中正确的有()。
A、若不希望否定某一命题,就将此命题作为原假设B、尽量使后果严重的错误成为第二类错误C、质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D、若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设E、可以随时根据检验结果改换原假设,以期达到决策者希望的结论2. 在假设检验中,α与β的关系是()。
A、α和β绝对不可能同时减少B、只能控制α,不能控制βC、在其它条件不变的情况下,增大α,必然会减少βD、在其它条件不变的情况下,增大α,必然会增大βE、增大样本容量可以同时减少α和β四、计算题:1.某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章、假设检验
思考题
1.1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则.
答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。
建立两个假设的原则有:
(1)原假设和备择假设是一个完备事件组。
(2)一般先确定备择假设。
再确定原假设。
(3)等号“=”总是放在原假设上。
(4)假设的确定带有一定的主观色彩。
(5)假设检验的目的主要是收集证据来拒绝原假设。
2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?
答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α。
第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β。
在其他条件不变时,α增大,β减小;β增大,α减小。
3.什么是显著性水平?它对于假设检验决策的意义是什么?
答:假设检验中犯第一类错误的概率被称为显著性水平。
显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。
4.什么是p值?p值检验和统计量检验有什么不同?
答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。
P值常常作为观察到的数据与原假设不一致程度的度量。
统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,p
值可以有效地补充α提供地关于检验可靠性的有限信息。
p值检验的优点在于,
它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。
5.什么是统计上的显著性?
答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。
显著性的意义在于“非偶然的
练习题
3.解(1)第一类错误是,供应商提供的炸土豆片的平均重量不低于60克,但店方拒收并投诉。
(2)第二类错误是,供应商提供的炸土豆片的平均重量低于60克,但店方没有拒收。
(3)顾客会认为第二类错误很严重,而供应商会将第一类错误看得较严重。
4.解:提出假设 02:6,:6H H μμ≤>
已知 1.19,100,0.05n σα===
(1)
检验统计量为()60,1a x Z N σ
-= (2) 拒绝规则是:若Z z α>,拒绝0H ;否则,不拒绝0H
(3) 由 6.35x =
得:0.056.356 2.94 1.64Z z -==>=,拒绝0H ,认为改进工艺能提高其平均强度。
5解: 设μ为如今每个家庭每天收看电视的平均时间(小时)
需检验的假设为:01: 6.70,: 6.70H H μμ≤ 调查的样本为:200,7.25, 2.5n x s ===
大样本下检验统计量为:0.55*14.14 3.112.5x z ==== 在0.01的显著性水平下,右侧检验的临界值为0.01 2.33z =
因为 2.33z >,拒绝0H ,可认为如今每个家庭每天收看电视的平均时间增加了
6. 解:提出假设 2222201:0.75,:0.75TV VCR TV H H σσσ≤=>
已知:230,2,0.05n s α===
检验统计量()()2220.0522129*21032942.5570.75
VCR n s χχσ-===>= 拒绝0H ,可判定电视使用寿命的方差显著大于VCR
7. 解:提出假设:012112:5,:5H H μμμμ-=-≠
120.02,100,50n n α===,独立大样本,则检验统计量为:
514.810.45 5.1458x x z ----===- 而0.01z =2.33 因为/2z z α>,拒绝0H ,平均装配时间之差不等于5分钟
8. 解:匹配小样本 提出假设:01:,:a b a b H H μμμμ≤> 由计算得:0.625, 1.302,8,0.05d d s n α===
=,检验统计量为
()0.051.35777 1.8946d t t ===<=,不拒绝0H ,不能认为广告提高了潜在购买力的平均得分。
9. 解:提出假设:012112:,:H H ππππ≥<
已知:1122197301288,0.684,367,0.82,0.1288367
n p n p α======= 大样本,则检验统计量为: 112212288*0.684367*0.820.76288367
p n p n p n n ++===++
4.0476z =
==- 而0.1 1.29z =,因为0.1z z <-,拒绝0H ,可认为信息追求者消极度假的比率显著小于非信息追求者。
10. 解:提出假设:2222012112
:,:H H σσσσ=≠ 由题计算得:112225,0.221,22,0.077n s n s ====
检验统计量为:22
12220.2218.23760.077
s F s ===,而()0.02524,21 2.37F = ()/2121,1F F n n α>--,所以拒绝0H ,认为两种机器的方差存在显著差异。