第四章_假设检验
4假设检验练习题
第四章 假设检验练习题一、单项选择题1、假设检验主要对()进行检验。
A 、总体参数B 、样本参数C 、统计量D 、样本分布2、参数估计是依据样本信息推断未知的()。
A 、总体参数B 、样本参数C 、统计量D 、样本分布3、小概率事件,是指在一次事件中几乎不可能发生的事件。
一般称之为“显著性水平”,用α表示。
显著性水平一般取值为()。
A 、5%B 、20%C 、30%D 、50%4、假设检验的依据是()。
A 、小概率原理B 、中心极限定理C 、方差分析原理D 、总体分布5、大样本情况下,当总体方差已知时,总体均值检验的统计量为()。
A 、xB 、x C、p -D 、x 6、大样本情况下,当总体方差未知时,总体均值检验的统计量为()。
A、 B、 C、p -D 、 7、小样本情况下,当总体服从正态分布,总体方差已知时,总体均值检验的统计量为()。
A 、xB 、xC 、p - D、x 8、小样本情况下,当总体服从正态分布,总体方差未知时,总体均值检验的统计量为()。
A、x B、xC 、p -D 、x 9、一种机床加工的零件尺寸绝对平均误差允许值为1.35mm 。
生产厂家现采用一种新的机床进行加工以期进一步降低误差。
为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某于生产的零件中随机抽取50个进行检验,得到50个零件尺寸的绝对误差数据,其平均差为1.2152,标准差为0.6365749。
利用这些样本数据,在α=0.05水平下,要检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低,提出的假设应为()。
A 、H 0:μ=1.35 H 1: μ≠1.35B 、H 0:μ≤1.35 H 1: μ>1.35C 、H 0:μ≤1.35 H 1: μ>1.35D 、H 0:μ≠1.35 H 1: μ=1.3510、在大样本时,总体比例检验统计量用z 统计量,其基本形式为()。
A、xB 、x C、p -D 、x 二、多项选择题1、小概率事件,是指在一次事件中几乎不可能发生的事件。
第四章 假设检验(1)
§4.1
关于总体未知分布或对已知分布总体中未知 参数的假设称为统计假设,简称假设;
对样本进行考察,从而决定假设是否成立的 方法称为假设检验,简称检验;
例1:罐装可乐的标准容量是250毫升
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 通常的办法是每隔一段时间进行抽样检查.
例2(医疗领域)为了检验某种新疗法是否比传统 疗法更有效,对40名患者进行实验。把病人分 成两组,每组20人,第一组采用新疗法,第二 组采用传统疗法。从治疗结果表中,我们能否 认为新疗法比传统疗法更有效?即第一组的康 复人数比第二组多的原因是因为新疗法效果更 好,还是由随机因素引起的?
疗法 新疗法 传统疗法 康复 12 9 未康复 8 11
假设检验中的两类错误 小概率事件不管多小都可能发生,再加上 样本的随机性,它们可能会影响检验结果。 实际情况
决定
拒绝H0 接受H0 以真为假(弃真) 以假为真(取伪)
H0为真 第一类错误 正确
H0不真 正确 第二类错误
P(拒绝H 0 | H 0为真) P(接受H 0 | H 0为假)
2 2 0 2 2 0
2.检验统计量
2
(n 1) S
2
2 0
~ (n 1)
2
2 3. P{12 / 2 (n 1) 2 / 2 ( n 1)} 1
得拒绝域是 (0,
2 1 / 2
(n 1)) ( / 2 (n 1), )
期望已知,关于方差的假设检验
双侧检验:
1.提出假设: H 0 : , H 1 :
2 2 0 2
第四章_两个总体的假设检验
net
1
net
2
两个总体比率之差的检验
(例题分析)
H0 :1- 2 0 H1 :1- 2 < 0 = 0.05 n1=200 , n2=200
临界值(c):
拒绝域
检验统计量:
z
0.27 0.35
1 1 0.31 (1 0.31) 200 200 1.72976
两个总体均值之差的估计 (例题分析)
【例】为检验两种方法组装产品所需时间的差异,分别对两种 不同的组装方法各随机安排 12 个工人,每个工人组装一件产 品所需的时间(分钟)下如表。假定两种方法组装产品的时间服 从正态分布,但方差未知且不相等。取显著性水平0.05,能否 认为方法1组装产品的平均数量明显地高于方法2?
2 ( d d ) i i 1 n
d
di
i 1
n
nd
sd
nd 1
匹配样本
(数据形式)
观察序号 样本1 样本2 差值
1 2 M i M n
x11 x12 M x1i M x 1n
x21 x22 M x 2i M x 2n
d1 = x11 - x21 d2 = x12 - x22 M d i = x 1i - x 2i M dn = x1n- x2n
拒绝域
P值决策
z z / 2
z z
z z
P 拒绝H0
两个总体比率之差的检验
(例题分析)
【例】一所大学准备采取一项学生 在宿舍上网收费的措施,为了解男 女学生对这一措施的看法是否存在 差异,分别抽取了 200 名男学生和 200名女学生进行调查,其中的一个 问题是:“你是否赞成采取上网收 费的措施?”其中男学生表示赞成 的比率为 27% ,女学生表示赞成的 比率为 35% 。调查者认为,男学生 中表示赞成的比率显著低于女学生 。取显著性水平 =0.01 ,样本提供 的证据是否支持调查者的看法?
第4章 假设检验(田间试验与统计分析 四川农业大学)
2 2
2
s2 1
s2 2
Hale Waihona Puke s2 es2 e
df1
s2 1
df1
df
2
s
2 2
df2
s2 e
5 2.412 4 3.997 54
3.1164
1.提出假设
H0 :1=2; HA :1≠2 。
2、计算t值
t x1 x2 s x1 x2
s x1 x2
第二节 单个样本平均数的假设检验
在实际研究工作中,常常要检验某样本
所属总体平均数与已知的总体平均数 0 是 否有差异。已知的总体平均数 0 一般为一些
公认的理论数值、经验数值或期望数值。
若σ2已知
u x 0 x
x
n
u检验
s2 若σ2未知
t x 0
sx
sx
s n
x2 1 ( x)2
x x 30.3667(g) s
n
n
2.5328 (g)
n 1
sx
s 0.8443 (g) n
t x 0 30.3667 27.5 3.395
sx
0.8443
df=n-1=9-1=8
t0.05(8) =2.306 t0.01(8) =3.355 | t |=3.395 > t0.01(8)
第四章 假设检验
第一节 假设检验的基本原理 第二节 单个样本平均数的假设检验 第三节 两个样本平均数的假设检验 第四节 百分率资料的假设检验 第五节 参数的区间估计
假设检验(test of hypothesis)又叫显著性 检验 (test of significance),是统计学中的一 个重要内容 。假设检验的方法很多 ,常用的
第四章_假设检验似然比-p值
参数空间为
可以求得
可以求得似然比检验统计量为
1 ( x) exp(nX (1) ) exp (2nX (1) ) 2
它等价与统计量
似然比检验的优点:
1. 它的构造形式与具体的模型无关. 并且
可以证明许多常用的检验就等价于或几
乎等价于似然比检验.
r )) E ( HR (
2. 检验统计量有统一的渐近分布.
2 ln ( x) ~
2 r
7
• 证明:
例
设 x1 , x2 ,, x是来自正态总体 n
2
N ( , 2 )
的简单样本,其中 , 是未知参数。 求检验
H 0: 0,
的似然比检验.
简单计算可知(见教材例3.4.2)
H1: 0
n/2
其中
因此,似然比检验统计量与传统的t统计量的平 方成反比 于是,两个检验统计量的拒绝与有如下关系
f ( x, ) e ( x ) , x , R
试求假设
解: 样本分布为
n 2 f ( x, ) exp ( x i ) I{ x(1) } i 1
一个故事
二、似然比检验
} 考虑检验问题 设统计模型为 { P , , H 0: 0, H1: 1
其中 0 1。定义似然比(Likelihood Ratio)为
( x)
sup{ p ( x, )}
1
0
sup{ p ( x, )}
,
1
解:样本分布为
n 2
n( x 0 ) 2 L( x ) 1 2 ( n 1) S
概率论和数理统计 假设检验
2、在H0成立的前提下,构造一个适当的检验统计量V,
3、按给定的显著性水平,在原假设为真的条件下, 求出临界值点,从而求出拒绝域。 结合备择假设
4、根据样本的观察值算出V的值,确定是否拒绝H0。
临界值点
注:
前两步乃解决问题的关键点!
拒绝域
-k
0
k
五、检验的分类
14
1、按检验对象分类:参数检验,非参数检验。 2、按拒绝域形成分类:
总体方差2已知时,
18 ① H0 := 0 ② H0 := 0 ③ H0 : = 0
检验统计量 U
X
0
~ N ( 0 ,1 )
—U检验法
n
H1 : ≠ 0 H1 : >0
U z
2
U z U z
X S n
0
拒绝域
H1 : <0
17
=0.05下检验假设:
H0: 0 =40; H1: >0=40 哪一个成立? 用单侧分位点 (2)取统计量: U X 0 X 40
则U~N(0,1)。
0
n
2
25
(3)由P{ U>Z0.05 } = 0.05 查表Z0.05=1.65, (4)而U 的数值: u =(40.75-40)/(2/5)=1.865>1.65
由 x 1582 ; s 129 ; t 0 . 44
得 t 0 . 44 t 0 . 025 9 2 . 262
统计量的观测值未落入拒绝域中,从而接受H0 . 即在显著性水平0.05下,可认为灯泡的平均寿命为 =1600。
问题:区间估计与假设检验有何关系?
第4章假设检验习题解答
.
25.设总体 X ~ N ( µ , σ ), 其中µ , σ 都未知 . X 1 , X 2 ,L , X n 为来自该总体的一个样 本.记 X =
1 n 1 n Xi, S2 = ( X i − X ) 2 .则检验假设 H 0 : µ ≤ 2 ∑ ∑ n i =1 n − 1 i =1
H 1 : µ > 2 所使
接受H 0
.
验结论为接受 H 0 ,则在显著性水平为 0.01 下检验结论一定为
24. X ~ N ( µ , 225) ,样本 ( X 1 , X 2 , L X n ) 来自正态总体 X , X 与 S 2 分别是样本均 值与样本方差,要检验 H 0 : µ = µ0 , 采用的统计量是
2 2
X − µ0 15 / n
2. 假设检验中的显著性水平 α 用来控制( A A.犯“弃真”错误的概率. C.不犯“弃真”错误的概率. 3.假设检验中一般情况下( C A. 只犯第一类错误. C. 两类错误都可能犯.
B.犯“纳伪”错误的概率. D.不犯“纳伪”错误的概率. ) .
B. 只犯第二类错误. D. 两类错误都不犯.
4. 假设检验时,当样本容量一定,若缩小犯第一类错误的概率,则犯第二类错误的概 率( B ) . A. 变小. B. 变大. C. 不变. D. 不确定.
检验 P -值: P-value = P ( Z > 1.5 ) = 0.0668 > 0.01 接受 H 0 ,认为这批钢索质量没有显著提高. ,技术革新后,抽出 6 个零件, 35.由经验知某零件质量 X ~ N (15, 0.05 ) (单位:g) 测得质量为: 14.7, 15.1, 14.8, 15.0, 15.2, 14.6. 已知方差不变, 问平均质量是否仍为 15g? 试求问题的 P-值,若取显著性水平 α = 0.05 ,有何结论. 解: H 0 : µ = 15
《统计学(第二版)》电子课件 第4章 假设检验
显著性检验本身对原假设起保护作用,水平越小, 检验犯第一类错误的概率就越小,换言之,越有 可能不拒绝原假设。
2021/8/7
《统计学》第4章假设检验
4-29
4.1.5 双侧检验和单侧检验
常见的三种显著性假设检验形式: (1)双侧检验 H0 : 0 H1 : 0 (2)右侧检验 H0 : 0 H1 : 0 (3)左侧检验 H0 : 0 H1 : 0
从该批产品中随机抽取了100件,发现其中有4件 次品,即样本次品率为4%,A公司认为样本次品 率4%大于1%,所以不接受B公司的这批产品,B 公司则认为虽然样本次品率为4%,但并不能说明 10万件产品的次品率大于1%,因为样本量很小;
2021/8/7
《统计学》第4章假设检验
4-3
问题
(1)A公司是否应该接受该批产品? (2)如果随机抽取了100件产品有3件次品,
H0:pp01%
2021/8/7
《统计学》第4章假设检验
4-12
记X为100件产品中次品的数目,直观上看, X越大,原假设越值得怀疑,反之, X越小, 对原假设越有利;问题是, X大到多少应 该拒绝原假设?
两种处理方法:
2021/8/7
《统计学》第4章假设检验
4-13
1. 假定H0成立,计算事件X≥4的概率
4-32
4.2 一个正态总体的检验
4.2.1 总体均值μ的检验: Z检验 考虑如下三种检验问题
H0:0 H1:0 H0:0 H1:0 H0:0 H1:0
(4.4) (4.5) (4.6)
2021/8/7
《统计学》第4章假设检验
4-33
第四章统计假设检验与参数估计.ppt
验等。尽管这些检验方法的用途及使用条件 不同,但其检验的基本原理是相同的。
参数估计有点估计(point
estimation)和区 间 估计(interval
estimation)。 2020-11-9
感谢你的观看
2
上一张 下一张 主 页 退 出
1 统计假设检验概述
了黑球,那么,自然会使人对H0的正确性产生 怀疑,从而否定H0。也就是说箱中不止1个黑 球。
2020-11-9
感谢你的观看
4
以上这几种问题的判断均是由样本去推断
总体的,属于统计假设检验问题,均是来判断 数据差异、分布差异是由处理引起,还是由于 随机误差引起的。
样本虽然来自于总体,但样本平均数并非 是总体平均数。由于抽样误差的影响(随机误 差的存在),样本平均数与总体平均数之间往 往有偏差。因此,仅由表面效应 x 0 是不能 判断它们之间是否有显著差异。其根本原因在 于 试 验 误差(或抽样误差)的不可避免性。
例3:小麦良种的千粒重x~N(33.5,1.62),现 由外地引进一高产品种,在8个小区种植,得千粒 重(g):35.6,37.6,33.4,35.1,32.7,36.8
,35.9,34.6,平均数为 x=35.2,试问新引进
的品种千粒重与当地品种有无显著差异?如果有
显著差异,是否显著高于当地品种?
曲种好于原曲种?
食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的?
2020-11-9
感谢你的观看
3
上一张 下一张 主 页 退 出
例2:A,B两种肥料,在相同条件下各施用于5 个小区的水稻上,水稻产量平均分别为
xA=500 kg,xB=520 kg ,二者相差20kg,那么 20kg差异究竟是由于两种肥料的不同而造成的 还是由试验的随机误差造成的?
第4章参数估计和假设检验
第4章参数估计和假设检验第四章参数估计与假设检验掌握参数估计和假设检验的基本思想是正确理解和应⽤其他统计推断⽅法的基础,后⾯将要学习的⽅差分析、⾮参数检验、回归分析、时间序列等统计推断⽅法都是在此基础上展开的。
需要特别指出的是,所有的统计推断都要以随机样本为基础。
如果样本是⾮随机的,统计推断⽅法就不适⽤了。
由于相关知识在先修课程中已经学习过,本章主要在回顾相关知识的基础上,补充讲解必要样本容量的计算、p值、参数估计和假设检验⽅法的软件操作和结果分析等内容。
本章的主要内容包括:(1)参数估计的基本思想和软件实现。
(2)简单随机抽样情况下样本容量的计算。
(3)假设检验的基本原理。
(4)假设检验中的p值。
(5)⼏种常⽤假设检验的软件实现。
第⼀节参数估计⼀、参数估计的基本概念参数估计是指利⽤样本信息对总体数字特征作出的估计。
例如,我们可以通过估计⼀部分产品的合格率对整批产品的合格率作出估计,通过调查⼀个样本的⼈⼝数来对全国的⼈⼝数作出估计,等等。
参数估计可以分为点估计和区间估计。
点估计是指根据样本数据给出的总体未知参数的⼀个估计值。
对总体参数进⾏估计的⽅法可以有多种,例如矩估计法、极⼤似然估计法等,得到的估计量(样本统计量)并不是唯⼀的。
例如我们可以使⽤样本均值对总体均值作出估计,也可以使⽤样本中位数对总体均值进⾏估计。
因此,在参数估计中我们需要对估计量的好坏作出评价,这就涉及到估计量的评价准则问题。
常⽤的估计量评价准则包括⽆偏性、有效性、⼀致性等。
⽆偏性是指估计量的数学期望与总体参数的真实值相等;有效性的含义是,在两个⽆偏估计量中⽅差较⼩的估计量较为有效,⽅差越⼩越有效;⼀致性是指随着样本容量的增⼤,估计量的取值应该越来越接近总体参数。
样本的随机性决定了估计结果的随机性。
由于每⼀个点估计值都来⾃于⼀个随机样本,所以总体参数真值刚好等于⼀个具体估计值的可能性极⼩。
区间估计的⽅法则以概率论为基础,在点估计的基础上给出了⼀个置信区间,并给出了这⼀区间包含总体真值的概率,⽐点估计提供了更多的信息。
统计学 第4章 假设检验
【解】研究者想收集证据予以支持的假设是该 城市中家庭拥有汽车的比率超过30%。 因此,建立的原假设和备择假设为 H0 :μ≤30% H1 :μ>30%
结论与建议
◆原假设和备择假设是一个完备事件组, 而且相互对立。在一项假设检验中,原假设和 备择假设必有一个成立,而且只有一个成立; ◆先确定备择假设,再确定原假设。因为 备择假设大多是人们关心并想予以支持和证实 的,一般比较清楚和容易确定; ◆等号“=”总是放在原假设上; ◆因研究目的不同,对同一问题可能提出 不同的假设,也可能得出不同的结论。 ◆假设检验主要是搜集证据来推翻和拒绝 原假设。
◆理想地,只有增加样本容量,能同时减小 犯两类错误的概率,但增加样本容量又受到很多 因素的限制; ◆通常,只能在两类错误的发生概率之间进 行平衡,发生哪一类错误的后果更为严重,就首 要控制哪类错误发生的概率; ◆在假设检验中,一般先控制第Ⅰ类错误的 发生概率。因为犯第Ⅰ类错误的概率是可以由研 究者控制的。
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择!
总体
我认为人口的平 均年龄是50岁
抽取随机样本
均值 x = 20
二、原假设与备择假设
什么是假设?
对总体参数的具体数
值所作的陈述
我认为这种新药的疗效 比原有的药物更有效!
总体参数包括总体均值、 总体比率、总体方差等 分析之前必须陈述
备择假设。
500g
【解】研究者抽检的意图是倾向于证实这种洗 涤剂的平均净含量并不符合说明书中的陈述。 因此,建立的原假设和备择假设为 H0:μ≥500 H1:μ< 500
提出假设例3
一家研究机构估计,某城市中家庭拥有 汽车的比率超过 30% 。为验证这一估计是否 正确,该研究机构随机抽取了一个样本进行 检验。试陈述用于检验的原假设与备择假设
第四章假设检验
x 0 s n
z z / 2
z z
z z
P值决策
P 拒绝H0
总体方差的检验
(检验方法的总结)
假设 假设形式 统计量
2 2 2 (n 1)
双侧检验
左侧检验
右侧检验
H0 : 2= 02 H0 : 2 02 H0 : 2 02 H1 : 2 02 H1 : 2< 02 H1 : 2> 02
第四章 参数检验
学习目标:
1、明确SPss提供了哪几种参数检验的方法 2、掌握Spss单样本t检验 3、掌握Spss两独立样本的t检验,理解t检 验和F检验的不同
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误) 原假设为真时拒绝原假设 第Ⅰ类错误的概率记为 被称为显著性水平 2. 第Ⅱ类错误(取伪错误) 原假设为假时未拒绝原假设 第 Ⅱ 类 错 误 的 概 率 记 为 (Beta)
习题2
某电脑公司2005年前4个月每天的销售量数据: 台)
234 143 187 161 159 198 160 152 187 141 214 149 155 167 168 211 172 194 173 196 183 225 178 234 182 177 184 185 177 189 209 189 163 196 176 196 158 203 188 206
《2012年中秋节国庆节假日旅游统 计报告》游客人均花费支出495元。 学生的考试成绩服从正态分布.现在 从某次《概率论与数理统计》课程 的考试中随机抽取36位学生的考试 试卷,计算得到平均成绩为65分, 标准差为15分.问在显著性水平 α=0.05下,是否可以认为这次考试 全体考生的平均成绩为70分?
spss学习第4章-假设检验
(1)假设检验含义
利用统计方法检验一个事先所作出的假设的真伪, 这一假设称为统计假设,对这一假设所作出的检验就 是假设检验
(2)假设检验基本思路
ⅰ. 对总体参数作出某种假设,并假定它是成立的。 ⅱ.根据样本得到的信息(统计量),考虑接受这个 假设后是否会导致不合理的结果,如果合理就接受这个 假设,不合理就拒绝这个假设。 所谓合理性,就是看是否在一次的观察中出现了小 概率事件。
[Ⅰ.提出原假设] [Ⅱ.选择检验统计量]
[Ⅲ.计算检验统计量的观测值和概率P-值]
[Ⅳ.给定显著性水平α,并作出决策]
举例2
利用住房状况问卷调查数据,推断家庭人均住房面积的平均 值是否为20平方米。 [Ⅰ.提出原假设]
[Ⅱ.选择检验统计量]
[Ⅲ.计算检验统计量的观测值和概率P-值]
SPSS软件计算结果
课堂体验 调查内容1:学生视力
抽取22名学生调查他们的视力,假设全校学生的视
力服从于正态分布,是否可以认为学生的视力均值 为0.8?(取显著性水平α=0.05)
调查内容2:每月消费支出(分男、女)
抽取22名学生调查他们的每月消费支出,假设全校学生的消费 支出服从正态分布,比较不同性别同学的消费支出平均值和方 差?是否可以认为该校学生的消费支出均值为 500元 (取显著性水平α=0.05) 男、女同学的月消费支出是否存在显著差异?
[Ⅲ.计算检验统计量的观测值和概率P-值] [Ⅳ.给定显著性水平α,并作出决策]
第二问
[Ⅰ.提出原假设] [Ⅱ.选择检验统计量]
[Ⅲ.计算检验统计量的观测值和概率P-值]
[Ⅳ.给定显著性水平α,并作出决策]
课堂习题
知识点:一个总体参数比例检验 检验量:Z检验
第4章 参数估计与假设检验
2 2Leabharlann y 14.36, n2 2000, 2 1.16
, 2 (2 )
2 1
2
2 2 2 未知但 1 2
(2) 2 未知
S S 或 X t S f=n-1 , X t 2 X t 2 2 n n n
X ~ t (n 1) 选取样本函数 t S n P t t P t t 1 2 2 X P t 1 2 S n 得 的置信度为 1 的置信区间为
23.67,62.27
此题因为是大样本,故用两种方法计算结果相同, 而公式**较简便。如果是小样本,只能按小样本的 公式*计算。若按大样本公式计算,结果误差偏大。
(2 ) , 2 未知且
2 1 2
2 1
2
2
若为小样本,取样本函数 t
2 1 2
X Y 1 2
n
2
n
2
n
0 5 1.960 u 0.0 1 2.576 u0.1 1.645 u0.2 2
例2 伤寒论用桂枝39张处方,桂枝用量服从σ=3g的正 态分布,根据样本均数8.14g,显著水平0.05,估计桂枝用 量μ的置信区间 解:μ 的置信度0.95的置信区间为
3 8.14 1.96 =(7.1984,9.0816)g 39
2 x (1 ) 已知 2 e X u ~ N 0,1 2 / n
2
第四章 假设检验
大,就越容易将试验的真实差异错判为试验误差。
显著性检验的两类错误归纳如下:
表4-1 显著性检验的两类错误
客观实际
H0 成立 H0 不成立
检验结果
否定 H0 Ⅰ型错误( )
接受 H0 推断正确(1- )
推断正确(1- ) Ⅱ型错误( )
与0 有差异而因为试验误差大被掩盖了。
为了降低犯两类错误的概率,一般从选取适当的显
著水平 和增加试验重复次数 n 来考虑。因为选取数 值小的显著水平 值可以降低犯Ⅰ类型错误的概率,
但与此同时也增大了犯Ⅱ型错误的概率,所以显著水
平 值的选用要同时考虑到犯两类错误的概率的大小。
对于田间试验,由于试验条件不容易控制
y1 510
y2 500
我们能否根据 y1 y2 10 就判定这两
个水稻品种平均产量不同?结论是,不一定。
因为两个水稻品种平均产量 y1 、y2 都 是从试验种植的10个小区获得,仅是两个品种
有关总体平均数 1, 2 的估计值。由于存在
试验误差 ,样本平均数并不等于总体平均数 , 样本平均数包含总体平均数与试验误差二部分, 即
∣u∣≥2.526的两尾概率,所以称为 u 检验.
三、显著水平与两种类型的错误
(一)显著水平
用来否定或接受无效假设的概率标准叫显著水
平,记作 。 在生物学研究中常取 =0.05,称为 5% 显著水平; 或 =0.01,称为1% 显著水平或极显著水平。
对于上述例子 u的检验来说,若∣u∣<1.96 ,
则说明试验的表面差异属于试验误差的概率p>0.05,
即表面差异属于试验误差的可能性大,不能否
第四章假设检验
• 在n重贝努利试验中,事件A可能发生0,1,2,…,n次, 则事件A 恰好发生k(0≤k≤n)次的概率Pn(k):
k Pn ( k ) = Cn p k q n − k
k=0,1,2…,n
二项分布的定义: 设随机变量x所有可能取的值为零和正整数:0,1,2,…,n, 且有
k Pn (k ) = Cn p k q n − k
k=0,1,2…,n
其中p>0,q>0,p+q=1,则称随机变量x服从参数为n和p的 二项分布,记为 x~B(n,p)。 , 在n较大,np、nq较接近时,二项分布接近于正态分布; 当n→∞时,二项分布的极限分布是正态分布。
二项分布的平均数、标准差: 当试验结果以事件A发生次数k表示时 μ=np σ=
小概率事件实际不可能原理 随机变量的概率分布——正态分布、二项分布 样本平均数的抽样分布 t分布 假设检验的基本原理和步骤
小概率事件实际不可能原理 • 概率的统计定义 • 在相同条件下进行n次重复试验,如果随机事件A发生的次 数为m,那么m/n称为随机事件A的频率; • 当试验重复数n逐渐增大时,随机事件A的频率越来越稳定 地接近某一数值p,那么就把p称为随机事件A的概率。 • 这样定义的概率称为统计概率,或者称后验概率。可以记 为P(A)=p。
由样本平均数 x 构成的总体称为样本平均数的抽样总体, 其平均数和标准差分别记为 µ x 和 σ x 。
σ x 是样本平均数抽样总体的标准差,简称标准误, ,
它表示平均数抽样误差的大小。 统计学上已证明
µx = µ
σ
x
=
σ
n
两个定理: 1、若随机变量x服从正态分布N(µ,σ2), x1 , x2 ,L, xn 是由x总体得来的随机样本,则统计量 也是正态分布, 且有
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则拒绝原假设(H0伪) 则接受原假设(H0真)
给出结论
假设检验统计量拒绝域推断结论
35
例1 我国健康成年男子的脉搏平均为72次/分,
标准差为6.4次/分,现从某体院男生中,随机抽 出25人,测得平均脉搏为68.6次/分.根据经验脉
搏X服从正态分布.如果标准差不变,试问该体院
男生的脉搏与一般健康成年男子的脉搏有无差
若以X表示折断力,那么这个例子的问题就 化为:如何根据抽样的结果来判断等式: “EX=570”是否成立。
上述例子的共同特点是:先对总体的
参数或总体的分布函数的形式作某种假设
H0,然后由抽样结果对假设H0是否成立进
行推断。 在数理统计学中,称检验假设
H0的方法为假设检验。
通常把需要检验是否为真的假设H0称为 原假设或者零假设。如例1中的假设H0: p4%,例2中的假设H0:EX=570,等等。
11
若原假设正确, 则
3.6 X ~ N (68 , ) 36 偏离较远 因而 E ( X ) 68 ,即 X 偏离68不应该太远, 是小概率事件, 由于
X 68 ~ N (0,1) 3.6 6
2
故
X 68 3.6 6
取较大值是小概率事件
12
规定 为小概率事件的概率大小,通常取 = 0.05, 0.01,… 因此, 可以确定一个常数 c ,
X 68 P c 3.6 6
使得
例如,
c z1 z10.025 1.96
2
13
取 = 0.05 ,
则
由
X 68 3.6 6
1.96
X 69.18 或 X 66.824
称 X 的取值区间 ( 66.824 , 69.18 ) 为检验的接受域 (实际上没理由拒绝),而区间 ( ,66.824 ) 与 ( 69.18 , + ) 为检验的拒绝域 则接受原假设 H0: = 68 现 x 68.5 落入接受域,
25
注 2º
右侧检验:
原假设 H0 : = 68;
备择假设 H1 : > 68 当原假设H0 : = 0 = 68 为真时, X 0 取较大值的概率较小 当备择假设H1: > 68 为真时, X 0 取较大值的概率较大 给定显著性水平 , 根据 可确定拒绝域
X 0 P z1 n
有罪
错误
正确
错误和 错误的关系
和 的关系就像 翘翘板,小 就 大, 大 就小
你不能同时减 少两类错误!
21
希望所用的检验方法尽量少犯错误,但不
能完全排除犯错误的可能性. 在样本的容量
给定的情形下, 不可能使两者都很小,降低一
个, 往往使另一个增大. 假设检验的指导思想是: 控制犯第一类 错误的概率不超过 ,然后, 若有必要,通过 增大样本容量的方法,减少 .
H1: >0(备选假设).
第二步 构建检验统计量
X 0 U ~ N 0,1) / n
第三步
确定拒绝域
x 0 第四步 由样本提供的信息计算出 u / n 的值,并对H0的正确性进行推断.
若 若
P{U z1 } u ( z1 , )
u z1 则接受原假设(H0真)
非参数检验
10
引
例
某厂生产的螺钉,按标准强度为68克/mm2, 而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 = 68, 则产品合格,否则认为不合格.为 此提出如下假设:
H0 : = 68
称为原假设或零假设
原假设的对立面: H1 : 68 称为备择假设 现从该厂生产的螺钉中抽取容量为 36 的样本, 其样本均值为 x 68 .5,问原假设是否正确?
样本统计量
30
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平 拒绝H0
1-
0
临界值
样本统计量
31
注 3º 关于零假设与备择假设的选取
H0与H1地位应平等,但在控制犯第一类错误 的概率 的原则下,使得采取拒绝H0 的决 策变得较慎重,即H0 得到特别的保护.
因而,通常把有把握的、有经验的结论作为 原假设,或者尽可能使后果严重的错误成为 第一类错误.
异?并求出体院男生脉搏的置信区间. 0.05)
解:此例是在已知=6.4的情况下, 第一步 检验假设 H0:=72,
第二步
统计量 U
x 0
/ n
~ N (0,1)
36
第三步 确定拒绝域
对于=0.05,查标准正态分布表得
z
1 2
z
0.975
1.96
拒绝域: |u|>1.96
... 如果这是总 体的假设均值 20
= 50 H0
样本均值
8
假设检验的过程
提出假设
总体
我认为人口的平 均年龄是50岁
作出决策 拒绝假设
别无选择!
抽取随机样本
均值 x = 20
9
假设检验的内容
参数检验 总体均值、均值差的检验 总体方差、方差比的检验 分布拟合检验 符号Байду номын сангаас验等
检验假设的依据是“小概率事件在一次 试验中实际上是不可能发生”原理(概率论中
称它为实际推断原理).
它是指 这样一个信念:概率很小的事件
在一次实际试验中是不可能发生的。如果发
生了,人们宁愿认为该事件的前提条件起了 变化。
7
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ...
... 因此我们拒 绝假设 = 50
给出结论
u z1
则拒绝原假设(H0伪)
第五步
类似可以由左边检验。相应的拒绝域形式为
P{U z1 } u (, z1 )
例2 已知某零件的质量X~N(,2),由经验
知=10g, 2=0.05.技术改新后,抽取8个样 品,测得质量(单位:g)为 9.8,9.5,10.1,9.6,10.2,10.1,9.8,10.0, 若方差不变,问平均质量是否比10为小? (取=0.05)
x
n
z
1
2
6.4 68.6 1.96 71.1 25
所以,该体院男生脉搏的95%的置信区间为 [66.1 , 71.1]。
38
(2)(右边检验)H0:=0;H1: >0,
此时样本信息显示 x > 0
H0 原假设;
H1 备选假设
第一步 提出假设 H0: =0(原假设);
第一类错误 (弃真)
正确
犯第一类错误的概率通常记为
犯第二类错误的概率通常记为
19
假设检验中的两类错误 (决策结果)
假设检验就好像
统计检验过程
H0: 无罪
一场审判过程
陪审团审判 裁决
实际情况
H0 检验
无罪
正确
有罪
错误
决策
未拒绝H0 拒绝H0
实际情况
H0为真
H0为假
无罪
正确决策 第Ⅱ类错 误( ) (1 – ) 第Ⅰ类错 正确决策 误( ) (1- )
x ( 0 z1
n
, )
26
因而, 接受域
x ( , 0 z1
称这种检验为右侧检验.
左侧检验 原假设
n
)
H0: = 0 = 68
备择假设 H1: < 68
) 类似可确定拒绝域 x (, 0 z n 因而, 接受域 x (0 z , + ) n
22
本引例中
犯第一类错误的概率 =P(拒绝H0|H0为真) P ( X 66.824 X 69.18)
0.05
若H0为真, 则
3.6 X ~ N (68 , ) 36
2
所以,拒绝 H0 的概率为 , 又称为显著性 水平, 越大,犯第一类错误的概率越大, 即越显著.
23
0.12 0.1 0.08 0.06
/2
0.04 0.02 60 62.5 65 67.5 70 72.5 75
/2
H0 真
0.12 0.1 0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
24
注 1º 一般,作假设检验时,先控制犯第一类
14
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平
拒绝H0
1-
/2
/2
临界值
0 样本统计量
临界值
15
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
16
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
错误的概率 , 在保证 的条件下使 尽量地小.要降低 一般要增大样本容量. 本课程仅考虑控制 . 备择假设可以是单侧的,也可以是双 侧的.引例中的备择假设是双侧的.如果根 据以往的生产情况, 0 = 68.现采用了新 工艺,关心的是新工艺能否提高螺钉强度, 越大越好.此时, 可作如下的假设检验:
U X 0 ~ N 0,1)
34
/ n
第三步
确定拒绝域
2 2 2