第四章-假设检验.PPT
合集下载
第四章 假设检验(1)
第四章 假设检验
§4.1
关于总体未知分布或对已知分布总体中未知 参数的假设称为统计假设,简称假设;
对样本进行考察,从而决定假设是否成立的 方法称为假设检验,简称检验;
例1:罐装可乐的标准容量是250毫升
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 通常的办法是每隔一段时间进行抽样检查.
例2(医疗领域)为了检验某种新疗法是否比传统 疗法更有效,对40名患者进行实验。把病人分 成两组,每组20人,第一组采用新疗法,第二 组采用传统疗法。从治疗结果表中,我们能否 认为新疗法比传统疗法更有效?即第一组的康 复人数比第二组多的原因是因为新疗法效果更 好,还是由随机因素引起的?
疗法 新疗法 传统疗法 康复 12 9 未康复 8 11
假设检验中的两类错误 小概率事件不管多小都可能发生,再加上 样本的随机性,它们可能会影响检验结果。 实际情况
决定
拒绝H0 接受H0 以真为假(弃真) 以假为真(取伪)
H0为真 第一类错误 正确
H0不真 正确 第二类错误
P(拒绝H 0 | H 0为真) P(接受H 0 | H 0为假)
2 2 0 2 2 0
2.检验统计量
2
(n 1) S
2
2 0
~ (n 1)
2
2 3. P{12 / 2 (n 1) 2 / 2 ( n 1)} 1
得拒绝域是 (0,
2 1 / 2
(n 1)) ( / 2 (n 1), )
期望已知,关于方差的假设检验
双侧检验:
1.提出假设: H 0 : , H 1 :
2 2 0 2
§4.1
关于总体未知分布或对已知分布总体中未知 参数的假设称为统计假设,简称假设;
对样本进行考察,从而决定假设是否成立的 方法称为假设检验,简称检验;
例1:罐装可乐的标准容量是250毫升
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 通常的办法是每隔一段时间进行抽样检查.
例2(医疗领域)为了检验某种新疗法是否比传统 疗法更有效,对40名患者进行实验。把病人分 成两组,每组20人,第一组采用新疗法,第二 组采用传统疗法。从治疗结果表中,我们能否 认为新疗法比传统疗法更有效?即第一组的康 复人数比第二组多的原因是因为新疗法效果更 好,还是由随机因素引起的?
疗法 新疗法 传统疗法 康复 12 9 未康复 8 11
假设检验中的两类错误 小概率事件不管多小都可能发生,再加上 样本的随机性,它们可能会影响检验结果。 实际情况
决定
拒绝H0 接受H0 以真为假(弃真) 以假为真(取伪)
H0为真 第一类错误 正确
H0不真 正确 第二类错误
P(拒绝H 0 | H 0为真) P(接受H 0 | H 0为假)
2 2 0 2 2 0
2.检验统计量
2
(n 1) S
2
2 0
~ (n 1)
2
2 3. P{12 / 2 (n 1) 2 / 2 ( n 1)} 1
得拒绝域是 (0,
2 1 / 2
(n 1)) ( / 2 (n 1), )
期望已知,关于方差的假设检验
双侧检验:
1.提出假设: H 0 : , H 1 :
2 2 0 2
《假设检验的概念》PPT课件
假设检验实例及解读
• 生物统计学实例:比较两个药物治疗组的患者生存率是否存在显著差异。 • 社会调查实例:通过问卷调查数据,研究两个群体之间的收入差异是否显著。
总结与回顾
假设检验是一种重要的统计方法,帮助我们进行数据分析和科学决策。通过清晰的步骤和方法,我们可以对总体参 数进行有效推断。
3 方差分析
4 非参数检验
用于比较多个样本均值之间是否存在显著差异。
当数据不满足正态分布假设时,使用的一类假设 检验方法。
注意事项
1 假设检验的局限性
假设检验是概率性推断,结果并不能绝对确定总体参数,仅供参考。
2 防范与排除偏差
在实际研究中,要注意样本选择的随机性和可比性,以排除偏差对推断结果的影响。
p值判定
4
参数估计和假设检验。
根据计算出的统计量,计算p值,并与显著性
水平比较,判断是否拒绝原假设。
5
结论推断
根据p值的判定结果,得出对总体参数的推断 结论,并解释研究的统计显著性和实际意义。
常见假设检验方法
1 单样本t检验
2 双样本t检验
用于比较一个样本的均值与总体均值是否存在显 著差异。
用于比较两个独立样本的均值是否存在显著差异。
应用领域
假设检验广泛应用于医学、社会科学、经济学等领 域,帮助我们进行数据分析和做出科学决策。
假设检验的步骤
1
假设设立
首先,根据研究问题,明确原假设和备择假
ห้องสมุดไป่ตู้
显著性水平确定
2
设,以便进行后续统计推断。
确定假设检验的显著性水平,通常为0.05或
0.01,用于判断统计显著性。
3
统计量计算
计算适应研究问题的合适统计量,以便进行
第四章_两个总体的假设检验
net
1
net
2
两个总体比率之差的检验
(例题分析)
H0 :1- 2 0 H1 :1- 2 < 0 = 0.05 n1=200 , n2=200
临界值(c):
拒绝域
检验统计量:
z
0.27 0.35
1 1 0.31 (1 0.31) 200 200 1.72976
两个总体均值之差的估计 (例题分析)
【例】为检验两种方法组装产品所需时间的差异,分别对两种 不同的组装方法各随机安排 12 个工人,每个工人组装一件产 品所需的时间(分钟)下如表。假定两种方法组装产品的时间服 从正态分布,但方差未知且不相等。取显著性水平0.05,能否 认为方法1组装产品的平均数量明显地高于方法2?
2 ( d d ) i i 1 n
d
di
i 1
n
nd
sd
nd 1
匹配样本
(数据形式)
观察序号 样本1 样本2 差值
1 2 M i M n
x11 x12 M x1i M x 1n
x21 x22 M x 2i M x 2n
d1 = x11 - x21 d2 = x12 - x22 M d i = x 1i - x 2i M dn = x1n- x2n
拒绝域
P值决策
z z / 2
z z
z z
P 拒绝H0
两个总体比率之差的检验
(例题分析)
【例】一所大学准备采取一项学生 在宿舍上网收费的措施,为了解男 女学生对这一措施的看法是否存在 差异,分别抽取了 200 名男学生和 200名女学生进行调查,其中的一个 问题是:“你是否赞成采取上网收 费的措施?”其中男学生表示赞成 的比率为 27% ,女学生表示赞成的 比率为 35% 。调查者认为,男学生 中表示赞成的比率显著低于女学生 。取显著性水平 =0.01 ,样本提供 的证据是否支持调查者的看法?
第4章 假设检验(田间试验与统计分析 四川农业大学)
2 2
2
s2 1
s2 2
Hale Waihona Puke s2 es2 e
df1
s2 1
df1
df
2
s
2 2
df2
s2 e
5 2.412 4 3.997 54
3.1164
1.提出假设
H0 :1=2; HA :1≠2 。
2、计算t值
t x1 x2 s x1 x2
s x1 x2
第二节 单个样本平均数的假设检验
在实际研究工作中,常常要检验某样本
所属总体平均数与已知的总体平均数 0 是 否有差异。已知的总体平均数 0 一般为一些
公认的理论数值、经验数值或期望数值。
若σ2已知
u x 0 x
x
n
u检验
s2 若σ2未知
t x 0
sx
sx
s n
x2 1 ( x)2
x x 30.3667(g) s
n
n
2.5328 (g)
n 1
sx
s 0.8443 (g) n
t x 0 30.3667 27.5 3.395
sx
0.8443
df=n-1=9-1=8
t0.05(8) =2.306 t0.01(8) =3.355 | t |=3.395 > t0.01(8)
第四章 假设检验
第一节 假设检验的基本原理 第二节 单个样本平均数的假设检验 第三节 两个样本平均数的假设检验 第四节 百分率资料的假设检验 第五节 参数的区间估计
假设检验(test of hypothesis)又叫显著性 检验 (test of significance),是统计学中的一 个重要内容 。假设检验的方法很多 ,常用的
假设检验PPT课件
假设检验
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?
4第四章 假设检验、t检验和Z检验
编号
1 2 3
干预前
12 9 10
干预后
15 12 16
差值(d)
3 3 6
d2
9 9 36
4
5 6
6
5 8
10
12 9
4
7 1
16
49 1
7
8 9 10
13
11 10 9
19
18 15 11
67 5 2Fra bibliotek3649 25 4
第三节 配对设计t检验
1.建立检验假设,确定检验水准 H 0 : d 0
两独立样本t检验
1.建立假设,确定检验水准
H 0 : 1 2 H 1 : 1 2
2.选定检验方法,计算检验统计量
t 3012 .5 2611 .3 (30 1) 280.1 (32 1) 302.5 1 1 ( ) 30 32 2 30 32
第二节 单样本t检验和Z检验
1.建立检验假设,确定检验水准
H 0 : 0 H1 : 0
0.05
2.选定检验方法,计算检验统计量Z值
Z x 0 s/ n 142.6 130 31.25 / 210 5.843
3.确定P值,作出推断结论
P<0.01。按α=0.05水准,拒绝H0,接受H1,差异有高
度统计学意义。
第三节 配对设计t检验
配对t检验的基本思路是:首先求出各对 子的差值的均数,若两种处理结果无差 别或某种处理前后不起作用,理论上差 值的总体均数应该为0。
d d d 0 d t Sd sd / n sd / n v n 1
第三节 配对设计t检验
表4-3 10名抑郁症患者干预前后心理指标LSIB测试结果
第四章_假设检验似然比-p值
参数空间为
可以求得
可以求得似然比检验统计量为
1 ( x) exp(nX (1) ) exp (2nX (1) ) 2
它等价与统计量
似然比检验的优点:
1. 它的构造形式与具体的模型无关. 并且
可以证明许多常用的检验就等价于或几
乎等价于似然比检验.
r )) E ( HR (
2. 检验统计量有统一的渐近分布.
2 ln ( x) ~
2 r
7
• 证明:
例
设 x1 , x2 ,, x是来自正态总体 n
2
N ( , 2 )
的简单样本,其中 , 是未知参数。 求检验
H 0: 0,
的似然比检验.
简单计算可知(见教材例3.4.2)
H1: 0
n/2
其中
因此,似然比检验统计量与传统的t统计量的平 方成反比 于是,两个检验统计量的拒绝与有如下关系
f ( x, ) e ( x ) , x , R
试求假设
解: 样本分布为
n 2 f ( x, ) exp ( x i ) I{ x(1) } i 1
一个故事
二、似然比检验
} 考虑检验问题 设统计模型为 { P , , H 0: 0, H1: 1
其中 0 1。定义似然比(Likelihood Ratio)为
( x)
sup{ p ( x, )}
1
0
sup{ p ( x, )}
,
1
解:样本分布为
n 2
n( x 0 ) 2 L( x ) 1 2 ( n 1) S
04_05假设检验-医学课件
例4.4:
μ0 =4.6(mmol/L)
?=
μ
n=25 X 5.1(mmol / L) S 0.88(mmol / L)
已知总体
未知总体
手头样本
例4.4:
X05.14.60.5
手头样本对应的未知总体均数μ等于已知总体均 数μ0,差别仅仅是由于抽样误差所致
除抽样误差外,样本所来自的未知总体与已知 总体不同,存在本质差异
碰巧猜对吗?
一个统计学故事
假设:她没有这个本事,是碰巧猜对的! 连续猜对8个杯子的可能性 P 是多少? P=0.58=0.00390625 你认为原假设 H0 成立吗?
推断结论她真的有这个本事! (不是碰巧猜对的。)
依据:小概率原理。 P ≤ 0.05为小概率。
做个实验
总体A是100例正常成年男子血红蛋白(g/L,以
t X 0
sn
n1
统计量t表示,在标准误的尺度下,样本均数与总体均
数0的偏离。这种偏离称为标准t离差。
根据抽样误差理论,在H0假设前提下,统计 量t服从自由度为n-1的t分布,即t值在0的附近 的可能性大,远离0的可能性小,离0越远可能 性越小。
t值越小,越利于H0假设 t值越大,越不利于H0假设
假设检验(Hypothesis Test)
------ 统计推断内容之一
Outline
基本思想 基本步骤 均数的假设检验 假设检验中几个基本概念 假设检验中几个值得注意的问题
一个统计学实验
一位常饮牛奶加茶的女士声称,她能辨别先倒 进杯子里的是茶还是牛奶ຫໍສະໝຸດ 对此做了8次试验, 她都正确地说出了。
4.317 4.029 3.833 3.690 3.581
《统计学(第二版)》电子课件 第4章 假设检验
显著性检验中原假设与备择假设的位置是不对称 的,二者不能随意交换;
显著性检验本身对原假设起保护作用,水平越小, 检验犯第一类错误的概率就越小,换言之,越有 可能不拒绝原假设。
2021/8/7
《统计学》第4章假设检验
4-29
4.1.5 双侧检验和单侧检验
常见的三种显著性假设检验形式: (1)双侧检验 H0 : 0 H1 : 0 (2)右侧检验 H0 : 0 H1 : 0 (3)左侧检验 H0 : 0 H1 : 0
从该批产品中随机抽取了100件,发现其中有4件 次品,即样本次品率为4%,A公司认为样本次品 率4%大于1%,所以不接受B公司的这批产品,B 公司则认为虽然样本次品率为4%,但并不能说明 10万件产品的次品率大于1%,因为样本量很小;
2021/8/7
《统计学》第4章假设检验
4-3
问题
(1)A公司是否应该接受该批产品? (2)如果随机抽取了100件产品有3件次品,
H0:pp01%
2021/8/7
《统计学》第4章假设检验
4-12
记X为100件产品中次品的数目,直观上看, X越大,原假设越值得怀疑,反之, X越小, 对原假设越有利;问题是, X大到多少应 该拒绝原假设?
两种处理方法:
2021/8/7
《统计学》第4章假设检验
4-13
1. 假定H0成立,计算事件X≥4的概率
4-32
4.2 一个正态总体的检验
4.2.1 总体均值μ的检验: Z检验 考虑如下三种检验问题
H0:0 H1:0 H0:0 H1:0 H0:0 H1:0
(4.4) (4.5) (4.6)
2021/8/7
《统计学》第4章假设检验
4-33
显著性检验本身对原假设起保护作用,水平越小, 检验犯第一类错误的概率就越小,换言之,越有 可能不拒绝原假设。
2021/8/7
《统计学》第4章假设检验
4-29
4.1.5 双侧检验和单侧检验
常见的三种显著性假设检验形式: (1)双侧检验 H0 : 0 H1 : 0 (2)右侧检验 H0 : 0 H1 : 0 (3)左侧检验 H0 : 0 H1 : 0
从该批产品中随机抽取了100件,发现其中有4件 次品,即样本次品率为4%,A公司认为样本次品 率4%大于1%,所以不接受B公司的这批产品,B 公司则认为虽然样本次品率为4%,但并不能说明 10万件产品的次品率大于1%,因为样本量很小;
2021/8/7
《统计学》第4章假设检验
4-3
问题
(1)A公司是否应该接受该批产品? (2)如果随机抽取了100件产品有3件次品,
H0:pp01%
2021/8/7
《统计学》第4章假设检验
4-12
记X为100件产品中次品的数目,直观上看, X越大,原假设越值得怀疑,反之, X越小, 对原假设越有利;问题是, X大到多少应 该拒绝原假设?
两种处理方法:
2021/8/7
《统计学》第4章假设检验
4-13
1. 假定H0成立,计算事件X≥4的概率
4-32
4.2 一个正态总体的检验
4.2.1 总体均值μ的检验: Z检验 考虑如下三种检验问题
H0:0 H1:0 H0:0 H1:0 H0:0 H1:0
(4.4) (4.5) (4.6)
2021/8/7
《统计学》第4章假设检验
4-33
第四章抽样误差与假设检验
单侧界值 :一侧尾部面积为时对应的t值 t,v 对称性得:单侧曲线下面积=2双侧曲线下面积 给定曲线下面积对应的界值与自由度有关 同样的尾部面积,t分布的界值要大于标准正态
分布的界值
t分布的界值
t分布界值示意图,表示阴影的面积
习题
一、名词解释
1.抽样误差 2.均数标准误 3.置信区间
习题
3.σ未知且n较小时,按t分布计算总 体均数的可信区间
双侧 1 可信区间为:
X t 2, SX
思考
总体均数可信区间与 参考值范围的区别和联系?
第三节 t 分布
X ~ N,(标,准正2 )态分布与U统计量
U X ~ N (0,1) n
实际研究中未知,用样本的标准差S作为
的一个近似值(估计值)代替,得到变换后的 统计量并记为
4.30
154.1-
94
9.40
13.70
154.7-
191
19.10
32.80
155.3-
255
25.50
58.30
155.9-
216
21.60
79.90
156.5-
116
11.60
91.50
157.1-
63
6.30
97.80
157.7-
20
2.00
99.80
158.3-158.9
2
0.20
100.00
注意区别:
SX
SX n
S 和S X
和 X
第二节 总体均数的估计
参数的估计
点估计:将样本统计量作为 总体参数的估计
区间估计:按预先给定的概率确定 一个包含未知总体参数的范围,称 为参数的可信区间或置信区间 (confidence interval,CI)
分布的界值
t分布的界值
t分布界值示意图,表示阴影的面积
习题
一、名词解释
1.抽样误差 2.均数标准误 3.置信区间
习题
3.σ未知且n较小时,按t分布计算总 体均数的可信区间
双侧 1 可信区间为:
X t 2, SX
思考
总体均数可信区间与 参考值范围的区别和联系?
第三节 t 分布
X ~ N,(标,准正2 )态分布与U统计量
U X ~ N (0,1) n
实际研究中未知,用样本的标准差S作为
的一个近似值(估计值)代替,得到变换后的 统计量并记为
4.30
154.1-
94
9.40
13.70
154.7-
191
19.10
32.80
155.3-
255
25.50
58.30
155.9-
216
21.60
79.90
156.5-
116
11.60
91.50
157.1-
63
6.30
97.80
157.7-
20
2.00
99.80
158.3-158.9
2
0.20
100.00
注意区别:
SX
SX n
S 和S X
和 X
第二节 总体均数的估计
参数的估计
点估计:将样本统计量作为 总体参数的估计
区间估计:按预先给定的概率确定 一个包含未知总体参数的范围,称 为参数的可信区间或置信区间 (confidence interval,CI)
chapter4假设检验
•单侧检验原假设与备择假设的确定
应区别不同情况采取不同的建立假设方法。 对于检验某项研究是否达到了预期效果 一般是将研究的预期效果(希望、想要证明的假 设)作为备择假设 H1 ,将认为研究结果无效作为 原假设 H0。先确立备择假设 H1 。因为只有当检验 结果与原假设有明显差别时才能拒绝原假设而接 受备择假设,原假设不会轻易被拒绝,就使得希 望得到的结论不会轻易被接受,从而减少结论错 误。
假设检验的原理
由于个体差异的存在,即使从同一总体中严格的
随机抽样, ,也不尽不同。 X1 , X 2 , X 3 ,
它们的不同有两种(只有两种)可能:
(1)分别所代表的总体均值相同,由于抽样误
差造成了样本均值的差别。差别无显著性 。 (2)分别所代表的总体均值不同。差别有显著 性。
假设检验的步骤
一个总体
均值
Z 检验
(单尾和双尾)
成数
t 检验 Z 检验
(单尾和双尾)
方差
2检验
(单尾和双尾)
(单尾和双尾)
步骤三
(1)确定显著性水平α和临界值及拒绝域 (2)计算检验统计量的值
显著性水平α是当原假设为正确时被拒绝的概率,是
由研究者事先确定的。 显著性水平的大小应根据研究需要的精确度和可靠 性而定。通常取α=0.05或α=0.01,即接受原假设的 决定是正确的可能性(概率)为95%或99%。 根据给定的显著性水平,查表得出相应的临界值, 同时指定拒绝域。
构造统计量 计算统计量值 做出推断
提出假设
做出统计 决策
假设检验的一般步骤,即提出假设、构造检验 统计量、计算检验统计量值、做出决策。
步骤一
提出假设:在决策分析过程中,需要证实 自己通过样本数据对总体分布形式做出的 某种推断的正确性(比如,总体的参数θ等 于某个值),这时就需要提出假设,假设 包括原假设H0与备择假设H1。
第四章假设检验
x 0 s n
z z / 2
z z
z z
P值决策
P 拒绝H0
总体方差的检验
(检验方法的总结)
假设 假设形式 统计量
2 2 2 (n 1)
双侧检验
左侧检验
右侧检验
H0 : 2= 02 H0 : 2 02 H0 : 2 02 H1 : 2 02 H1 : 2< 02 H1 : 2> 02
第四章 参数检验
学习目标:
1、明确SPss提供了哪几种参数检验的方法 2、掌握Spss单样本t检验 3、掌握Spss两独立样本的t检验,理解t检 验和F检验的不同
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误) 原假设为真时拒绝原假设 第Ⅰ类错误的概率记为 被称为显著性水平 2. 第Ⅱ类错误(取伪错误) 原假设为假时未拒绝原假设 第 Ⅱ 类 错 误 的 概 率 记 为 (Beta)
习题2
某电脑公司2005年前4个月每天的销售量数据: 台)
234 143 187 161 159 198 160 152 187 141 214 149 155 167 168 211 172 194 173 196 183 225 178 234 182 177 184 185 177 189 209 189 163 196 176 196 158 203 188 206
《2012年中秋节国庆节假日旅游统 计报告》游客人均花费支出495元。 学生的考试成绩服从正态分布.现在 从某次《概率论与数理统计》课程 的考试中随机抽取36位学生的考试 试卷,计算得到平均成绩为65分, 标准差为15分.问在显著性水平 α=0.05下,是否可以认为这次考试 全体考生的平均成绩为70分?
第四章 假设检验
为 ,一般是随着 0 的减小或试验误差的 增大而增大,所以 0 越小或试验误差越
大,就越容易将试验的真实差异错判为试验误差。
显著性检验的两类错误归纳如下:
表4-1 显著性检验的两类错误
客观实际
H0 成立 H0 不成立
检验结果
否定 H0 Ⅰ型错误( )
接受 H0 推断正确(1- )
推断正确(1- ) Ⅱ型错误( )
与0 有差异而因为试验误差大被掩盖了。
为了降低犯两类错误的概率,一般从选取适当的显
著水平 和增加试验重复次数 n 来考虑。因为选取数 值小的显著水平 值可以降低犯Ⅰ类型错误的概率,
但与此同时也增大了犯Ⅱ型错误的概率,所以显著水
平 值的选用要同时考虑到犯两类错误的概率的大小。
对于田间试验,由于试验条件不容易控制
y1 510
y2 500
我们能否根据 y1 y2 10 就判定这两
个水稻品种平均产量不同?结论是,不一定。
因为两个水稻品种平均产量 y1 、y2 都 是从试验种植的10个小区获得,仅是两个品种
有关总体平均数 1, 2 的估计值。由于存在
试验误差 ,样本平均数并不等于总体平均数 , 样本平均数包含总体平均数与试验误差二部分, 即
∣u∣≥2.526的两尾概率,所以称为 u 检验.
三、显著水平与两种类型的错误
(一)显著水平
用来否定或接受无效假设的概率标准叫显著水
平,记作 。 在生物学研究中常取 =0.05,称为 5% 显著水平; 或 =0.01,称为1% 显著水平或极显著水平。
对于上述例子 u的检验来说,若∣u∣<1.96 ,
则说明试验的表面差异属于试验误差的概率p>0.05,
即表面差异属于试验误差的可能性大,不能否
大,就越容易将试验的真实差异错判为试验误差。
显著性检验的两类错误归纳如下:
表4-1 显著性检验的两类错误
客观实际
H0 成立 H0 不成立
检验结果
否定 H0 Ⅰ型错误( )
接受 H0 推断正确(1- )
推断正确(1- ) Ⅱ型错误( )
与0 有差异而因为试验误差大被掩盖了。
为了降低犯两类错误的概率,一般从选取适当的显
著水平 和增加试验重复次数 n 来考虑。因为选取数 值小的显著水平 值可以降低犯Ⅰ类型错误的概率,
但与此同时也增大了犯Ⅱ型错误的概率,所以显著水
平 值的选用要同时考虑到犯两类错误的概率的大小。
对于田间试验,由于试验条件不容易控制
y1 510
y2 500
我们能否根据 y1 y2 10 就判定这两
个水稻品种平均产量不同?结论是,不一定。
因为两个水稻品种平均产量 y1 、y2 都 是从试验种植的10个小区获得,仅是两个品种
有关总体平均数 1, 2 的估计值。由于存在
试验误差 ,样本平均数并不等于总体平均数 , 样本平均数包含总体平均数与试验误差二部分, 即
∣u∣≥2.526的两尾概率,所以称为 u 检验.
三、显著水平与两种类型的错误
(一)显著水平
用来否定或接受无效假设的概率标准叫显著水
平,记作 。 在生物学研究中常取 =0.05,称为 5% 显著水平; 或 =0.01,称为1% 显著水平或极显著水平。
对于上述例子 u的检验来说,若∣u∣<1.96 ,
则说明试验的表面差异属于试验误差的概率p>0.05,
即表面差异属于试验误差的可能性大,不能否
第四章假设检验
• 在n重贝努利试验中,事件A可能发生0,1,2,…,n次, 则事件A 恰好发生k(0≤k≤n)次的概率Pn(k):
k Pn ( k ) = Cn p k q n − k
k=0,1,2…,n
二项分布的定义: 设随机变量x所有可能取的值为零和正整数:0,1,2,…,n, 且有
k Pn (k ) = Cn p k q n − k
k=0,1,2…,n
其中p>0,q>0,p+q=1,则称随机变量x服从参数为n和p的 二项分布,记为 x~B(n,p)。 , 在n较大,np、nq较接近时,二项分布接近于正态分布; 当n→∞时,二项分布的极限分布是正态分布。
二项分布的平均数、标准差: 当试验结果以事件A发生次数k表示时 μ=np σ=
小概率事件实际不可能原理 随机变量的概率分布——正态分布、二项分布 样本平均数的抽样分布 t分布 假设检验的基本原理和步骤
小概率事件实际不可能原理 • 概率的统计定义 • 在相同条件下进行n次重复试验,如果随机事件A发生的次 数为m,那么m/n称为随机事件A的频率; • 当试验重复数n逐渐增大时,随机事件A的频率越来越稳定 地接近某一数值p,那么就把p称为随机事件A的概率。 • 这样定义的概率称为统计概率,或者称后验概率。可以记 为P(A)=p。
由样本平均数 x 构成的总体称为样本平均数的抽样总体, 其平均数和标准差分别记为 µ x 和 σ x 。
σ x 是样本平均数抽样总体的标准差,简称标准误, ,
它表示平均数抽样误差的大小。 统计学上已证明
µx = µ
σ
x
=
σ
n
两个定理: 1、若随机变量x服从正态分布N(µ,σ2), x1 , x2 ,L, xn 是由x总体得来的随机样本,则统计量 也是正态分布, 且有
生物统计学
提出原假设和备择假设
为什么叫0假设
11
什么是备择假设?(Alternative Hypothesis)1. 与原假设对立的假设2. 总是有不等号:, 或 3. 表示为 H1H1:某一数值, <某一数值,或 某一数值例如, H1:50(岁), < 50(岁),或 50(岁)
提出原假设和备择假设
12
学习目标
3
第一节 假设检验的一般问题
假设检验的概念假设检验的步骤假设检验中的小概率原理假设检验中的两类错误双尾检验和单尾检验
假设检验的概念与思想
什么是假设?
对总体参数的一种看法总体参数包括总体均值、比例、方差等分析之前必需陈述
我认为懒人的愚笨程度每年平均会增加0.4444%!
6
概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立类型参数假设检验非参数假设检验特点采用逻辑上的反证法依据统计上的小概率原理
单尾检验
(原假设与备择假设的确定)
35
提出原假设 H0: 1000选择备择假设 H1: < 1000
单尾检验
(示例)
体重超过5公斤的野生乌龟平均寿命可能会超过1000年(属于检验声明的有效性,先提出原假设)
36
提出原假设 H0: 25选择备择假设 H1: 25
麻雀体内被隐孢子虫(一种肠道寄生虫)寄生的比率超过25%吗? (属于研究中的假设,先提出备择假设)
单尾检验
(原假设与备择假设的确定)
32
例1,改善栽培技术后,将会使豌豆的平均籽粒重超过360毫克以上属于研究中的假设建立的原假设与备择假设应为 H0: 360 H1: 360例2,改进筛选方法后,会使鱼苗场的杂种率降低到2%以下属于研究中的假设建立的原假设与备择假设应为 H0: 2% H1: < 2%
为什么叫0假设
11
什么是备择假设?(Alternative Hypothesis)1. 与原假设对立的假设2. 总是有不等号:, 或 3. 表示为 H1H1:某一数值, <某一数值,或 某一数值例如, H1:50(岁), < 50(岁),或 50(岁)
提出原假设和备择假设
12
学习目标
3
第一节 假设检验的一般问题
假设检验的概念假设检验的步骤假设检验中的小概率原理假设检验中的两类错误双尾检验和单尾检验
假设检验的概念与思想
什么是假设?
对总体参数的一种看法总体参数包括总体均值、比例、方差等分析之前必需陈述
我认为懒人的愚笨程度每年平均会增加0.4444%!
6
概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立类型参数假设检验非参数假设检验特点采用逻辑上的反证法依据统计上的小概率原理
单尾检验
(原假设与备择假设的确定)
35
提出原假设 H0: 1000选择备择假设 H1: < 1000
单尾检验
(示例)
体重超过5公斤的野生乌龟平均寿命可能会超过1000年(属于检验声明的有效性,先提出原假设)
36
提出原假设 H0: 25选择备择假设 H1: 25
麻雀体内被隐孢子虫(一种肠道寄生虫)寄生的比率超过25%吗? (属于研究中的假设,先提出备择假设)
单尾检验
(原假设与备择假设的确定)
32
例1,改善栽培技术后,将会使豌豆的平均籽粒重超过360毫克以上属于研究中的假设建立的原假设与备择假设应为 H0: 360 H1: 360例2,改进筛选方法后,会使鱼苗场的杂种率降低到2%以下属于研究中的假设建立的原假设与备择假设应为 H0: 2% H1: < 2%
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解答
(1)建立检验假设
H0 : 62 H1 : 62 (2)0 62, 0 10.2, X 68, n 90, Z X 0 68 62 5.58
0 n 10.2 / 90 (3)由已给出的显著性水平 0.05,查表得到Z 2 1.96
假设检验中各种可能结果的概率
H0为真 H0为伪
接受H0
拒绝H0,接受H1
1-(正确决策) (弃真错误)
(取伪错误) 1- (正确决策)
2. 总体均值的显著性检验
2.1 总体正态且总体方差己知
已知样本x1, x2, xn来自正态总体X ~ N 0, 2 ,
其均值与总体均值0是否有显著差异? Z检验
• 虚无假设 H0 null hypothesis
– 又叫零假设 zero hypothesis,原假设,与研究假 设对立的假设,一般假设差异不显著
• H1:1 0 • Z检验
• 取=0.05
• 接受H0:X 0 1.96 0
拒绝H0:X 0 1.96 0
或Z 1.96,或Z 1.96
t0.05(n) 2.042 2.009 1.984 1.976 1.972 1.965 1.962 1.960
t0.01(n) 2.750 2.678 2.626 2.609 2.601 2.586 2.581 2.577
小结
¼Ù Éè
× Ü Ìå Õý ̬ £¬ · ½ ²î 2 ÒÑ × Ü Ìå Õý ̬ £¬ · ½ ²î 2 δ Öª £¬
(
2
,
2 2
n2
)
D X
X
1
X
的分布
2
仍为
正态分
布,
D
X
=1
,不同
2
条
件下
标
准误
公式不
同
3.1.1 总体方差已知,独立样本
X,Y独立,则
2 (X
Y
)
2 X
2 Y
,
X
与
1
X
独
2
立
时,
2 D
X
SED2 X
SE2 X1
SE2 X2
2 1
Öª £¬ Z ¼ì Ñé
t ¼ì Ñé
H0
H1
ÁÙ ½ç Öµ ¾Ü ¾ø H0 ÁÙ ½ç Öµ
¾Ü ¾ø H0
Ë« ²à ¼ì Ñé µ¥ ²à ¼ì Ñé
= 0
¡Ù 0 Z/2
¡Ü 0 > 0
Z
|Z| > Z/2 Z > Z
t/2(n-1) t(n-1)
|t| > t/2(n-1) t > t(n-1)
S
2 p
(n1
1)S12 (n2 1)S22 n1 n2 2
,
SEDX
S
2 p
1 n1
1 n2
,
t
X1 X2 SEDX
~ tn1 n2
2
• 例:某校进行一项智力速度测验,共有19 名学生参加,其中男生12人,女生7人。测 验共200道题目,在规定时间里,答对一题 记1分,测验结束后,得到以下的测验成绩
n1
2 2
,
n2
SEDX
2 1
2 2
,
n1 n2
则Z ( X1 X 2 ) (1 2 )
SEDX
当H 0
: 1
2假设成立时,Z
X1 X2 SEDX
X1 X2
2 1
2 2
n1 n2
• 例: 某地区的六岁儿童中随机抽取男生30 人,其平均身高为114cm,抽取女生27人, 平均身高112.5cm。根据以往资料,该区六 岁男女儿童身高的标准差男童为5cm,女童 为6.5cm,问该区六岁男女儿童身高有无显 著差异? (=0.05)
例子:
• 学生的学习成绩与教师的教学方法有关。 某校一教师采用了一种他认为新式有效的 教学方法。经过一学年的教学后,从该教 师所教班级中随机抽取了6名学生的考试成 绩,分别为48.5, 49.0, 53.5, 49.5, 56.0, 52.5, 而在该学年考试中,全年级的总平均分数 为52.0,试分析采用这种教学方法与未采用 新教学方法的学生成绩有无显著的差异 (已知考试成绩服从正态分布,取=0.05)
(4)显然 Z 5.58 1.96,即拒绝原假设H0 可以认为该校的学生考试成绩与全市的平均成绩有 显著差异。
2.2总体正态但总体方差未知
已知样本x1, x2, xn来自正态总体X ~ N 0, 2 ,
问样本均值与总体均值之间是否有显著差异? t检验
1 建立假设
H0 : 0 H1 : 0
t分布的特点: (1)对称。左侧为负,右侧为正,均值为0; (2)-<t<+; (3)n 时, t分布为正态分布,方差为1;
n-1>30时, t分布为接近正态分布,方差>1, n-1<30时, t分布与正态分布相差较大,随n-1减小方差越大
n>45时, t分布与正态分布没有多大差异 在小样本n<30时, t分布具有重要作用。
2
接
受
假
设H
,两
0
种
教
学方法无
显
著差异
Z检验和t检验
• 两种检验的前提之一
– 总体正态分布
• 当n≥50时,两种检验的临界值差不多相等, 即 Z/2 t/2 (n) (Z0.05/2 1.960, Z0.01/2 2.576
n
30 50 100 150 200 500 1000 5000
假设检验
本章基本内容
• 假设检验的基本原理和步骤
– 虚无假设和备择假设 – 错误和错误 – 单侧检验和双侧检验
• 差异的显著性检验
– 均值 – 方差 – 比例、相关系数
1.1 假设检验和参数估计
• 参数估计
– 用样本统计量估计总体参数
• 假设检验
– 先对总体参数提出一个假设,然后利用样本信 息检验这个假设是否成立
3.2两总体方差未知
3.2.1 两总体方差相等独立样本
D =X X
1-X
的
2
标准误为SED
X
=
2 1
2 2
,
n1 n2
两总体方差相等
12=
22=
2 0
SEDX =
2 1
2 2
=
n1 n2
2 0
1 n1
1 n2
,
02未知, 用S12和S22的加权平均代替,
2
X i X 445.82,
S22
17 7 1 i1
Yi
Y
2
425.33,
由于S12和S22差不多,可以认为方差相等,
t
120 101
1.91
12 1445.82 7 1425.33 1 1
解:
X 51.5,S 2.98, (1)建立假设
H0 : 0
H1 : 0
(2)t X 0 51.5 52.0 0.41
S n 2.98 6
(3)临界值t (5) 2.571
2
(4) t 0.41 0.41 2.571 t (5)
2 计算统计量 t X 0
Sn
3 查临界值t n 1
2
4若
t
t
,
拒绝H
,
0
t t , 接受H0
2
2
T统计量的分布 设X1,X2,…,Xn是来自正态总体N(,2)的一个样本,
X
1 n
n i 1
Xi,S2
1 n 1
n
(Xi
i 1
X )2,
称 T n( X ) 为T统计量,它服从自由度为n-1
– 男生12人:83、146、119、104、120、161、 134、115、129、99、123
– 女生7人:70、118、101、85、107、132、94试 确定男、女生的平均成绩有无显著的差异(取 =0.05)
解: X
120,Y
101, S12
1 12 1
12 i 1
Sn
3. 两总体均值差异的显著性检验 3.1 两总体方差已知
两个正态总体,均值为1, 2 ,两个样本均值为X1, X 2, 由X1 X 2的差异验证1 2的差异。
如果两个总体方差已知:
X X
1~N
(
1,
2 1
)
2~N
(
2
,
2 2
)
X1
~
N (1,
2 1
n1
)
X2
~
N
• 某校一个班进行比奈智力测验,X=110,班 级人数n=50,该测验常模0=100,0=16。 该班智力水平1(不是这一次测验结果) 是否与常模水平有差异?
研究假设和虚无假设
• 研究假设 H1 research hypothesis
– 又叫备择假设 alternative hypothesis,指待验证的 假设,一般假设差异显著