第9章 二总体假设检验
第9章假设检验习题解答
9. 在统计假设的显著性检验中,取小的显著性水平α 的目的在于( B ).
A. 不轻易拒绝备选假设.
B. 不轻易拒绝原假设.
C. 不轻易接受原假设.
D. 不考虑备选假设.
10. 在统计假设的显著性检验中,实际上是( B ).
A. 只控制第一类错误,即控制"拒真"错误.
B. 在控制第一类错误的前提下,尽量减小第二类错误(即受伪)的概率.
C.
x − µ0 s/ n
<
−tα / 2 (n −1)
.
D.
x − µ0 s/ n
<
−tα /2 (n −1)或
x − µ0 s/ n
> tα / 2 (n −1) .
二.填空题 15.概率很小的事件,在一次试验中几乎是不可能发生的,这个原理称为 小概率原理
.
16. 在假设检验中,把符合 H0 的总体判为不符合 H0 加以拒绝,这类错误称为第 一 类
σ
2 1
=
σ
2 2
,
H1
:
σ
2 1
≠
σ
2 2
;在 0.05 的显
著性水平,由于检验问题的P-值 2× 0.217542 > 0.05 ,所以, 接受 (接受,
拒绝)原假设,认为甲乙两家供货商的灯泡使用寿命方差的差异 显著).
不显著 (显著,不
F-检验 双样本方差分析
供货商甲
供货商乙
平均 方差 观测值
H1 : µ = 3,若检验的拒绝域为W = {x > 2.6} .
(1)当 n = 20 时,求检验犯第一类错误的概率α 和第二类错误的概率 β ;
(2)如果要使犯第二类错误的概率 β ≤ 0.01 , n 最小应取多少?
假设检验
Z <Zα/2
所以接受原假设,即该医院病 所以接受原假设 即该医院病 人候诊的时间无显著变化.。 人候诊的时间无显著变化 。
0.025
1- α
接受区域
0.025(α/2) ( )
-1.96
若
Z > Zα
2
则否定H 则否定 0
或总体分布未知、 或总体分布未知、大样本
0.025 0.025(2/α) ( )
检验统计量: 检验统计量
-1.96
1- α
x − µ0 t= ~ n − 1) ( s 1.96( Z ) ( n
2/α
t > t α (n − 1)
2
则否定H 则否定 0
t ≤ t α (n − 1)
2
则接受H 则接受 0
0.025 -1.96 1.96( Z 2/α ) ( 0.025(2/α) ( )
属于:总体正态,已知方差, 属于:总体正态,已知方差,双侧检验 ( H0: µ= µ0 )
(一)总体正态,已知方差,双侧检验 ( H0: µ= µ0 ) 总体正态,已知方差, 解:该批瓷砖进货的抗断强度X ~N( µ , 1.12 ) 该批瓷砖进货的抗断强度 ( S1 作假设 H0: µ= µ0 = 32.50 作假设:
x H 0 : µ = 300;H1 : µ ≠ 300 总体分布正态 但σ2未知, x =297, 总体分布正态,但 未知, n=10 =
x − µ0 t= ~ t(n − 1) s n 0.025 x − µ 0 297 − 3001- α t= = = −2.35 s 4.028 -1.96 1.96( Z ( n 10
总体均数的假设检验
$number {01}
目 录
• 引言 • 假设检验的基本原理 • 总体均数的假设检验方法 • 实例分析 • 总结与展望
01 引言
目的和背景
确定样本数据是否与假设的总体均数 存在显著差异,从而对总体均数进行 假设检验。
在科学实验、统计学、医学研究等领 域广泛应用,用于评估样本数据是否 支持或拒绝关于总体均数的假设。
配对样本均数假设检验实例
总结词
配对样本均数假设检验用于比较同一组研究对象在不同条件下的均数是否存在统计学显 著性差异。
详细描述
例如,为了比较同一组患者在接受两种不同治疗措施前后的改善程度,研究者收集了患 者的基线数据和接受不同治疗措施后的数据,并计算出各自治疗组的平均改善程度。然 后,研究者使用配对样本均数假设检验来比较同一组患者在不同治疗措施下的平均改善
概念简介
假设检验是一种统计推断方法,通过 检验样本数据是否符合某个假设,从 而对总体参数进行推断。
它基于概率论原理,通过计算样本数 据与假设的总体参数之间的差异,评 估这种差异是否具有统计学上的显著 性。
02
假设检验的基本原理
假设检验的步骤
建立假设
根据研究目的,提出一个关于总 体参数的假设,通常包括零假设 和备择假设。
收集样本数据
从总体中随机抽取一定数量的样 本,并记录样本数据。
确定检验水准
选择合适的检验水准,如α和β, 以平衡第一类和第二类错误的概 率。
计算统计量
根据样本数据计算适当的统计量, 如t值、Z值或χ^2值。
假设检验的类型
1 2
3
单样本均数检验
比较一个样本均数与已知总体均数或正常值范围。
两样本均数比较
假设检验的定义和步骤
假设检验的定义和步骤
假设检验是统计学中一种常用的推断方法,用于判断样本数据
是否支持对总体参数的某个假设。
通过对样本数据进行分析,假设
检验可以帮助我们判断我们所做的假设是否合理,并据此对总体参
数进行推断。
假设检验的步骤通常包括以下几个步骤:
1. 提出假设,首先,我们需要明确提出一个关于总体参数的假设,通常包括原假设(H0)和备择假设(H1)两种。
2. 选择检验统计量,根据所提出的假设,选择适当的检验统计量,该统计量应能够在原假设成立时具有已知的概率分布。
3. 确定显著性水平,确定显著性水平(α),即拒绝原假设的
概率阈值。
通常选择0.05作为显著性水平。
4. 计算统计量的值,利用样本数据计算出所选检验统计量的值。
5. 做出决策,根据检验统计量的值和显著性水平,做出决策,
即是拒绝原假设还是不拒绝原假设。
6. 得出结论,根据做出的决策,得出对原假设的结论,判断样本数据是否支持原假设。
总的来说,假设检验是一种通过对样本数据进行统计分析,以判断对总体参数的假设是否成立的方法。
通过严格的步骤和逻辑推理,假设检验可以帮助我们做出合理的推断和决策。
医学统计学9 χ2检验
卡方检验的基本原理
反映实际频数与理论频数的吻合程度可用统计量
A
T T
2
来表示
案例分析
某医院采用甲乙两种方法测定60例结核杆菌阳性率, 如下图。试问这两种检测方法阳性率是否相同。
测定方法 阳性数 阴性数 合计
阳性率
甲法
42
18
60
70.0%
乙法
23
37
60
38.3%
合计
65
55
120
54.2%
错误的方法
根据2*2四格表卡方检验方法进行 可求得 2 =12.62, p<0.001;
2
(ad bc)2n
(a b)(a c)(bd )(c d )
c2
(
29 26 5 2 42
2 5 )( 26 9 )( 2 26 )( 5
9
)
5.49
x2,1 3.84
P 0.05
结论与之相反。
配对四格表资料的 χ2 检验
与计量资料推断两总体均数是否有差别有成组设 计和配对设计一样,计数资料推断两个总体率(构 成比)是否有差别也有成组设计和配对设计,即四 格表资料和配对四格表资料。
若检验假设H0:π1=π2成立,四个格子的实际频 数A与理论频数T 相差不应该很大,即统计量不
应该很大。如果上述统计量值很大,从而怀疑H0 的正确性,继而拒绝H0,接受其对立假设H1,即 π1≠π2 。
这个统计量就称为卡方统计量。
假设检验
本的取值,按一定原则进行检验,然后作出接受或拒绝所作假设
的决定. 参数假设检验:对总体分布中参数做假设。 分类: 分布假设检验:对总体分布做假设。
假设检验的过程
提出假设
我认为人口的平 均年龄是50岁
作出决策 拒绝假设
别无选择!
总体
抽取随机样本
均值 x = 20
一、引例
X 68 可以确定一个常数c 使得 P c 3.6 / 6
取 0.05,则
c z z0.025 1.96
2
X 68 1.96 由 3 .6 6
X 69.18或 X 66.824
即区间( ,66.824 )与( 69.18 , + )为检验的拒绝域
2 设 X 1 , , X n是取自正态总体 N , 的一个样本, 其中 , 2 都是未知参数。
具体步骤:
(1)先考虑假设检验问题
H 0 : 0
H1 : 0
(2)选择检验统计量,在此处,由于, 2 未知,所以用总
1 n ( X i X ) 2 来代替,则采用 体方差 2 的无偏估计 S n 1 i 1
这是小概率事件 ,一般在一次试验中是不会发生的, 现一 次试验竟然发生, 故认为原假设不成立, 即该批产品次品 率 p 0.04 , 则该批产品不能出厂.
1 P (1) C12 p1 (1 p)11 0.306 0.3 12
这不是小概率事件,没理由拒绝原假设,而接受原假设, 即该批产品可以出厂. 注1 直接算 1 / 12 0.083 0.04
0.01 0.05,0.1 ,
应用统计学7假设检验
应用统计学第九章假设检验朱佳俊博士Applied Statistics 第一节假设检验的基本问题一、假设检验的基本概念对总体的概率分布或分布参数作出某种“假设”,根据抽样得到的样本观测值,运用数理统计的分析方法,检验这种“假设”是否正确,从而决定接受或拒绝“假设”,这就是本章要讨论的假设检验问题。
1、假设定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。
是对总体参数的一种假设。
常见的是对总体均值或比例和方差的检验;在分析之前,被检验的参数将被假定取一确定值。
2、假设检验(hypothesis test)(1)概念–事先对总体参数或分布形式作出某种假设–然后利用样本信息来判断原假设是否成立(2)类型–参数假设检验–非参数假设检验(3)特点–采用逻辑上的反证法–依据统计上的小概率原理... 因此我们拒绝假设 =20... 如果这是总体的真实均值样本均值μ= 50抽样分布H0这个值不像我们应该得到的样本均值...203、假设检验的基本思想小概率原理是假设检验的基本依据,即认为小概率事件在一次试验中几乎是不可能发生的。
当进行假设检验时,先假设H 0正确,在此假设下,若小概率事件A出现的概率很小,例如P (A )=0.01,经过取样试验后,A 出现了,则违反了上述原理,我们认为这是一个不合理的结果。
4、小概率原理5、原假设和备择假设(1)原假设(null hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H 1–H 1 :μ<某一数值,或μ>某一数值–例如, H 1 :μ< 10cm ,或μ>10cm(2)备择假设(alternative hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H1–H1 :μ<某一数值,或μ>某一数值–例如, H1 :μ< 10cm,或μ>10cm6、双侧检验与单侧检验(1)备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test)(2)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)–备择假设的方向为“<”,称为左侧检验–备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验(假设的形式)单侧检验H1: μ> μ0H1:μ< μ0H1: μ≠μ0备择假设H: μ≤μ0H: μ≥μ0H: μ= μ0原假设右侧检验左侧检验双侧检验假设二、假设检验中的两类错误与显示性水平1、假设检验中的两类错误(1)第Ⅰ类错误(弃真错误)–原假设为真时拒绝原假设–第Ⅰ类错误的概率记为α•被称为显著性水平(2)第Ⅱ类错误(取伪错误)–原假设为假时未拒绝原假设–第Ⅱ类错误的概率记为β(Beta)2、显著性水平(significant level)(1)是一个概率值(2)原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域(3)表示为α(alpha)–常用的α值有0.01, 0.05, 0.10(4)由研究者事先确定三、检验统计量与拒绝域(一)检验统计量(test statistic)1、根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2、对样本估计量的标准化结果–原假设H为真–点估计量的抽样分布点估计量的抽样标准差假设值—点估计量标准化检验统计量=3.标准化的检验统计量显著性水平和拒绝域(双侧检验)抽样分布临界值临界值α/2α/2 样本统计量拒绝H 0拒绝H 01 -α1 -置信水平显著性水平和拒绝域(单侧检验)0临界值α样本统计量拒绝H 0抽样分布1 -α置信水平(二)决策规则1、给定显著性水平α,查表得出相应的临界值z α或z α/2,t α或t α/22、将检验统计量的值与α水平的临界值进行比较3、作出决策–双侧检验:I 统计量I > 临界值,拒绝H 0–左侧检验:统计量< -临界值,拒绝H 0–右侧检验:统计量> 临界值,拒绝H 0四、利用P 值进行决策(一)什么是P 值(P -value)1、在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率–双侧检验为分布中两侧面积的总和2、反映实际观测到的数据与原假设H 0之间不一致的程度3、被称为观察到的(或实测的)显著性水平4、决策规则:若p 值<α, 拒绝H 0双侧检验的P 值α/ 2α/ 2Z拒绝H 0拒绝H 0临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值临界值α样本统计量拒绝H 0抽样分布1 -1 -α置信水平计算出的样本统计量P 值左侧检验的P 值临界值α拒绝H 0抽样分布 1 -1 -α置信水平计算出的样本统计量P 值右侧检验的P 值五、假设检验步骤1、陈述原假设和备择假设2、从所研究的总体中抽出一个随机样本3、确定一个适当的检验统计量,并利用样本数据算出其具体数值4、确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5、将统计量的值与临界值进行比较,作出决策–统计量的值落在拒绝域,拒绝H 0,否则不拒绝H 0–也可以直接利用P 值作出决策第二节一个总体参数的检验z 检验(单尾和双尾)z 检验(单尾和双尾)t 检验(单尾和双尾)t 检验(单尾和双尾)z 检验(单尾和双尾)z 检验(单尾和双尾)χ2 检验(单尾和双尾)χ2 检验(单尾和双尾)均值均值一个总体一个总体比率比率方差方差是z 检验x z nμσ−=否z 检验ns x z 0μ−=一、总体均值的检验σ是否已知小样本容量n大σ是否已知否t 检验ns x t 0μ−=是z 检验nx z σμ0−=(一)总体均值的检验(大样本)•1.假定条件–正态总体或非正态总体大样本(n ≥30)2.使用z 检验统计量σ2已知:σ2未知:)1,0(~0N nx z σμ−=)1,0(~0N nsx z μ−=1、总体均值的检验(σ2已知)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml ,标准差为5ml 。
社会统计学课后题答案(卢淑华)
《社会统计学》课程练习题〔1〕答案一、略 二、〔1〕对立事件 〔2〕互不相容事件 〔3〕互不相容事件 〔1〕对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、〔1〕极差R=1529-65=1464〔百元〕〔2〕将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q〔3〕)(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、〔1〕10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ 〔3〕该公司赢利的时机为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。
09 第九章 假设检验
解:根据题意可建立假设如下: H0:μ ≥20 kg H1:μ <20 kg 这是一个左侧检验问题,拒绝域应在抽样分布的左端。查标准正态 分布表可知,在显著性水平α =0.05下,临界值为-Zα =-1.65,即拒 绝域为(-∞,-1.65)。 由于样本均值 x 19.5 kg,总体方差σ 2=(1.5 kg)2,故检验统计 量的值为 x μ 0 19.5 20 Z 1.826 1.65 σ 1.5 n 50 即检验统计量落入了拒绝域,所以要拒绝原假设H0:μ =20 kg,转 而接受备择假设H1:μ <20 kg,即检验结果充分说明这些食品的平均净 重减少了。
例1:ProCare Industries,Ltd.曾经提供了一种称为“性别选择”的产 品,根据广告上的说法,这种产品可以使夫妇“将生一个男孩的概率增加 到85%,生一个女孩的概率增加到80%。”对于想要男孩的夫妇,“性别 选择”就装在一个蓝色的包装里,对于想要女孩的夫妇,“性别选择”就 装在一个粉色的包装里。假设我们对100对想要女孩的夫妇进行了一项实验, 他们都遵照了在“性别选择”粉色包装上描述的“户内方便使用说明”。 使用常识和非正规统计学方法来判断,如果100个婴儿中包含以下数量的女 孩,我们应该对“性别选择”的有效性得出什么结论?
前面双侧检验例子的Excel操作过程:
P值=2×0.01991631≈0.0398小于显著性水平0.05,故拒 绝原假设而选择备择假设。
(二)总体满足正态分布N(μ ,σ 2),且方差σ 2未知, 小样本(n<30)时,统计量
x μ t ~ t n 1 S n
其中,S为样本标准差 S
实际情况
决策结果
未拒绝H0 拒绝H0
原假设H0真 正确决策 第一类错误α
第二节单正态总体的假设检验
P{|T |k }
查 t 分布表得 kt / 2t0.025(8) 2.306,从而拒绝域
为 | t | 2.306. (4) 因为 x 49.9, s2 0.29, 所以
| t | x 50 0.56 2.036,| t | 0.56 2.036, s/ n
故应接受 H0 , 即以为包装机工作正常.
由此即得拒绝域为
u
x
0
/n
u / 2 ,
即
W (,u / 2 ) (u / 2 ,).
根据一次抽样后得到旳样本观察值 x1, x2 ,, xn 计 算出 U旳观察值 u, 若 u u / 2 , 则拒绝原假设 H0 ,
即以为总体均值与0 有明显差别;
若 u u / 2 , 则接受原假设 H0 , 即以为总体均值与
S/ n 故选用 T 作为检验统计量,记其观察值 t. 因为 X
是 旳无偏估计量,S 2是 2 旳无偏估计量, 当 H0
成立时,t 不应太大,当 H1 成立时,t 有偏大旳趋
势, 故拒绝域形式为
t x 0 k
s/ n
( k 待定).
对于给定旳明显性水平 , 查分布表得
k t / 2(n 1), 使 P{T t / 2(n 1)} ,
使
P{ 2
2 1
/
2
(
n
1)
或
2
2
/
2
(
n
1)}
,
由此即得拒绝域为
2
n1
2 0
s
2
2 1
/
2
(
n
1)
或
2
n1
2 0
s
2
2 1
第9章 课外练习
H0,没有充分证据表明该大学英语六级考试的及格率仍然保持在原有水平。
5.解: H 0
:
2 国产
1.75
;
H 1
:
2 国产
1.75
计算 2 统计量的实际值:
2
n
1 s 2
2 0
30 1 2
1.75
33.14
对给定的显著性水平 0.05 ,以及自由度 n-1=29,查 2 分布表,得到检验临界值:
,所以拒
绝 H0,说明该栏目设置的目标观众没有针对性。
3.解: H 0
:
2;H 1
:
2
t x 0 1.88 2 3.16 s n 0.12 10
在显著性水平 0.01下,t
n 1
t 0.01
9
2.82 。因为t t0.01 ,所以拒绝 H0
说明该厂汽车轮胎平均行驶里程与标准不相符。
(1)该批节能灯管采用新技术改造后的使用寿命与原 先相比,是否有显著性差异?
(2)该批节能灯管采用新技术改造后的使用寿命与原先相比,是否有显著性提高?
2.某电视台某栏目是针对平均年龄 65 岁的老年人,现随机抽取收看该栏目的 25 名观众进行了 调查,其平均年龄为 68 岁,样本标准差为 3 岁。假定收看该栏目观众的年龄服从正态分布,试 在显著性水平 0.05 的条件下检验该栏目设置的目标观众是否具有针对性? 3.某汽车轮胎厂生产的轮胎合格标准为平均行驶里程至少 2 万公里,现从该厂生产的一批汽车 轮胎中随机抽取 10 个,测得平均行驶里程为 1.88 万公里,标准差为 0.12 万公里。假定该汽车 轮胎行驶里程近似服从正态分布,试在显著性水平 0.01的条件下,检验该厂汽车轮胎平均 行驶里程与标准是否相符合?
假设检验
σ2
的假设检验 2 2 2 σ ≠ σ0 σ 2 =σ0 H0: ,H1: .
其中
为已知常数.检验统计量n
T=
1
2 σ0
( X i − µ ) 2 ~ χ 2 ( n) . ∑
i =1
对于给定的显著性水平 α ,拒绝域为
2 t ≤ χ 12−α / 2 (n) 或 t ≥ χ α / 2 ( n) .
.
左边检验的问题,拒绝域为
X − 1000 ~ N (0, 1) σ/ n 对于给定的显著性水平 α = 0.05, 查表得 uα = u 0.05 = 1.645 .此题是一个 u=
u ≤ −uα = −1.645 .
现在 n = 25,σ = 100,x = 950 .
u=
x − 1000
σ/ n
σ/ n
=
41.25 − 40 2 / 25
= 3.125 > 1.645,
即 u 的取值落在拒绝域中,所以在显著性水 平 α = 0.05下拒绝 H0,接受 H1,即认为这 批新推进器较以往提高了燃烧率.
第二节 单个正态总体均值 与方差的假设检验 一、方差已知时,正态总体均值的假 设检验——u 检验
µ0 .
我们用 S 2 代替 σ 2,当H0为真时,检验统计
X − µ0 T= ~ t (n − 1) . S/ n
对于给定的显著性水平 α ,拒绝域为
| t |≥ tα / 2 ( n − 1) .
上述检验统计量服从 t 分布,称这种检验为 t 检验.类似地可以进行单边检 验(见表8-1).
例2 某车间加工一种零件,要求长度为150mm, 今从一批加工后的这种零件中抽取 9 个,测得长度如 下: 147,150,149,154,152,153,148,151, 155 假设零件长度服从正态分布,问这批零件是否 合格(取 α = 0.05)? 解 这里是在总体方差 σ 2 未知的情况下,检验假设 H0: = µ 0 = 150 ,H1: ≠ 150 . µ µ 在H0成立时,检验统计量
参数假设检验
(二)总体方差未知,正态总体,小样本 总体方差未知,正态总体, 这时只能用 t 统计量进行假设检验:
t= x − µ0 s/ n ~ t (n − 1)
注: 如果总体分布也未知,则没有适当的统计量进 行假设检验,唯一的解决办法是增大样本,以使 样本均值趋向于正态分布,从而再采用Z统计量。
σ2 未知小样本均值的检验
二、假设检验的基本思想 1、假设检验采用的逻辑推理方法是反证法 、 为了检某假设是否成立,先假定它正确,然后 根据样本信息,观察由此假设而导致的结果是否合 理,从而判断是否接受原假设; 2、判断结果合理与否,是基于“小概率事件不 、判断结果合理与否,是基于“ 易发生” 易发生”这一原理的 即在一次抽样中,小概率事件不可能发生。如 果在原假设下发生了小概率事件,则认为原假设是 不合理的;反之,小概率事件没有发生,则认为原 假设是合理的。
或者说在给定置信度1-α下(比如99%):
x − µ0
(σ
n ≤ Zα 2
)
其中:µ0为所要检验的假设(这里为4cm) σ为总体标准差(这里为0.1cm)
N为样本容量(这里为100) Zα/2为置信度1-α下,标准正态分布对应的右尾 临界值
如果取置信度为0.99,则显著性水平α=0.01,对 应的临界值为Zα/2 =2.58 换言之,如果原假设为真,则样本测算值将以 99%的可能性落在[-2.58,2.58]区间内。 通过一组(实际)样本计算得:
拒绝 H0
.025
检验统计量: 检验统计量:
决策: 决策:
在 α = 0.05的水平上拒绝H0 0.05的水平上拒绝H
拒绝 H0
.025
结论: 结论:
说明该机器的性能不好
-2.262
第九章 假设检验
五、双侧检验与单侧检验
(一)假设的形式
研究的问题
假设 双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
0 < 0
0 > 0
(一)双侧检验 1、原假设与备择假设的确定
例如,某种零件的尺寸,要求其平均长度为10 厘米,大于或小于10厘米均属于不合格 建立的原假设与备择假设应为 H0: 10 H1: 10
(2)提出备择假设: H1: 4
4、显著性水平与拒绝域 抽样分布
拒绝域 /2
置信水平
拒绝域
1-
/2
接受域
H0值 样本统计量
临界值
临界值
抽样分布
拒绝域 /2 1- 接受域 H0值
置信水平 拒绝域
/2
临界值
临界值
样本统计量
抽样分布
拒绝域 /2 1- 接受域 H0值
置信水平
拒绝域 /2
•
当概率足够小时,可以作为从实际可能
性上,把零假设加以否定的理由。因为根据
这个原理认为:在随机抽样的条件下,一次
实验竟然抽到与总体参数值有这么大差异的
样本,可能性是极小的,实际中是罕见的,
几乎是不可能的。
四、假设检验中的两类错误
(一)第一类错误(弃真错误)
1、原假设为真时拒绝原假设 2、第一类错误的概率为
(四)计算检验统计量的值 (五)作出统计决策
1、计算检验的统计量 2、根据给定的显著性水平,查表得出相应 的临界值Z或Z/2 3、将检验统计量的值与 水平的临界值进 行比较 4、得出拒绝或不拒绝原假设的结论
显著性水平与拒绝域 抽样分布
拒绝域 /2
置信水平
拒绝域
第9讲 一个总体参数的假设检验
2.
检验统计量
已知: z
2
x 0
n
~ N (0,1)
2 未知:t x 0 ~ t ( n 1) s n
总体均值的检验
(例题分析)
【例】一种汽车配件的平均长度要求为 12cm ,高于
或低于该标准均被认为是不合格的。汽车生产企业在 购进配件时,通常是经过招标,然后对中标的配件提 供商提供的样品进行检验,以决定是否购进。现对一 个配件提供商提供的10个样本进行了检验。假定该供 货商生产的配件长度服从正态分布,在 0.05的显著性 水平下,检验该供货商提供的配件是否符合要求?
决策:
拒绝H0
结论:
0
-2.33
z
新机床加工的零件尺寸的平均误 差与旧机床相比有显著降低
总体均值的检验( 2 未知)
(例题分析)
【 例 】 某 一 小 麦 品 种 的 平 均 产 量 为 5200kg/hm2 。一家研究机构对小麦品
种进行了改良以期提高产量。为检验改 良后的新品种产量是否有显著提高,随 机抽取了36个地块进行试种,得到的样 本平均产量为 5275kg/hm2 ,标准差为 120/hm2 。试检验改良后的新品种产量 是否有显著提高? (=0.05)
右侧检验
总体均值的检验( 2 未知)
(例题分析)
5200 H1 : > 5200 = 0.05
H0 :
检验统计量:
z
5275 5200 120 36
3.75
= 36 临界值(c):
n
决策:
拒绝H0 0.05
拒绝H0 (P = 0.000088 < = 0.05)
假设检验
第一节 假设检验的基本原理 第二节 单个正态总体的假设检验 第三节 两个正态总体的假设检验
第一节:假设检验的基本原理
一、基本概念 假设检验是统计推断的另一种重要形式,
其任务是通过样本对未知的总体分布特征作 出合理的推测。
先对总体分布中的某些参数或对总体分布类 型做某种假设,然后根据样本值做出接受还 是拒绝所做假设的结论。
例如 若H0 : m = m0, 则H1 有以下三种情况: (1) H0 : m = m0, H1: m m0 (2) H0 : m = m0, H1 : m > m0 (3) H0 : m = m 0, H1 : m < m0
其中(1)称为双边检验.
其中(2), (3)称为单边检验.
第二步:选取一个合适的检验统计量,并根据原假设 H0和备择假设 H1 确定H0的拒绝域.
0.05 6
因为4.9>1.96 ,即观测值落在拒绝域内
所以拒绝原假设。
二 当2未知时, 均值m的检验(t检验)
1 (双边检验) H0: m = m0 H1: m m0
此时2未知, 不能用
U
X
m0
n
用
T
X
m0
S
n
当H0成立时,
T
X m0
S
~ t(n 1)
n
因此, 对给定的, 查t分布表, 使
X
m0
~ N(0, 1)
n
当H0 成立时, u的值不应太大.
而当H1 成立时, u的值往往偏大.
因此, P{uu}=
于是得到H0的拒绝域为 (u, )
类似地, 若检验的假设是
二元假设检验的检验步骤
二元假设检验的检验步骤二元假设检验是统计学中一种重要的方法,用于判断两个样本的均值、比例或者方差是否存在显著差异。
这种假设检验方法通常包含五个关键步骤,下面将逐一介绍这些步骤。
步骤一:确定原假设和备择假设在进行二元假设检验之前,我们首先需要确定原假设(H0)和备择假设(H1)。
原假设是我们希望证伪的假设,而备择假设则是我们希望得到支持的假设。
这两个假设通常使用符号表示,例如H0代表原假设,H1代表备择假设。
步骤二:确定显著性水平显著性水平(α)是我们用来判断原假设是否成立的标准。
常见的显著性水平包括0.05和0.01,分别代表5%和1%的错误接受原假设的风险。
我们需要根据实际情况来选择适当的显著性水平。
步骤三:计算检验统计量在二元假设检验中,我们需要计算一个检验统计量,该统计量用于衡量样本数据与原假设的偏离程度。
具体的计算方法取决于所使用的检验方法和假设类型。
例如,对于均值的检验,可以使用t检验,而对于比例的检验,可以使用z检验。
步骤四:确定拒绝域拒绝域是在给定显著性水平下,用于决定是否拒绝原假设的区域。
拒绝域的确定需要根据具体的检验方法和假设类型进行计算。
通常,拒绝域位于检验统计量的临界值两侧。
如果检验统计量落在拒绝域内,我们就拒绝原假设。
步骤五:进行假设检验和做出决策在完成前面的步骤后,我们可以进行假设检验并做出决策。
具体的假设检验方法取决于问题的性质和样本的大小。
假设检验的结果可以分为两种情况:拒绝原假设或者接受原假设。
根据实际情况,我们可以做出相应的决策。
需要注意的是,假设检验并不能给出绝对的结论,它只是根据样本数据对总体的假设进行推断。
在进行假设检验时,我们应该根据实际情况来选择适当的检验方法,并严格按照上述步骤进行。
此外,我们还应该对结果进行适当的解释和讨论,以便更好地理解和应用统计结果。
总结起来,二元假设检验是一种常用的统计方法,它可以帮助我们判断两个样本的差异是否显著。
在进行二元假设检验时,我们需要确定原假设和备择假设,选择适当的显著性水平,计算检验统计量,确定拒绝域,并根据检验结果做出决策。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(σ12、 σ22未知但相等)
3.
检验统计量 (x1 − x2 ) − (µ1 − µ2 ) 2 2 t= (n1 −1)s1 + (n2 −1)s2 2 1 1 Sp = 其中: 其中: + sp n1 + n2 − 2 n1 n2
(三)两总体均值差的 t 检验 三 两总体均值差的
2 2 2 未知, 两总体方差 σ12 和σ2 未知,但 σ1 ≠ σ2
2 2 不能合并方差,需要单独计算: 因为 σ1 σ
2 用 2 , s2 = SS2 代替 1 n2 −1
σ
t= 2 。 2 于是有统计量
SS1 n1 −1 (x1 − x2 ) −(µ1 − µ2 )
2 2 s1 s2 + n1 n2
分布,但自由度需要矫正,矫正公式为: 近似服从 t 分布,但自由度需要矫正,矫正公式为:
A B
> D0
P −P <D
A B
0
双边: P − P
A
B
≠ D0
3、统计量: 4、拒绝域: 单右:z >
z=
∧ ∧ P A − P B − Do
p •q n
A A
A
+
p •q n
B B
B
z
a
; 单左: < − z
z
a
; 双边:z > z a
2
且 z < − za
•例:甲、乙两公司属于同一行业,现调查工人愿意增 例 乙两公司属于同一行业, 加福利还是工资。在甲公司150名工人中有75 150名工人中有75人愿意 加福利还是工资。在甲公司150名工人中有75人愿意 增加工资,乙公司200名工人中有103人愿意增加工资, 200名工人中有103人愿意增加工资 增加工资,乙公司200名工人中有103人愿意增加工资, 的显著性水平下, 在 的显著性水平下,可以判断这两个公司中 α = 0.01 愿意增加工资的工人所占比例不同吗? 愿意增加工资的工人所占比例不同吗?
二、大样本总体成数差检验
二项总体A与B,其总体成数分别为: A:PA; B:PB。
∧ A
二总体中各抽一随机样本,且有A:
P
∧
An;
B: Bn。 P
B
nA、nB足够大, PA 、 B 趋向正态分布。 P
∧
∧
大样本成数差检验的步骤
1、原假设
H
0
: P −P
A
1
B
= D0
2、备择假设: H 单边: P − P
2 2
0
3、统计量: 单边: = F
s ( > ) 或 F = sB ( 2 < 2 ) s s sB 2 sA s 2 sA sA ( 2 > 2 ) 双边: F = 2 s A s B sB 4、拒绝域 F>F F>F 单边: 双边:
2
2
A 2 B
2
2
A
B
α
α
2
分子自由度 K 1 = n A − 1
解:
H0
µA ≥ µB
H1
µA < µB
左端检验
− z0.05 = −1.645
( x1 − x2 ) − ( µ1 − µ 2 ) ( 33 − 49) − 0 z= = = −4.0 2 2 900 1050 s1 s2 + + 100 150 n1 n2
例2: 甲、乙两县,调查农户养殖业收入: 甲县:调查1000户 平均收入505元 标准差50元 乙县:调查800户 平均收入520元 标准差40元 问哪个县收入更高一些?(α=0.05)
A B 2 B B
σ +σ
n
A
~~
N (0, 1)
其余检验步骤与前同
n
(二)两总体均值差的 t 检验 两总体均值差的
1. 2.
检验具有等方差的两个总体的均值 假定条件
两个样本是独立的随机样本 两个总体都是正态分布 两个总体都是正态分布 两个总体方差未知但相等σ 两个总体方差未知但相等σ12 = σ22
df ′ = 1 k2 (1− k)2 + df1 df2
2 s1 / n1 = 2 2 2 sx1 + sx2 s1 / n1 + s2 / n2
1
2 其中 k = sx 2
利用此分布, 利用此分布,可对总体均值差 µ1- µ2 进行测验
例: 设两总体正态分布且方差相等。 n=8 甲: x = 20 . 1 s = 0.17 2 乙: x = 19 . 8 n=6 s = 0.14 问:两总体平均值有无明显差异?(α=0.05)
H0
ˆ p1 =
p1 − p0 = 0
H1
p1 − p0 ≠ 0 75 + 103 p= = 0.509 150 + 200
75 = 0.5 150
103 ˆ p = = 0.515 2 200
z= − zα
0.50 − 0.515 1 1 ) 0.509 × (1 − 0.509) × ( + 150 200 = −2.58
拒绝域 α
结论: 结论: 没有证据表明乙厂工人参加技
术培训的人数比例高于甲厂
-1.645
0
Z
z=
ˆ ˆ ( p1 − p2 ) − ( p1 − p2 ) p1 (1 − p1 ) p2 (1 − p2 ) + n1 n2
x1 + x2 p= n1 + n2
ˆ ˆ ˆ ˆ ( p1 − p2 ) − ( p1 − p2 ) ( p1 − p2 ) − ( p1 − p2 ) = z= p (1 − p ) p (1 − p ) 1 1 + p (1 − p )( + ) n1 n2 n1 n2
第一节
引
言
一、社会现象研究多涉及两个或两个以上概念 两个或两个以上概念 间的关系 1、代际职业流动中,父辈与子辈职业关系 2、文化程度与收入 3、年龄与娱乐的爱好 4、个人品格与文化成就 等等
二、根据变量的不同层次有不同的研究方法 两变量的二维矩阵
y 二分 定类 定序 定距(定比) 定距(定比) x 二分变量 本章 10章(列联) 14(非参数) 11(等级相 关) 13(方差分析) 12(回归与 相关) 定类 定序 定距(定比) 定距(定比) 本章
两个总体成数差的Z检验(计算结果)
H0: P1- P2 ≥ 0 检验统计量: 检验统计量: H1: P1- P2 < 0 ˆ ˆ (P − P2) −(P − P2) 0.30−.035−0 1 1 z= = = −0.52 α = 0.05 ˆ ˆ ˆ ˆ P(1− P) P2(1− P2 ) 0.30(1−030) + 0.35(1−0.35) 1 1 + n1 = 60,n2 = , 60 80 n1 n2 80 决策: 接受H 决策: 接受H0 临界值(s): 临界值
2
= −0.278
小样本二总体(正态) 第三节 小样本二总体(正态)假设检验
一、小样本总体均值差检验
两总体A、B分别满足正态分布: ξ A ~~ N (µ ,σ ) ξ B ~~
2 A A
N
(µ ,σ )
2 B B
2 (一)、 σ 2 σA B
为已知, 统计量:
(x z=
A
− xB −
2 A
) (µ − µ )
2
t < tα
t < −tα
2
配对样本的 t 检验(例子)
一个以减肥为主要目标的健美俱乐部声称, 【 例 】 一个以减肥为主要目标的健美俱乐部声称, 参加其训练班至少可以使减肥者平均体重减轻8.5公 参加其训练班至少可以使减肥者平均体重减轻 公 斤以上。为了验证该宣称是否可信, 斤以上。为了验证该宣称是否可信,调查人员随机抽 取了10名参加者 得到他们的体重记录如下表: 名参加者, 取了 名参加者,得到他们的体重记录如下表:
第九章 二总体假设检验
第一节 第二节 第三节 第四节 引 言 大样本二总体假设检验 小样本二总体假设检验 配对样本的比较
两个总体的参数检验
两个总体的检验 均值
独立样本 配对样本
成数
方差
Z 检验
(大样本 大样本) 大样本
t 检验
(小样本 小样本) 小样本
t 检验
(小样本 小样本) 小样本
Z 检验
F 检验
三、独立样本与配对样本
1、独立:从两个总体中各抽取一个随机样本进 行比较和研究 2、配对:在一个样本中,每个样本先后观测两 次。先观测的为第一总体,后观测的为第二 总体。或通过随机分配产生两个配对样本。
第二节 大样本二总体假设检验
一、样本总体均值差检验
两个总体:A与B 参数为A: A σ µ 样本容量足够大(≥50), x 大样本均值差检验的步骤: 1、原假设 H :µ − µ
2
二、小样本二总体方差比的检验
设有两总体A与B,满足正态分布: 总体A: N
2 A
2 A A B
(µ ,σ ) 总体B:N (µ ,σ )
2 B
从两总体中分别独立各抽取一个随机样本, 总体A:
s
2
;
n
A
A
总体B:
s
2 B
;
n
B
根据抽样分布的讨论有
n n
σ
2 B
A
−1
2 A
sA ~
2 B
x (n
2 2 B
2
例4:一个200家甲型企业组成的随机样本表 明,12%的企业广告费用占总销售额的1%以 上,由同等数量的乙型企业组成的另一个独 立随机样本表明,15%的企业广告费用占总 销售额1%以上,问:能否认为甲型企业广告 费低于乙型企业?(α=0.05)