(08)第8章 假设检验
概率论与数理统计第8章(公共数学版)

P (弃真)
P(拒 绝H0
|
H
为
0
真)
P(
A
|
H
为
0
真)
小概率事件发生的概率就是犯弃真错误的概率
越大,犯第一类错误的概率越大, 即越显著. 故在检验中,也称为显著性水平
20
2.第二类错误:纳伪错误
如
果
原
假
设H
是
0
不
正
确
的, 但
却
错
误
地
接
受
了Hቤተ መጻሕፍቲ ባይዱ
0
此时我们便犯了“纳伪”错误,也称为第二类错误
统计量观测值 u 57.9 53.6 2.27 6 10
该批产品次品率 p 0.04 , 则该批产品不能出厂.
11
若从一万件产品中任意抽查12件发现1件次品
p 0.04 代入
取 0.01,则 P12(1) C112 p1(1 p)11 0.306 0.01
这不是小概率事件,没理由拒绝原假设,从而接受 原假设, 即该批产品可以出厂.
13
例2 某厂生产的螺钉,按标准强度为68/mm2, 而实际
称其中的一个为原假设,也称零假设或基本假设 记 为H0 称另一个为备择假设,也称备选假设或对立假设 记为H1 一般将含有等号的假设称为原假设
7
二、假设检验的基本原理
假设检验的理论依据是“小概率原理” 小概率原理:如果一个事件发生的概率很小,那么在一 次实验中,这个事件几乎不会发生. 如: 事件“掷100枚均匀硬币全出现正面”
(三)对给定(或选定)的显著性水平 ,由统计
量的分布查表确定出临界值,进而得到H0的拒绝域 和接受域.
第8章_假设检验8.4_置信区间与假设检验之间的关系

例1 设 X ~ N ( , 1), 未知, 0.05, n 16,
且由一样本算得 x 5.20 ,
于是得到参数 的一个置信水平为 0.95 的置信 1 1 区间 ( x z0.025 , x z0.025 ) 16 16
(5.20 0.49, 5.20 0.49) (4.71, 5.69 ).
反之 ,为要求出参数 的置信水平为 1 的 置信区间 ,
要先求出显著水平为 的检验假设
H 0 : 0 , H1 : 0 , 的接受域 : 0
( , ) 是参数的一个置信水平为1 的置信区间
2. 置信区间与单边检验之间的对应关系
(1)置信水平为 1 的单侧置信区间
(, ) 与显著水平为 的左边检验问题 H 0 : 0 , H1 : 0 有类似的对应关系.
若已求得单侧置信区间 (, ),
则当 0 (, ) 时接受 H0 ;
当 0 (, ) 时拒绝 H0 .
第四节 置信区间与假设检验之间 的关系
一、置信区间与双边检验之间的对应关系 二、 置信区间与单边检验之间的对应关系 三、小结
区间估计与假设检验的联系
1.区间估计与假设检验都是根据样本信息对总体参 数进行推断,都是以抽样分布为理论依据,都是 建立在概率基础上的推断,推断结果都有一定的 可信程度或风险。 2.对同一问题的参数进行推断,二者使用同一样本、 同一统计量、同一分布,因而二者可以相互转换。 区间估计问题可以转换成假设问题,假设问题也 可以转换成区间估计问题。区间估计中的置信区 间对应于假设检验中的接受区域,置信区间以外 的区域就是假设检验中的拒绝域。
单侧置信区间 (4.79, ), 单侧置信下限 4.79.
(08)第8章 假设检验

是大样本还是小样本 总体方差已知还是未知
3. 检验统计量的基本形式为 X 0 Z n 8 - 13
作者:徐刚,河南城建学院数理系
统计学
STATISTICS
规定显著性水平
(significant level)
(第五版)
什么是显著性水平? 1. 是一个概率值
2. 原假设为真时,拒绝原假设的概率
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明这批灯泡的使用 寿命有显著提高
作者:徐刚,河南城建学院数理系
8 - 36
0
1.645
Z
统计学
STATISTICS
2 未知大样本均值的检验
(例题分析)
单侧检验
(第五版)
【例】某电子元件批量生产的 质量标准为平均使用寿命 1200 小时。某厂宣称他们采用一种 新工艺生产的元件质量大大超 过规定标准。为了进行验证, 随机抽取了 100 件作为样本, 测得平均使用寿命 1245 小时, 标准差 300 小时。能否说该厂 生产的电子元件质量显著地高 于规定标准? (=0.05)
(第五版)
拒绝
1/2 P 值
临界值
计算出的样本统计量
8 - 18
H0值
临界值
Z
计算出的样本统计量
作者:徐刚,河南城建学院数理系
统计学
STATISTICS
左侧检验的P 值
置信水平
(第五版)
抽样分布
拒绝域
1-
P值
临界值 计算出的样本统计量 8 - 19
H0值
样本统计量
作者:徐刚,河南城建学院数理系
左侧检验时,P-值为曲线上方小于等于检 验统计量部分的面积 右侧检验时,P-值为曲线上方大于等于检 验统计量部分的面积
统计学第8章假设检验

市场调查中常用的假设检验方法包括T检验、Z检验和卡方 检验等。选择合适的检验方法需要考虑数据的类型、分布 和调查目的。例如,对于连续变量,T检验更为适用;对于 分类变量,卡方检验更为合适。
医学研究中假设检验的应用
临床试验
在医学研究中,假设检验被广泛应用于临床试验。研究 人员通过设立对照组和实验组,对不同组别的患者进行 不同的治疗,然后收集数据并使用假设检验来分析不同 治疗方法的疗效。
03 假设检验的统计方法
z检验
总结词
z检验是一种常用的参数检验方法,用于检验总体均值的假设。
详细描述
z检验基于正态分布理论,通过计算z分数对总体均值进行检验。它适用于大样本 数据,要求数据服从正态分布。z检验的优点是简单易懂,计算方便,但前提假 设较为严格。
t检验
总结词
t检验是一种常用的参数检验方法,用于检验两组数据之间的差异。
卡方检验
总结词
卡方检验是一种非参数检验方法,用于 比较实际观测频数与期望频数之间的差 异。
VS
详细描述
卡方检验通过计算卡方统计量来比较实际 观测频数与期望频数之间的差异程度。它 适用于分类数据的比较,可以检验不同分 类之间的关联性。卡方检验的优点是不需 要严格的假设前提,但结果解释需谨慎。
04 假设检验的解读与报告
详细描述
t检验分为独立样本t检验和配对样本t检验,分别用于比较两组独立数据和同一组数据在不同条件下的 差异。t检验的前提假设是小样本数据近似服从正态分布。t检验的优点是简单易行,但前提假设需满 足。
方差分析
总结词
方差分析是一种统计方法,用于比较两个或多个总体的差异。
详细描述
方差分析通过分析不同组数据的方差来比较各组之间的差异。它适用于多组数据的比较,可以检验不同因素对总 体均值的影响。方差分析的前提假设是各组数据服从正态分布,且方差齐性。
管理定量分析课程第8章:假设检验

判决
无罪 有罪
陪审团审判
真实的情况
无罪
有罪
判决正确
判决错误
判决错误
判决正确
结论
未拒绝原假设 拒绝原假设
假设检验 总体参数的实际情况
原假设为真 备择假设为真 结论正确 第二类错误 第一类错误 结论正确
11
假设检验中犯Ⅰ型错误的概率,称为显著性水平(level of significance),即指当零假设实际上是正确时,检验统计量落
7
又如:教育部要检验2012年录取的大学新生平均身高是否 达到了170cm标准,这样需要提出原假设(H0):2012
年大学新生(总体)的平均身高(µ )是170cm。为了检
验这个假设是否正确,需要根据随机取样的原则,从2012 年的大学新生总体中选取样本并计算样本的平均高度,以 此来检验原假设的正确性。
8
假设检验一般分为参数假设检验和非参数假设检验两种类型。参 数假设检验对变量的要求较为严格,适合于等距变量和比率变量 ,非参数假设检验对变量的要求较为自由,既适合于等距变量和 比率变量,也适用于类别变量和顺序变量。
变量测量层次
分类(nominal)变 量
数学性(interval)变量
4
一、假设与假设检验
假设是科学研究中广泛应用的方法,它是根据已知理 论与事实对研究对象所作的假定性说明。统计学中的 假设一般专指用统计学术语对总体参数所做的假定性 说明。在进行任何一项研究时,都需要根据已有的理 论和经验事先对研究结果作出一种预想的假设。这种 假设叫科学假设,在统计学上称为研究假设。对这种 研究假设进行证实或证伪的过程叫假设检验。
非参数检验是一种与总体分布状况无关的检验方法,它不 依赖于总体分布的形式。
第8章假设检验含答案

5.在假设检验中,拒绝实际上不成立的H0假设是( ) 。
A、 犯第I类错误 B、 犯第II类错误 C、 推断正确 D、 A,B都有可能
答案:C
6.α=0.05, t>t0.05,ν,统计上可认为()。
A、两总体均数差别无显著意义 B、两样本均数差别无显著意义
C、两总体均数差别有显著意义D、两样本均数差别有显著意义
答案:A
3.在假设检验中,由于抽样偶然性,接受了实际上不成立的H0假设,则( )。
A、 犯第I类错误 B、 犯第II类错误 C、 推断正确 D、 A,B都有可能
答案:B
4.在假设检验中,接受了实际上成立的H0假设,则( )。
A、 犯第I类错误 B、 犯第II类错误 C、 推断正确 D、 A,B都有可能
9.假设检验中,显著性水平表示()。
A、P{接受 | 为假} B、P{拒绝 | 为真}
C、置信度为D、无具体含义
答案:B
11.在对总体参数的假设检验中,若给定显著性水平(0<<1),则犯第一类错误的概率为()。
A.1-B、C、/2 D、不能确定
答案:B
12.对某批产品的合格率进行假设检验,如果在显著性水平=0.05下接受了零假设,则在显著性水平=0.01下()。
C、样本量太大容易引起检验结果显著
D、样本量太小容易引起检验结果显著
答案:BC
13.以下问题可以用Z检验的有( )。
A、正态总体均值的检验,方差已知
B、正态总体均值的检验,方差未知
C、大样本下总体均值的检验
D、正态总体方差的检验
答案:AC
14.对总体均值进行检验,影响检验结论的因素有( )
A、显著性水平B、样本量n
第8章假设检验

24
6.假设检验的统计结论是根据原假设进行阐述的,
要么拒绝原假设,要么不拒绝原假设 • 当我们不能拒绝原假设时,我们不能说“接受 原假设”,因为我们没有证明原假设是真(如 果用“接受”则意味证明了原假设是正确的), 只不过我们没有足够的证据拒绝原假设,因此 不能拒绝原假设。当我们拒绝原假设时,得出 结论是清楚的。
拒绝原假设
小概率原理:小概率事件在一次试验中几乎不会发生 小概率的标准:与一个显著性水平a 有关, 0<a <1
13
四、假设检验的过程
提出假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策
14
五、 原假设和备则假设
15
五、 原假设和备择假设
(一)原假设(null hypothesis)
我认为这种新药比原有 的药物更有效!
总体参数包括总体均 值、比例、方差等 分析之前必需陈述
如 产品合格率在80%以 上等。
9
二、什么是假设检验?
1.
2.
3.
一个假设的提出总是以一定的理由为基础,但 这些理由是不是完全充分的,要进行检验,即 进行判断。如在某种新药的研发中,研究者要 判断新药是否比原有药物更有效;海关人员对 进口货物进行检验,判断该批货物的属性是否 与申报的相一致。 假设检验就是先对总体的参数提出某种假设(原 假设和备择假设),然后利用样本信息判断假设 是否成立的过程 逻辑上运用反证法,统计上依据小概率原理
绝的却是一个真实的假设,采取的是错误行为。
31
二、显著性水平a
(significant level)
1.
2.
3.
4.
第8章 假设检验

例 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的 和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的 频数将以比例9:3:3:1发生。在检验这个理论时,孟德 尔分别得到频数315、101、108、32、这些数据提供充分 证据拒绝该理论吗?
P PH0 | Z || z0 | 2PH0 Z | z0 | 2(1 (| z0 |))
(即z0代替了拒绝域式中的z 2 )
判断:当P小于显著水平时,拒绝原假设,
否则,接受: 0, H1 : 0 , 其中0是已知的常数
以X 作为的参考, 若H0为真,X比0大些,但
这个批次清漆的干燥时间构成的总体方差可设 2 0.36 而其均值是要求我们检验的!
经计算,现抽取的9个数据的平均值x 6.4小时,
现在的问题是,我们能否认为 "6.4 6.0 0" ?
即,接受以下哪个假设?
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
4
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
16
*另外方法:若给定显著性水平, 当原假设成立时
( 0),总体X ~ N (0, 2 ),因此,X ~ N (0, 2 n )
P0 ( X 0
k)
P 0
(
X
0
n
k
设
)
n
k
n z /2
k z/2 n
1
一般,H
的拒绝域写为:
第8章假设检验

完成生产线上某件工作的平均时间为15.5分钟,标准差为3分 钟。对随机抽选的9名职工讲授一种新方法,训练期结束后这9名 职工完成此项工作的平均时间为13.5分钟。这个结果是否说明用 新方法所需时间比老方法所需时间短?设������ = 0.05,并假定完成 这件工作的时间服从正态分布。
①建立假设:������0 : ������ = 15.5, ������1 : ������ < 15.5 ②因为正态总体,方差已知,故可选用������ 检验,选择检验统计 ¯ −������0 √ ;当������0 成立时,������ ∼ ������ (0, 1)。 量������ = ������ ������/ ������ ③根据对立假设及显著性水平������ = 0.05知:拒绝域 为{������ < −������������ } = {������ < −������0.05 } = {������ < −1.64} ¯ = 13.5,������0 = 15.5, ������ = 3, ������ = 9, 因此 ④由样本信息,得到������ ������ = ¯ − ������0 13.5 − 15.5 ������ √ = √ = −2. ������/ ������ 3/ 9
������0 : ������1 = ������2 , ������1 : ������1 < ������2 Excel计算结果如下:
������ = −2.41347279,拒绝域 为{������ < −������0.05 (33) = −1.692360258}。
例3-1-5:“多吃谷物,将有助于减肥。”为了验证这个假设, 随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的 食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类 为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取 量。经过一段时间的实验,得到如下结果。假设总体正态,试 以������ = 0.05 的显著性水平进行检验,数据见工作表“3-1-5”。 ������0 : ������1 = ������2 , ������1 : ������1 < ������2
第8章 平均数的假设检验

重点
• 根据样本平均数的抽样分布,可以对总体 平均数进行差异显著性检验,需考虑总体 方差是否已知,总体是否服从正态分布, 是大样本还是小样本等问题。
• 根据两个独立样本平均数之差的抽样分布, 可以检验两个总体的平均数有无显著差异, 需考虑两总体的方差是否已知,两总体是 否服从正态分布,方差是否齐性,是大样 本还是小样本等问题。
• 显著性水平和可靠性程度(置信水平)之间 的关系是:两者之和为1。
双侧检验与单侧检验
• 双侧检验(two-tailed test,twosided test):将α等分为左右两个部分,
左右两边各设置一个拒绝域,中间是接受域。 每个拒绝域相应的概率为α/2. 零假设为无显著 差异的情况;
• 单侧检验(one-tailed test):要么将与α
– 备择假设(alternative hypothesis,或称 研究假设、对立假设),用H1表示。
假设检验是从零假设出发,视其被拒绝的概 率,从而得出决断。
假设检验的步骤
• 2.确定适当的检验统计量并计算其值
• 确定检验统计量时,要根据抽样分布做出 选择。不同类型的问题涉及到的抽样分布 不同,要选择不同的检验统计量。
假设检验的基本思想
设(X1,X2,…,Xn)
是抽自正态分布总体 X~N(μ, σ2)的一个容 量为n的简单随机样 本,则其样本均值也 是一个正态分布随机 变量,且有
E(X) X
D(
X
)
2 X
2
n
X ~ N(, 2 )
n
Z X ~ N (0,12 ) / n
假设检验
08章 假设检验习题及答案

第八章假设检验1、原假设与备选假设一定是对应的关系。
()是: 否: 2、假设检验中犯1类错误的后果比犯2类错误的后果更为严重。
()是: 否: 3、显著性水平越小,犯检验错误的可能性越小。
()是: 否: 4、假设检验一般是针对错误的抽样推断做的。
()是: 否: 5、对总体成数的检验一般采用Z检验法为好。
()是: 否:1、下面有关小概率原则说法中正确的是()。
小概率原则事件就是不可能事件它是指当一个事件的概率不大于充分小的界限α(0<α<1)时,可认为该事件为不可能事件基于”小概率原则”完全可以对某一事件发生与否作出正确判断总体推断中可以不予考虑的事件2、假设检验中的1类错误也叫()。
弃真错误纳伪错误假设错误判断错误3、如果是小样本数据的均值检验,应该采用()。
t 检验z 检验秩符检验以上都不对4、如果检验总体方差的显著性,应采用哪种检验方法?()。
t 检验Z 检验X2检验以上都对、 一个优良的统计量通常要符合( )标准。
无假性一致性有效性完整性随机性2、在统计检验假设中,通常要对原假设作出判断,就有可能会犯错误。
这些错误分别是( )。
1类错误(α类)2类错误(β类)功效错误 系统错误代表性错误3、 科学的抽样估计方法要具备的要素是( )。
合适的统计量抽样方法合理的误差范围可接受的置信度严格遵守随机原则1、用一台自动包装机包装葡萄糖,按规格每袋净重0.5千克。
长期积累的数据资料表明,每袋的实际净重服从正态分布,标准差为0.015千克。
现在从成品中随机抽取9袋,结果其净重分别为0.479,0.5006,0.518,0.511,0.524,0.488,0.515,0.512。
试根据抽样结果说明:(1)标准差有无变化?(2)袋糖的平均净重是否符合规格?(α=0.05)2、环境保护条例规定,在排放的工业废水中,某有害物质含量不得超过0.5‰,现在取5份水样测定有害物质含量,得到如下数据:0.53‰,0.542‰,0.51‰,0.495‰,0.515‰。
08练习题解答:第八章 单总体假设检验

第八章 单总体假设检验练习题:1. 某市去年进行的调查显示该市市民上下班花费的平均时间为75.45分钟。
今年 有两条地铁线路开通,今年某报社在全市随机抽取了60名市民对其上下班时间进行调查,调查结果如下表所示:(单位:分钟)60 60 56 48 48 70 80 70 55 70 75 65 120 60 54 54 20 50 60 60 90 58 36 80 60 68 90 58 64 64 80 40 45 58 54 50 40 58 70 58 50 48 62 64 55 36 80 40 48 66 585850386810080908865(1)请计算这60名市民今年每天上下班在公交车上花费的时间的平均数x 和标准差S 。
(2)请陈述研究假设1H 和虚无假设0H 。
(3)若显著性水平为0.05,能否认为该市市民上下班变得更加便利了。
解: (1) x 60+60++88+653700== 61.676060= ,17.10S ====(2)研究假设1H :75.45μ<虚无假设0H :75.45μ≥ (3)采用Z 检验:,===-61.6775.45 6.24x Z ,假设方向明确,采用一端(左)检定,显著性水平为0.05时,否定域 1.65Z ≤-,检验统计值(Z=-6.24<-1.65)落在否定域中,因此可以否定虚无假设,接受研究假设,也就是说在0.05的显著性水平上,该市居民上下班变得更加便利了。
2.某大学去年的调查显示,该校学生每周体育锻炼平均时间为5.2个小时,今 年在全校6000名学生中随机抽取了20名学生进行调查,得到下面的数据:(单 位:小时)5.54 3 3 3.5 2.5 5 96 4 42812768924(1)请计算这20学生每天体育锻炼时间的平均数和标准差S 。
(2)请陈述研究假设1H 和虚无假设0H 。
(3)若显著性水平为0.05,能否认为该校学生体育锻炼的时间有所增加?解:(1) 5.5426107.55.38220x ++++==== ;2.72S ====(2)研究假设1H : 5.2μ>虚无假设0H : 5.2μ≤ (3)采用小样本t 检验:df=20-1=190.288x x t SE μ-==== 假设方向明确,采用一端(右端)检验,显著性水平为0.05时否定域为 1.729t ≥, 检验统计值(t =0.028<1.729)没有落在否定域中,因此不能否定虚无假设,即在0.05的显著性水平下,不能认为该校学生体育锻炼的时间有所增加。
概率论与数理统计第8章假设检验习题及答案

62第8章 假设检验一、填空题1、 对正态总体的数学期望m 进行假设检验,如果在显著性水平0.05下,接受假设00:m m =H ,那么在显著性水平0.01下,必然接受0H 。
2、在对总体参数的假设检验中,若给定显著性水平为a ,则犯第一类错误的概率是a 。
3、设总体),(N ~X 2s m ,样本n 21X ,X ,X ,2s未知,则00:H m =m ,01:H m <m 的拒绝域为 )}1(/{0--<-n t nS X a m ,其中显著性水平为a 。
4、设n 21X ,X ,X 是来自正态总体),(N 2s m 的简单随机样本,其中2,sm 未知,记å==n1i i X n 1X ,则假设0:H 0=m 的t 检验使用统计量=T Qn n X )1(-.二、计算题1、某食品厂用自动装罐机装罐头食品,规定标准重量为250克,标准差不超过3克时机器工作 为正常,每天定时检验机器情况,现抽取16罐,测得平均重量252=X 克,样本标准差4=S 克,假定罐头重量服从正态分布,试问该机器工作是否正常?解:设重量),(~2s m N X05.016==a n 4252==S X(1)检验假设250:0=m H 250:1¹m H , 因为2s 未知,在0H 成立下,)15(~/250t nS X T -=拒绝域为)}15(|{|025.0tT >,查表得1315.2)5(025.0=¹t由样本值算得1315.22<=T ,故接受0H (2)检验假设9:20=s H9:201>s H因为m 未知,选统计量 222)1(s S n x -=在0H 成立条件下,2x 服从)15(2x 分布,拒绝域为)}15({205.02x x >,查表得996.24)15(205.0=x ,现算得966.24667.26916152>=´=x 拒绝0H ,综合(1)和(2)得,以为机器工作不正常2、一种电子元件,要求其使用寿命不得低于1000小时,现在从一批这种元件中随机抽取25 件,测得其寿命平均值为950小时,已知该种元件寿命服从标准差100=s 小时正态分布, 试在显著性水平0.05下确定这批产品是否合格. 解:设元件寿命),(~2s m N X ,2s 已知10002=s,05.0,950,25===a X n检验假设1000:0=m H1000:1<m H在2s 已知条件下,设统计量)1,0(~/1000N nX s m -=拒绝域为}{05.0mm<,查表得645.195.005.0-=-=m m而645.15.2205025/1001000950-<-=-=-=m拒绝假设0H 选择备择假设1H ,所以以为这批产品不合格.3. 对 显 著 水 平 a , 检 验假 设 H 0 ; m = m 0, H 1 ; m ¹ m 0, 问当 m 0, m , a 一定 时 , 增大样本量 n 必 能 使 犯 第 二 类 错 误 概 率 b减 少 对 吗 ?并 说 明 理 由 。
第8章假设检验

是正确的,也可以是不正确的
定义8.1.1:所谓假设检验,是先对总体的分布函数 形式或分布的某些参数作出某些可能的假设,然后 根据所得的样本数据,对假设的正确性作出判断
假
§8.1 基本概念
设
检
例8.1.1:检验一批产品的废品率是否超过0.03, 验
把“ p 0.03 ”作为一个假设,从这批产品中抽取
若干个样品,记其中所含废品数为 X
➢ 当 X 较小时,认为假设正确,或“接受”假设
➢ 当 X 较大时,则认为假设是不正确,“拒绝”
或“否定”假设
假
§8.1 基本概念
设
检
例8.1.2:判断一个硬币是否均匀,即投掷时出现 验
正面的概率是否为
1
2,
把“ p
1 2
”作为一个假设,
将硬币投掷100次,以 X 记正面出现的次数
原假设,而将新方法优于原方法取为对立假设
假
§8.1 基本概念
设
检
➢ 或者说对立假设可能是我们真正感兴趣的,接受 验
对立假设可能意味着得到某种有特别意义的结论,
或意味着采取某种重要决断
➢ 因此对统计假设作判断前,在处理原假设时总是 偏于保守,在没有充分证据时,不应轻易拒绝原假 设,或者说在没有充分的证据时不能轻易接受对立 假设
➢
例8.1.2的统计假设为:H0
:
p
1 2
H1
:
p
1 2
假
§8.1 基本概念
设
检
注:当根据抽样结果接受或拒绝一个假设时,只 验
是表明我们的一种判断;由于样本的随机性,这
样作出的判断就有可能犯错误
➢ 例如:一批产品的废品率只有0.01,因为0.01<
第8章 假设检验

关于建立假设的几点认识:
❖ 1.原假设和备择假设是一个完备事件组,且相互对 立,即必有一个成立,而且只有一个成立。
❖ 2.在假设检验中,通常将符号≤ ≥ =放在原假设上。 ❖ 3. 不同的研究者出于不同的研究目的或角度,可能
根据计算的检验统计 量与临界值进行比较, 得出拒绝或不拒绝原 假设的结论
检验统计量与拒绝域
拒绝原假设的检验统计量的所有可能取 值的集合,称为拒绝域。
若 绝对值Z临界值,拒绝原假设
拒绝域的大小与我们事先选定的显著性 水平有关。
根据选定的显著性水平确定的拒绝域的 边界值,称为临界值。
选定的显著性水平后,查阅书后的附表 就可以得到具体的临界值,将检验统计 量与之比较,就可以作出拒绝或接受原 假设的决策。
H0 H1
研究的问题 双侧检验 左侧检验 右侧检验
= 0
8.1.4 用P 值进行假设检验
❖ P 值是一个概率值(194页) 左侧检验时,P值为曲线左边小于等于检
验统计量部分的面积
右侧检验时,P值为曲线右边大于等于检
验统计量部分的面积
双侧检验时P值为曲线两边大于等于或小于 等于检验统计量部分的面积检验统计量部
什么是原假设?
1. 待检验的假设,又称“0假设”
为什么叫0 假设?
2. 研究者想收集证据予以反对的假设
3. 总是有等号 , 或
4. 表示为 H0 例如, H0: 3190(克)
什么是备择假设?
1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设,总 是有不等号: , 或
假设检验

X − µ0 - T= = 2.07 > -t0.05(16)=-1.746 S/ n
不能否定H 不能否定 0,
认为此批罐头维生素C含量合格。 认为此批罐头维生素 含量合格。 含量合格
均值的单尾 Z 检验
(提出假设)
左侧:H0:µ ≥ µ0 H1:µ < µ0 左侧:
拒绝 H0 α
右侧:H0:µ ≤ µ0 H1: µ > µ0 右侧:
分别用 X,Y 估计 µ 1, µ 2 当H0成立时: 成立时:
X-Y 应很小。故当找大的临界值。 - 应很小。故当找大的临界值。
成立时: 当H0成立时:
T=( X − Y ) =
Байду номын сангаас
2 ( n1 − 1) S12 + ( n2 − 1) S 2 1 1 ( + ) n1 + n2 − 2 n1 n2
X-µ0 T= 也不应太大。 也不应太大。 S/ n
故需找一个大的临界值。 故需找一个大的临界值。 分布未知。 因T分布未知。 分布未知
X-µ 考虑辅助随机变量: 考虑辅助随机变量:T = S/ n
~
~ ~ ≤ 成立时: ~ 在H0成立时: T~t(n-1) 且:T≤ T ~ 由于事件{T 由于事件 > tα(n-1)}⊂{T > tα(n-1)} ⊂ 于是: 于是:
已知某铁厂铁水含碳量X服从正态 例2.已知某铁厂铁水含碳量 服从正态 已知某铁厂铁水含碳量 分布,今测试5炉铁水的含碳量如下 炉铁水的含碳量如下: 分布,今测试 炉铁水的含碳量如下:4.28, 4.40, 4.42, 4.35, 4.37, 正常情况含碳量应为 4.55。检验今铁水含碳量有无显著变化? 。检验今铁水含碳量有无显著变化? 解: H0:µ=4.55 H1:µ ≠ 4.55 n=5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– –
备择假设的方向为“>‖(寿命延长) 建立的原假设与备择假设应为
•
H0: 1500
H1: 1500
统计学
(第三版)
单侧检验
(原假设与备择假设的确定)
一项研究表明,改进生产工艺后,会使 产品的废品率降低到2%以下。检验这一 结论是否成立
统计学
(第三版)
假设检验的概念与思想
统计学
(第三版)
什么是假设?
(hypothesis)
我认为该地区新生婴儿 的平均体重为3190克!
• 对总体参数的的数值 所作的一种陈述
– 总体参数包括总体均值、 比例、方差等 – 分析之前必需陈述
统计学
(第三版)
什么是假设检验?
(hypothesis testing)
– 我们想要证明(检验)大于或小于这两种可能性 中的任何一种是否成立
4. 建立的原假设与备择假设应为 • H0: 10 H1: 10
统计学
(第三版)
双侧检验
(显著性水平与拒绝域 )
置信水平 拒绝域 1- /2
抽样分布
拒绝域 /2
临界值
H0值
临界值
样本统计量
统计学
(第三版)
双侧检验
= 50 H0
样本均值
统计学
(第三版)
假设检验的过程
提出假设 作出决策
拒绝假设! 别无选择.
我认为人口的平 均年龄是50岁
总体
抽取随机样本
均值 X = 20
统计学
(第三版)
假设检验的步骤
提出假设(原假设H0,备择假设H1) 确定适当的检验统计量 规定显著性水平,确定临界值和拒绝
H0值
样本统计量
统计学
(第三版)
抽样分布
右侧检验的P 值
置信水平 拒绝域 1-
P值
H0值
临界值 计算出的样本统计量
统计学
(第三版)
利用 P 值进行检验
(决策准则)
若p-值 ,不拒绝 H0 若p-值 < , 拒绝 H0 若p-值 , 不拒绝 H0 若p-值 < , 拒绝 H0
1. 单侧检验
统计学
(第三版)
错误和 错误的关系
和的关系就像 翘翘板,小就 大, 大就小
你不能同时减 少两类错误!
统计学
(第三版)
影响 错误的因素
• 1. 总体参数的真值
– 随着假设的总体参数的减少而增大
• 2. 显著性水平
当 减少时增大
• 3. 总体标准差
当 增大时增大
– – – –
2. 双侧检验
统计学
(第三版)
双侧检验和单侧检验
统计学
(第三版)
双侧检验与单侧检验
(假设的形式)
研究的问题
假设 双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
0 < 0
0 > 0
统计学
(第三版)
双侧检验
(原假设与备择假设的确定)
1. 属于决策中的假设检验 2. 不论是拒绝H0 还是不拒绝H0 ,都必需采取 相应的行动措施 3. 例如,某种零件的尺寸,要求其平均长度为 10cm,大于或小于10cm均属于不合格
• 4. 样本容量 n
– 当 n 减少时增大
统计学
(第三版)
假设检验中的 P 值
统计学
(第三版)
什么是P 值?
(P-value)
1. 是一个概率值 2. 如果原假设为真,P-值是抽样分布中大于 或小于样本统计量的概率
–
–
左侧检验时,P-值为曲线上方小于等于检 验统计量部分的面积 右侧检验时,P-值为曲线上方大于等于检 验统计量部分的面积
统计学
• 什么小概率? • 1. 在一次试验中,一个几乎不可能发生 的事件发生的概率
• 2. 在一次试验中小概率事件一旦发生, 我们就有理由拒绝原假设
• 3. 小概率由研究者事先确定
什么是小 概率?
统计学
(第三版)
假设检验中的两类错误
(决策风险)
统计学
(第三版)
假设检验中的两类错误
• 1.第一类错误(弃真错误, 漏检概率)
抽样分布
拒绝域
1-
临界值
H0值
样本统计量
统计学
(第三版)
左侧检验
(显著性水平与拒绝域)
置信水平
抽样分布
拒绝域
1-
临界值
H0值
样本统计量
观察到的样本统计量
统计学
(第三版)
左侧检验
(显著性水平与拒绝域)
置信水平
抽样分布
拒绝域
1-
临界值
H0值
样本统计量
统计学
(第三版)
抽样分布
右侧检验
(显著性水平与拒绝域)
检验权在销售商一方 作为销售商,你总是想收集证据证明生产商 的说法(寿命在1000小时以上)是不是正确的 备择假设的方向为“<‖( 寿命不足1000小 时) 建立的原假设与备择假设应为 H0: 1000 H1: 1000
–
•
统计学
(第三版)
单侧检验
(显著性水平与拒绝域)
置信水平
– 研究者总是想证明自己的研究结论(废品率 降低)是正确的
– –
•
备择假设的方向为“<‖(废品率降低) 建立的原假设与备择假设应为 H0: 2% H1: 2%
统计学
(第三版)
单侧检验
(原假设与备择假设的确定)
某灯泡制造商声称,该企业所生产的灯泡 的平均使用寿命在1000小时以上。如果你 准备进一批货,怎样进行检验
置信水平 拒绝域 1-
H0值
观察到的样本统计量
临界值
样本统计量
统计学
(第三版)
右侧检验
(显著性水平与拒绝域)
置信水平 拒绝域
抽样分布
1-
H0值
临界值
样本统计量
统计学
(第三版)
一. 二. 三. 四.
§8.2 一个正态总体参数的检验
检验统计量的确定 总体均值的检验 总体比例的检验 总体方差的检验
H0 能被拒绝的的最小值
3. 被称为观察到的(或实测的)显著性水平
–
统计学
(第三版)
/ 2
双侧检验的P 值
/ 2 拒绝
1/2 P 值
拒绝
1/2 P 值
临界值
计算出的样本统计量
H0值
临界值
Z
计算出的样本统计量
统计学
(第三版)
左侧检验的P 值
置信水平
抽样分布
拒绝域
1-
P值
临界值 计算出的样本统计量
参数估计
假设检验
统计学
(第三版)
学习目标
1. 了解假设检验的基本思想
2. 掌握假设检验的步骤
3. 对实际问题作假设检验
4. 利用置信区间进行假设检验
5. 利用P - 值进行假设检验
统计学
(第三版)
一. 二. 三. 四. 五. 六.
§8.1
假设检验的基本问题
假设问题的提出 假设的表达式 两类错误 假设检验中的值 假设检验的另一种方法 单侧检验
(显著性水平与拒绝域)
置信水平
抽样分布
拒绝域 /2
拒绝域 1- /2
临界值
H0值
临界值
样本统计量
统计学
(第三版)
双侧检验
(显著性水平与拒绝域)
置信水平 拒绝域 1-
抽样分布
拒绝域 /2
/2
临界值
H0值
临界值
样本统计量
统计学
(第三版)
双侧检验
(显著性水平与拒绝域)
置信水平 拒绝域 /2
抽样分布
拒绝域 /2 1-
临界值
H0值
临界值
样本统计量
相逢不是恨早,便是恨晚(张小娴) (第三版)
•
统计学
太早遇上你了,我还不懂得爱你 太早遇上你了,我还不懂得珍惜你 太早遇上你了,我们的世界还有一大段距离,
•
•
需要用时间来拉近 太早遇上你了,我还有很多梦想要实现,
•
你不会理解,也不可能接受 后来,我才觉得遗憾,你出现得太早了,
• 如果能够晚一点,我们的生命都会有不同
统计学
(第三版)
• 太晚遇上你了,你身边已经另外有人 • …….. • 太晚遇上你了,我现在才知道什么是爱情。我遗 憾没有把第一次留给你。
太晚遇上你了,我已经不再像以前那样,会 义无返顾的爱一个人。 如果我们恰恰相逢在适当的时候,那是多么 没可能的事……
统计学
统计学
(第三版)
作出统计决策
1. 计算检验的统计量 2. 根据给定的显著性水平,查表得出相应 的临界值z或z/2, t或t/2 3. 将检验统计量的值与 水平的临界值进 行比较 4. 得出拒绝或不拒绝原假设的结论
统计学
(第三版)
假设检验中的小概率原理
(第三版) 假设检验中的小概率原理
Z
X 0
Z
X 0 S n
t
X 0 S n
n
统计学
–
H1: <某一数值,或 某一数值
–
例如, H1: < 3910(克),或 3910(克)
统计学
(第三版)