第六章假设检验(上)

合集下载

数理统计:假设检验

数理统计:假设检验
12
二 假设检验的思路、步骤和术语
由长期实践可知,标准差较稳定,设 15, 则 X ~ N (, 152 ), 其中未知.
1. 提出两个对立假设
H0 : 0 500
H1 : 0
原假设或零假设
备择假设
利用已知样本作出判断:是接受假设H0(拒绝假 设H1), 还是拒绝假设H0(接受假设H1). 如果作出的判 断是接受H0, 则认为 0 500 , 即认为机器工作是 正常的, 否则, 认为是不正常的.
13
2. 选择适当的统计量,称为检验统计量,
原则是 1°其中含着总体X的均值 好的估计 X ,
2° H0为真时,检验统计量分布确定。
因为 X是 的无偏估计量,
检验统计量
若 H0 为真, 则| x 0 | 不应太大,
当H0为真时, X ~ N (0 , 2 n),
Z X 0 ~ N (0,1), / n
P{拒绝H0 H0为真} (按“=”具体计算)
以假当真: 当μ≠500时,X 取值落在500附近的可能也存 在,此时将接受H0,认为μ=500,于是犯了取伪错误,称 为第二类错误,犯第Ⅱ类错误的概率
P{接受H0 H0不真}
23
两类错误的关系
以下述检验为例:X~N(, 2), 已知, 未知
率不超过 ,而犯第ⅠI类错误的概率无法控制。
25
【注】假设检验的结果与显著性水平α的大小有关: α越小越不易拒绝H0. 就引例而言:
当α=0.05时,则 临界值z /2 z0.025 1.96,
z x 0 2.2 1.96, 落入拒绝域 / n
于是拒绝 H0, 认为包装机工作不正常.
在实例中若取定 0.05,则 k z / 2 z0.025 1.96,

第六章 假设检验1

第六章 假设检验1
1. 给定显著性水平α,查表得出相应的临界值 α 查表得出相应的临界值z 或zα/2, tα或tα/2 2. 将检验统计量的值与α 水平的临界值进行比较 3. 作出决策 – 双侧检验:I统计量 > 临界值,拒绝 0 双侧检验: 统计量 临界值,拒绝H 统计量I – 左侧检验:统计量 < -临界值,拒绝 0 左侧检验: 临界值, 临界值 拒绝H – 右侧检验:统计量 > 临界值,拒绝 0 右侧检验: 临界值,拒绝H
二,假设检验的过程
1,提出假设 3,作出决策
拒绝假设 别无选择
总体
我认为人口的 平均年龄是50 50岁 平均年龄是50岁
2,抽取随机样本
均值 X = 20
二,假设检验的过程 假设检验的具体步骤: 假设检验的具体步骤: 第一,提出原假设 第一,提出原假设(null hypothesis)和备择假设 和备择假设 (alternative hypothesis); ; 第二,确定合适的检验统计量; 第二,确定合适的检验统计量; 第三,规定显著性水平 ; 第三,规定显著性水平α; 第四,根据数据计算检验统计量的实现值; 第四,根据数据计算检验统计量的实现值; 第五,统计决策. 第五,统计决策.
原假设
(null hypothesis)
1. 2. 3. 4. 研究者想收集证据予以反对的假设 又称"0假设" 总是有符号 =, ≤ 或 ≥ 表示为 H0
– – –
H0 : = 某一数值 指定为符号 =,≤ 或 ≥ ≤ 例如, H0 : = 10cm
备择假设
(alternative hypothesis)
什么是P 值?
(P-value)
1.p值(p-value)是在零假设下, 1.p值(p-value)是在零假设下,检验统计量取其实现 是在零假设下 值及(沿着备择假设的方向)更加极端值的概率. 值及(沿着备择假设的方向)更加极端值的概率.

应用统计学6-假设检验(1)

应用统计学6-假设检验(1)

t 检验
(单边和双边)
χ2检验
(单边和双边)
名称 条件
H0
统计量及其分布
拒绝域 |u| >u1-α/2 u >u1-α u < - u1-α |t| >tα/2 t >tα t < -tα
2 χ 2 > χα / 2 ( n − 1)或
0 u 总体 µ ≤ µ0 2 检 方差σ 均 验 已知 µ ≥ µ 0 值 检 验 t 总体 µ = µ 0 µ ≤ µ0 2 检 方差σ 验 未知 µ ≥ µ 0
正确
α 错误和 β 错误的关系
当H0、H1给定,n固定时,无法同时使α和β变小 α和β的关系就像翘翘板,α小β就大, α大β就小
β α
使α、β 同时变小的办法就是增大样本容量。
“不能拒绝H0”
一般地说,哪一类错误所带来的后果越严重,危害越大, 在假设检验中就应当把哪一类错误作为Fra bibliotek要的控制目标。
通常β不易计算,所以通常我们 主要控制α,尽量减小β
µ ≥ µ0 µ < µ0
µ ≤ µ0 µ > µ0
双边检验
抽样分布
拒绝域 α/2
H0 :µ = µ0
H1 :µ ≠ µ0
置信水平 拒绝域 1-α α/2 接受域 H0值
临界值
临界值
左单边检验
抽样分布
拒绝域
H0 :µ ≥ µ0
H1 :µ < µ0
置信水平
α
1-α 接受域 H0值
临界值
右单边检验
由于α 事先确定,所以拒绝H0 是有说服力的, 而β通常未知,所以如果我们决定“接受H0 “,我们并不 确定这个决策的置信度,所以通常我们不采用“接受H0 “的说法,而是采用“不能拒绝H0 “的说法。

第6章假设检验

第6章假设检验

第6章假设检验一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为小时,标准差为小时。

据报道,10年前每天每个家庭看电视的平均时间是小时。

取显着性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?详细答案:,=,,拒绝,如今每个家庭每天收看电视的平均时间显着地增加了。

为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。

已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。

在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):根据最近的测量数据,当显着性水平时,能否认为该城市空气中悬浮颗粒的平均值显着低于过去的平均值详细答案:,=,,拒绝,该城市空气中悬浮颗粒的平均值显着低于过去的平均值。

安装在一种联合收割机的金属板的平均重量为25公斤。

对某企业生产的20块金属板进行测量,得到的重量数据如下:假设金属板的重量服从正态分布,在显着性水平下,检验该企业生产的金属板是否符合要求?详细答案:,,,不拒绝,没有证据表明该企业生产的金属板不符合要求。

在对消费者的一项调查表明,17%的人早餐饮料是牛奶。

某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。

为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。

在显着性水平下,检验该生产商的说法是否属实详细答案:,,,拒绝,该生产商的说法属实。

某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:操作A操作B=100=50====对=,检验平均装配时间之差是否等于5分钟。

详细答案:,=,,拒绝,两种装配操作的平均装配时间之差不等于5分钟。

某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。

样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。

潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。

原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。

第6章 假设检验

第6章 假设检验

×
样本均数 分布未知
样本均数服从 t分布
( X-t / 2 ( ) .S X, X+t / 2 ( ) .S X )

样本均数服从 正态分布

N ( , 2 / n)
N ( , S 2 / n)
( X-u / 2 . X, X+u / 2 . X )
( X-u / 2 .S X, X+u / 2 .S X )
时,当P值在检验水准α 附近时,应慎重做结论。

α 是犯Ⅰ型错误的最大概率,P是犯Ⅰ型错误的实际概率。
3.假设检验的统计意义

假设检验的实际意义

不管是接受还是拒绝零假设都未必有实际意义; 拒绝零假设时,即使P值很小,总体之间差异可能很小,不具有
实际意义;

接受零假设时,不代表总体之间没有差异,可能由于样本量过 小,“证据不足”,“补充证据”后,仍可能拒绝零假设;
样本均数 分布未知
×
样本均数服从 正态分布
Ⅳ N
σ 已知? Y
u
X
X
X X / n S/ n
样本均数服从 t分布
样本均数服从 正态分布
N ( , / n)
2

N ( , S 2 / n)
样本均数与总体 均数比较 (大样本:u检验) (小样本:?检验)
两样本均数比较

若小概率事件发生了,则我们犯了经验主义错误;
因为小概率事件发生可能性为α ,则我们犯经验主义错 误的概率为α ,这种错误称为Ⅰ型ห้องสมุดไป่ตู้误。

若小概率事件没有发生,接受零假设时,还是有可能犯错
误,这时候错误是教条主义,称为Ⅱ型错误。

统计学第六章假设检验

统计学第六章假设检验

10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?

第六章--假设检验基础课件

第六章--假设检验基础课件
两样本所属总体方差相等且两总体均为正态分布
H 0 : 1 2H 1 :1 2 ( 单 1 2 或 侧 1 2 )
当H0成立时,检验统计量:
t X1X2 ~t, n1n22
Sc2n 11n12
第六章 假设检验基础
Sc2
n1
1S12 n2 1S22
n1 n2 2
X1 X1 2 X2 X2 2 n1 n2 2
第六章 假设检验基础
55、作出推断结论:当P≤时,结论为 按所取检验水准α拒绝H0,接受H1,差异有 统计学显著性意义。如果P> ,结论为按 所取检验水准α不拒绝H0,差异无统计学显 著性意义。其间的差异是由抽样误差引起
的。
第六章 假设检验基础
1.建立检验假设
原 假 设 H0:0 14.1 备 择 假H设1 :0(单 侧 ) 检 验 水 准: 0.05
第六章 假设检验基础
检验假设为:
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
当H0成立时,检验统计量:
td0 ~t, n1
Sd n
第六章 假设检验基础
表6第-1二用节药前t后检患儿验血清中免疫球蛋白IgG(mg/dl)含量
二、序号配对设计资用料药前的t 检验 用药后
n1 20, X1 17.15,S1 1.59,n1 34, X2 16.92,S2 1.42
Sc2
n1
1S12 n2 1S22
n1 n2 2
2011.592 3411.422
20342
2.2 0
t X1 X2 17.1516.92 0.550
Sc2
1 n1
1 n2
2.20 1 1 20 34
得治疗前后舒张压(mmHg)的差值(前–后)如下表。问新药和标准药的疗效

第6章 假设检验

第6章  假设检验

2
2
n2 7.5 2 / 120 6.3 2 / 153 0.8533
u
X1 X 2 s X1X 2

139.9 143.7 0.8533
4.4353 u 0.05 2.58
P<0.01,差别有统计学意义,可认为该市1993年12岁男童平均身高比1973年高。
假设检验应注意的问题
t 检 验
样本均数与总体均数的比较

目的:推断该样本是否来自某已知总体; 样本均数代表的总体均数与0是否相等。

总体均数0一般为理论值、标准值或经大量观察所得并为人们接
受的公认值、习惯值。

解决思路:

区间估计

判断样本信息估计的总体均数之可信区间是否覆盖已知的 总体均数0 ?若不覆盖,则可推断该样本并非来自已知均 数的总体。
样本信息不支持H0,便拒绝之并接受H1,否则不拒绝H0 。
假设检验的基本步骤

建立假设 确定检验水准 计算检验统计量 计算概率P 结论

当P≤ 时,拒绝H0,接受H1,差别有统计学意义。
当P> 时,不拒绝H0,差别尚无统计学意义。
不论,拒绝拒绝H0,还是不拒绝H0都可能范错误。
同?
μ0 =132(g/L)
n=25
? =
μ
X 150 ( g / L) S 16.5( g / L)
已知总体
未知总体

目的:推断病人的平均血红蛋白(未知总体均
数)与正常女性的平均血红蛋白(已知总体均
数0)间有无差别
μ =μ0 ?
X 0 150 132 18

手头样本对应的未知总体均数 μ等于已知总体均数μ0,

第六章 假设检验

第六章 假设检验

,接受 H 1 。表明在
第二节 总体均值的假设检验
(二)总体为非正态分布或分布未知 当总体分布为非正态分布且大样本时,检验的 X 统计量为 Z
0
/
n

在“原假定成立”的条件下,只要样本容量充分 大(一般习惯上要求 n≥30),它近似服从标准正 态分布。 如果标准差σ未知,只需用样本标准差S作为它 的估计量代替式中的 σ即可,这时检验统计量为

检验统计量服从t分布与其服从标准正态分布的检验结论判断方法一致
例6.3 某厂购买了一台新的生产机器,生产零件的长度规定为10厘米。为了 检验机器的性能是否良好,质检员随机抽取了25件产品,测得其平均长度为9.8厘 米,标准差为0.4厘米。假设生产的零件长度服从正态分布,问在显著性水平 =0.05时,该机器的性能是否良好。 2 解:设 X 表示该机器生产零件的长度,则有 X ~ N (, ),样本容量n=25,样本 均值 x =9.8厘米,样本标准差 s 0.4 厘米。根据问题提出的假设为: H0 : 0 =10厘米; H 1 : 0 =10厘米 这是一个双侧检验问题,因为总体服从正态分布但总体方差未知,用检验的小 样本数据检验,故当 H 0 成立时,检验统计量为: x 0
t
s n
规定显著性水平为 =0.05,查表得到临界值 t / 2(24) 2.064 ,所以原假设的否 定域为:t 2.064 。 计算检验统计量的值: t x 0 9.8 10 2.5
s 0.4 n 100
因为 |-2.5|=2.5>2.064,落在否定域,所以否定 H 0 显著性水平 =0.05时,不能说该机器的性能良好。 互动地带 6-11
第Ⅱ类错误,也称取伪错误 本来是非真的,却根据检验统计量的值把它给接受了。 发生这种错误的概率通常用 表示,即 P(接受H 0 / H 0非真) 在样本容量一定时,犯两种错误的风险是彼此消长的。两者要同时得到控制只 有增加样本容量。在样本容量受限时,通常根据研究问题的性质决定重点控制 第一类错误的风险还是控制第二类错误的风险。

第六章 假设检验

第六章 假设检验
第六章 假设检验
第一节 假设检验的基本原理
第二节 总体参数假设检验
假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
第一节 假设检验的基本原理
一、假种假设,然后利
用样本信息来判断原假设是否成立,决定应接受或
否定假设。假设检验也称为显著性检验。
在此,我们关心的是新机床加工零件的椭圆度总体均值 与老机床加工零件的椭圆度总体均值为0.081mm是否有 不同,可作如下假设 原假设 H 0 : 0.081mm 没有明显差异 备择假设 H1 : 0.081mm 有显著差异, 这是一个双侧检验问题,所以只要 > 0 或 < 0 二者之间有一个成立就可以拒绝原假设。
例某机床厂加工一种零件,根据经验知道,该厂加工零件的椭
圆度近似服从正态分布,其总体均值为0=0.081mm,总体标
准差为= 0.025 今换一种新机床进行加工,抽取n=200个零件 进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的 椭圆度的均值与以前有无显著差异?(=0.05)
H 0 : 0.081mm H1 : 0.081mm < 0 或 > 0 有一个成立就可以拒绝原假设。
为了减少冤枉好人的概率,应尽可能接受原假设, 判被告无罪,这可能增大了放过坏人的概率。
第二节总体参数假设检验
一、总体均值的假设检验
总体均值的检验
(检验统计量)

总体 是否已知 ?

小 样本容量 n
用样本标 准差S代替

z 检验
z 检验
t 检验
Z
X 0

n
Z
X 0 S n
t

第六章 假设检验

第六章 假设检验
绝原假设。这时需要选择另一个假设,这个假设 就是备择假设。即:
Ha : u≠3190(克) (有符号 , 或 )
2、Ha为备择假设,表示1990年新生儿与1989年新
生儿体重有明显差异。也可表达为:
Ha:u ≠ m0 或 Ha:u- m0 ≠0
6.1 假设检验的基本概念
提出假设 (结论与建议)
第Ⅰ类错误的概率的条件下,尽可能使犯第Ⅱ类
错误的概率减小。
6.2 一个总体参数的检验
1. 总体均值的检验 2. 总体比例的检验
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验
(检验样本是否来自某已知总体均值的总体)
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验( 2 已知)
H0 :m 1.35 Ha :m <1.35 = 0.01
n = 50 临界值(c):
拒绝H0 0.01
-2.33 0
检验统计量:
z 1.3152 1.35 2.6061 0.365749 50
决策:
拒绝H0
结论:
新机床加工的零件尺寸的平均误 差与旧机床相比有极显著的降低
z
6.2 一个总体参数的检验
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0 样本统计量
第四章 概率论与抽样分布
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0
样本统计量
第四章 概率论与抽样分布

统计学基础与实务-ppt-第6章假设检验

统计学基础与实务-ppt-第6章假设检验
6-49
总体均值的检验
(大样本)
STAT
1. 假定条件
– 正态总体或非正态总体大样本(n30)
2. 使用z检验统计量 2 已知:z x0 ~N(0,1) n
2 未知:z x0 ~N(0,1)
sn
6-50
总体均值的检验(大样本)
(决策规则)
STAT
1. 在双侧检验中,如果|z| z/2 ,则拒绝原 假设H0;反之,则不能
STAT
1. 研究者想收集证据予以反对的假设 2. 又称“0假设” 3. 总是有符号 , 或 4. 表示为 H0
– H0 : = 某一数值
– 指定为符号 =, 或
– 例如, H0 : 10cm
6-12
备择假设
(alternative hypothesis)
STAT
1. 研究者想收集证据予以支持的假设 2. 也称“研究假设” 3. 总是有符号 , 或 4. 表示为 H1
– 总体参数包括总体均值、 比率、方差等
– 分析之前必须陈述
6-6
什么是假设检验?
(hypothesis test)
STAT
1. 先对总体的参数(或分布形式)提出某种假 设,然后利用样本信息判断假设是否成 立的过程
2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率
原理
6-7
假设检验中的小概率原理
z 检验
z x 0 sn
z 检验
z x 0 n
t 检验
t x 0 sn
6-47
STAT
总体均值的检验
(大样本)
6-48
总体均值的检验
(提出假设)

第六章-假设检验(Hypothesis-test)

第六章-假设检验(Hypothesis-test)
Back
二、接受域和拒绝域
假设设定之后,我们需要一个判别标准,判断拒绝或 接受H0。利用“小概率原理”,指发生概率很小的随机 事件,在一次试验中几乎是不可能发生的。如果发生 了,就可以拒绝提出的原假设。
例如:有一个厂商声称其产品的合格品率很高,可以达到 99%,则从一批产品(100件)中随机抽取1件,该件是次品 的概率就非常小,只有1%。
➢ 根据α值和抽样分布,确定临界值。 ➢ 将检验统计量的数值与临界值相比较,做出
是否拒绝H0的判断。 ➢ 或以检验统计量计算p值,确定是否拒绝H0 。
Back
五、p值(p-value)
p值:H0为真时,由样本数据给出的犯第Ⅰ类错误 的概率的精确数值(观察到的显著性水平)。
统计软件给出检验统计量的数值时,一般都给出该
Back
四、假设检验的步骤
Step1:提出原假设 H0 和备择假设 H1
例如:H0:μ=μ0;H1:μ≠μ0
Step2:确定显著性水平α
➢ 是决策中的风险。主观确定。 ➢ α一般取0.05或0.01。
四、假设检验的步骤
Step3:选择检验统计量(Test Statistic)
➢ 假设检验也是从抽样分布出发,借由样本数据 计算检验统计量的数值进行推断。
检验统计量数值的p值。
以Zobs表示Z统计量的观测值: 双侧检验時p值=P(|Z|≥ Zobs)
右侧检验时p值=P(Z≥ Zobs)
p值/2
p值/2
以p值进行假设检验:
α/2
1 -α
α/2
p值>α,接受H0
-1.96
1.96(临界值)
计算的检验统计量数值
p值<α ,拒绝H0
Back

第六章 假设检验

第六章 假设检验
2 2 , 1 2 已知,或大样本情况 6.3.1 2 2 两个总体均服从正态分布、两个总体的方差 1 , 2 已知;或两 个总体分布及方差未知,但大样本情况下,样本均值之差 X 1 X 2 的抽样分布服从或近似服从正态分布,即可采用检验 统计量:
第六章 假设检验 6.2 总体均值的假设检验
【例6-7】某厂采用自动包装机分装产品,假定每包产 品的重量服从正态分布,每包标准重量为1000克。某 日随机抽查9包,测得样本平均重量为986克,样本标 准差为24克。试问在0.05的显著性水平上,能否认为 这天自动包装机工作正常?
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.2
假设检验的步骤
(三)选取显著性水平,确定原假设的拒绝域和接受域 显著性水平表示原假设为真时拒绝原假设 H 0 的最大概率, 即拒绝原假设所冒的风险,用 表示。 通常取 0.05 或 0.01
6.1
第六章 假设检验 假设检验的原理
第六章 假设检验 6.2 总体均值的假设检验
6.2.3 2未知时小样本情况下总体均值的假设检验
设总体服从正态分布 X ~ N (, 2 ) ,在小样本抽样情况下,利用 t检验法对总体均值的检验,其检验统计量及分布为:
t X ~ t (n 1) s/ n
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.4
假设检验中的P值
H1 : 0
(2)左侧检验:H 0 : 0
P值= P(Z zc 0 )
H 0 : 0
(3)右侧检验:
H1 : 0

第六章 假设检验

第六章 假设检验

第一步:建立假设 第一步:
H0 : µ = 8000; H1 : µ > 8000
原假设的选取原则: 原假设的选取原则:没有充分理由 不能轻易否定的命题。 不能轻易否定的命题。
对立假设的选取原则:没有把握不 对立假设的选取原则: 能轻易肯定的命题。 能轻易肯定的命题。
第二步:寻找检验统计量 第二步:
2
第三步:给定显著性水平和临界值 第三步:
• 在原假设 H0 为真时,X 应该接近8000。 为真时, 如果 X 远离8000 ,就有理由怀疑原 假设为真。 假设为真。 • 例中,8300与8000之间算近还是算远? 例中, 之间算近还是算远? • 需要定一个界限,记此界限为c。 需要定一个界限,记此界限为c
假设检验是要根据样本的观测值对原假作 出判断,接受原假设或者拒绝。 出判断,接受原假设或者拒绝。 由于样本的随机性,客观情况未知, 由于样本的随机性,客观情况未知,有可 能犯错误。 能犯错误。 例:产品验收,有时面对的整批产品是合 产品验收, 格的,有时面对的整批产品是不合格的。 格的,有时面对的整批产品是不合格的。 拒收了合格率高的产品或者接受了合格率 低的产品都是犯了错误。 低的产品都是犯了错误。
例:餐厅的营业额问题: 餐厅的营业额问题:
H0 : µ = 8000; H1 : µ பைடு நூலகம் 8000
N(µ0 ,σ )
2 0
N(µ,σ )
2
在原假设成立的条件下,新菜单挂出后, 在原假设成立的条件下,新菜单挂出后, 每天营业额仍然服从正态分布
N(8000,640 )
如今获得了一个容量为9的样本, 如今获得了一个容量为9的样本,此时样 服从: 本均值 X 服从: 1 2 N(8000, ×640 ) 9
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9
(一)提出假设

包括原假设和备择假设。 原假设(Null Hypothesis)——待检验的假设,也称 为零假设,用 H0表示。 备择假设(Alternative Hypothesis )——也称对 立假设,与原假设内容完全相反的假设。准备在拒 绝原假设后应接受的假设。用 H1表示。对某个问题 提出了原假设,也就同时给出了备择假设。
30
利用 P 值进行决策
若p-值 ,不能拒绝 H0 若p-值 < , 拒绝 H0
31
P值与的关系显著性水平(图)
32
第二节 正态总体参数的检验
对正态总体均值的检验
一、总体方差已知时—— z 检验法 二、总体方差未知时—— t 检验法
对正态总体方差的检验
三、小样本时—— 卡方检验法
33
一、方差已知时对正态总体均值的检验——z检 验法
抽样分布

(1 -
临界值
HO的值
样本统计量
HO的拒绝区域
HO的不能拒绝区域
20
(四)计算检验统计量的值

根据样本资料计算出检验统计量 的观察值。
(五)作出检验结论
• 将检验统计量的值与 水平的临 界值进行比较,看其是否落在了 拒绝区内,从而得出接受或拒绝 原假设的结论。
21
三、假设检验中的两类错误
第六章 假设检验与方差分析
1
实际中的假设检验问题

产品自动生产线工作是否正常; 某种新生产方法是否会降低产品成本; 治疗某疾病的新药是否比旧药疗效更高; 厂商声称产品质量符合标准,是否可信; 学生考试成绩是否服从正态分布…
※ 假设检验——事先作出关于总体参数、分布形式 、相互关系等的命题,然后通过样本信息来判断该命 题是否成立。可分为: 参数检验和非参数检验。
2
第一节 假设检验的一般问题
一、假设检验的基本思想 二、假设检验的步骤 三、两类错误
3
一、假设检验的基本思想
例1. 某工厂规定产品次品率不超过4%,今天从 1000件产品中抽出10件,有4件次品,问这批产品能 否出厂(=整批产品的次品率P是否低于4% )? 提出假设:P≤4% 决策思路:
如果这一假设成立,则根据二项分布理论可算得:出现所 抽样本的概率小于1‰,即在次品率为4%的总体中抽出10 件产品有4件次品的概率是小于1 ‰ 。 这种可能性极小,但在一次抽样中发生了,显然不合理。 这种不合理性源于推论的假设前提,故上述假设不能接 受。即这批产品不能出厂。


原假设的提出应该本着“保守”或“不轻易拒绝”的原 则。
10
假设的三种形式:
0 H 0 : o , H 1 : 0 0

双侧检验 左侧检验 右侧检验
单侧检验
严格地讲,单侧检验中原假设应该用 “ ≤ ” 或 “ ≥ ” 表 示,且必须包括 “=” 。但实际检验时,只取其边界 值,该值能够拒绝,其它值更有理由拒绝。
7
假设检验必须以有关的 抽样分布理论为依据。
这样的值在一次观 察中出现的可能性 很小,... 如果这个值是 总体参数真值
在抽样观察中 出现这样的值 则很正常...
样本 观察值
总体参数 的假设值
样本估计量
8
二、假设检验的步骤
(一)提出原假设和备择假设 (二)确定检验统计量及其分布 (三)规定显著性水平 (四)计算检验统计量的值 (五)作出统计决策
13
14
15
(二)确定检验统计量及其分布

检验统计量是用于假设检验问题的统计量;检验 统计量及其分布是假设检验的具体理论依据。 选择统计量的方法与参数估计相同:

• •

是大样本还是小样本 总体方差已知还是未知
常用的检验统计量有:Z、t、卡方、F统计量 等。如:
Z
xX

n
~ N (0,1)
29
P值的计算
单侧检验中,P值通常为统计量分布曲线从检验 统计量的观察值到拒绝区域这一侧的面积。 设检验的统计量为ξ,c是计算得出的检验 统计量的值。
• 左侧检验时,P值= • 右侧检验时,P值=

P{ξ c } P{ξ c }
双侧检验中,P值=单侧P值的2倍。即: P值=2P{ξ≥c },当 c 在右侧时; 或: P值=2P{ξ≤c },当 c 在左侧时。
37
H
0
: X 10
H
1
: X 10
x X Z ~ N ( 0 ,1 ) n
由=0.05 查标准正态分布表得临界值
Z / 2 Z 0 .025 1 .96
x X 9 . 8 10 Z0 3 . 33 / n 0 . 6 / 100
因为 Z 3.33 Z / 2 1.96 故拒绝原假设,接 受备择假设,即每袋大米的重量有显著变 化,所以不能接受这种包装线。

Z检验法——利用服从标准正态分布的 Z
统计量进行假设检验的方法。 对总体均值的Z检验,主要适用于:

• 若总体呈正态分布,且总体方差已知时; • 若总体非正态分布, 但 n 30 时可近似采用Z
检验
34


H0:
X X0
;H1:
X (or or ) X 0 ,
根据抽样分布理论,总体方差已知时,对均值 的检验统计量为:
• 选择检验统计量 Z • 给定显著性水平1%,查临界值Zα/2=2.58 • 计算检验统计量的观察值: z =-26 • 比较检验统计量的值|z|和临界值,作出结论——
拒绝原假设。
36
例,某公司引进一自动包装线包装大米, 设计规格为每袋大米10公斤,标准差4为 0.6公斤。随机抽取100袋大米,调查表 明:每袋大米平均重量为9.8公斤。在α为 5%的显著水平下,该自动包装线可否接 受?
28

P值表示所观察到的样本对原假设的支持 程度。

P值越大,在原假设为真的情况下,样本出现 的概率越大,出现这样的样本不是小概率事 件,说明原假设不能拒绝。反之, P值越小, 在原假设为真的情况下,样本出现的概率越 小,出现这样的样本属于小概率事件,而实际 却正好抽到了这样的样本,说明原假设不能成 立,应拒绝原假设。
1.第一类错误( “弃真”或“拒真” 错误) 原假设为真时拒绝原假设(例1,当产品本来合格时) 犯第一类错误的概率为 被称为显著性水平)
Prob (拒绝H0 / H0为真)=
2.第二类错误(“取伪”或“采伪”错误)
原假设不真时接受原假设
例如,产品销售方承诺次品率<2%,这是假的。但买方检验 时作出了信任卖方的错误结论,购买了本来不合格的产 品. 第二类错误的概率为
Prob(接受H0 / H0不真)=
22
决策结果与两类错误
实际情况 决策 H0为真 第一类错误 (拒真) ( 接受H0 正确 (1 – ) H0为不真
拒绝H0
正确 (1- 第二类错误 (采伪) (
23
和 的关系
在检验中人们总希望犯两类错误的可能性都 很小,然而,在其它条件不变的情况下, 和 不可能同时减小,就象交易中买卖双方各自承担 的风险一样。

视两类错误所产生的后果轻重而定
• •

当犯第一类错误的后果严重时,则希望尽可能不犯第一 类错误,宁愿犯第二类错误,此时α宜小。 当犯第二类错误的后果严重时,则希望尽可能不犯第二 类错误,宁愿犯第一类错误,此时α不宜太小
事前对原假设的信念
• 对原假设越有信心,则越小;反之则越大
26
影响 错误的因素
11
12
单侧检验
有些情况下,我们关心的假设问题带有方向性, 有两种情况:一种是我们所考察的数据越大越 好,如产品的使用寿命、利润率等;另一种是我 们所考察的数据越小越好,如废品率、单位成本 等。这时检验的拒绝区域在分布的左侧或右侧。 如果我们提出的原假设是μ≥ 0 或μ≤ 0
H 0 :μ ≥ 0 ——左侧检验(下限检验) H 0 :μ≤ 0 ——右侧检验(上限检验)
ቤተ መጻሕፍቲ ባይዱ
反证法带有概率性质

判断是否合理的依据统计上的小概率原理, 并非严格的逻辑证明。
6
假设检验中的小概率原理
• • • • •
小概率事件:发生概率很小的随机事件 小概率原理:小概率事件在一次试验(观察) 中几乎不可能发生。 什么样的概率才算小概率? 研究者事先确定(根据决策的风险或要求的 把握程度来决定),没有统一的界定标准。 假设检验中把这个概率称为检验的 “显著性水 平”,用 表示。
4

例2. 某零件原平均长度为4 cm,标准差为0.02 cm。进 行工艺改革后,抽取样本:n=100,平均长度 =3.948。 问:改革后的零件长度是否有显著变化( = 零件平均长 度是否为4 cm )?
假设:改革后 x =4, 根据抽样分布理论,有:
x ~ N ( X , / n ), 即: Z ( x X ) /( / n ) 26 Z


α和β的关系 就好比翘翘板
24

一般说,哪一类错误带来的后果越严重、 危害越大,就应该作为首要的控制目标. 在假设检验中,一般都首先控制第一类错 误,也即控制α.

• 大家都遵守这个原则,讨论问题比较方便; • 最主要的原因是:原假设是什么非常明确,而
备择假设往往是模糊的。
25
确定α时应考虑的因素
1
: X 1000
x X Z ~ N ( 0 ,1 ) n
由=0.05 查标准正态分布表得临界值 Z / 2 Z 0 . 025 1 . 96
x X 1050 1000 Z0 2 .5 n 100 / 25
相关文档
最新文档