概率论与数理统计 假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本:X1 , X 2 ,, X n
h = ztest(x,m,sigma) h = ztest(...,alpha)
假设: H 0 : 0 , H 0 : 0 , H 0 : 0 ,
H1 : 0 . H1 : 0 H1 : 0
h = ztest(...,alpha,tail)
· [h,sig]=ztest(x,m,sigma,alpha,tail) · h=ztest(x,m,sigma) · h=ztest(x,m,sigma,alpha) · [h,sig,ci]=ztest(x,m,sigma,alpha,tail) 命令[h,sig,ci]=ztest(x,m,sigma,alpha,tail)表示通过tail 指定值控制可选择假 设的类型, 以显著性水平为alpha 检验, 标准差为sigma 的正态分布样本x 的 均值是否为m. 返回值h=l表示在显著性水平为alpha 时拒绝原假设; h=0 表 示在显著水平为alpha 时不拒绝原假设. 返回值sig 为Z 的样本数据在x 的均 值为 m 的原假设下较大或者在统计意义下较大的概率值. ci 返回置信度为100(1-alpha)%的真实均值的置信区间.
~ t (m n 2)
总体1:X ~ N (1, 12 ) 样本1:X1 , X 2 ,, X n1
当Tail=0时,备择假设为“ 0 ”; 当Tail=1时,备择假设为“ 0 ”; 当Tail=-1时,备择假设为“ 0 ”; 当H=0表示接受原假设; 当H=1表示拒绝原假设。
例 1、某切割机正常工作时,切割的金属棒的长度服从正态分布 N (100, 4) . 从该切割机切割的一批金属棒中随机抽取 15 根,测得它们的长度(单 位:mm)如下: 97 102 105 112 99 103 102 94 100 95 105 98 102 100 103. 假设总体方差不变,试检验该切割机工作是否正常,即总体均值是否等于 100mm?取显著性水平 0.05 .
二、总体标准差未知时的单个正态总体均值的t检验
ttest函数
总体:X ~ N (, 2 )
样本:X1 , X 2 ,, X n
调用格式: h = ttest(x) h = ttest(x,m) h = ttest(x,y)
假设: H 0 : 0 , H 0 : 0 , H 0 : 0 ,
例4 某电视机厂采用了新的生产技术生产显像管,质监部门 随机抽取了 20 个样本,测得样本的平均寿命为 31850 小时, 样本标准差1300小时。已知,在采用了新技术前生产的显像 管的平均寿命为 3 万小时,显像管的寿命服从正态分布,问: 在 的显著性水平下,问:新技术采用前与采用后生 产的显像管的平均寿命是否有显著差异。 0.05
解: 未知,所以采用 t 检验 (1) H0 : H1 : 0 0
x 0
31850 30000 (2) t =6.36 s/ n 1300 / 20 (3) t1 / 2 (n 1) =2.0930 (4) t
拒绝域 t t1 / 2
t1 / 2
>> x = [97 102 105 112 99 103 102 94 100 95 105 98 102 100 103]; % 调用ztest函数作总体均值的双侧检验, % 返回变量h,检验的p值,均值的置信区间muci,检验统计量的观测值zval >> [h,p,muci,zval] = ztest(x,100,2,0.05) % 调用ztest函数作总体均值的单侧检验 >> [h,p,muci,zval] = ztest(x,100,2,0.05,'right')
1-
临界值
0
样本统计量 观察到的样本统计量
抽样分布
置信水平 拒绝H0 1-
0
临界值
样本统计量
观察到的样本统计量
假设 假设形式
双侧检验
左侧检验
右侧检验
H0 : =0 H1 : 0
H0 : 0 H1 : <0
H0 : 0 H1 : >0
已知:
统计量
% 定义样本观测值向量 >> x = [49.4 50.5 50.7 51.7 49.8 47.9 49.2 51.4 48.9]; % 调用ttest函数作总体均值的双侧检验, % 返回变量h,检验的p值,均值的置信区间muci,结构体变量stats >> [h,p,muci,stats] = ttest(x,50,0.05)
求解参数假设检验问题的步骤: (1) 根据问题提出合理的原假设H0和备择假设H1 ; (2) 给定显著性水平α, 一般取较小的正数, 如 0.05,0.01 等; (3) 选取合适的检验统计量及确定拒绝域的形式; (4) 令P{当H0为真拒绝H0}<= α , 求拒绝域; (5) 由样本观察值计算检验统计量的值, 并做出决策: 拒绝H0或接受H0.
原假设 备择假设
双侧检验
H0 : = 0 H1 : ≠0
单侧检验
左侧检验
H0 : 0 H1 : < 0
右侧检验
H0 : 0 H1 : > 0
双侧检验
抽样分布
拒绝H0 置信水平
拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
抽样分布
拒绝H0
置信水平
· [h, sig]=ttest(x, m, alpha, tail) · h=ttest(x, m) · h=ttest(x, m, alphal) · [h, sig, ci]=ttest(x, m, alpha, tail) 命令[h, sig, ci]=ttest(x, m, alpha, tail)表示在给定显著水平为alpha 的基础上进 行t 假设检验, 检验正态分布样本x 的均值是否为给出的m, m 的缺省值是0. 返 回的h 值等于1 表示在显著水平为alpha 时拒绝原假设; 返回的h 值等于0 表示 在显著水平为alpha 时不拒绝原假设. 返回的 sig 表示在x 的均值等于m 的原假 设下较大或者统计意义下较大的概率值.ci 返回一个置信度为 100(1-alpha)% 的均值的置信区间.
H1 : 0 . H1 : 0 H1 : 0
h = ttest(...,alpha)
h = ttest(...,alpha,tail) h = ttest(...,alpha,tail,dim) [h,p] = ttest(...) [h,p,ci] = ttest(...)
所以拒绝原假设,即平均寿命有显著差异。
算法
1、定义参数,mean,mu,n,alpha,model分别代表样本 均值,总体均值,样本容量,显著性水平,检验模式包括 :左侧,双侧,右侧 2、根据检验模式定义出拒绝域; (mean mu ) sample 3、根据上述参数计算 s/ n
(1) 已知:
设 x1 , x2 ,, xn 是来自正态总体X的一个简单随机样
1 n 本,样本均值为 x xi ,根据单个总体的抽样分布结 n i 1
论,选用统计量
z
x 0
(2) 未知:
选用统计量:
n
~ N (0,1)
t
x 0 s/ n
~ t (n 1)
假设
例2 某电子元器件生产厂对一批产品进行检测,使用寿命不 低于2000小时为合格品。该电子元器件的使用寿命服从正态 分别,标准差为100小时。从该批产品中随机抽取了120个产 品进行检测,测得样本均值为1960小时,在 0.01 的显著 性水平下检验该批电子元器件的质量是否符合要求。
0 2000, 100, 解:由题意总体服从正态分布, 样本均值 x 1960 ,样本容量 n 120. (1) H 0 : 2000 2000 H1 :
4、判断sample是否在第2步定义的拒绝域,如果 在就拒绝原假设返回值0,否则返回值1. 5、根据第四步结果做出结论,0拒绝原假设,1接 受原假设。
在Matlab中t检验法由函数ttest来实现。调用格式如下
[ H , P, CI ] ttest ( X , M , , Tail )
4、判断sample是否在第2步定义的拒绝域,如果 在就拒绝原假设返回值0,否则返回值1. 5、根据第四步结果做出结论,0拒绝原假设,1接 受原假设。
2 2 , 当两个正态总体均服从正态分布且方差 1 2 未知但相 等时,进行两个总体均值之差的检验采用统计量。
选用统计量: T
X Y Sw 1 1 m n
(2) (3)
Z
x - 0
/ n
1960 2000 100 / 120
=-4.382
拒绝域 z z1
z1 = -2.33 (4) z z1
所以拒绝原假设,即电子元件的质量不符合标准。
算法
1、定义参数,mean,mu,sigma,n,alpha,model分别代 表样本均值,总体均值,标准差,样本容量,显著性水平 ,检验模式包括:左侧,双侧,右侧 2、根据检验模式定义出拒绝域; (mean mu ) sample 3、根据上述参数计算 sigma / n
h = ztest(...,alpha,tail,dim) [h,p] = ztest(...) [h,p,ci] = ztest(...) [h,p,ci,zval] = ztest(...)
在Matlab中U检验法由函数ztest来实现。调用格式如下
[ H , P, CI , zval ] ztest ( X , 0 , , , Tail )
我认为这种新药的疗效 比原有的药物更有效!
2
构造假设 总体
选择统计量并计算
确定
作出决策
作出决策
拒绝假设 别无选择!
提出假设
我认为人口的平 均年龄是50岁
均值 x = 20
抽取随机样 本
1. 问题背景 假设检验是统计推断的基本问题之一, 主要是确定关于样本总体特征的判断是否合理. 其基本思想是, 按照一定的规则(即检验准则), 根据样本信息对所做出的原假设H0 判断 是否成立, 以决定是接受还是否定原假设H0. 假设检验的判断和结论是根据样本做出的, 故具有“概率性”, 从而要犯判断上的错误——弃真错误和取伪错误. 假设检验分为参 数假设检验和总体分布假设检验两类. 由样本数据来做出拒绝和接受原假设的判断, 计算量是相当大的. 下面我们用MATLAB 软件来解决这一问题. 2. 实验目的与要求 (1) 掌握 MATLAB 工具箱中关于假设检验的有关操作命令; (2) 熟练掌握对单个正态总体均值、方差的假设检验; (3) 掌握对两个正态总体均值、方差有关的假设检验; (4) 掌握两个未知总体分布类型对均值是否相等的假设检验; (5) 掌握对单个总体是否服从正态分布的假设检验; (6) 掌握对单个总体是否服从指定的理论分布的假设检验.
[h,p,ci,stats] = ttest(...)
例 3、化肥厂用自动包装机包装化肥,某日测得 9 包化肥的质 量(单位:kg)如下: 49.4 50.5 50.7 51.7 49.8 47.9 49.2 51.4 48.9 设每包化肥的质量服从正态分布,是否可以认为每包化肥的平 均质量为 50kg?取显著性水平 0.05 .
z
x 0
s
n
未知:
t
x 0 n
z z1 / 2
拒绝域
z z1 t t1
拒绝H0
z z1 t t1
t t1 / 2
P值决策
P
一、总体标准差已知时的单个正态总体均值的Uห้องสมุดไป่ตู้验
2 总体:X ~ N (, 0 )
ztest函数 调用格式: