应用数理统计 第5讲 假设检验(1)
《应用数理统计》吴翊李永乐第三章假设检验课后作业参考答案
第三章 假设检验
课后作业参考答案
3.1 某电器元件平均电阻值一直保持2.64Ω,今测得采用新工艺生产36个元件的平均电阻值为2.61Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为0.06Ω,问新工艺对产品的电阻值是否有显著影响?(01.0=α)
解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36
/06.064
.261.2/u 00
-=-=
-=
n
X σμ
(3)否定域⎭⎬⎫⎩
⎨⎧>=⎭⎬⎫⎩
⎨⎧>⋃⎭
⎬⎫⎩
⎨⎧<=--21212
αααu u u
u u u V (4)给定显著性水平01.0=α时,临界值575.2575.22
12
=-=-
α
αu
u ,
(5) 2
αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。
3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,
测得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分
布,试在显著水平0.05下确定这批元件是否合格。 解:
{}010
001:1000, H :1000
X u=
950 100 n=25 1000950-1000
u= 2.5
10025
V=u 0.05H n
x u αμμμσσμα-≥<-====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:
本题中:0.950.950
u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
应用数理统计课后习题参考答案
习题五
1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g)
日期重旦量
1 5500 5800 5740 5710
2 5440 5680 5240 5600
4 5400 5410 5430 5400
9 5640 5700 5660 5700
10 5610 5700 5610 5400
试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05)
解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5.
2
假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5
检验的问题:H。:i 2 L 5, H i : i不全相等.
计算结果:
注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为
查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所
以拒绝H。,认为不同日期生产的钢锭的平均重量有显著差异
2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验
解
根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 .
2
假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .
日产量
操作工
查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。,认为在四种不同催化剂下平均得率无显著差异
《应用数理统计》吴翊李永乐第三章假设检验课后作业参考答案
《应用数理统计》吴翊李永乐第三章假设检验课后作
业参考答案
-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII
第三章 假设检验
课后作业参考答案
3.1 某电器元件平均电阻值一直保持2.64Ω,今测得采用新工艺生产36个元件的平均电阻值为2.61Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为0.06Ω,问新工艺对产品的电阻值是否有显著影响( 01.0=α)
解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36
/06.064
.261.2/u 00
-=-=
-=
n
X σμ
(3)否定域⎭⎬⎫
⎩
⎨⎧>=⎭⎬⎫⎩⎨⎧>⋃⎭⎬⎫⎩⎨⎧<=-
-21212αααu u u u u u V
(4)给定显著性水平01.0=α时,临界值575.2575.22
12
=-=-
α
αu
u ,
(5) 2
αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。
3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。已知这种元件寿命服从标准差
100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。 解:
{}01001:1000, H :1000
X 950 100 n=25 10002.5
V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:
应用数理统计吴翊李永乐假设检验课后作业参考答案
第三章假设检验
课后作业参考答案
3.1某电器元件平均电阻值一直保持2.64Q,今测得采用新工艺生产36个元件的平均电阻 值为2.61 Qo 假设在正常条件卞,电阻值服从正态分布,而且新工艺不改变电阻值的标准 偏差。已知改变
工艺前的标准差为0.06Q,问新工艺对产品的电阻值是否有显著影响? (G = 0.01) 解:⑴提出假设H°:“ = 2・64, H 「〃H 2・64
(2)构造统计量u = 士孕
=24 — 2.64 = _3 b 。/亦 0.06/6
(3) 否定域 V = \u<u a
< U > U a > = < II > Il a >
(4) 给定显著性水平a = 0.01时,临界值u a = -2.575, u a =2.575
—
1——
(5) U < u a ,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。
3.2 一种元件,要求其使用寿命不低于1000 (小时),现在从一批这种元件中随机抽取25件, 测得
其寿命平均值为950 (小时)。已知这种元件寿命服从标准差b=100(小时)的正态分 布,试在显著水平0.05 F 确定这批元件是否合格。 解:
提出假设:1000,
< 1000
构造统计量:此问题情形属于u 检验,故用统计量:
此题中 X = 950 CT O = 1OO n=25 //0 = 1000
代入上式得:
拒绝域:
v={|i 】|> 心
本题中:Q = 0.05 u 095 = 1.64
即,同〉%拒绝原假设
《应用数理统计》吴翊李永乐第三章假设检验课后作业参考答案
解:
(1)提出假设
(2)构造统计量
(3)否定域
(4)给定显著性水平 时,临界值
(5) ,样本点在否定域内,故拒绝原假设,认为两种方法的总体均值不相等。
3.7今有两台机床加工同一种零件,分别取6个及9个零件侧其口径,数据记为 及 ,计算得
查表得 ,故接受 ,认为服从平均寿命为1500小时的指数分布
3.20考察某台仪器的无故障工作时间12次,的数据如下:
28 42 54 92 138 159 169 181 210 234 236 265
试问无故障工作时间是否服从指数分布?( )
解:
无故障工作时间服从指数分布
无故障工作时间不服从指数分布
0.339
665
1
0.475
0.2
0.4
0.275
0.075
0.275
965
1
0.607
0.4
0.6
0.207
0.007
0.207
1350
1
0.730
0.6
0.8
0.130
0.070
0.130
1750
1
0.817
0.8
1.0
0.017
0.183
应用数理统计
Rj
13.25
13
23.25
由 Rj 大小可知各因子重要性顺序为:C>A>B>D 因粉粒越大越好,因此得最优搭配方案为 A3 B2 C1 D2
D -10 21
-1.25 2.625
3.875
第五章 线性回归模型(1 道题)
P205 公式 回归方程:③ yˆ ˆ0 ˆ1x
其中:①
n
n
yi xi
t1a/2 (n 1) t10.05/2 (15 1) t0.975 (14) 查表得 2.1448;
代入公式: St1a/2 (n 1) 得上限: =0.58+
1.3336 g2.1448
=1.24197
n 1
15 1
1.3336 g2.1448
下限: =0.58-
=-0.08197
P167.题 10
4、独立性检验
①假设: H0 : F (x, y) F1( x) F2( y) ,H(1x:)F ((xy, )y) F1 F2
②计算
X
2 n
,
X 2n
r n
i1
s
ni2k
j1 nig ngk
1
③
计算
X2 1a
((r
1)(s
1))
【应用数理统计】5回归分析
Q
ˆ 0
=
2
T
(Yt
i=1
− ˆ0
− ˆ1X t ) (-1)
=
0
Q
ˆ1
=
2
T
(Yt
i=1
− ˆ0
− ˆ1X t
) (-
Xt)
=
0
T
即
i =1 T
ui
=
0
i=1
X tui
=
0
T
(Yt − ˆ0 − ˆ1X t ) = 0
(3)
i=1
T
(Yt − ˆ0 − ˆ1X t ) xt = 0
T
T
T
Q = uˆt 2 = (Yt −Yˆt )2 = (Yt − ˆ1X t )2
i =1
i=1
i=1
正规方程只剩下一个,
Q
ˆ1
=
2
T
(Yt
i=1
− ˆ1X t
)
(-
Xt)
=
T
T
T
(YtYt − ˆ1X t 2 ) = Yt X t − ˆ1X t 2 = 0
i=1
i=1
i=1
ˆ1 =
(2) 估计的回归直线 Yˆt = ˆ0 + ˆ1 Xt 过( X , Y )点。
正规方程 (Yt - ˆ0 - ˆ1 Xt) = 0 两侧同除样本容量 T,得
应用数理统计之假设检验
励志人生 好好学习
励志人生 好好学习
励志人生 好好学习
励Βιβλιοθήκη Baidu人生 好好学习
励志人生 好好学习
二、两总体之间关系的假设检验
1. 独立性检验
励志人生 好好学习
一、问题的提出
例1 买荔枝。小贩说他的荔枝是糯米糍,你信吗?怎么办?
吃一个尝一尝!如果真就买,不真就走开。
这一做法就含有假设检验的思想。 首 先,假设小贩所言为真(原假设); 第二步,吃一个(抽取样本,做检验); 第三步,买或不买(根据样本和统计理论 作出判断并采取行动)。
假设 检验
定义3:由
确定出的 称为临界值。
这样,当某个 落在 否则就接受原假设。
的拒绝域内时我们就拒绝原假设,
励志人生 好好学习
拒绝域 Rejection Regions
拒绝域
拒绝域
1 -
/2 临界值
接受域 /2
μ0 临界值
样本统计量
励志人生 好好学习
定义4 (两类错误)
实际情况 (未知)
H0成立
判断正确
励志人生 好好学习
§3大样本的假设检验及样 本容量的确定
励志人生 好好学习
一、大样本方法
励志人生 好好学习
励志人生 好好学习
《应用数理统计》第三章假设检验课后作业参考答案
第三章 假设检验
课后作业参考答案
3.1 某电器元件平均电阻值一直保持2.64Ω,今测得采用新工艺生产36个元件的平均电阻值为2.61Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为0.06Ω,问新工艺对产品的电阻值是否有显著影响?(01.0=α)
解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36
/06.064
.261.2/u 00
-=-=
-=
n
X σμ
(3)否定域⎭⎬⎫⎩
⎨⎧>=⎭⎬⎫⎩
⎨⎧>⋃⎭
⎬⎫⎩
⎨⎧<=--21212
αααu u u
u u u V (4)给定显著性水平01.0=α时,临界值575.2575.22
12
=-=-
α
αu
u ,
(5) 2
αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。
3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,
测得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分
布,试在显著水平0.05下确定这批元件是否合格。 解:
{}01001:1000, H :1000
X 950 100 n=25 10002.5
V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:
本题中:0.950.950
u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
3.3某厂生产的某种钢索的断裂强度服从正态分布(
应用数理统计课后习题参考答案
应用数理统计课后习题参考答案
1. 描述性统计
问题1
描述性统计是一种对数据进行整理、呈现和分析的方法。它可以提供数据的基本特征,包括数据的中心趋势、离散程度和分布形状。常见的描述性统计方法有:
•平均数:用于衡量数据的中心趋势,是所有数据值的总和除以数据的个数。
•中位数:将数据按大小顺序排列,中间位置的数值即为中位数。
•众数:数据中出现次数最多的数值。
•范围:数据的最大值减去最小值。
•方差:用于衡量数据的离散程度,是每个数据与平均数之差的平方的平均值。
•标准差:方差的正平方根。
问题2
对于给定数据集,以下是计算描述性统计的步骤:
1.求出数据的个数。
2.计算数据的总和。
3.求出数据的平均数。
4.将数据按大小顺序排列。
5.求出数据的中位数。
6.找出数据中出现次数最多的数值,即众数。
7.计算数据的范围。
8.计算数据的方差。
9.计算数据的标准差。
2. 概率分布
问题1
概率分布是用来描述随机变量的分布规律的函数。常见的概率分布包括:
•二项分布:适用于具有两个可能结果的离散型随机变量,如投硬币的结果。
•泊松分布:适用于描述单位时间或单位空间内随机事件发生次数的离散型随机变量。
•正态分布:也称为高斯分布,是一种连续型概率分布,常用于描述自然界中许多现象的分布情况,如身高、体重等。
问题2
对于给定的概率分布,以下是计算概率的步骤:
1.对于离散型概率分布,计算每个可能结果的概率,
并将其加总为1。
2.对于连续型概率分布,计算指定区间内的概率,可
以使用积分来进行计算。
3.根据需要计算特定事件的概率,可以使用概率密度
《应用数理统计》第五章方差分析课后作业参考答案
第五章 方差分析
课后习题参考答案
5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数:
设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α)
解:(1)手工计算解答过程 提出原假设:()
3,2,10:0==i H i μ
记
167.20812
11112
=⎪⎪⎭⎫ ⎝⎛-=∑∑∑∑====r i n j ij r
i n j ij T i i
X n X S
467.7011
2
11211=⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛=∑∑∑
∑====r i n j ij r
i n j ij i
A i
i X n X n S
7
.137=-=A T e S S S
当
H
成立时,
()()
()r n r F r n S r S F e A ----=
,1~/1/
本题中r=3
经过计算,得方差分析表如下:
查表得
()()35
.327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原
假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。
(2)软件计算解答过程
组建效应检验
Dependent Var iable: 存活日数a
70.429235.215 6.903
.004
137.73727 5.101
208.167
29
方差来源菌型误差总和
平方和自由度
均值F 值P 值R Squared = .338 (Adjusted R Squared = .289)
a.
从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。
《应用数理统计》吴翊李永乐第三章假设检验课后作业参考答案
第三章 假设检验
课后作业参考答案
某电器元件平均电阻值一直保持Ω,今测得采用新工艺生产36个元件的平均电阻值为Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为Ω,问新工艺对产品的电阻值是否有显著影响(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H ,
(2)构造统计量36
/06.064
.261.2/u 00
-=-=
-=
n
X σμ
(3)否定域⎭⎬⎫
⎩
⎨⎧>=⎭⎬⎫⎩⎨⎧>⋃⎭⎬⎫⎩⎨⎧<=-
-21212αααu u u u u u V
(4)给定显著性水平01.0=α时,临界值575.2575.22
12
=-=-
α
αu
u ,
(5) 2
αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显
著性影响。
一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。已知这种元
件寿命服从标准差100σ=(小时)的正态分布,试在显著水平下确定这
批元件是否合格。
解:
{}01001:1000, H :1000
950 100 n=25 10002.5
V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:
拒绝域:
本题中:0.950.950
u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
某厂生产的某种钢索的断裂强度服从正态分布()2,σμN ,其中
《应用数理统计》第五章方差分析课后作业参考答案
第五章 方差分析
课后习题参考答案
5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数:
设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α)
解:(1)手工计算解答过程 提出原假设:()
3,2,10:0==i H i μ
记
167.20812
11112
=⎪⎪⎭⎫ ⎝⎛-=∑∑∑∑====r i n j ij r
i n j ij T i i
X n X S
467.7011
2
11211=⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛=∑∑∑
∑====r i n j ij r
i n j ij i
A i
i X n X n S
7
.137=-=A T e S S S
当
H
成立时,
()()
()r n r F r n S r S F e A ----=
,1~/1/
本题中r=3
经过计算,得方差分析表如下:
查表得
()()35
.327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原
假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。
(2)软件计算解答过程
组建效应检验
Dependent Var iable: 存活日数a
70.429235.215 6.903
.004
137.73727 5.101
208.167
29
方差来源菌型误差总和
平方和自由度
均值F 值P 值R Squared = .338 (Adjusted R Squared = .289)
a.
从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。
应用数理统计课件
03
基本概念
阐述总体、样本、随机抽样、 变量等基本概念。
应用领域
社会科学
如经济学、心理学、社会学等研究 中,利用数理统计方法对调查数据
进行处理和分析。
医学与生物学
如临床试验、流行病学调查、基因 组学等领域,数理统计在数据处理 、分析和解释方面发挥重要作用。
工业与质量管理
如六西格玛、田口方法等,数理统 计在提高产品质量和生产效率方面 有着广泛应用。
描述性统计指标解读
01
平均数
反映数据的平均水平,但可能 受极端值影响,需结合其他指
标综合判断。
02
中位数
将数据按大小排序后位于中间 的数,不易受极端值影响,能 较好地反映数据的集中趋势。
03
众数
数据中出现次数最多的数,适 用于定性数据和离散型定量数
据。
04
方差与标准差
衡量数据的离散程度,方差是 每个数据与平均数之差的平方 的平均值,标准差是方差的平
经济学与金融
如时间序列分析、回归分析、风险 度量等,数理统计为经济金融领域 提供有力支持。
课程目标
01
02
03
知识目标
能力目标
素质目标
掌握数理统计的基本概念、原理和方法, 熟悉常用的统计分析软件。
培养学生运用数理统计方法解决实际问题 的能力,包括数据收集与处理、描述性统 计、推断性统计以及实验设计等。
数理统计第五章1
一元线性回归模型
Linear Regression Models of one Variable
两边求数学期望(Mathematical Expectation) :
待估计
未知参数:2
,,σb a 5.1 一元线性回归
Linear Regression of One Variable
....
...
.η
εεη ,++=bx a ~
)
,0(2
σN (5.1)
随机变量
常系数
可控变量
随机误差
未知参数
二. 未知参数的估计
Estimation of Unknown parameters
1. 正规方程组、回归参数的估计
最小二乘估计:
a
ˆb ˆ令偏导数为零求最小值:
0)1)](([2=-+-=∂∂∑i i bx a y a
Q
随a , b 而变偏差总量[]
2
)(),(∑+-=i i bx a y b a Q ),(min )ˆ,ˆ(b a Q b a
Q =使0))](([2=-+-=∂∂∑i i i x bx a y b
Q
●
●
●
)
,(11y x )
,(i i y x l 1
l 2
●●
●
●
●
●
三、线性回归效果的显著性检验
经验回归方程:
x b a y
ˆˆˆ+=Linear model:ε
η++=bx a 1. F -Test
平方和分解公∑∑∑-+-=-2
2
2
)ˆ( )ˆ( )(y y y
y y y
i i i
R
e T S S S +=总偏差平方和
残差平方和
回归平方和
(随机平方和)
Total variation Error sum of Regression sum
The significance test of efficiency of linear regression
《应用数理统计》吴翊李永乐第五章方差分析课后作业参考答案
第五章 方差分析
课后习题参考答案
5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数:
设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α)
解:(1)手工计算解答过程 提出原假设:()
3,2,10:0==i H i μ
记
167.20812
11112
=⎪⎪⎭⎫ ⎝⎛-=∑∑∑∑====r i n j ij r
i n j ij T i i
X n X S
467.7011
2
11211=⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛=∑∑∑
∑====r i n j ij r
i n j ij i
A i
i X n X n S
7
.137=-=A T e S S S
当
H
成立时,
()()
()r n r F r n S r S F e A ----=
,1~/1/
本题中r=3
经过计算,得方差分析表如下:
查表得
()()35
.327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原
假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。
(2)软件计算解答过程
从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。
5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示:
试在显著水平
0.05α=下,检验电池的平均寿命有无显著性差异?并求
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3
(三) 检验的两类错误 称 H0真而被拒绝的错误为第一类错误或弃真错误;称 H0假 而被接受的错误为第二类错误或取伪错误。 记 p(I)=p{拒绝H0| H0真}; P(II)=p {接受H0| H0假} 奈曼—皮尔逊 准则: “在控制犯第一类错误的概率不超过指定值的条件下,
尽量使犯第二类错误概率小”按这种法则做出的检验
5
例3.1.2 已知某炼铁厂的铁水含碳量在正常情况下服 从正态分布N(4.55,0.112).某日测得5炉铁水含碳量如 下: 4.28, 4.40, 4.42, 4.35, 4.37. 如果标准差不变,该日铁 水的平均含碳量是否显著偏低? (取 =0.05)
解:
H 0 : 4 . 55
H 0下 U
数据统计分析
第5讲 假设检验
主讲教师:陈萍 教授
e-mail:prob123@mail.njust.edu.cn
1
分布
第三章 假设检验
3.1 假设检验的基本概念
例3.1.1. 设某种产品的次品率为q,若规定次品率不能超过 2%,现随机抽取10个产品进行检验,其中含有1个次品,可 否认为这批产品合格? 求检验准则—10个产品中至少有几个次品则判断不合格? 例如,约定α=0.1(小概率),以X表示10个产品中的次品数, 思路1:假定q=2%, 记p=P{X1},若pα,则表明小概率事件 发生了,有理由认为q=2%的假定不合理,拒绝这批产品。 p=P{X1}称为“检验的p值”; 思路2:约定检验准则为“当Xk时,拒绝这批产品”。选取 k使P{Xk} α---显著性检验。
i
(包括 x i 自己),则称
xi
在( x 1 , x 2 , , x n )中的秩
为Ri 。
2012-9-25
9
设X
1
, , X
m
和 Y1 , , Y n分别为来自两个相互独立的连续
Yi
i
型分布 F ( x )和 G ( y ) 的样本,记
X 1 , , X m , Y1 , , Y n
称为“显著性检验”, 称为显著性水平或检验水平。
4
显著性检验的基本步骤: (1)根据实际问题作出假设H0与H1; (2)构造检验统计量(在H0真时其分布已知); (3)给定显著性水平的值, 参考H1, 令 P{拒绝H0| H0真}= , (连续型总体) P{拒绝H0| H0真}≤, (离散型总体) 求出拒绝域W; (4) 计算统计量的值, 若统计量W, 则拒绝 H0, 否则接受H0
2012-9-25 11
因此,比较两个总体的分布函数的秩和检验法如下表所示:
H0
F ( x) G ( x)
H1
F ( x) G ( x)
拒 绝 域
W c
W d
W d .or .W c
F ( x) G ( x)
F ( x) G ( x)
F ( x) wenku.baidu.comG ( x)
F ( x) G ( x)
H 1 : 4 . 55
X 4 . 55 0 . 11 5 ~N( 0, 1)
由 p{U U ( ) } α
得水平为的拒绝域为
这里
u 4 . 364 4 . 55 0 . 11 5
U U ( 0 . 05 ) 1 . 645
3 . 78 1 . 645
在合样本
,Wilcoxon提
中的秩为 R
, i 1, 2 , , n
出,把 Y1 , , Y n 在合样本中的秩的总和 W
作为检验统计量,检验原假设:
n
Ri
i 1
H 0 : F ( x) G ( x)
10
若 F ( x) G ( x)
,则
P(X Y )
(
x
g ( y ) dy ) f ( x ) dx
1 0
G ( x) f ( x)dx F ( x) f ( x)dx
F ( x)dF x
zd z 1 2
这表明,在 F ( x ) G ( y ) 时 ,W的值应偏大才合 理。
(5) 为使(4)的P(II)<0.1, n至少取多大?
解
8
3.2秩和检验
一、基本概念
威尔柯克逊(Wilconxon)在1945年提出了比较两 个总体是否同分布的检验--秩和检验法。 定义3.2.1 设 x 1 , x 2 , , x n 为两两互不相等的实数,
若在 x 1 , x 2 , , x n中恰有 R 个元素的值不超过 x i
2 X i ~
i 1
n
2
2n
(2) 某元件寿命X服从上述指数分布,现从中抽取一容量为 n=16的样本,测得样本均值为5010小时,试在水平 0 .0 5 下检验假设:
H 0 : 1 5000 ;
(3) 求上述检验的p值。
H 1 : 1 5000
(4) 若 1 5 1 0 0 ,求检验犯第二类错误的概率。
MATLAB [p,h]=ranksum(x,y,alpha), h=1 X与Y分布显著不 同。
12
2
(一)原假设与备择假设:H0:…;H1:…
(二) 检验法则与拒绝域
假设检验的基本思想是”小概率准则”: 1.给定小概率α—显著性水平; 2.假定原假设成立,根据问题背景决定小概率事件W—拒绝 域; 3.若(x1, …, xn) 使事件W发生, 则拒绝H0;否则接受H0。 这种从样本出发制定的,参考H1,判断是否拒绝H0的法则 称为H0对H1的一个检验法则, 简称检验法
拒绝H0
注:上题中,用双边检验或右边检验都是错误的. 若用双边检验, H0:=4.55;H1:4.55,则拒绝 域为 U U ( ) 1 . 96 由|U|=3.78>1.96,故拒绝H0,说明可以认为该 日铁水的平均含碳量显著异于4.55.但无法说 明是显著高于还是低于4.55.不合题意 若用右边检验, H0:=4.55;H1:>4.55,
2
则拒绝域为
U U ( 0 . 05 ) 1 . 645
由U=-3.78<-1.96,故接受H0,说明不能认为该日铁 水的平均含碳量显著高于4.55.但无法区分是等 于还是低于4.55.不合题意.
例3.1.3设总体X服从参数为 的指数分布, 1, , n为X的样 X X
本。
(1)证明