概率与数理统计,第七章
概率论与数理统计第七章-1矩估计法和极大似然估计法

μ1 h1 (θ1 , θ2 , μ j h j (θ1 , θ2 , μk hk (θ1 , θ2 ,
, θk ) , θk ) , θk )
, μk ) , μk ) , μk )
数理统计
从这 k 个方程中解出
θ1 g1 ( μ1 , μ2 , θ j g j ( μ1 , μ2 , θk gk ( μ1 , μ2 ,
数理统计
定义 用样本原点矩估计相应的总体原点矩 ,
用样本原点矩的连续函数估计相应的总体原点矩的 连续函数, 这种参数点估计法称为矩估计法 . 矩估计法的具体做法如下 设总体的分布函数中含有k个未知参数 θ1 , θ2 , 那么它的前k阶矩 μ1 , μ2 ,
, θk ,
, μk , 一般
l xi P{ X xi ;1 , 2 , , k } l E ( X l ) l 1 hl (1 , 2 , , k ) x l p ( x; , , , )dx 1 2 k
2 1
b μ1 3( μ2 μ12 )
于是 a , b 的矩估计量为
总体矩
a A1 3( A2 A12 ) 3 n 2 X ( X X ) , i n i 1
3 n 2 b X ( X X ) n i 1 i
样本矩
数理统计
例2 设总体 X 的均值 μ和方差 σ 2 ( 0) 都存
数理统计
点估计问题的一般提法 设总体 X 的分布函数 F ( x; )的形式为已
知, 是待估参数 . X 1 , X 2 ,, X n 是 X 的一个样 本, x1 , x2 ,, xn 为相应的一个样本值 .
概率论与数理统计第7章

x 0 , x 0 ,x 1 ,x 2 ,
,x n 为 总 体 X
的 一 个 样 本 ,则 未 知 参 数 的 矩 估 计 ˆ _ _ _ _ _ _ _ _ _ _ _ .
这个例子所作的推断已经体现了极大似然法 的基本思想 .
最大似然估计原理:
设X1,X2,…Xn是取自总体X的一个样本,样 本的联合密度(连续型)或联合分布律 (离散型)为
f (x1,x2,… ,xn ; ) .
当给定样本X1,X2,…Xn时,定义似然函数为:
L() f (x1, x2 ,…, xn; )
得
pˆ1Βιβλιοθήκη nn i 1xix
即为 p 的最大似然估计值 .
从而 p 的最大似然估计量为
p ˆ(X1,
1n ,Xn)ni1Xi X
求最大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合分布率(或联 合密度);
(2) 把样本联合分布率 ( 或联合密度 ) 中自变
量看成已知常数,而把参数 看作自变量,得到似然 函数L();
要求:领会
2.2 估计量的有效性、相合性, 要求:领会
3.区间估计
3.1 置信区间的概念,
要求:领会
3.2 求单个正态总体均值和方差的置信区间,要求:简单应用
参数估计
现在我们来介绍一类重要的统计推断问题
参数估计问题是利用从总体抽样得到的信息来估计总体 的某些参数或者参数的某些函数.
估计新生儿的体重
1 p
n
pxi (1p)1xi
i1
n
n
xi
n xi
pi1 (1p) i1
n
n
xi
n xi
L(p)pi1 (1p) i1
概率论与数理统计复习7章

( n − 1) S 2 ( n − 1) S 2 = 1 − α 即P 2 <σ2 < 2 χα 2 ( n − 1) χ1−α 2 ( n − 1) ( n − 1) S 2 ( n − 1) S 2 置信区间为: 2 , χα 2 ( n − 1) χ12−α 2 ( n − 1)
则有:E ( X v ) = µv (θ1 , θ 2 ,⋯ , θ k ) 其v阶样本矩是:Av = 1 ∑ X iv n i =1
n
估计的未知参数,假定总体X 的k阶原点矩E ( X k ) 存在,
µ θ , θ ,⋯ , θ = A k 1 1 1 2 µ2 θ1, θ 2 ,⋯ , θ k = A2 用样本矩作为总体矩的估计,即令: ⋮ µ θ , θ ,⋯ , θ = A k k k 1 2 ɵ ɵ ˆ 解此方程即得 (θ1 , θ 2 ,⋯ , θ k )的一个矩估计量 θ 1 , θ 2 ,⋯ , θ k
+∞
−∞
xf ( x ) dx = ∫ θ x θ dx =
1 0
令E ( X ) = X ⇒
θ +1
θ
ˆ = X ⇒θ =
( )
X 1− X
θ +1
2
θ
7.2极大似然估计法
极大似然估计法: 设总体X 的概率密度为f ( x,θ ) (或分布率p( x,θ )),θ = (θ1 ,θ 2 ,⋯ ,θ k ) 为 未知参数,θ ∈ Θ, Θ为参数空间,即θ的取值范围。设 ( x1 , x2 ,⋯ , xn ) 是 样本 ( X 1 , X 2 ,⋯ , X n )的一个观察值:
i =1 n
概率论与数理统计第7章参数估计PPT课件

a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
《概率论与数理统计》第七章假设检验.

《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。
能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。
参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。
当然由于样本的随机性,这种推断只能具有⼀定的可靠性。
本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。
由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。
第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。
例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。
现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。
问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。
灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。
即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。
另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。
这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。
究竟是哪种情况与实际情况相符合,这需要作检验。
假如给定显著性⽔平05.0=α。
在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。
概率论与数理统计-参数估计

第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2
令
A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,
即
B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为
《概率论与数理统计》7

未知参数 , ,, 的函数.分别令
12
k
L(1,,k ) 0,(i 1,2,...,k)
或令
i
ln L(1,,k ) 0,(i 1,2,...,k)
i
由此方程组可解得参数 i 的极大似然估计值 ˆi.
例5 设X~b(1,p), X1, X2 , …,Xn是来自X的一个样本,
求参数 p 的最大似然估计量.
解 E( X ) ,E( X 2 ) D( X ) [E( X )]2 2 2
由矩估计法,
【注】
X
1
n
n i 1
X
2 i
2
2
ˆ X ,
ˆ
2
1 n
n i 1
(Xi
X )2
对任何总体,总体均值与方差的矩估计量都不变.
➢常见分布的参数矩估计量
(1)若总体X~b(1, p), 则未知参数 p 的矩估计量为
7-1
第七章
参数估计
统计 推断
的 基本 问题
7-2
参数估 计问题
(第七章)
点估计 区间估 计
假设检 验问题 (第八章)
什么是参数估计?
参数是刻画总体某方面概率特性的数量.
当此数量未知时,从总体抽出一个样本, 用某种方法对这个未知参数进行估计就 是参数估计.
例如,X ~N ( , 2),
若, 2未知, 通过构造样本的函数, 给出
k = k(A1, A2 , …, A k)
用i 作为i的估计量------矩估计量.
例1 设总体X服从[a,b]上的均匀分布,a,b未知,
X1, X2 , …,Xn为来自总体X的样本,试求a,b的 矩估计量.
解 E(X ) a b , D(X ) (b a)2
概率论与数理统计PPT课件第七章最大似然估计

• 最大似然估计的概述 • 最大似然估计的数学基础 • 最大似然估计的实现 • 最大似然估计的应用 • 最大似然估计的扩展
01
最大似然估计的概述
定义与性质
定义
最大似然估计是一种参数估计方法, 通过最大化样本数据的似然函数来估 计参数。
性质
最大似然估计是一种非线性、非参数 的统计方法,具有一致性、无偏性和 有效性等优良性质。
无偏性
在某些条件下,最大似然估计的参数估计值是无偏的,即其期望值等于真实值。
最大似然估计的优缺点
• 有效性:在某些条件下,最大似然估计具有最小方差性质, 即其方差达到最小。
最大似然估计的优缺点
非线性
01
最大似然估计是非线性估计方法,对参数的估计可能存在局部
最优解而非全局最优解。
对初值敏感
02
最大似然估计对初值的选择敏感,不同的初值可能导致不同的
04
最大似然估计的应用
在回归分析中的应用
线性回归
最大似然估计常用于线性回归模型的参数估计,通过最大化似然函 数来估计回归系数。
非线性回归
对于非线性回归模型,最大似然估计同样适用,通过将非线性模型 转换为似然函数的形式进行参数估计。
多元回归
在多元回归分析中,最大似然估计能够处理多个自变量对因变量的影 响,并给出最佳参数估计。
最大熵原理与最大似然估计在某些方面具有相似性,例如都追求最大化某种度量, 但在应用场景和约束条件上有所不同。
THANKS
感谢观看
连续型随机变量的概率密度函数
然函数
基于样本数据和假设的概率模型, 计算样本数据在该模型下的可能 性。
似然函数的性质
非负性、归一化、随着样本数据的 增加而增加。
《概率论与数理统计》第七章

n
n
ln xi
(4)的极大似然估计量为:ˆ
n
n2 i1
lnX
i
2
i1
第七章 参数估计 ‹#›
例 9 设X~b(1,p), X1,X2,…,Xn是来自X的一个样本, 试求参数p的最大似然估计量
解: 设x1, x2,, xn,是相应于样本X1,X2,…,Xn 的一个样本值,X
的分布律为:
(3)以样本各阶矩A1, ,Ak代替总体各阶矩1,
得各参数的矩估计
ˆi gi(A1, ,Ak ), i 1, , k
, k,
第七章 参数估计 ‹#›
注意:
在实际应用时,为求解方便,也可以用
中心矩 i 代替原点矩i,相应地以样本中心矩Bi 估计 i.
(二)最大似然估计法
最(极)大似然估计的原理介绍
第七章
参数估计
目录/Contents
第1章 随机事件与 2 概率
§ 1 点估计
§3
估计量的评选标准
第七章 参数估计 ‹#›
问题的提出:
在实际进行统计时,有不少总体的(我们关心的某 确定指标)概率分布是已知的。比如
例 1 产品寿命服从的分布
X~
f
(
x)
1
x
e
x0
0
其他
但其中有参数是未知的: θ
n
似然函数 L f xi , 。 i 1
, xn ,
极大似然原理:L(ˆ( x1 ,
,
xn
))
max
L(
).
计算简化方法:
在求L 的最大值时,通常转换为求:lnL 的最大值,
lnL 称为对数似然函数.
利用
概率论与数理统计教程第七章答案

.第七章假设检验7.1设总体J〜N(4Q2),其中参数4, /为未知,试指出下面统计假设中哪些是简洁假设,哪些是复合假设:(1) W o: // = 0, σ = 1 ;(2) W o√∕ = O, σ>l5(3) ∕70:// <3, σ = 1 ;(4) % :0< 〃 <3 ;(5)W o :// = 0.解:(1)是简洁假设,其余位复合假设7.2设配么,…,25取自正态总体息(19),其中参数〃未知,无是子样均值,如对检验问题“0 :〃 = 〃o, M :4工从)取检验的拒绝域:c = {(x1,x2,∙∙∙,x25)r∣x-χ∕0∖≥c},试打算常数c ,使检验的显著性水平为0. 05_ Q解:由于J〜N(〃,9),故J~N(",二)在打。
成立的条件下,一/3 5cP o(∖ξ-^∖≥c) = P(∖ξ-μJ^∖≥-)=2 1-Φ(y) =0.05Φ(-) = 0.975,-= 1.96,所以c=L176°3 37. 3 设子样。
,乙,…,25取自正态总体,cr:已知,对假设检验%邛=μ0, H2> /J。
,取临界域c = {(X[,w,…,4):片>9)},(1)求此检验犯第一类错误概率为α时,犯其次类错误的概率夕,并争论它们之间的关系;(2)设〃o=0∙05, σ~=0. 004, a =0.05, n=9,求"=0.65 时不犯其次类错误的概率。
解:(1)在儿成立的条件下,F~N(∕o,军),此时a = P^ξ≥c^ = P0< σo σo )所以,包二为册=4_,,由此式解出c°=窄4f+为% ∖∣n在H∣成立的条件下,W ~ N",啊 ,此时nS = %<c°) = AI。
气L =①(^^~品)二①匹%=①(2δξ^历σoA∣-σ+A)-A-------------- y∕n)。
东华大学《概率论与数理统计》课件 第七章 假设检验

1. 2为已知, 关于的检验(U 检验 )
在上节中讨论过正态总体 N ( , 2 ) 当 2为已知时, 关于 = 0的检验问题 :
假设检验 H0 : = 0 , H1 : 0 ;
我们引入统计量U
=
− 0 0
,则U服从N(0,1)
n
对于给定的检验水平 (0 1)
由标准正态分布分位数定义知,
~
N (0,1),
由标准正态分布分位点的定义得 k = u1− / 2 ,
当 x − 0 / n
u1− / 2时, 拒绝H0 ,
x − 0 / n
u1− / 2时,
接受H0.
假设检验过程如下:
在实例中若取定 = 0.05, 则 k = u1− / 2 = u0.975 = 1.96, 又已知 n = 9, = 0.015, 由样本算得 x = 0.511, 即有 x − 0 = 2.2 1.96,
临界点为 − u1− / 2及u1− / 2.
3. 两类错误及记号
假设检验是根据样本的信息并依据小概率原
理,作出接受还是拒绝H0的判断。由于样本具有 随机性,因而假设检验所作出的结论有可能是错
误的. 这种错误有两类:
(1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称做第一类错误, 又叫弃
设 1,2, ,n 为来自总体 的样本,
因为 2 未知, 不能利用 − 0 来确定拒绝域. / n
因为 Sn*2 是 2 的无偏估计, 故用 Sn* 来取代 ,
即采用 T = − 0 来作为检验统计量.
Sn* / n
当H0为真时,
− 0 ~ t(n −1),
Sn* / n
由t分布分位数的定义知
《概率论与数理统计》课件 第七章 随机变量的数字特征

i 1,2, , 如果 xi pi , 则称 i 1 E( X ) xi pi 为随机变量X的数学期望; i 1
或称为该分布的数学期望,简称期望或均值.
(2)设连续随机变量X的密度函数为p( x),
如果
+
x p( x)dx ,
则称
-
E( X ) xp( x)dx 为随机变量X的数学期望.
5
例2.求二项分布B(n, p)的数学期望.
P(X
k)
n!
k!n
k !
pk
(1
p)nk ,k
1, 2,
, n.
n
解:EX kP{ X k}
k0
n
k
k0
n!
k!n
k !
pk
(1
p)nk
n
np
k 1
k
n 1! 1!n
pk1
k!
(1
p)nk
np[ p (1 p)]n1 np.
特别地,若X服从0 1分布,则EX p.
6
例3. 求泊松分布P( )的数学期望.
注:P( X k) k e , k 1, 2, .
k!
解:EX k k e e
k1
e
k1
k0 k !
k1 k 1 !
k1 k 1 !
ee
e x 1 x 1 x2 1 xn [这里,x ]
当 a 450时,平均收益EY 最大.
28
第二节 方差与标准差
29
引例
比较随机变量X、Y 的期望
X3 4 5 Y1 4 7 P 0.1 0.8 0.1 P 0.4 0.2 0.4
01 2 3 4 5 67
概率与数理统计第7章参数估计习题与答案

第7章参数估计----点估计一、填空题1、设总体X服从二项分布B(N,p),0P1,X1,X2X n是其一个样本,那么矩估计量p?XN.2、设总体X~B(1,p),其中未知参数0p1,X1,X2,X n是X的样本,则p的矩估计为_ 1n in1X i _,样本的似然函数为_in1X i(1p)1Xp__。
i3、设X1,X2,,X n是来自总体X~N(,2)的样本,则有关于及2的似然函数2L(X,X,X n;,)_12 in112e12(X) i22__。
二、计算题1、设总体X具有分布密度f(x;)(1)x,0x1,其中1是未知参数,X1,X2,X为一个样本,试求参数的矩估计和极大似然估计.n解:因E(X ) 1x1a()α1(α1)xdx1x dxαα112a2|xααα12令E(X)X?α?α122X1α?为的矩估计1Xn因似然函数L(x1,x2,x;)(1)(x1x2x)nnnlnLnln(α1)lnX,由αii1 l nLαnα 1inlnX0得,i1n ?的极大似量估计量为(1)αnln Xii12、设总体X服从指数分布f(x)xe,x00,其他,X1,X2,X n是来自X的样本,(1)求未知参数的矩估计;(2)求的极大似然估计.56解:(1)由于1 E(X),令11 X X,故的矩估计为? 1 X(2)似然函数nL(x,x,,x )e12ni nx i 1nlnLnlnxii1 ndlnLnnx0 indi1x ii1故的极大似然估计仍为1 X 。
3、设总体 2 X~N0,, X 1,X 2,,X n 为取自X 的一组简单随机样本,求 2 的极大似然估计;[解](1)似然函数n1 Le i122 x i 2 22n 22en 2x i 2 i 12于是n2nnx2i lnLln2ln2222i1 dlnLn1d224 22n i1 2x i,令 d lnL 2d 2 0,得的极大似然估计:n 122X ini1. 4、设总体X 服从泊松分布P(),X 1,X 2,,X n 为取自X 的一组简单随机样本,(1)求 未知参数估计;(2)求大似然估计. 解:(1)令E(X )X?X ,此为估计。
《概率论与数理统计》课件第七章 参数估计

03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10
比
11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.
故
D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2
时
3
令
1
当
6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题
概率与数理统计第7章参数估计习题及答案

第7章参数估计 ----点估计一、填空题1、设总体X 服从二项分布),(p N B ,10P ,n X X X 21,是其一个样本,那么矩估计量pX N.2、设总体)p ,1(B ~X ,其中未知参数01p, X X X n 12,,是X 的样本,则p 的矩估计为_n1i iX n1_,样本的似然函数为_iiX 1n1i X )p 1(p __。
3、设12,,,n X X X 是来自总体),(N ~X 2的样本,则有关于及2的似然函数212(,,;,)n L X X X _2i2)X (21n1i e21__。
二、计算题1、设总体X 具有分布密度(;)(1),01f x x x ,其中1是未知参数,n X X X ,,21为一个样本,试求参数的矩估计和极大似然估计.解:因10101α1α1αdxxdxx x X E a)()()(2α1α2α1α12|a x令2α1α)(XX E XX112α为的矩估计因似然函数1212(,,;)(1)()nn n L x x x x x x ni i X n L 1α1αln )ln(ln ,由ni iX n L 101ααln ln 得,的极大似量估计量为)ln (ni iX n11α2、设总体X 服从指数分布,0()0,xe xf x 其他,n X X X ,,21是来自X 的样本,(1)求未知参数的矩估计;(2)求的极大似然估计.解:(1)由于1()E X ,令11XX,故的矩估计为1X(2)似然函数112(,,,)nii x nn L x x x e111ln lnln 0nii nini ii L n x d Lnnx dx 故的极大似然估计仍为1X。
3、设总体2~0,X N ,12,,,n X X X 为取自X 的一组简单随机样本,求2的极大似然估计;[解] (1)似然函数222112i x ni Le2212222ni i x ne于是2221ln ln 2ln222ni i x n n L22241ln 122n ii d L n x d,令2ln 0d L d,得2的极大似然估计:2211nii X n.4、设总体X 服从泊松分布()P , 12,,,n X X X 为取自X 的一组简单随机样本, (1)求未知参数的矩估计;(2)求的极大似然估计.解:(1)令()E X XX ,此为的矩估计。
概率论与数理统计(茆诗松)第二版课后第七章习题参考答案

第七章 假设检验习题7.11. 设X 1 , …, X n 是来自N (µ , 1) 的样本,考虑如下假设检验问题H 0:µ = 2 vs H 1:µ = 3,若检验由拒绝域为}6.2{≥=x W 确定. (1)当n = 20时求检验犯两类错误的概率;(2)如果要使得检验犯第二类错误的概率β ≤ 0.01,n 最小应取多少? (3)证明:当n → ∞ 时,α → 0,β → 0. 解:(1)犯第一类错误的概率为0037.0)68.2(168.220126.21}2|6.2{}|{0=Φ−=⎭⎬⎫⎩⎨⎧=−≥−==≥=∈=n X P X P H W X P µµα,犯第二类错误的概率为0367.0)79.1(79.120136.21}3|6.2{}|{1=−Φ=⎭⎬⎫⎩⎨⎧−=−<−==<=∉=n X P X P H W X P µµβ;(2)因01.0)4.0(4.0136.21}3|6.2{≤−Φ=⎭⎬⎫⎩⎨⎧−=−<−==<=n n n n X P X P µµβ,则99.0)4.0(≥Φn ,33.24.0≥n ,n ≥ 33.93,故n 至少为34;(3))(0)6.0(16.0126.21}2|6.2{∞→→Φ−=⎭⎬⎫⎩⎨⎧=−≥−==≥=n n n n n X P X P µµα,)(0)4.0(4.0136.21}3|6.2{∞→→−Φ=⎭⎬⎫⎩⎨⎧−=−<−==<=n n n n n X P X P µµβ. 2. 设X 1 , …, X 10是来自0-1总体b (1, p ) 的样本,考虑如下检验问题H 0:p = 0.2 vs H 1:p = 0.4,取拒绝域为}5.0{≥=x W ,求该检验犯两类错误的概率. 解:因X ~ b(1, p ),有),10(~10101p b X X i i =∑=,则0328.08.02.0}2.0|510{}2.0|5.0{}|{10510100=⋅⋅==≥==≥=∈=∑=−k k k kC p X P p X P H W X P α,6331.06.04.0}4.0|510{}4.0|5.0{}|{410101=⋅⋅==<==<=∉=∑=−k k k kC p X P p X P H W X P β.3. 设X 1 , …, X 16是来自正态总体N (µ , 4) 的样本,考虑检验问题H 0:µ = 6 vs H 1:µ ≠ 6,拒绝域取为}|6{|c x W ≥−=,试求c 使得检验的显著性水平为0.05,并求该检验在µ = 6.5处犯第二类错误的概率.解:因05.0)]2(1[22162162}6||6{|}|{0=Φ−=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧=≥−==≥−=∈=c c c X P c X P H W X P µµα,则Φ (2c ) = 0.975,2c = 1.96,故c = 0.98;故}5.6|48.05.648.1{}5.6|98.0|6{|}|{1=<−<−==<−=∉=µµβX P X P H W X P83.0)96.2()96.0(96.01625.696.2=−Φ−Φ=⎭⎬⎫⎩⎨⎧<−<−=X P .4. 设总体为均匀分布U (0, θ ),X 1 , …, X n 是样本,考虑检验问题H 0:θ ≥ 3 vs H 1:θ < 3,拒绝域取为}5.2{)(≤=n x W ,求检验犯第一类错误的最大值α ,若要使得该最大值α 不超过0.05,n 至少应取多大?解:因均匀分布最大顺序统计量X (n ) 的密度函数为θθ<<−Ι=x nn n nx x p 01)(,则nn n n nn n n x dx nx X P H W X P ⎟⎠⎞⎜⎝⎛=====≤=∈=∫−6535.233}3|5.2{}|{5.205.201)(0θα, 要使得α ≤ 0.05,即05.065≤⎟⎠⎞⎜⎝⎛n,43.16)6/5ln(05.0ln =≥n ,故n 至少为17.5. 在假设检验问题中,若检验结果是接受原假设,则检验可能犯哪一类错误?若检验结果是拒绝原假设,则又有可能犯哪一类错误?答:若检验结果是接受原假设,当原假设为真时,是正确的决策,未犯错误;当原假设不真时,则犯了第二类错误.若检验结果是拒绝原假设,当原假设为真时,则犯了第一类错误;当原假设不真时,是正确的决策,未犯错误.6. 设X 1 , …, X 20是来自0-1总体b (1, p ) 的样本,考虑如下检验问题H 0:p = 0.2 vs H 1:p ≠ 0.2,取拒绝域为⎭⎬⎫⎩⎨⎧≤≥=∑∑==17201201i i i i x x W 或,(1)求p = 0, 0.1, 0.2, …, 0.9, 1的势并由此画出势函数的图;(2)求在p = 0.05时犯第二类错误的概率.解:(1)因X ~ b(1, p ),有),20(~201p b X i i ∑=,势函数∑∑=−=−⎟⎟⎠⎞⎜⎜⎝⎛−=⎭⎬⎫⎩⎨⎧∈=6220201)1(201)(k kk i i p p k p WX P p g , 故110201)0(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k k k k g ,3941.09.01.0201)1.0(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k kk k g , 1559.08.02.0201)2.0(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k k k k g ,3996.07.03.0201)3.0(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k k kk g ,7505.06.04.0201)4.0(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k k kk g ,9424.05.05.0201)5.0(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k k k k g , 9935.04.06.0201)6.0(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k k k k g ,9997.03.07.0201)7.0(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k k kk g , 999998.02.08.0201)8.0(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k k kk g11.09.0201)9.0(6220≈××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k k kk g , 101201)1(6220=××⎟⎟⎠⎞⎜⎜⎝⎛−=∑=−k kk k g ; (2)在p = 0.05时犯第二类错误的概率2641.095.005.02005.0|6220201=××⎟⎟⎠⎞⎜⎜⎝⎛=⎭⎬⎫⎩⎨⎧=∉=∑∑=−=k kk i i k p W X P β. 7. 设一个单一观测的样本取自密度函数为p (x )的总体,对p (x )考虑统计假设: H 0:p 0(x ) = I 0 < x < 1 vs H 1:p 1(x ) = 2x I 0 < x < 1.若其拒绝域的形式为W = {x : x ≥ c },试确定一个c ,使得犯第一类,第二类错误的概率满足α + 2β 为最小,并求其最小值.解:当0 < c < 1时,α = P {X ∈ W | H 0} = P {X ≥ c | X ~ p 0(x )} = 1 − c ,且20112)}(~|{}H |{c xdx x p X c X P W X P c==<=∉=∫β,则2224128721161287212⎟⎠⎞⎜⎝⎛−+=⎟⎠⎞⎜⎝⎛+−+=+−=+c c c c c βα,故当41=c 时,α + 2β 为最小,其最小值为87. 8. 设X 1, X 2, …, X 30为取自柏松分布P (λ)的随机样本.(1)试给出单侧假设检验问题H 0:λ ≤ 0.1 vs H 1:λ > 0.1的显著水平α = 0.05的检验; (2)求此检验的势函数β (λ)在λ = 0.05, 0.2, 0.3, …, 0.9时的值,并据此画出β (λ)的图像.解:(1)因)30(~3021λP X X X X n +++=L ,假设H 0:λ ≤ 0.1 vs H 1:λ > 0.1, 统计量)30(~λP X n ,当H 0成立时,设)3(~P X n ,其p 分位数)3(p P 满足∑∑=−−=−≤<)3(031)3(03e !3e !3p p P k k P k k k p k 显著水平α = 0.05,可得P 1−α (3) = P 0.95 (3) = 6,右侧拒绝域}7{≥=x n W ;(2)因∑=−−=≥=∈=630e!)30(1}|7{}|{)(k k k X n P W X n P λλλλλβ, g故0001.0e !5.11)05.0(605.1=−=∑=−k k k β,3937.0e !61)2.0(606=−=∑=−k k k β,7932.0e !91)3.0(609=−=∑=−k k k β,9542.0e !121)4.0(6012=−=∑=−k k k β,9924.0e !151)5.0(6015=−=∑=−k k k β,9990.0e !181)6.0(6018=−=∑=−k k k β,9999.0e !211)7.0(6021=−=∑=−k kk β, 1e !241)8.0(6024≈−=∑=−k k k β,1e !271)9.0(6027≈−=∑=−k k k β.习题7.2说明:本节习题均采用拒绝域的形式完成,在可以计算检验的p 值时要求计算出p 值. 1. 有一批枪弹,出厂时,其初速率v ~ N (950, 1000)(单位:m /s ).经过较长时间储存,取9发进行测试,得样本值(单位:m /s )如下:914 920 910 934 953 945 912 924 940.据经验,枪弹经储存后其初速率仍服从正态分布,且标准差保持不变,问是否可认为这批枪弹的初速率有显著降低(α = 0.05)?解:设枪弹经储存后其初速率X ~ N (µ , 1000),假设H 0:µ = 950 vs H 1:µ < 950,已知σ 2,选取统计量)1,0(~N nX U σµ−=, 显著性水平α = 0.05,u 1 − α = u 0.95 = 1.645,左侧拒绝域W = {u ≤ −1.645}, 因928=x ,µ = 950,σ = 10,n = 9, 则W u ∈−=−=6.6910950928,并且检验的p 值p = P {U ≤ −6.6} = 2.0558 × 10−11 < α = 0.05,故拒绝H 0,接受H 1,即可以认为这批枪弹的初速率有显著降低. 2. 已知某炼铁厂铁水含碳量服从正态分布N (4.55, 0.1082 ).现在测定了9炉铁水,其平均含碳量为4.484,如果铁水含碳量的方差没有变化,可否认为现在生产的铁水平均含碳量仍为4.55(α = 0.05)? 解:设现在生产的铁水含碳量X ~ N (µ , 0.1082 ),假设H 0:µ = 4.55 vs H 1:µ ≠ 4.55,已知σ 2,选取统计量)1,0(~N nX U σµ−=, 显著性水平α = 0.05,u 1 − α /2 = u 0.975 = 1.96,双侧拒绝域W = {| u | ≥ 1.96}, 因484.4=x ,µ = 4.55,σ = 0.108,n = 9, 则W u ∉−=−=8333.19108.055.4484.4,并且检验的p 值p = 2P {U ≤ −1.8333} = 0.0668 > α = 0.05,β (故接受H 0,拒绝H 1,即可以认为现在生产的铁水平均含碳量仍为4.55. 3. 由经验知某零件质量X ~ N (15, 0.05 2 ) (单位:g ),技术革新后,抽出6个零件,测得质量为14.7 15.1 14.8 15.0 15.2 14.6.已知方差不变,问平均质量是否仍为15 g (取α = 0.05)?解:设技术革新后零件质量X ~ N (µ , 0.05 2 ),假设H 0:µ = 15 vs H 1:µ ≠ 15,已知σ 2,选取统计量)1,0(~N nX U σµ−=, 显著性水平α = 0.05,u 1 − α /2 = u 0.975 = 1.96,双侧拒绝域W = {| u | ≥ 1.96}, 因9.14=x ,µ = 15,σ = 0.05,n = 6, 则W u ∈−=−=8990.4605.0159.14,并且检验的p 值p = 2P {U ≤ −4.8990} = 9.6326 × 10−7 < α = 0.05,故拒绝H 0,接受H 1,即不能认为平均质量仍为15 g . 4. 化肥厂用自动包装机包装化肥,每包的质量服从正态分布,其平均质量为100 kg ,标准差为1.2 kg .某日开工后,为了确定这天包装机工作是否正常,随机抽取9袋化肥,称得质量如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5.设方差稳定不变,问这一天包装机的工作是否正常(取α = 0.05)? 解:设这天包装机包装的化肥每包的质量X ~ N (µ , 1.22 ),假设H 0:µ = 100 vs H 1:µ ≠ 100,已知σ 2,选取统计量)1,0(~N nX U σµ−=, 显著性水平α = 0.05,u 1 − α /2 = u 0.975 = 1.96,双侧拒绝域W = {| u | ≥ 1.96}, 因9778.99=x ,µ = 100,σ = 1.2,n = 9, 则W u ∉−=−=0556.092.11009778.99,并且检验的p 值p = 2P {U ≤ −0.0556} = 0.9557 > α = 0.05,故接受H 0,拒绝H 1,即可以认为这一天包装机的工作正常. 5. 设需要对某正态总体的均值进行假设检验H 0:µ = 15, H 1:µ < 15.已知σ 2 = 2.5,取α = 0.05,若要求当H 1中的µ ≤ 13时犯第二类错误的概率不超过0.05,求所需的样本容量.解:设该总体X ~ N (µ , 2.5 ),假设H 0:µ = 15 vs H 1:µ < 15,已知σ 2,选取统计量)1,0(~N nX U σµ−=, 显著性水平α = 0.05,u 1 − α = u 0.95 = 1.645,左侧拒绝域W = {u ≤ −1.645}, 因µ = 15,σ 2 = 2.5,有nx u 5.215−=,当µ ≤ 13时犯第二类错误的概率为⎭⎬⎫⎩⎨⎧≤−+−>−=⎭⎬⎫⎩⎨⎧≤−>−=13|5.21565.15.213|65.15.215µµµµβn n X P n X P 05.0)2649.165.1(15.2131565.15.2≤+−Φ−=⎭⎬⎫⎩⎨⎧−+−>−≤n n nX P µ,则95.0)2649.165.1(≥+−Φn ,即65.12649.165.1≥+−n ,6089.2≥n ,n ≥ 6.8064, 故样本容量n 至少为7.6. 从一批钢管抽取10根,测得其内径(单位:mm )为:100.36 100.31 99.99 100.11 100.64 100.85 99.42 99.91 99.35 100.10.设这批钢管内直径服从正态分布N (µ , σ 2),试分别在下列条件下检验假设(α = 0.05).H 0:µ = 100 vs H 1:µ > 100.(1)已知σ = 0.5; (2)σ 未知.解:设这批钢管内直径X ~ N (µ , σ 2),假设H 0:µ = 100 vs H 1:µ > 100,(1)已知σ 2,选取统计量)1,0(~N nX U σµ−=, 显著性水平α = 0.05,u 1 − α = u 0.95 = 1.645,右侧拒绝域W = {u ≥ 1.645}, 因104.100=x ,µ = 100,σ = 0.5,n = 10, 则W u ∉=−=6578.0105.0100104.100,并且检验的p 值p = P {U ≥ 0.6578} = 0.2553 > α = 0.05,故接受H 0,拒绝H 1,即不能认为µ > 100. (2)未知σ 2,选取统计量)1(~−−=n t nS X T µ, 显著性水平α = 0.05,t 1 − α (n − 1) = t 0.95 (9) = 1.8331,右侧拒绝域W = {t ≥ 1.8331}, 因104.100=x ,µ = 100,s = 0.4760,n = 10, 则W t ∉=−=6910.0104760.0100104.100,并且检验的p 值p = P {T ≥ 0.6910} = 0.2535 > α = 0.05,故接受H 0,拒绝H 1,即不能认为µ > 100.7. 假定考生成绩服从正态分布,在某地一次数学统考中,随机抽取了36位考生的成绩,算得平均成绩为66.5分,标准差为15分,问在显著性水平0.05下,是否可以认为这次考试全体考生的平均成绩为70分?解:设这次考试考生的成绩X ~ N (µ , σ 2 ),假设H 0:µ = 70 vs H 1:µ ≠ 70,未知σ 2,选取统计量)1(~−−=n t nS X T µ, 显著性水平α = 0.05,t 1 − α /2 (n − 1) = t 0.975 (35) = 2.0301,双侧拒绝域W = {| t | ≥ 2.0301}, 因5.66=x ,µ = 70,s = 15,n = 36, 则W t ∉−=−=4.13615705.66,并且检验的p 值p = 2P {T ≤ −1.4} = 0.1703 > α = 0.05,故接受H 0,拒绝H 1,即可以认为这次考试全体考生的平均成绩为70分. 8. 一个小学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看8 h 电视.”她认为她所在学校的学生看电视的时间明显小于该数字.为此她在该校随机调查了100个学生,得知平均每周看电视的时间5.6=x h ,样本标准差为s = 2 h .问是否可以认为这位校长的看法是对的(取α = 0.05)? 解:设学生看电视的时间X ~ N (µ , σ 2 ),假设H 0:µ = 8 vs H 1:µ < 8,未知σ 2,选取统计量)1(~−−=n t nS X T µ,n = 100,大样本,有)1,0(~N n S X T &µ−=,显著性水平α = 0.05,t 1 − α (n − 1) = t 0.95 (99) ≈ u 0.95 = 1.645,左侧拒绝域W ≈ {t ≤ −1.645},因5.6=x ,µ = 8,s = 2,n = 100, 则W t ∈−=−=5.7100285.6,并且检验的p 值p = P {T ≤ −7.5} = 3.1909 × 10−14 < α = 0.05,故拒绝H 0,接受H 1,即可以认为这位校长的看法是对的.9. 设在木材中抽出100根,测其小头直径,得到样本平均数2.11=x cm ,样本标准差为s = 2.6 cm ,问该批木材小头的平均直径能否认为不低于12 cm (取α = 0.05)? 解:设该批木材小头的直径X ~ N (µ , σ 2 ),假设H 0:µ = 12 vs H 1:µ < 12,未知σ 2,选取统计量)1(~−−=n t n S X T µ,n = 100,大样本,有)1,0(~N nS X T &µ−=, 显著性水平α = 0.05,t 1 − α (n − 1) = t 0.95 (99) ≈ u 0.95 = 1.645,左侧拒绝域W ≈ {t ≤ −1.645},因2.11=x ,µ = 12,s = 2.6,n = 100, 则W t ∈−=−=0769.31006.2122.11,并且检验的p 值p = P {T ≤ −3.0769} = 0.0010 < α = 0.05,故拒绝H 0,接受H 1,即不能认为这批木材小头的平均直径不低于12 cm .10.考察一鱼塘中鱼的含汞量,随机地取10条鱼测得各条鱼的含汞量(单位:mg )为:0.8 1.6 0.9 0.8 1.2 0.4 0.7 1.0 1.2 1.1.设鱼的含汞量服从正态分布N (µ , σ 2),试检验假设H 0:µ = 1.2 vs H 1:µ > 1.2(取α = 0.10). 解:设鱼的含汞量X ~ N (µ , σ 2 ),假设H 0:µ = 1.2 vs H 1:µ > 1.2,未知σ 2,选取统计量)1(~−−=n t nSX T µ,显著性水平α = 0.1,t 1 − α (n − 1) = t 0.9 (9) = 1.3830,右侧拒绝域W = {t ≥ 1.3830}, 因97.0=x ,µ = 1.2,s = 0.3302,n = 10, 则W t ∉−=−=2030.2103302.02.197.0,并且检验的p 值p = P {T ≥ −2.2030} = 0.9725 > α = 0.10,故接受H 0,拒绝H 1,即不能认为µ > 1.2 . 11.如果一个矩形的宽度w 与长度l 的比618.0)15(21≈−=l w ,这样的矩形称为黄金矩形.下面列出某工艺品工厂随机取的20个矩形宽度与长度的比值.0.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.553 0.570 0.844 0.576 0.933 0.630.设这一工厂生产的矩形的宽度与长度的比值总体服从正态分布,其均值为µ ,试检验假设(取α = 0.05)H 0:µ = 0.618 vs H 1:µ ≠ 0.618.解:设这一工厂生产的矩形的宽度与长度的比值X ~ N (µ , σ 2 ),假设H 0:µ = 0.618 vs H 1:µ ≠ 0.618,未知σ 2,选取统计量)1(~−−=n t nS X T µ, 显著性水平α = 0.05,t 1 − α /2 (n − 1) = t 0.975 (19) = 2.0930,双侧拒绝域W = {| t | ≥ 2.0930},因6620.0=x ,µ = 0.618,s = 0.0918,n = 20, 则W t ∈=−=1422.2200918.0618.06620.0,并且检验的p 值p = 2P {T ≥ 2.1422} = 0.0453 < α = 0.05,故拒绝H 0,接受H 1,即不能认为µ = 0.618.12.下面给出两种型号的计算器充电以后所能使用的时间(h )的观测值型号A 5.5 5.6 6.3 4.6 5.3 5.0 6.2 5.8 5.1 5.2 5.9;型号B 3.8 4.3 4.2 4.0 4.9 4.5 5.2 4.8 4.5 3.9 3.7 4.6.设两样本独立且数据所属的两总体的密度函数至多差一个平移量.试问能否认为型号A 的计算器平均使用时间明显比型号B 来得长(取α = 0.01)?解:设两种型号的计算器充电以后所能使用的时间分别为),(~211σµN X ,),(~222σµN Y ,且2221σσ=,假设H 0:µ 1 = µ 2 vs H 1:µ 1 > µ 2,未知2221,σσ,但2221σσ=,选取统计量)2(~112121−++−=n n t n n S YX T w ,显著性水平α = 0.01,t 1 − α (n 1 + n 2 − 2) = t 0.99 (21) = 2.5176,右侧拒绝域W = {t ≥ 2.5176}, 因5.5=x ,3667.4=y ,s x = 0.5235,s y = 0.4677,n 1 = 11,n 2 = 12,4951.0214677.0115235.0102)1()1(22212221=×+×=−+−+−=n n s n s n s yx w ,则W t ∈=+×−=4844.51211114951.03667.45.5,并且检验的p 值p = P {T ≥ 5.4844} = 9.6391 × 10 −6 < α = 0.01,故拒绝H 0,接受H 1,即可以认为型号A 的计算器平均使用时间明显比型号B 来得长.13.从某锌矿的东、西两支矿脉中,各抽取样本容量分别为9与8的样本进行测试,得样本含锌平均数及样本方差如下:东支:1337.0,230.0211==s x ;西支:1736.0,269.0222==s x .若东、西两支矿脉的含锌量都服从正态分布且方差相同,问东、西两支矿脉含锌量的平均值是否可以看作一样(取α = 0.05)?解:设东、西两支矿脉的含锌量分别为),(~211σµN X ,),(~222σµN Y ,且2221σσ=,假设H 0:µ 1 = µ 2 vs H 1:µ 1 ≠ µ 2,未知2221,σσ,但2221σσ=,选取统计量)2(~11212121−++−=n n t n n S X X T w,显著性水平α = 0.05,t 1 − α /2 (n 1 + n 2 − 2) = t 0.975 (15) = 2.1314,双侧拒绝域W = {| t | ≥ 2.1314},因1736.0,269.0,1337.0,230.0222211====s x s x ,n 1 = 9,n 2 = 8,3903.0151736.071337.082)1()1(21222211=×+×=−+−+−=n n s n s n s w ,则W t ∉−=+×−=2056.081913903.0269.0230.0,并且检验的p 值p = 2P {T ≤ −0.2056} = 0.8399 > α = 0.05, 故接受H 0,拒绝H 1,即可以认为东、西两支矿脉含锌量的平均值是一样的.14.在针织品漂白工艺过程中,要考察温度对针织品断裂强力(主要质量指标)的影响.为了比较70°C与80°C 的影响有无差别,在这两个温度下,分别重复做了8次试验,得数据如下(单位:N ):70°C 时的强力:20.5 18.8 19.8 20.9 21.5 19.5 21.0 21.2, 80°C 时的强力:17.7 20.3 20.0 18.8 19.0 20.1 20.0 19.1.根据经验,温度对针织品断裂强力的波动没有影响.问在70°C 时的平均断裂强力与80°C 时的平均断裂强力间是否有显著差别?(假设断裂强力服从正态分布,α = 0.05)解:设在70°C 和80°C 时的断裂强力分别为),(~211σµN X ,),(~222σµN Y ,且2221σσ=,假设H 0:µ 1 = µ 2 vs H 1:µ 1 ≠ µ 2,未知2221,σσ,但2221σσ=,选取统计量)2(~112121−++−=n n t n n S Y X T w,显著性水平α = 0.05,t 1 − α /2 (n 1 + n 2 − 2) = t 0.975 (14) = 2.1448,双侧拒绝域W = {| t | ≥ 2.1448}, 因4.20=x ,375.19=y ,s x = 0.9411,s y = 0.8876,n 1 = 8,n 2 = 8,9148.0148876.079411.072)1()1(22212221=×+×=−+−+−=n n s n s n s yx w ,则W t ∈=+×−=2410.281819148.0375.194.20,并且检验的p 值p = 2P {T ≥ 2.2410} = 0.0418 < α = 0.05, 故拒绝H 0,接受H 1,即可以认为70°C 时的平均断裂强力与80°C 时的平均断裂强力间有显著差别. 15.一药厂生产一种新的止痛片,厂方希望验证服用新药片后至开始起作用的时间间隔较原有止痛片至少缩短一半,因此厂方提出需检验假设H 0:µ 1 = 2µ 2 vs H 1:µ 1 > 2µ 2.此处µ 1 , µ 2分别是服用原有止痛片和服用新止痛片后至开始起作用的时间间隔的总体的均值.设两总体均为正态分布且方差分别为已知值2221,σσ,现分别在两总体中取一样本X 1 , …, X n 和Y 1 , …, Y m ,设两个样本独立.试给出上述假设检验问题的检验统计量及拒绝域.解:设服用原有止痛片和新止痛片后至开始起作用的时间间隔分别为),(~211σµN X ,),(~222σµN Y ,因X 1 , …, X n 和Y 1 , …, Y m 分别X 和Y 为来自的样本,且两个样本独立,则),(~211n N X σµ,,(~222mN Y σµ,且X 与Y 独立,有4,2(~2222121m n N Y X σσµµ+−−, 标准化,得)1,0(~4)2()2(222121N mnY X σσµµ+−−−,假设H 0:µ 1 = 2µ 2 vs H 1:µ 1 > 2µ 2,已知2221,σσ,选取统计量)1,0(~422221N mnYX U σσ+−=,显著性水平α ,右侧拒绝域W = {u ≥ u 1 − α}.16.对冷却到−0.72°C 的样品用A 、B 两种测量方法测量其融化到0°C 时的潜热,数据如下:方法A :79.98 80.04 80.02 80.04 80.03 80.03 80.04 79.97 80.05 80.03 80.02 80.0080.02,方法B :80.02 79.94 79.98 79.97 80.03 79.95 79.97 79.97.假设它们服从正态分布,方差相等,试检验:两种测量方法的平均性能是否相等?(取α = 0.05).解:设用A 、B 两种测量方法测量的潜热分别为),(~211σµN X ,),(~222σµN Y ,且2221σσ=,假设H 0:µ1 = µ2 vs H 1:µ1 ≠ µ2,未知2221,σσ,但2221σσ=,选取统计量)2(~112121−++−=n n t n n S YX T w ,显著性水平α = 0.05,t 1−α /2 (n 1 + n 2 − 2) = t 0.975 (19) = 2.0930,双侧拒绝域W = {| t | ≥ 2.0930}, 因0208.80=x ,9787.79=y ,s x = 0.0240,s y = 0.0.314,n 1 = 8,n 2 = 8,0269.0190314.070240.0122)1()1(22212221=×+×=−+−+−=n n s n s n s yx w ,则W t ∈=+×−=4722.3811310269.09787.790208.80,并且检验的p 值p = 2P {T ≥ 3.4722} = 0.0026 < α = 0.05,故拒绝H 0,接受H 1,可以认为两种测量方法的平均性能不相等.17.为了比较测定活水中氯气含量的两种方法,特在各种场合收集到8个污水样本,每个水样均用这两种方法测定氯气含量(单位:mg /l ),具体数据如下:水样号 方法一(x ) 方法二(y ) 差(d = x − y ) 1 0.36 0.39 −0.03 2 1.35 0.84 0.51 3 2.56 1.76 0.80 4 3.92 3.35 0.57 5 5.35 4.69 0.66 6 8.33 7.70 0.63 7 10.70 10.52 0.18 8 10.91 10.92 −0.01设总体为正态分布,试比较两种测定方法是否有显著差异.请写出检验的p 值和结论(取α = 0.05).解:设用这两种测定方法测定的氯气含量之差为),(~2d d N Y X D σµ−=,成对数据检验,假设H 0:µ d = 0 vs H 1:µ d ≠ 0,未知2d σ,选取统计量)1(~−=n t nS D T d,显著水平α = 0.05,t 1−α /2 (n − 1) = t 0.975 (7) = 2.3646,双侧拒绝域W = {| t | ≥ 2.3646}, 因4138.0=d ,s d = 0.3210,n = 8, 则W t ∈==6461.383210.04138.0,并且检验的p 值p = 2P {T ≥ 3.6461} = 0.0082 < α = 0.05,故拒绝H 0,接受H 1,可以认为两种测定方法有显著差异.18.一工厂的;两个化验室每天同时从工厂的冷却水取样,测量水中的含气量(10−6)一次,下面是7天的记录:室甲:1.15 1.86 0.75 1.82 1.14 1.65 1.90, 室乙:1.00 1.90 0.90 1.80 1.20 1.70 1.95.设每对数据的差d i = x i − y i (i = 1, 2, …, 7)来自正态总体,问两化验室测定结果之间有无显著差异?(α = 0.01)解:设两个化验室测定的含气量数据之差为),(~2d d N Y X D σµ−=,成对数据检验,假设H 0:µ d = 0 vs H 1:µ d ≠ 0,未知2d σ,选取统计量)1(~−=n t nS D T d,显著水平α = 0.01,t 1−α /2 (n − 1) = t 0.995 (6) = 3.7074,双侧拒绝域W = {| t | ≥ 3.7074}, 因0257.0−=d ,s d = 0.0922,n = 7, 则W t ∉−=−=7375.070922.00257.0,并且检验的p 值p = 2P {T ≤ −0.7375} = 0.4886 > α = 0.05,故接受H 0,拒绝H 1,可以认为两化验室测定结果之间没有显著差异.19.为比较正常成年男女所含红血球的差异,对某地区156名成年男性进行测量,其红血球的样本均值为465.13(104/mm 3),样本方差为54.802;对该地区74名成年女性进行测量,其红血球的样本均值为422.16,样本方差为49.202.试检验:该地区正常成年男女所含红血球的平均值是否有差异?(取α = 0.05)解:设该地区正常成年男女所含红血球分别为),(~211σµN X ,),(~222σµN Y ,假设H 0:µ1 = µ2 vs H 1:µ1 ≠ µ2,未知2221,σσ,大样本场合,选取统计量)1,0(~2212N n S n SY X U yx&+−=,显著水平α = 0.05,u 1−α /2 = u 0.975 = 1.96,双侧拒绝域W = {| t | ≥ 1.96},因222220.49,16.422,80.54,13.465====y x s y s x ,n 1 = 156,n 2 = 74,则W u ∈=+−=9611.57420.4915680.5416.42213.46522,并且检验的p 值p = 2P {U ≥ 5.9611} = 2.5055 × 10−9 < α = 0.05,故拒绝H 0,接受H 1,可以认为该地区正常成年男女所含红血球的平均值有差异.20.为比较不同季节出生的女婴体重的方差,从去年12月和6月出生的女婴中分别随机地抽取6名及10名,测其体重如下(单位:g ):12月:3520 2960 2560 2960 3260 3960,6月:3220 3220 3760 3000 2920 3740 3060 3080 2940 3060.假定新生女婴体重服从正态分布,问新生女婴体重的方差是否是冬季的比夏季的小(取α = 0.05)?解:设12月和6月出生的女婴体重分别为),(~211σµN X ,),(~222σµN Y ,假设H 0:2221σσ= vs H 1:2221σσ<,选取统计量)1,1(~2122−−=n n F S S F yx,显著水平α = 0.05,21.077.41)5,9(1)9,5()1,1(95.005.021====−−F F n n F α,左侧拒绝域W = { f ≤ 0.21},因225960.491=x s ,225217.306=y s ,则W f ∉==5721.25217.3065960.49122,并且检验的p 值p = P {F ≤ 2.5721} = 0.8967 > α = 0.05,故接受H 0,拒绝H 1,新生女婴体重的方差冬季的不比夏季的小.21.已知维尼纶纤度在正常条件下服从正态分布,且标准差为0.048.从某天产品中抽取5根纤维,测得其纤度为1.32 1.55 1.36 1.40 1.44问这一天纤度的总体标准差是否正常(取α = 0.05)?解:设这一天维尼纶纤度X ~ N (µ , σ 2),假设H 0:σ 2 = 0.0482 vs H 1:σ 2 ≠ 0.0482,选取统计量)1(~)1(2222−−=n S n χσχ,显著性水平α = 0.05,4844.0)4()1(2025.022/==−χχαn ,1433.11)4()1(2975.022/1==−−χχαn ,双侧拒绝域W = {χ 2 ≤ 0.4844或χ 2 ≥ 11.1433}, 因σ 2 = 0.0482,s 2 = 0.08822,n = 5,则W ∈=×=5069.13048.00882.04222χ,并且检验的p 值p = 2P {χ 2 ≥ 13.5069} = 0.0181 < α = 0.05, 故拒绝H 0,接受H 1,即可以认为这一天纤度的总体方差不正常.22.某电工器材厂生产一种保险丝.测量其熔化时间,依通常情况方差为400,今从某天产品中抽取容量为25的样本,测量其熔化时间并计算得24.62=x ,s 2 = 404.77,问这天保险丝熔化时间分散度与通常有无显著差异(取α = 0.05,假定熔化时间服从正态分布)? 解:设这天保险丝熔化时间分散度X ~ N (µ , σ 2),假设H 0:σ 2 = 400 vs H 1:σ 2 ≠ 400,选取统计量)1(~)1(2222−−=n S n χσχ,显著性水平α = 0.05,4012.12)24()1(2025.022/==−χχαn ,3641.39)24()1(2975.022/1==−−χχαn ,双侧拒绝域W = {χ 2 ≤ 12.4012或χ 2 ≥ 39.3641}, 因σ 2 = 400,s 2 = 404.77,n = 25,则W ∉=×=2862.2440077.404242χ,并且检验的p 值p = 2P {χ 2 ≥ 24.2862} = 0.8907 > α = 0.05,故接受H 0,拒绝H 1,即可以认为这天保险丝熔化时间分散度与通常没有显著差异. 23.某种导线的质量标准要求其电阻的标准差不得超过0.005(Ω).今在一批导线中随机抽取样品9根,测得样本标准差s = 0.007(Ω),设总体为正态分布.问在显著水平α = 0.05下,能否认为这批导线的标准差显著地偏大?解:设这批导线的电阻X ~ N (µ , σ 2),假设H 0:σ 2 = 0.005 2 vs H 1:σ 2 > 0.005 2,选取统计量)1(~)1(2222−−=n S n χσχ,显著性水平α = 0.05,5073.15)8()1(295.021==−−χχαn ,右侧拒绝域W = {χ 2 ≥ 15.5073},因σ 2 = 0.005 2,s 2 = 0.007 2,n = 9,则W ∈=×=68.15005.0007.08222χ,并且检验的p 值p = P {χ 2 ≥ 15.68} = 0.0472 < α = 0.05, 故拒绝H 0,接受H 1,即可以认为这批导线的标准差显著地偏大.24.两台车床生产同一种滚珠,滚珠直径服从正态分布.从中分别抽取8个和9个产品,测得其直径为甲车床:15.0 14.5 15.2 15.5 14.8 15.1 15.2 14.8;乙车床:15.2 15.0 14.8 15.2 15.0 15.0 14.8 15.1 14.8.比较两台车床生产的滚珠直径的方差是否有明显差异(取α = 0.05).解:设两台车床生产的滚珠直径分别为),(~211σµN X ,),(~222σµN Y ,假设H 0:2221σσ= vs H 1:2221σσ≠,选取统计量)1,1(~2122−−=n n F S S F yx,显著性水平α = 0.05,2041.09.41)7,8(1)8,7()1,1(975.0025.0212/====−−F F n n F α,F 1 − α /2 (n 1 − 1, n 2 − 1) = F 0.975 (7, 8) = 4.53,双侧拒绝域W = {F ≤ 0.2041或F ≥ 4.53},因223091.0=x s ,221616.0=y s ,则W F ∉==6591.31616.03091.022,并且检验的p 值p = 2P {F ≥ 3.6591} = 0.0892 > α = 0.05,故接受H 0,拒绝H 1,即可以认为两台车床生产的滚珠直径的方差没有明显差异. 25.有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量为m = 14和n = 12的样本,测得部件质量的样本方差分别为46.1521=s ,66.922=s ,设两样本相互独立,试在显著性水平α = 0.05下检验假设H 0:2221σσ= vs H 1:2221σσ>.解:设两台机器生产金属部件质量分别为),(~211σµN X ,),(~222σµN Y ,假设H 0:2221σσ= vs H 1:2221σσ>,选取统计量)1,1(~2221−−=n m F S S F ,显著性水平α = 0.05,F 1 − α (m − 1, n − 1) = F 0.95 (13, 11) = 2.7614,右侧拒绝域W = {F ≥ 2.7614},因46.1521=s ,66.922=s ,则W F ∉==6004.166.946.15,并且检验的p 值p = P {F ≥ 1.6004} = 0.2206 > α = 0.05, 故接受H 0,拒绝H 1,即可以认为2221σσ=.26.测得两批电子器件的样品的电阻(单位:Ω)为A 批(x ) 0.140 0.138 0.143 0.142 0.144 0.137;B 批(y ) 0.135 0.140 0.142 0.136 0.138 0.140.设这两批器材的电阻值分别服从),(211σµN ,),(222σµN ,且两样本独立.(1)试检验两个总体的方差是否相等(取α = 0.05)? (2)试检验两个总体的均值是否相等(取α = 0.05)?解:设两批电子器件样品的电阻分别为),(~211σµN X ,),(~222σµN Y ,(1)假设H 0:2221σσ= vs H 1:2221σσ≠,选取统计量)1,1(~2122−−=n n F S S F yx,显著性水平α = 0.05,1399.015.71)5,5(1)5,5()1,1(975.0025.0212/====−−F F n n F α,F 1 − α /2 (n 1 − 1, n 2 − 1) = F 0.975 (5, 5) = 7.15,双侧拒绝域W = {F ≤ 0.1399或F ≥ 7.15},因22002805.0=x s ,22002665.0=y s ,则W F ∉==1080.1002665.0002805.022,并且检验的p 值p = 2P {F ≥ 1.1080} = 0.9131 > α = 0.05, 故接受H 0,拒绝H 1,即可以认为两个总体的方差相等; (2)假设H 0:µ 1 = µ 2 vs H 1:µ 1 ≠ µ 2,未知2221,σσ,但2221σσ=,选取统计量)2(~112121−++−=n n t n n S YX T w ,显著性水平α = 0.05,t 1 − α /2 (n 1 + n 2 − 2) = t 0.975 (10) = 2.2281,双侧拒绝域W = {| t | ≥ 2.2281}, 因1407.0=x ,1385.0=y ,s x = 0.002805,s y = 0.002665,n 1 = 6,n 2 = 6,002736.010002665.05002805.052)1()1(22212221=×+×=−+−+−=n n s n s n s yx w ,则W t ∉=+×−=3718.16161002736.01385.01407.0,并且检验的p 值p = 2P {T ≥ 1.3718} = 0.2001 > α = 0.05, 故接受H 0,拒绝H 1,即可以认为两个总体的均值相等.27.某厂使用两种不同的原料生产同一类型产品,随机选取使用原料A 生产的样品22件,测得平均质量为2.36(kg ),样本标准差为0.57(kg ).取使用原料B 生产的样品24件,测得平均质量为2.55(kg ),样本标准差为0.48(kg ).设产品质量服从正态分布,两个样本独立.问能否认为使用原料B 生产的产品质量较使用原料A 显著大(取α = 0.05)?解:设两种原料生产的产品质量分别为),(~211σµN X ,),(~222σµN Y ,假设H 0:µ 1 = µ 2 vs H 1:µ 1 < µ 2 ,未知2221,σσ,大样本,选取统计量)1,0(~2212N n S n SY X U yx&+−=,显著性水平α = 0.05,u 1 − α = u 0.95 = 1.645,左侧拒绝域W ≈ {u ≤ −1.645}, 因36.2=x ,55.2=y ,s x = 0.57,s y = 0.48,n 1 = 22,n 2 = 24, 有W u ∉−=+−=2171.12448.02257.055.236.222,并且检验的p 值p = P {U ≤ −1.2171} = 0.1118 > α = 0.05,故接受H 0,拒绝H 1,即可以认为使用原料B 生产的产品质量较使用原料A 不是显著大.习题7.31. 从一批服从指数分布的产品中抽取10个进行寿命测试,观测值如下(单位:h ): 1643 1629 426 132 1522 432 1759 1074 528 283根据这批数据能否认为其平均寿命不低于1100 h (取α = 0.05)? 解:设这批产品的寿命X ~ Exp (1/θ ),假设H 0:θ = 1100 vs H 1:θ < 1100,选取统计量)2(~222n Xn χθχ=,显著性水平α = 0.05,8508.10)20()2(205.02==χχαn ,左侧拒绝域W = {χ 2 ≤ 10.8508},因8.942=x ,n = 10,θ = 1100,则W ∉=××=1418.1711008.9421022χ,并且检验的p 值p = P {χ 2 ≤ 17.1418} = 0.3563 > α = 0.05,故接受H 0,拒绝H 1,即可以认为其平均寿命不低于1100 h .2. 某厂一种元件平均使用寿命为1200 h ,偏低,现厂里进行技术革新,革新后任选8个元件进行寿命试验,测得寿命数据如下:2686 2001 2082 792 1660 4105 1416 2089假定元件寿命服从指数分布,取α = 0.05,问革新后元件的平均寿命是否有明显提高? 解:设革新后元件的寿命X ~ Exp (1/θ ),假设H 0:θ = 1200 vs H 1:θ > 1200,选取统计量)2(~222n Xn χθχ=,显著性水平α = 0.05,2962.26)16()2(295.021==−χχαn ,右侧拒绝域W = {χ 2 ≥ 26.2962},因875.2103=x ,n = 8,θ = 1200,则W ∈=××=0517.281200875.2103822χ,并且检验的p 值p = P {χ 2 ≥ 28.0517} = 0.0312 < α = 0.05,故拒绝H 0,接受H 1,即可以认为革新后元件的平均寿命有明显提高.3. 有人称某地成年人中大学毕业生比例不低于30%,为检验之,随机调查该地15名成年人,发现有3名大学毕业生,取α = 0.05,问该人看法是否成立?并给出检验的p 值.解:设该地n 名成年人中大学毕业生人数为∑==ni i X X n 1,有),(~p n b X n ,假设H 0:p = 0.3 vs H 1:p < 0.3, 选取统计量),(~p n b X n ,显著性水平α = 0.05,n = 15,p = 0.3, 有1268.07.03.005.00353.07.03.021515101515=⋅⋅<<=⋅⋅∑∑=−=−k k k kk kkkC C ,左侧拒绝域}1{≤=x n W ,因W x n ∉=3,并且检验的p 值2969.07.03.0}3{31515=⋅⋅=≤=∑=−k k k kC X n P p ,故接受H 0,拒绝H 1,即可以认为该人看法成立.4. 某大学随机调查120名男同学,发现有50人非常喜欢看武侠小说,而随机调查的85名女同学中有23人喜欢,用大样本检验方法在α = 0.05下确认:男女同学在喜爱武侠小说方面有无显著差异?并给出检验的p 值. 解:设n 1名男同学中有∑==111n i i X X n 人喜欢看武侠小说,n 2名女同学中有∑==212n j j Y Y n 人喜欢看武侠小说,有),(~111p n B X n ,),(~222p n B Y n ,大样本,有⎟⎟⎠⎞⎜⎜⎝⎛−1111)1(,~n p p p N X &,⎟⎟⎠⎞⎜⎜⎝⎛−2222)1(,~n p p p N Y &, 则⎟⎟⎠⎞⎜⎜⎝⎛−+−−−22211121)1()1(,~n p p n p p p p N Y X &,即)1,0(~)1()1()()(22211121N n p p n p p p p Y X &−+−−−−,当p 1 = p 2 = p 但未知时,此时用总频率2121ˆn n Yn X n p++=作为p 的点估计替换p ,在大样本场合,有)1,0(~11)ˆ1(ˆ21N n n p pY X U &+−−=,假设H 0:p 1 = p 2 vs H 1:p 1 ≠ p 2, 大样本,选取统计量)1,0(~11)ˆ1(ˆ21N n n p pY X U &+−−=,显著性水平α = 0.05,u 1 − α /2 = u 0.975 = 1.96,双侧拒绝域W = {| u | ≥ 1.96},因n 1 = 120,n 2 = 85,501=x n ,232=y n ,有3561.0851202350ˆ2121=++=++=n n y n x n p,则W u ∈=+−×−=1519.28511201)3561.01(3561.0852312050,并且检验的p 值p = 2P {U ≥ 2.1519} = 0.0314 < α = 0.05,故拒绝H 0,接受H 1,可以认为男女同学在喜爱武侠小说方面有显著差异.5. 假定电话总机在单位时间内接到的呼叫次数服从泊松分布,现观测了40个单位时间,接到的呼叫次数如下:0 2 3 2 3 2 1 0 2 2 1 2 2 1 3 1 1 4 1 1 5 1 2 2 3 3 1 3 1 3 4 0 6 1 1 1 4 0 1 3.在显著性水平0.05下能否认为单位时间内平均呼叫次数不低于2.5次?并给出检验的p 值. 解:设电话总机在单位时间内接到的呼叫次数X ~ P(λ),有)(~1λn P X X n ni i ∑==,大样本,有)1,0(~N nX n n X n &λλλλ−=−,假设H 0:λ = 2.5 vs H 1:λ < 2.5, 大样本,选取统计量)1,0(~N nX U &λλ−=, 显著性水平α = 0.05,u 1 − α = u 0.95 = 1.645,左侧拒绝域W = {u ≤ −1.645}, 因975.1=x ,n = 40,λ = 2.5, 则W u ∈−=−=1.2405.25.2975.1,并且检验的p 值p = P {U ≤ −2.1} = 0.0179 < α = 0.05,故拒绝H 0,接受H 1,不能认为单位时间内平均呼叫次数不低于2.5次;6. 通常每平方米某种布上的疵点数服从泊松分布,现观测该种布100 m 2,发现有126个疵点,在显著性水平0.05下能否认为该种布每平方米上平均疵点数不超过1个?并给出检验的p 值. 解:设每平方米该种布上的疵点数X ~ P(λ),有)(~1λn P X X n ni i ∑==,大样本,有)1,0(~N nX n n X n &λλλλ−=−,假设H 0:λ = 1 vs H 1:λ > 1, 大样本,选取统计量)1,0(~N nX U &λλ−=,显著性水平α = 0.05,u 1 − α = u 0.95 = 1.645,右侧拒绝域W = {u ≥ 1.645},因26.1=x ,n = 100,λ = 1, 则W u ∈=−=6.21001126.1,并且检验的p 值p = P {U ≥ 2.6} = 0.0047 < α = 0.05, 故拒绝H 0,接受H 1,不能认为该种布每平方米上平均疵点数不超过1个; 7. 某厂的一批电子产品,其寿命T 服从指数分布,其密度函数为p (t ; θ ) = θ −1exp{− t /θ } I t > 0,从以往生产情况知平均寿命θ = 2000 h .为检验当日生产是否稳定,任取10件产品进行寿命试验,到全部失效时停止.试验得失效寿命数据之和为30200.试在显著性水平α = 0.05下检验假设H 0:θ = 2000 vs H 1:θ ≠ 2000.解:假设H 0:θ = 2000 vs H 1:θ ≠ 2000,选取统计量)2(~222n Xn χθχ=,显著性水平α = 0.05,5908.9)20()2(2025.022/==χχαn ,1696.34)20()2(2975.022/1==−χχαn ,双侧拒绝域W = {χ 2 ≤ 9.5908或χ 2 ≥ 34.1696},因30201030200==x ,n = 10,θ = 2000, 则W ∉=××=20.30200030201022χ,并且检验的p 值p = P {χ 2 ≥ 30.20} = 0.0667 > α = 0.05,故接受H 0,拒绝H 1,即可以认为其平均寿命等于2000 h . 8. 设X 1, X 2, …, X n 为取自两点分布b (1, p )的随机样本.(1)试求单侧假设检验问题H 0:p ≤ 0.01 vs H 1:p > 0.01的显著水平α = 0.05的检验; (2)若要这个检验在p = 0.08时犯第二类错误的概率不超过0.10,样本容量n 应为多大? 解:(1)假设H 0:p = 0.01 vs H 1:p > 0.01,若为小样本,选取统计量),(~1p n b X X n ni i ∑==,显著性水平α = 0.05,p = 0.01,取⎭⎬⎫⎩⎨⎧≥⋅⋅=⎭⎬⎫⎩⎨⎧≤⋅⋅=∑∑−=−=−95.099.001.0min 05.099.001.0min 102c k k n k k n n c k kn k k n C C c ,当n ≤ 5时,c 2 = 1;当6 ≤ n ≤ 35时,c 2 = 2;当36 ≤ n ≤ 82时,c 2 = 3;当83 ≤ n ≤ 137时,c 2 = 4; 右侧拒绝域}{2c x n W ≥=, 根据x n ,作出决策; 若为大样本,选取统计量)1,0(~)1(N np p pX U &−−=,显著性水平α = 0.05,u 1 − α = u 0.95 = 1.645,右侧拒绝域W = {u ≥ 1.645}, 计算u ,作出决策;(2)在p = 0.08时,)08.0,(~1n b X X n ni i ∑==,则犯第二类错误的概率10.092.008.0}08.0|{}08.0|{1022≤⋅⋅==<==∉=∑−=−c k k n k kn C p c X n P p W X n P β,当n ≤ 5时,c 2 = 1,β = 0.92n ≥ 0.6591;当6 ≤ n ≤ 35时,c 2 = 2,2184.092.008.01≥⋅⋅=∑=−k k n k kn C β;当36 ≤ n ≤ 82时,c 2 = 3, 若n = 64,1050.092.008.02=⋅⋅=∑=−k kn kknC β;若n = 65,0991.092.008.02=⋅⋅=∑=−k k n k kn C β;故n ≥ 65.9. 有一批电子产品共50台,产销双方协商同意找出一个检验方案,使得当次品率p ≤ p 0 = 0.04时拒绝的概率不超过0.05,而当p > p 1 = 0.30时,接受的概率不超过0.1,请你帮助找出适当的检验方案. 解:设这批电子产品中的次品数为∑==ni i X X n 1,有),(~p n b X n ,假设H 0:p = 0.04 vs H 1:p > 0.04, 小样本,选取统计量),(~p n b X n , 显著性水平α = 0.05,p = 0.04,。
概率论与数理统计第七章课后习题及参考答案

5.设总体 X 的概率密度为
f
(x,
)
(
1) x
,0
x
1,
0, 其他.
其中 1是未知参数, X1 , X 2 ,…, X n 是来自 X 的一个样本.试求参数
2
的矩估计和极大似然估计.现有样本观测值 0.1 ,0.2 ,0.9 ,0.8 ,0.7 及 0.7 ,
求参数 的矩估计值和极大似然估计值.
1 2 2 c 2 2 ( 1 c) 2 ,
n
n
取 c 1 即可. n
14.设总体 X 的均值为 ,方差为 2 ,从总体中抽取样本 X1 , X 2 , X 3 ,证明
(
x,
,
2
)
1
1
1
e 2 2
(ln x )2
,
x
0,
2 x
0,
x 0.
其中 , 0 为未知参数, X1 , X 2 ,…, X n 是取自该总体的一
个样本,求参数 , 2 的极大似然估计.
解: xi 时,似然函数为
L(, 2 )
(
1 2 )n
1 x1x2 xn
exp{
dL
d
n exp{
n i 1
( xi
)}
0,
所以 L( ) 是 的单调增函数,从而对满足条件 xi 的任意 ,有
n
n
L( ) exp{ i1 (xi )} exp{ i1 (xi m1iinn{xi})} ,
即 L( ) 在 m1iinn{xi} 时取最大值, 故 的极大似然估计值为ˆ m1iinn{xi} . 7.(1) 设总体 X 具有分布律
ˆ1 X1 ;
ˆ2
概率论与数理统计第七章习题讲解

1 6
1 3
因此T1,T3是的无偏估计量. (2) X1,X2,X3,X4相互独立
1 1 1 5 2 2 1 D(T1 ) [ D( X1 ) D( X 2 )] [ D( X 3 ) D( X 4 )] 2 ( ) 36 9 36 9 18 1 1 5 D(T3 ) [ D( X1 ) D( X 2 ) D( X 3 ) D( X 4 )] (1 1 1 1) 2 2 16 16 20
故 E(Y)=aE(X1)+bE(X2)=(a+b)=, (a+b=1) 所以,对于任意常数,a,b(a+b=1), Y=aX1+bX2都是的无偏估计. 由于两样本独立,故两样本均值X1和X2独立,所以
2 2 2 2 a ( 1 a ) a b ] 2 D(Y ) a 2 D( X 1 ) b 2 D( X 2 ) [ ] 2 [ n1 n2 n1 n2 dD(Y ) 2a 2(1 a ) 2 由极值必要条件 [ ] 0 da n1 n2
1 E( X )
1 0
xf ( x)dx.
1 1 0
x dx x 1 1 解出 ( )2 1 1
1
将总体一阶矩1换成样本一阶矩A1=X ,
得到参数的矩估计量
矩估计值
X 2 ( ) 1 X
x 2 ( ) 1 x
( x1 x2 t / 2 ( n1 n2 2) sw
1 1 2 (n1 1) S12 (n2 1) S22 2 ) Sw , Sw Sw . n1 n2 n1 n2 2
n1=4,n2=5,1-=0.95, =0.05, t/2(n1+n2-2)=t0.025(7)= 2.3646
概率论与数理统计第七章参数估计

例1. 设总体X的数学期望和方差分别是μ,
σ2 ,求μ , σ2的矩估计量。
E(X )
E( X 2 ) D( X ) [EX ]2 2 2
(3) 写出方程 ln L 0
i1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..x.n,)
于 是 ˆ ˆ ( X 1 , X 2 , . . . , X n ) 即 为 的 极 大 似 然 估 计 量
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
ˆ(x1,x2,..x.n,),使得
L (ˆ) m a x L (), (或 L (ˆ) s u p L ())
则 称 ˆ ( x 1 ,x 2 , . . . ,x n ) 为 的 极 大 似 然 估 计 值
称 ˆ ( X 1 ,X 2 ,...,X n ) 为 极 大 似 然 估 计 量
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 (可以是向量) .
概率论与数理统计第七章

估计 为1.68,这是点估计.
估计在区间[1.57, 1.84]内,这是区间估计.
一、点估计概念及讨论的问题
例1 已知某地区新生婴儿的体重X~ N(,2),
, 2未知,
…
随机抽查100个婴儿
得100个体重数据
9, 7, 6, 6.5, 5, 5.2, … 而全部信息就由这100个数组成.
求:两个参数a,b的矩估计
解: 写出方 V E 程 (X a(X )r组 ) ˆˆ2
其 中uˆˆ2Xn1in1(Xi X)2
但是
E
(
X
)
Var ( X )
a
b 2 (b a)2
12
即有
(ab2ba)2 12
X
ˆ
2
由方程组求解出a,b的矩估计:
a ˆX 3 ˆ b ˆX 3 ˆ
其中 ˆ:ˆ2 n 1i n1 ( XiX)2
(4) 在最大值点的表达式中, 用样本值代入 就得参数的极大似然估计值 .
两点说明:
1、求似然函数L( ) 的最大值点,可以应
用微积分中的技巧。由于ln(x)是x的增函
数,lnL( )与L( )在 的同一值处达到 它的最大值,假定是一实数,且lnL( ) 是 的一个可微函数。通过求解所谓“似 然方程”: dlnL() 0
E(X1m)=E(X2m)==E(Xnm)= E(Xm)=am . 根据大数定律,样本原点矩Am作为 X1m,X2m, ,Xnm的算术平均值依概率收敛到均 值am=E(Xm).即:
n 1i n1Xim pE(Xm)am
例1 设总体X的概率密度为
f(x)(1)x,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一讲Ⅰ 授课题目第七章 参数估计§1点估计 §3估计量的评选标准 Ⅱ 教学目的与要求掌握求矩估计和极大最大似然估计的方法,掌握三种评选标准。
Ⅲ 教学重点与难点重点:估计的基本思想,评选标准的提出。
难点:估计的基本思想,评选标准的提出。
Ⅳ 讲授内容: 一、点估计在许多实际问题中,可以认为总体X分布的形式是已知的,它只依赖于一个或几个未知参数.如果能对分布中所含的参数作出推断,那么就可以确定总体分布.例如, 已知总体服从正态分布(),1Nμ,μ未知,我们的目的是通过样本提供的信息对未知参数μ作出估计,也就是借助于样本对总体作出推断,这类问题就是参数估计问题.例1 在某炸药制造厂,一天中发生着火现象的次数X 是一个随机变量,假设它服从以0λ>为参数的泊松分布,参数λ为未知,现有以下的样本值试估计参数λ着火次数k0 1 2 3 4 5 6 7≥发生k 次着火的天数k n75 90 54 22 6 2 1 0250=∑解略点估计问题的一般提法是:设总体X的分布函数();F x θ的形式为已知,θ是待估参数,12,,,n X X X 是X的一个样本,12,,,n x x x 是相应的一个样本值.设点估计问题就是要构造一个适当的统计量()12ˆ,,,n X X X θ,用它的观察值()12ˆ,,,n x x x θ作为未知参数θ的近似值,.我们称()12ˆ,,,n X X X θ为参数θ的估计量,称()12ˆ,,,n x x x θ为θ的估计值。
在不致混淆的情况下, 统称估计量与估计值为估计,简记为ˆθ.容易看出,对于不同的样本值来说,由同一个估计量得出的估计值一般是不相同的.在几何上一个数值是数轴上的一个点,用θ的估计值ˆθ作为θ的近似值就像用一个点来估计θ,故称为点估计.如果总体分布中含有k个未知参数1,,kθθ,则需要构造k个统计量()()11212ˆˆ,,,,,,,,n kn X X X X X X θθ分别作为1,,k θθ的估计量.例1(加) 设总体X 服从参数为λ的泊松分布, 0λ>为未知参数,现有以下样本值3,4,1,5,6,3,8,7,2,0,1,5,7,9,8试求未知参数λ的估计值.解:由于()E X λ=,自然地想到用样本均值11ni i X X n ==∑作为λ的估计量,利用样本值得()1341563872015798 4.615x =++++++++++++++=. 这样,我们获得了参数λ的估计量ˆX λ=与估计值ˆ 4.6x λ==. 在本例中,对于总体X的一个样本12,,,n X X X ,()1i X i n ≤≤亦可以作为λ的估计量;同样地,()1X 和()n X 都应该可作为λ的估计量.这样,对于同一个参数,可以有许多不同的点估计;在这些估计中,我们自然地希望挑选一个最“优”的点估计.因此,有必要建立评价估计量优劣的标准.下面介绍几个常用的标准:无偏性、有效性和一致性. 二、矩估计法许多总体的未知参数与总体矩之间存在着函数关系,如在泊松总体()P λ中,它的参数λ就是总体的一阶矩,又如在正态总体()2,XN μσ中(),E X μ=()()222E X E X σ=-⎡⎤⎣⎦.若总体矩存在,我们很自然地想到用样本矩来估计相应的总体矩,从而可以获得未知参数的估计量,这种方法称之为矩估计法.设12,,,n X X X 是总体X的一个样本,若X是连续型随机变量,则其概率密度函数为();f x θ;若X 是离散型随机变量,则其分布律为()();PX x P x θ==,()12,,,k θθθθ=,θ∈Θ.假设总体X 的前k 阶矩存在,记()ll E X μ=,11n ll ii A X n ==∑,()1,2,,l k =.由辛钦大数定律可知,lA 依概率收敛于l μ,即可以用样本矩替换同阶的总体矩,我们称之为替换原则.替换原则是矩估计法的思想实质,这种方法只需假设总体矩存在,无需知道总体的分布类型.由于l μ依赖于参数12,,,k θθθ,可设1112221212(,,,)(,,,),(,,,).k k k k k μμθθθμμθθθμμθθθ=⎧⎪=⎪⎨⎪⎪=⎩将此方程组的解记为1112221212(,,,),(,,,),(,,,).k k k k k θθμμμθθμμμθθμμμ=⎧⎪=⎪⎨⎪⎪=⎩用l A 替换lμ()1,2,,l k =,得到1112221212ˆ(,,,),ˆ(,,,),ˆ(,,,).k k k k k A A A A A A A A A θθθθθθ⎧=⎪=⎪⎨⎪⎪=⎩并把它们分别作为参数12,,,k θθθ的估计量,称之为矩估计量, 矩估计量的观测值称为矩估计值.例2 设总体X 在[],a b 上服从均匀分布,,a b 未知,12,,,n X X X 是是来自X的样本,试求,a b 的矩估计量. 解略例2.1(加) 设总体X的概率密度函数为()()101,;0x x f x θθθ⎧+<<=⎨⎩,,其他. 1,θ>-求参数θ的矩估计量.解: ()()111011d 2E X x x θθμθθ++==+=+⎰,解得 11211μθμ-=-,因此, θ的矩估计量为 21ˆ1X Xθ-=-.如果我们获得一组样本观测值,其样本均值为0.65x=,则参数θ的矩估计值为20.651ˆ0.8610.65θ⨯-==-.例 3 设总体X 的均值μ及方差2σ都存在,且有20σ>,但μ,2σ均为未知,又设12,,,n X X X 是是来自X的样本,试求μ,2σ的矩估计量.解:注意到()()()22EX D X E X =+⎡⎤⎣⎦,由方程组()()12222,.E X E X μμμσμ==⎧⎪⎨==+⎪⎩ 解得1μμ=,2221σμμ=-.因此,μ和2σ的矩估计量分别为1ˆA X μ==, 22222211111()n n i i i i A A X X X X n n σ===-=-=-∑∑.此例表明, 总体X均值和方差的矩估计量分别是样本均值与样本的二阶中心矩,而不依赖总体X的分布.三、最大似然估计由于矩估计法只需假设总体矩存在,没有充分利用总体分布提供的信息,为获得更理想的估计,需要引入最大似然估计法,它的一个直观想法是某个随机试验有若干个结果,,A B C 等,如果在一次试验中,出现结果A ,则认为事件A 发生的概率是最大的.例如,一只袋子里有黑白两种外形相同的球,这两种球的数量不详,只知道它们占总数的比例:一种球为10%,另一种球占90%.今从中任抽取一只球,取得白球,一种比较合理的想法是认为袋子里白球的数量较多, 占总数的90%,这就是最大似然估计法的基本思想.我们通过下面的例子说明最大似然估计法的原理.某工厂加工一批产品,现需要估计其不合格品率p,今从中抽取一个容量为n 的样本值12,,,n x x x ,令1,0,i i X i ⎧=⎨⎩第次取到次品第次取到正品1,2,,i n =,总体X的分布律为()()1;1,0,1xx p x p p p x -=-=.取得样本获得观测值的概率为{}()()()1111111122,,,111==---====--∑∑=-nn nniii i x x x x n n x n x P X x X x X x p p p p p p ,()0,11,2,,i x i n ==.显然{}1122,,,n n P X x X x X x ===是p 的函数,记为()L p ,即()()111nni i i i x n xL p p p ==-∑∑=-.由于在一次取样中,样本值12,,,n x x x 出现,我们认为概率()L p 是最大的,选取使得()L p 达到最大的ˆp作为参数p 的一个估计值,即()(){}ˆmax p L p L p ∈Θ=.由微积分中求极大点的方法, p 可从方程()d 0d L p p=求出,又由于ln x 是x 的单调增函数,()ln L p 与()L p 在同一个p 处取极大值,p 也可从方程()d ln L p 0dp=求出,()()()11ln ln ln 1nni i i i L p x p n x p ===⋅+--∑∑,()11d ln 0d 1nniii i x n x L p ppp==-=-=-∑∑,解得: 1ˆnii xpn==∑.容易验证, 1ˆn ii xpn==∑能使得()Lp 达到最大,称之为参数p 的最大似然估计值,其对应的统计量称为参数p 的最大似然估计量.下面我们讨论最大似然估计法.设12,,,n X X X 是取自总体X 的一个样本, 12,,,n x x x 为样本值.如果总体X 是离散型的,其分布律为();p x θ,θ为未知参数,θ∈Θ. 样本12,,,n X X X 的联合分布律为{}()11221,,,;nn n i i P X x X x X x p x θ=====∏,容易看出,当样本值12,,,nx x x 固定时上式是参数θ的函数,当θ取固定值时,上式是事件{}1122,,,n n X x X x X x ===发生的概率,记()()()121;,,,;nn i i L L x x x p x θθθ===∏ , (2.1)并称()Lθ为样本的似然函数.若样本值12,,,n x x x 的函数()12ˆˆ,,,n x x x θθ=∈Θ满足()(){}ˆmax LL θθθ∈Θ=, (2.2)则称()12ˆˆ,,,n x x x θθ=为θ的最大似然估计值,其相应的统计量()12ˆ,,,n X X X θ称为θ的最大似然估计量.如果总体X是连续型的,X的概率密度为();f x θ,θ为未知参数,θ∈Θ.随机点12(,,,)n X X X 落在点12(,,,)n x x x 的边长为12,,,nx x x ∆∆∆的邻域内的概率近似为()1;ni i i f x x θ=∆∏.我们寻找使()1;ni i i f x x θ=∆∏达到最大的()12ˆˆ,,,n x x x θθ=,但1nii x =∆∏与它无关,故可取样本的似然函数为()()()121;,,,;nn i i L L x x x f x θθθ===∏. (2.3)类似地, 若样本值12,,,n x x x 的函数()12ˆˆ,,,n x x x θθ=∈Θ满足()(){}ˆmax LL θθθ∈Θ=则称()12ˆˆ,,,n x x x θθ=为θ的最大似然估计值,其相应的统计量()12ˆ,,,n X X X θ称为θ的最大似然估计量.获得样本的似然函数后,为求出未知参数θ的最大似然估计量,可以利用微积分中求函数极值的方法.假设();f x θ或();p x θ关于θ可微,由下面的似然方程()d 0d L θθ=, 或对数似然方程()d ln 0d L θθ=,可求出最大似然估计θ. 例4 设()1,,Xb p 12,,,n X X X 是来自X的一个样本。