数理统计Chapter7-2
概率论与数理统计 第7章
一、基本概念 二、基于截尾样本的最大似然估计 三、小结
一、基本概念
1. 寿命分布的定义
产品寿命T 是一个随机变量,它的分布称为寿 产品寿命 是一个随机变量 它的分布称为寿 命分布. 命分布
2. 完全样本的定义
将随机抽取的 n 个产品在时间 t = 0 时, 同时 投入试验直到每个产品 都失效 . 记录每一个产 品的失效时间 , 这样得到的样本 (即由所有产品 的失效时间 0 ≤ t1 ≤ t 2 ≤ ⋯ ≤ t n 所组成的样本 )
利用这一样本估计未知 参数 θ (产品的平均寿命 ).
在时间区间 [0, t m ] 有 m 个产品失效 , 有 n − m 个产品的寿命超过 t m .
估计θ , 利用最大似然估计法来
为了确定似然函数, 观察上述结果出现的概率. 为了确定似然函数, 观察上述结果出现的概率.
产品在(ti , ti + dti ] 失效的概率近似地为 f (ti )dti = e θ dti , i = 1, 2,⋯, m. 1
又因为 E ( X ) = D( X ) + [ E ( X )] =
2 2
σ
2
n
+ µ 2,
所以 E (σ 2 ) = E ( A2 − X 2 ) = E ( A2 ) − E ( X 2 ) ˆ
n −1 2 ˆ σ ≠ σ 2 , 所以 σ 2 是有偏的. = n n 若以 乘 σ 2 , 所得到的估, 若 X 1 , X 2 ,⋯, X n 为总体 X 的一个样本,
θ ∈ Θ 是包含在总体 X 的分布中的待估参数 , (Θ 是 θ 的取值范围 )
ˆ 若估计量θ = θ( X1, X2 ,⋯, Xn ) 的数学期望 ˆ ˆ E(θ ) 存在, 且对于任意θ ∈Θ 有E(θ ) = θ , 则称 ˆ θ 是θ 的无偏估计量.
概率论与数理统计 第七章2
P{θ1 ≤ θ ≤ θ 2 } ≥ 1 − α , (0 < α < 1)
称区间(θ1,θ 2 )为θ的置信水平为1 − α 该区间的置信区间 。
区间(θ1,θ2)是一个随机区间; α给出该区间含真 1− 值θ的可靠程度。α表示该区间不包含真值θ的可能性。
ch7-1 2
上海理工大学
University of Shanghai for Science and Technology
( X −u1−α
σ
2
n
,
X + u1−α
σ
2
n
)
可得所求的置信区间为
2 (12.35 ± 1.96 × ) = (12.35 ± 1.307) = (11.043,13.657) 9
ch7-1 8
上海理工大学
University of Shanghai for Science and Technology
上海理工大学
University of Shanghai for Science and Technology
College of Science
理学院
概率论与数理统计
区 间 估 计
ch7-1
1
上海理工大学
University of Shanghai for Science and Technology
1001,1004,1003,997,999,1000, , , , , , , 1004,1000,996, 1002,998,999. , , , , ,
求σ2的置信水平为 的置信水平为0.95的置信区间 的置信区间. 的置信区间 −α的置信区间如 解:本例中 µ未知, σ2的置信水平为 −α的置信区间如 本例中 未知, 的置信水平为1−α的置信区间如. (n −1)S2 (n −1)S2 2 , 2 χ1−α (n −1) χα (n −1) 其中n=12,计算得:(n−1)s2=11×6.932=76.25.又 计算得: − 其中 计算得 × 又 查自由度为11的 分布分位数表,得 α=1− 0.95=0.05, 查自由度为 的 χ 2分布分位数表 得 −
概率论与数理统计习题及答案第七章
习题7-11.选择题(1)设总体X 的均值口与方差 /都存在但未知,而X 1,X 2,L ,X n 为来自X 的样本,则均值 口与方差 (T 2的矩估计量分别是 ().(A) X 和(B)1 nX 和—(Xn i 1i )2.(C)口和 2(T・1 (D) X 和一 nn(X ii 1 x)2.解 选(D).(2) 设X : U[0,],其中 e >0为未知参数,又X ,,X 2,L ,X n 为来自总体X 的样本 ,则e 的矩估计量是().(A) X . (B)2X . (C)max{X i }.(D)mi^X i}.解选(B).2.设总体X 其中0v B v 为未知参数,X1, X 2,…,X.为来自总体X 的样本,试求e 的矩 估计量.解 因为 E (X )=(- 2)x3 e +1x (1 -4 e )+5x e =1-5 e ,令 1 5 X 得到的矩估计量为3.设总体X 的概率密度为f(x ;)(1)x ,0 x 1,0,其它•其中 0> -1是未知参数,X ,冷… ,X n 是来自 X 的容量为n 的简单随机样本求:(1) 的矩估计量;⑵ 0的极大似然估计量•解 总体X 的数学期望为-19 2X 1令E(X) X ,即一1 X,得参数B 的矩估计量为?•21 X设X 1, X 2,…,x n 是相应于样本X 1, X 2,…,X n 的一组观测值,则似然函 数为n(1)n X i , 0x i 1,i 10,其它.In xi 1In X ii 14.设总体X 服从参数为的指数分布,即X 的概率密度为E(X)1xf(x)dx o (1)x dx当 0<X i <1(i =1,2,3,…,n )时,L >0 且 In L nln(1)In X i ,i 1dln LnIn x =0,得0的极大似然估计值为而0的极大似然估计量为f(X,xe , x 0,其中0为未知参数,X, X2,)0, x< 0,…,X n为来自总体X的样本,试求未知参数的矩估计量与极大似然估计量解因为E(X)= 1= X , 所以的矩估计量为设X1, X2,…,x n是相应于样本X i, X2,…,X 的一组观测值,则似然函数取对数Xii 1然估计量为In L 0,得5.设总体X的概率密度为f (x,) 其中(0< <1)是未知参数.X, N为样本值x1, X2,L ,x n中小于极大似然估计量•解⑴ X E(X) xnInnXn e 11X).的极大似然估计值为1,的极大似X0,X2,0x1,, 1< x< 2,其它,…,X n为来自总体的简单随机样本,记1的个数.dx 2x(1求:(1)e的矩估计量;(2)e的3 3 —)dx ,所以矩一X .2 21⑵ 设样本X ,X 2 ,L X n 按照从小到大为序(即顺序统计量的观测值)有如下关系:X (1) w X (2)X ( Ni <1 W X ( N +1) W X (N+2)X (n ).似然函数为N n NL()(1 ),X (1) w X (2) w L w X ( N ) 1W X (N1) W X (N2) w L w X n ,0,其它.考虑似然函数非零部分,得到In L ( 0 ) = N ln 0 + ( n -N ) ln(1 - 0 ),令d |nL ( )」o ,解得0的极大似然估计值为? N .d1n习题7-2的无偏估计量•1.选择题:设总体X 的均值与方差 2都存在但未知,X i ,X 2,L ,X n 为X 的样本,则无论总体 X 服从什么分布,()1X i和丄 (XiX)2.(B)n i 1 n i1 n(C)X i 和n 1 i 1解 选(D).2.若X 1 ,X 2lx1 1X 2kX 334解 要求E( 7X 1-X j 和丄 1 i 1 n 1n(X ii 1X)2.(X i1)2 • (D)X i 和丄(X i)2.X 3为来 自总体X : N(,2)的样本,且的无偏估计量,问k 等于多少1 11 「2 kX 3)3 4k解之,k=g(A)13.设总体X的均值为0,方差2存在但未知,又X「X2为来自总体X1 2 2的样本,试证:—(X i X2)为的无偏估计21 2 1 2 2证因为E[—(X i X2) ] —E[(X i 2X^2 X2 )]2 2-[E(X i2) 2E(X i X2)E(X22)]-2 2所以-(X i X2)2为2的无偏估计•2习题7-31.选择题(1)总体未知参数的置信水平为的置信区间的意义是指()(A)区间平均含总体95%的值.(B)区间平均含样本95%的值.(C) 未知参数有95%的可靠程度落入此区间.(D) 区间有95%的可靠程度含参数的真值•解选(D).(2)对于置信水平1- a (0< a <1),关于置信区间的可靠程度与精确程度F列说法不正确的是().(A)若可靠程度越咼,则置信区间包含未知参数真值的可能性越大(B)如果a越小,则可靠程度越高,精确程度越低•(C)如杲1 - a越小,则可靠程度越高,精确程度越低•(D)若精确程度越高,则可靠程度越低,而1- a越小.解选(C)习题7-41. 某灯泡厂从当天生产的灯泡中随机抽取9只进行寿命测试,取得数据如下(单位:小时): 1050, 1100, 1080 , 1120, 1250, 1040, 1130, 1300, 1200设灯泡寿命服从正态分布 N 口 , 902),取置信度为,试求当天生产的全部灯泡的平均寿命的置信区间所求置信区间为(x - z /2 , X - z /2 ) \l n J n 90 90 (1141.11 = 1.96,1141.11 r 1.96)V 9V 9(1082.31,1199.91).2.为调查某地旅游者的平均消费水平,随机访问了40名旅游者,算得平均消费额为 X 105元,样本标准差s 28元•设消费额服从正态分布 取置信水平为,求该地旅游者的平均消费额的置信区间解计算可得X 105, s 2 =282.对于a =,查表可得t_(n 1) t o.025(39)2.0227.2所求口的置信区间为3. 假设某种香烟的尼古丁含量服从正态分布 .现随机抽取此种香烟 8支解计算得到X1141.11, CT 2 =902.对于a =,查表可得Z /2Z).Q25匸96*(Xt (n 1), x ■■- n 2s —t (n ■■- n 21)) (1052.0227, 1052.0227)2828为一组样本,测得其尼古丁平均含量为毫克,样本标准差s=毫克.试求此种香烟尼古丁含量的总体方差的置信水平为的置信区间.a =,查表可得 2(n 1) 爲5(7) 20.278,并说明该置信区间的实际意义1 2的置信水平为的置信区间是,”的实际意义是:在两总体第一个正态总体的均值1比第二个正态总体均值 2大〜,此结 论的可靠性达到95%.5.某商场为了了解居民对某种商品的需求 ,调查了 100户,得出每户月2解已知n =8, s2 2 (n 1)0.995(7) 1 - 20.989,所以方差d 2的置信区间为((n 1)S 2(2_ (n 1)22 22(8 1) 2.4 (8 1) 2.4 _2 —)(, )=,.2(n 廿丿 20.2780.9891 -(n 1)S 4.某厂利用两条自动化流水线灌装番茄酱 ,分别从两条流水线上抽取样本:X ,X 2,…,X 12 及 Y ,Y 2,…,丫17,算出 x 10.6g, y2 29.5g, s 1 2.4, s 2 4.7 .假设这两条流水线上装的番茄酱的重量都服从正态分布 ,且相互独立,其均值分别为2又设两总体方差1:.求2置信水平为的置信区间解由题设2 2x 10.6,y 9.5,s 12.4, s 2 4.7,n12,n 2 17,m 1)s 2 仏 1)s :(12 1) 2.4(171) 471.94212 17 2t_gn 22q n 2 22) t °.°25(27)2.05181,所求置信区间为((X y)11) ((10.6 9.5) 2.05181 1.94结论“方差相等时, [(a n 22)s w2)平均需求量为10公斤,方差为9 .如果这种商品供应10000户,取置信水平为•(1) 取置信度为,试对居民对此种商品的平均月需求量进行区间估计(2) 问最少要准备多少这种商品才能以99%的概率满足需要解(1) 每户居民的需求量的置信区间为_ s(xt(n* n_ s1), xt (nV n1)) (xs卅,%s川)(10,9J492.575,10 2.575)(9.2275,10.7725). 100J10010000户居民对此种商品月需求量的置信度为的置信区间为(92275,107725);(2)最少要准备92275公斤商品才能以99%的概率满足需要。
概率论与数理统计第七章第二节(概率统计)
1 = n μk = μk . 上页 n
下页
返回
所以, 样本k阶原点矩是总体参数k—— 总体 k 阶原点矩——的无偏估计量. 讲评 不管总体服从什么分布, 只要总体
的数学期望存在, 样本均值总是总体均值的
无偏估计量. 这个结论可以当作定理应用.
上页
下页
返回
例7.2.2 设总体X的方差 X1 , X 2 ,, X n 是来自X的样本, 试证明:
1 n k k阶矩 Ak X i (k 1, 2,) 是总体阶矩的无 n i 1
偏估计量.
证 由于 E( X ik ) = E( X k ) = μk, i = 1,2, ,n, 因而
n 1 n 1 E ( Ak ) = E ( X ik ) = E ( X ik ) n i =1 n i =1
1 E (Z ) . n
于是也成立
E ( nZ ) 1
E ( X ).
下页 返回
即nZ也是总体均值的无偏估计量 . 上页
由此可见, 一个总体未知参数可以有不
同的无偏估计量.
讲评 一个未知参数的无偏估计量不一定
是唯一的, 它可以有许多无偏估计量. 事实 上, 在本例中, X1 , X 2 ,, X n 中的每一个都可 以作为θ的无偏估计量.
量. 这就提出了一个问题: 当总体的同一个参数 存在不同的估计量时, 究竟采用哪一个更好呢?
7.2.2 预备知识
数学期望及其性质,方差及其性质,依概 率收敛.
上页 下页 返回
7.2.3 建立理论
1. 无偏性 我们希望估计量在未知参数真值附近摆 动, 即它的数学期望等于未知参数的真值,
这就导致无偏性这个标准的产生. 定义1 若估计量 ˆ ˆ( X1, X 2 ,, X n ) 的数学 ˆ) 存在, 且对于任意 ,有 期望 E ( ˆ) , E(
概率论与数理统计:第7章 数理统计的基本概念2 (2)
(a j1, a j
]
j 1,2,, m ,其中 a a0 a1 am b。分点取值
应比数据的有效数字多一位或少一位。当 n 100时,一般
取m 为 5 ~ 10 。
称
a
j a j1
步骤3
1 (b a) 为组距,称 m
计算各组相应的频数 n
1 2
(a j
a j1)
与频率
j
f
j,
列出下表
宇宙粒子个数 j
0
频数 n j
13
频率 f j
32.50%
1
13
32.50%
2
8
20.00%
3
5
12.50%
4
1
2.50%
根据表中频数 n j的值作出条形图。 13 13 8 5 1
例7.1与例7.2中出现的数据分类表具有类似的地方。如
果n个数据中有 n1个 x1,, nm 个 xm,其中 x1 xm 。
频率 f j
6.67% 3.30% 10.00% 16.70% 23.30% 20.00% 10.00% 3.30% 3.30% 3.30%
根据表中10个组 (a j1, a j ]及相应的频数n j (j=1,…,10)
作出下列图形(称为直方图),见下图。从直方图看出,大部 分数据落在组(993,1008]中,而组(999,1002]内的数据个 数最多。
在实际问题中遇到的正态总体往往是第三种类型。
由于总体X的分布是未知的,因此总体X的数字特征(例 如均值、方差等等)往往也是一个未知的值。
从例7.1中,我们看到对这些未知的值可以根据数据来推
测。这些数据称为样本观测值,记作 x1,, xn 或 (x1,, xn )
概率论与数理统计习题及答案第七章
习题7-11. 选择题(1) 设总体X 的均值μ与方差σ2都存在但未知, 而12,,,n X X X L 为来自X 的样本, 则均值μ与方差σ2的矩估计量分别是( ) .(A) X 和S 2. (B) X 和211()nii X nμ=-∑. (C) μ和σ2. (D) X 和211()nii X X n=-∑.解 选(D).(2) 设[0,]X U θ:, 其中θ>0为未知参数, 又12,,,n X X X L 为来自总体X 的样本, 则θ的矩估计量是( ) .(A) X . (B) 2X . (C) 1max{}i i nX ≤≤. (D) 1min{}i i nX ≤≤.解 选(B).2. 设总体X 的分布律为其中0<θ<12n , 试求θ的矩估计量.解 因为E (X )=(-2)×3θ+1×(1-4θ)+5×θ=1-5θ, 令15X θ-=得到θ的矩估计量为ˆ15X θ-=. 3. 设总体X 的概率密度为(1),01,(;)0, x x f x θθθ+<<=⎧⎨⎩其它.其中θ>-1是未知参数, X 1,X 2,…,X n 是来自X 的容量为n 的简单随机样本, 求: (1) θ的矩估计量;(2) θ的极大似然估计量. 解 总体 X 的数学期望为1101()()d (1)d 2E X xf x x x x θθθθ+∞+-∞+==+=+⎰⎰. 令()E X X =, 即12X θθ+=+, 得参数θ的矩估计量为21ˆ1X X θ-=-. 设x 1, x 2,…, x n 是相应于样本X 1, X 2,… , X n 的一组观测值, 则似然函数为1(1),01,0,n n i i i x x L θθ=⎧⎛⎫+<<⎪ ⎪=⎨⎝⎭⎪⎩∏其它. 当0<x i <1(i =1,2,3,…,n )时, L >0且 ∑=++=ni ixn L 1ln )1ln(ln θθ,令1d ln ln d 1ni i L nx θθ==++∑=0, 得θ的极大似然估计值为 1ˆ1ln nii nxθ==--∑,而θ的极大似然估计量为 1ˆ1ln nii nXθ==--∑.4. 设总体X 服从参数为λ的指数分布, 即X 的概率密度为e ,0,(,)0,0,x x f x x λλλ->=⎧⎨⎩≤ 其中0λ>为未知参数, X 1, X 2, …, X n 为来自总体X 的样本, 试求未知参数λ的矩估计量与极大似然估计量.解 因为E (X )=1λ =X , 所以λ的矩估计量为1ˆXλ=. 设x 1, x 2,…, x n 是相应于样本X 1, X 2,… ,X n 的一组观测值, 则似然函数11nii inxx nni L eeλλλλ=--=∑==∏,取对数 1ln ln ()ni i L n x λλ==-∑.令1d ln 0,d ni i L n x λλ==-=∑ 得λ的极大似然估计值为1ˆxλ=,λ的极大似然估计量为1ˆXλ=. 5. 设总体X 的概率密度为,01(,)1,120,x f x x θθθ<<=-⎧⎪⎨⎪⎩,≤≤,其它,其中θ(0<θ<1)是未知参数. X 1, X 2, …, X n 为来自总体的简单随机样本, 记N 为样本值12,,,n x x x L 中小于1的个数. 求: (1) θ的矩估计量; (2) θ的极大似然估计量.解 (1) 1213()d (1)d 2X E X x x x x θθθ==+-=-⎰⎰, 所以32X θ=-矩.(2) 设样本12,,n x x x L 按照从小到大为序(即顺序统计量的观测值)有如下关系:x (1) ≤ x (2) ≤…≤ x (N ) <1≤ x (N +1)≤ x (N +2)≤…≤x (n ) .似然函数为(1)(2)()(1)(2)(1),1()0,,N n N N N N n x x x x x x L θθθ-++-<=⎧⎨⎩L L ≤≤≤≤≤≤≤其它.考虑似然函数非零部分, 得到ln L (θ ) = N ln θ + (n − N ) ln(1−θ ),令d ln ()0d 1L N n N θθθθ-=-=-, 解得θ的极大似然估计值为ˆN nθ=. 习题7-21. 选择题: 设总体X 的均值μ与方差2σ都存在但未知, 而12,,,n X X X L 为X 的样本, 则无论总体X 服从什么分布, ( )是μ和2σ的无偏估计量.(A) 11nii X n=∑和211()nii X X n=-∑. (B)111nii X n =-∑和211()1nii X X n =--∑.(C)111nii X n =-∑和211()1nii X n μ=--∑. (D)11nii X n=∑和211()nii X nμ=-∑.解 选(D).2. 若1X ,2X ,3X 为来自总体2(,)X N μσ:的样本, 且Y 1231134X X kX =++为μ的无偏估计量, 问k 等于多少?解 要求1231111()3434E X X kX k μμμμ++=++=, 解之, k =512.3. 设总体X 的均值为0, 方差2σ存在但未知, 又12,X X 为来自总体X的样本, 试证:2121()2X X -为2σ的无偏估计.证 因为22212112211[()][(2)]22E X X E X X X X -=-+2222112212[()2()()]22E X E X X E X σσ=-+==,所以2121()2X X -为2σ的无偏估计.习题7-31. 选择题(1) 总体未知参数θ的置信水平为0.95的置信区间的意义是指( ). (A) 区间平均含总体95%的值. (B) 区间平均含样本95%的值.(C) 未知参数θ有95%的可靠程度落入此区间. (D) 区间有95%的可靠程度含参数θ的真值. 解 选(D).(2) 对于置信水平1-α(0<α<1), 关于置信区间的可靠程度与精确程度, 下列说法不正确的是( ).(A) 若可靠程度越高, 则置信区间包含未知参数真值的可能性越大. (B) 如果α越小, 则可靠程度越高, 精确程度越低. (C) 如果1-α越小, 则可靠程度越高, 精确程度越低. (D) 若精确程度越高, 则可靠程度越低, 而1-α越小. 解 选(C )习题7-41. 某灯泡厂从当天生产的灯泡中随机抽取9只进行寿命测试, 取得数据如下(单位:小时):1050, 1100, 1080, 1120, 1250, 1040, 1130, 1300, 1200. 设灯泡寿命服从正态分布N (μ, 902), 取置信度为0.95, 试求当天生产的全部灯泡的平均寿命的置信区间.解 计算得到1141.11,x = σ2 =902. 对于α = 0.05, 查表可得/20.025 1.96z z ==α.所求置信区间为/2/2(,)(1141.11 1.96,1141.11 1.96)(1082.31,1199.91).x x z +=-=αα2. 为调查某地旅游者的平均消费水平, 随机访问了40名旅游者, 算得平均消费额为105=x 元, 样本标准差28=s 元. 设消费额服从正态分布. 取置信水平为0.95, 求该地旅游者的平均消费额的置信区间.解 计算可得105,x = s 2 =282.对于α = 0.05, 查表可得0.0252(1)(39) 2.0227t n t α-==.所求μ的置信区间为22((1),(1))(105 2.0227,105 2.0227)x n x n αα--+-=+=(96.045, 113.955).3. 假设某种香烟的尼古丁含量服从正态分布. 现随机抽取此种香烟8支为一组样本, 测得其尼古丁平均含量为18.6毫克, 样本标准差s =2.4毫克. 试求此种香烟尼古丁含量的总体方差的置信水平为0.99的置信区间.解 已知n =8, s 2 =2.42, α = 0.01, 查表可得220.0052(1)(7)20.278n αχχ-==, 220.99512(1)(7)0.989n αχχ--==, 所以方差σ 2的置信区间为2222122(1)(1)(,)(1)(1)n S n S n n ααχχ---=--22(81) 2.4(81) 2.4(,)20.2780.989-⨯-⨯=(1.988, 40.768). 4. 某厂利用两条自动化流水线灌装番茄酱, 分别从两条流水线上抽取样本:X 1,X 2,…,X 12及Y 1,Y 2,…,Y 17, 算出221210.6g,9.5g, 2.4, 4.7x y s s ====.假设这两条流水线上装的番茄酱的重量都服从正态分布, 且相互独立, 其均值分别为12,μμ. 又设两总体方差2212σσ=. 求12μμ-置信水平为0.95的置信区间, 并说明该置信区间的实际意义.解 由题设22121210.6,9.5, 2.4, 4.7,12,17,x y s s n n ======2222112212(1)(1)(121) 2.4(171) 4.71.94212172wn s n s s n n -+--⨯+-⨯===+-+-120.0252(2)(27) 2.05181,t n n t α+-==所求置信区间为122(()(2)((10.69.5) 2.05181 1.94x y t n n s α-±+-=-±⨯ =(-0.40,2.60).结论“21μμ-的置信水平为0.95 的置信区间是(-0.40,2.60)”的实际意义是:在两总体方差相等时, 第一个正态总体的均值1μ比第二个正态总体均值2μ大-0.40~2.60,此结论的可靠性达到95%.5. 某商场为了了解居民对某种商品的需求, 调查了100户, 得出每户月平均需求量为10公斤, 方差为9 . 如果这种商品供应10000户, 取置信水平为0.99.(1) 取置信度为0.99,试对居民对此种商品的平均月需求量进行区间估计; (2) 问最少要准备多少这种商品才能以99%的概率满足需要? 解 (1) 每户居民的需求量的置信区间为2222((1),(1))()(10 2.575,10 2.575)(9.2275,10.7725).,x n x n x z x αααα-+-≈+=-=10000户居民对此种商品月需求量的置信度为0.99的置信区间为(92275,107725);(2)最少要准备92275公斤商品才能以99%的概率满足需要.。
概率论与数理统计第七章参数估计习题答案
æ çè
x
±
ua
/
2
s n
ö ÷ø
=
(14.95
±
0.1´1.96)
=
(14.754,15.146)
大学数学云课堂
3028709.总体X ~ N (m,s 2 ),s 2已知,问需抽取容量n多大的样本,
才能使m的置信概率为1 -a,且置信区间的长度不大于L?
解:由s
2已知可知m的置信度为1
-
a的置信区间为
64 69 49 92 55 97 41 84 88 99 84 66 100 98 72 74 87 84 48 81 (1)求m的置信概率为0.95的置信区 间.
(2)求s 2的置信概率为0.95的置信区间.
解:x = 76.6, s = 18.14,a = 1- 0.95 = 0.05, n = 20,
大学数学云课堂
3028706.设X1,X 2,L,X n是取自总体X的样本,E(X)= m,D(X)= s 2,
n -1
å sˆ 2 = ( X i+1 - X i )2 ,问k为何值时sˆ 2为s 2的无偏估计. i =1 解:令 Yi = X i+1 - X i , i = 1, 2,¼, n -1, 则E(Yi ) = E( X i+1) - E( X i ) = m - m = 0, D(Yi ) = 2s 2 , n -1 å 于是Esˆ 2 = E[k ( Yi2 )] = k(n -1)EY12 = 2s 2 (n -1)k, i =1 那么当E(sˆ 2 ) = s 2 ,即2s 2 (n -1)k = s 2时, 有k = 1 . 2(n -1)
的密度函数为f
(x,q
概率论与数理统计教程第七章答案
、 第七章 假设检验7、1 设总体2(,)N ξμσ~,其中参数μ,2σ为未知,试指出下面统计假设中哪些就是简单假设,哪些就是复合假设:(1)0:0,1H μσ==; (2)0:0,1H μσ=>; (3)0:3,1H μσ<=; (4)0:03H μ<<; (5)0:0H μ=、解:(1)就是简单假设,其余位复合假设7、2 设1225,,,ξξξL 取自正态总体(,9)N μ,其中参数μ未知,x 就是子样均值,如对检验问题0010:,:H H μμμμ=≠取检验的拒绝域:12250{(,,,):||}c x x x x c μ=-≥L ,试决定常数c ,使检验的显著性水平为0、05 解:因为(,9)N ξμ~,故9(,)25N ξμ~ 在0H 成立的条件下,00053(||)(||)53521()0.053cP c P c ξμξμ-≥=-≥⎡⎤=-Φ=⎢⎥⎣⎦55()0.975,1.9633c cΦ==,所以c =1、176。
7、3 设子样1225,,,ξξξL 取自正态总体2(,)N μσ,20σ已知,对假设检验0010:,:H H μμμμ=>,取临界域12n 0{(,,,):|}c x x x c ξ=>L ,(1)求此检验犯第一类错误概率为α时,犯第二类错误的概率β,并讨论它们之间的关系;(2)设0μ=0、05,20σ=0、004,α=0、05,n=9,求μ=0、65时不犯第二类错误的概率。
解:(1)在0H 成立的条件下,200(,)nN σξμ~,此时00000()P c P ξαξ=≥=所以10αμ-=,由此式解出010c αμμ-=+在1H 成立的条件下,20(,)nN σξμ~,此时10100010()(P c P αξβξμ-=<==Φ=Φ=Φ-由此可知,当α增加时,1αμ-减小,从而β减小;反之当α减少时,则β增加。
(2)不犯第二类错误的概率为100.9511(0.650.51(3)0.21(0.605)(0.605)0.7274αβμμ--=-Φ-=-Φ-=-Φ-=Φ= 7、6 设一个单一观测的ξ子样取自分布密度函数为()f x 的母体,对()f x 考虑统计假设:0011101201:():()00x x x H f x H f x ≤≤≤≤⎧⎧==⎨⎨⎩⎩其他其他试求一个检验函数使犯第一,二类错误的概率满足2min αβ+=,并求其最小值。
《概率论与数理统计》第七章 讲义
测得强度值为x1, x2 , …, x25,其均值为 x 108 (Pa),问当日生产是否正常?
Page 12
Chapter 7 假设检验
(1) 是参数估计问题吗? (2) 回答“是”还是“否”,假设检验问题。 (3) 命题“合金平均强度不低于110Pa”正确 与否仅涉及如下两个参数集合:
0 { : 110}
其二是 H 0不真(即 H1为真)但样本观测值落 在接受域中,从而接受原假设H 0,这种错误称 为第二类错误,其发生的概率称为犯第二类错 误的概率,或称受伪概率,通常记为 。
Page 22
Chapter 7 假设检验
观测数 据情况
( x1,, xn ) W
( x1 ,, xn ) W c
H0 : 110
vs
H1 : 110
Page 18
Chapter 7 假设检验
•假设检验的两个特点:
第一,假设检验采用逻辑上的反证法,即为了检验一个假设 是否成立,首先假设它是真的,然后对样本进行观察,如 果发现出现了不合理现象,则可以认为假设是不合理的, 拒绝假设。否则可以认为假设是合理的,接受假设。 第二,假设检验采用的反证法带有概率性质。所谓假设的不 合理不是绝对的,而是基于实践中广泛采用的小概率事件 几乎不可能发生的原则。至于事件的概率小到什么程度才 算是小概率事件,并没有统一的界定标准,而是必须根据 具体问题而定。如果一旦判断失误,错误地拒绝原假设会 造成巨大损失,那么拒绝原假设的概率就应定的小一些; 如果一旦判断失误,错误地接受原假设会造成巨大损失, 那么拒绝原假设的概率就应定的大一些。
Page 19
Chapter 7 假设检验
二、选择检验统计量,给出拒绝域形式
概率论与数理统计第七章-精品
i1
n
1
(xi )2
e 22 (2
n ) e 2
1
22
n
(xi
i1
)2
i1 2
lo L (,g 2 ) n 2 lo 2 ) g n 2 l( o 2 ) g 2 1 2 i ( n 1 ( x i ) 2
似然方程组为
例3 均值,方差2的矩估计
设总体的均值为,方差为2 ,于是
a a 1 2(( ,, 2 2)) E E ((X X )2) u V(X a ) [rE (X )2] 22
由此列出方程组:
aa12((
, 2 ) , 2 )
A1 A2
若是向量,上述方程必须用似然方程
组代替 .
两点说明:
2、用上述求导方法求参数的MLE有时 行不通,这时要用极大似然原则来求 .
下面举例说明如何求极大似然估计
例1 设X1,X2,…Xn是取自总体 X~B(1, p) 的 一个样本,求参数p的极大似然估计.
解:似然函数为:
L(p)= f (X1,X2,…Xn; p )
它是极大值点.
由 L ( ,
2)(2
n ) e 2
2 12i n 1(xi)2
lim L(,2)0
lim L(,2)0 lim L(,2)0
2
2 0
*x
2*n 1i n 1(xix)2
是L(,2)的最大值点. ∴ 和2的极大似然估
n 1i n1Xim pE(Xm)am
例1 设总体X的概率密度为
f(x)(1)x,
0,
0x1 其它
其中 1
是未知参数,
数理统计第7章
数理统计第7章第7章估计理论一(本章导学一(教学目的1 准确理解估计量、估计值,熟练掌握参数点估计的矩估计和极大似然估计。
2 理解估计量的评价标准,了解充分性与完备性,极大似然估计的性质。
3 熟练掌握区间估计的有关概念,正态总体均值与方差的区间估计。
二(内容提要主要介绍了两种点估计方法,估计量的评选标准,充分性与完备性,区间估计的基本概念和常用方法、公式。
估计理论是数理统计学的重要内容之一。
它主要分为参数估计和非参数估计,参数估计有点估计和区间估计两类问题。
本章主要研究参数估计问题。
在本章中,设是总体的一个待估参数,的一切可能取值构成的参数空间记为。
为从总体中抽取的一容量为n的样本,其观测值记为。
=,然后用去估计称在参数的点估计中,是要构造一个统计量为的点估计或估计量,或简称估计,将样本观测值代入在后便得到了的一个估计值,在不致混淆的情况均用表示。
在参数的区间估计中,是要构造两个统计量与,且<,然后以区间[,] 的形式给出未知参数的估计,事件“区间[,]含有”的概率称为置信水平。
一(矩法估计量1900年英国统计学家K.Pearson提出了一个替换原则:用样本矩去替换总体矩,后来人们就称此为矩估计。
矩估计的基本点是:用样本矩估计总体矩,用样本矩的相应函数估计总体矩的函数。
设是来自某总体ξ 的一个样本,则样本的阶原点矩为:如果总体ξ 的k阶原点矩存在,则用去估计,记为。
例1 设总体,从中获得样本,由于Eξ=p,故p的矩估计为设样本的观察值为,那么每一个不是0便是1,从而的观察值便是这便是频率。
例2 设总体ξ 具有方差,从总体中获得样本,由于那么分别用估计,从而其函数的矩估计为这便是样本的二阶中心矩,Dξ是总体的二阶中心矩,故。
一般当总体的k 阶中心矩存在时,其矩估计为样本的k阶中心矩,即:。
矩估计的优点是不要求知道总体的分布,因而矩估计获得了广泛的应用。
当总体分布类型已知时,但含有未知参数,有时也可用矩法获得未知参数的估计。
概率论与数理统计7-数理统计2 [兼容模式]
箱线图
例2 设有一组容量为18的样本如下(已经排过序) 122 126 133 140 145 145 149 150 157 162 166 175 177 177 183 188 199 212
箱线图
即有 x0.5 个数的平均值,
1 (157 162) 159.5. 2
数据集的箱线图是由箱子和直线组成的图形, 它是基于以下五个数的图形概括: 最小值 Min,
141 147 126 140 141 150 142
148 148 140 146 149 132 137
132 144 144 142 148 142 134
138 150 142 137 135 142 144
154 149 141 148 148 143 146
142 145 140 154 152 153 147
简单随机样本
若总体的分布函数为F(x)、概率密度函数为 f(x), ) 则其简单随机样本的联合分布函数为
F * ( x , x2 ,, xn ) =F F(x1) F(x2) … F(xn)
其简单随机样本的联合概率密度函数为
f * ( x , x2 ,, xn ) =f f ( x 1) f ( x 2) … f ( x n)
求样本分位数: x0.2,x0.25,x0.5 .
解
第一四分位数 Q1, 第三四分位数 Q3和 最大值 Max. 中位数 M,
(1) 因为 np 18 0.2 3.6, ( 2) 因为 np 18 0.25 4.5,
它的作法如下:
LOGO LOGO
直方图
例1 下面给出了84个伊特拉斯坎(Etruscan)人男子的头颅的最大宽度
数理统计第7章部分习题解答
第七章习题()-1127.1 (1)(1),01(,)0,.0.,,,n X x x x f x X X X X θθθθθθ⎧+-<≤=⎨⎩>设总体的分布密度函数为其它其中为来自总体的简单随机样本,求未知参数的矩估计量.11101121100M[](1)(1)(1)(1)(1)()(1)1222[][]1[]2ˆ1E X x x x dx x x dxx x x x dx E X E X X E X X Xθθθθθθθθθθθθθθθθθθθθθ-+++=+-=+-⎛⎫=+-=+-= ⎪+++⎝⎭=-=-⎰⎰⎰解:,将式中的用替代,得的矩估计量7.2. (),0.601/012345162210732.X Pois λλλ>假设每升水中大肠杆菌的数目服从泊松分布其中为了检验某种自来水消毒设备的效果,现从消毒后的水中随机抽取个样品(每个样品为升水)进行化验,结果如下:大肠杆菌的个数升样品数试求未知参数的矩估计值[][] ˆ 016122210374352176012MM E X E X X X λλλλλ==⨯+⨯+⨯+⨯+⨯+⨯==解:,将式中的用代替,得的矩估计量的矩估计值()1217.3 (,), 0 .2,,, xn X f x e X X X X θθθθ-=>设总体的分布密度函数为其中是未知参数为来自总体的样本,求的最大似然估计量. ()()12112121211211,,,,,,,(,)(,)(,)112(2)1ln ln(2)ln -110 1,2,,.nnii n n X X X n nx x x x nnii nni ii i i i x x x x x x f x f x f x e e L n xL n x x n x X i n θθθθθθθθθθθθθθθθθ=-----====∑⎛⎫== ⎪⎝⎭=--∂=+==∂=∑∑∑令解:设样本观测值为.似然函数L ,得将式中的观测值用个体替代,得到11ˆ .nL i i X X n θ===∑的最大似然估计量()1127.4 1,1 (,)0, 1.0.,,, .x n X ex f x x X X X X θθθθθ--⎧>⎪=⎨⎪≤⎩>设总体的分布密度函数为其中是未知参数为总体的容量为n 的样本,求的最大似然估计量()()1211212121111()1211 ,,,1, 1,2,,L ,,,,=(,)(,)(,)1111=1ln ln ()ln 1()01=(nn i i n i n n x x x x n nni i ni i n i i x x x x i n x x x f x f x f x eeeeL n x n L n x n x n n θθθθθθθθθθθθθθθθθθ=--------===>=∑==---∂=-+-=∂-∑∑∑令解:设是样本观测值,当满足每个,似然函数得111)1(1,2,,)1ˆ1 1.ni i i i n i i x x i n X n X X n θθ===-==-=-∑∑L,将式中的用替代,得的最大似然估计量7.5 1231-21. 1,1,1,3,2,1,3,2,2,1,2,2,3,1,1,22 X X P θθθθθ<设总体的分布列为其中0<今有样本观测值:试求的最大似然估计值.()()133123416L 1,1,1,3,2,1,3,2,2,1,2,2,3,1,1,21,1,1,3,2,1,3,2,2,1,2,2,3,1,1,2,(1)(1)(1)(3)(2)(1-2)ln 13ln 3ln(1-2)ln 136013-26632=1312=P X P X P X P X P X L L θθθθθθθθθθθθ=======+∂=-==∂-令解对样本观测值:,似然函数L =,得 ,即 有最大似然估计值1332()127.6 ~(,)01, ˆ,,, ˆn M L X B m p p p m X X X X p pp<<设总体,其中为未知参数,为正整数且已知。
概率论与数理统计课后习题答案第7章习题详解
习题七1.设总体X 服从二项分布b (n ,p ),n 已知,X 1,X 2,…,X n 为来自X 的样本,求参数p 的矩法估计.【解】1(),(),E X np E X A X ===因此np =X所以p 的矩估计量 ˆXpn= 2.设总体X 的密度函数f (x ,θ)=22(),0,0,.x x θθθ⎧-<<⎪⎨⎪⎩其他X 1,X 2,…,X n 为其样本,试求参数θ的矩法估计. 【解】23022022()()d ,233x x E X x x x θθθθθθθ⎛⎫=-=-= ⎪⎝⎭⎰令E (X )=A 1=X ,因此3θ=X 所以θ的矩估计量为 ^3.X θ=3.设总体X 的密度函数为f (x ,θ),X 1,X 2,…,X n 为其样本,求θ的极大似然估计.(1) f (x ,θ)=,0,0,0.e x x x θθ-⎧≥⎨<⎩(2) f (x ,θ)=1,01,0,.x x θθ-⎧<<⎨⎩其他【解】(1) 似然函数111(,)e e eniii n nx x nn ii i L f x θθθθθθ=---==∑===∏∏1ln ln ni i g L n x θθ===-∑由1d d ln 0d d ni i g L n x θθθ===-=∑知 1ˆnii nxθ==∑所以θ的极大似然估计量为1ˆXθ=.(2) 似然函数11,01nni i i L x x θθ-==<<∏,i =1,2,…,n.1ln ln (1)ln ni i L n x θθ==+-∏由1d ln ln 0d ni i L n x θθ==+=∏知11ˆln ln nniii i n nxx θ===-=-∑∏所以θ的极大似然估计量为 1ˆln nii nxθ==-∑求这批股民的收益率的平均收益率及标准差的矩估计值. 【解】0.094x =- 0.101893s = 9n =0.094.EXx ==- 由222221()()[()],()ni i x E X D X E X E X A n==+==∑知222ˆˆ[()]E X A σ+=,即有 ˆσ=于是 ˆ0.101890.0966σ=== 所以这批股民的平均收益率的矩估计值及标准差的矩估计值分别为-0.94和0.966. 5.随机变量X 服从[0,θ]上的均匀分布,今得X 的样本观测值:0.9,0.8,0.2,0.8,0.4,0.4,0.7,0.6,求θ的矩法估计和极大似然估计,它们是否为θ的无偏估计. 【解】(1) ()2E X θ=,令()E X X =,则ˆ2X θ=且ˆ()2()2()E E X E X θθ===, 所以θ的矩估计值为ˆ220.6 1.2x θ==⨯=且ˆ2X θ=是一个无偏估计.(2) 似然函数8811(,)i i L f x θθ=⎛⎫== ⎪⎝⎭∏,i =1,2, (8)显然L =L (θ)↓(θ>0),那么18max{}i i x θ≤≤=时,L =L (θ)最大, 所以θ的极大似然估计值ˆθ=0.9.因为E(ˆθ)=E (18max{}i i x ≤≤)≠θ,所以ˆθ=18max{}i i x ≤≤不是θ的无偏计.6.设X 1,X 2,…,X n 是取自总体X 的样本,E (X )=μ,D (X )=σ2,2ˆσ=k 1211()n i i i XX -+=-∑,问k 为何值时2ˆσ为σ2的无偏估计. 【解】令 1,i i i Y X X +=-i =1,2,…,n -1,则 21()()()0,()2,i i i i E Y E X E X D Y μμσ+=-=-==于是 1222211ˆ[()](1)2(1),n ii E E k Yk n EY n k σσ-===-=-∑那么当22ˆ()E σσ=,即222(1)n k σσ-=时, 有 1.2(1)k n =-7.设X 1,X 2是从正态总体N (μ,σ2)中抽取的样本112212312211311ˆˆˆ;;;334422X X X X X X μμμ=+=+=+ 试证123ˆˆˆ,,μμμ都是μ的无偏估计量,并求出每一估计量的方差. 【证明】(1)11212212121ˆ()()(),333333E E X X E X E X μμμμ⎛⎫=+=+=+= ⎪⎝⎭21213ˆ()()()44E E X E X μμ=+=, 31211ˆ()()(),22E E X E X μμ=+= 所以123ˆˆˆ,,μμμ均是μ的无偏估计量. (2) 22221122145ˆ()()(),3399D D X D X X σμσ⎛⎫⎛⎫=+== ⎪ ⎪⎝⎭⎝⎭222212135ˆ()()(),448D D X D X σμ⎛⎫⎛⎫=+= ⎪ ⎪⎝⎭⎝⎭()223121ˆ()()(),22D D X D X σμ⎛⎫=+= ⎪⎝⎭8.某车间生产的螺钉,其直径X ~N (μ,σ2),由过去的经验知道σ2=0.06,今随机抽取6枚,测得其长度(单位mm )如下:14.7 15.0 14.8 14.9 15.1 15.2 试求μ的置信概率为0.95的置信区间. 【解】n =6,σ2=0.06,α=1-0.95=0.05,0.25214.95, 1.96,a x u u ===,μ的置信度为0.95的置信区间为/2(14.950.1 1.96)(14.754,15.146)x u α⎛±=±⨯= ⎝.9.总体X ~N (μ,σ2),σ2已知,问需抽取容量n 多大的样本,才能使μ的置信概率为1-α,且置信区间的长度不大于L ?【解】由σ2已知可知μ的置信度为1-α的置信区间为/2x u α⎛± ⎝,/2u α,/2u α≤L ,得n ≥22/224()u L ασ 10.设某种砖头的抗压强度X ~N (μ,σ2),今随机抽取20块砖头,测得数据如下(kg ·cm -2):64 69 49 92 55 97 41 84 88 99 84 66 100 98 72 74 87 84 48 81 (1) 求μ的置信概率为0.95的置信区间. (2) 求σ2的置信概率为0.95的置信区间. 【解】76.6,18.14,10.950.05,20,x s n α===-==/20.025222/20.0250.975(1)(19)2.093,(1)(19)32.852,(19)8.907t n t n ααχχχ-==-===(1) μ的置信度为0.95的置信区间/2(1)76.6 2.093(68.11,85.089)a x n ⎛⎫⎛⎫-== ⎪ ⎪⎝⎭⎝⎭(2)2σ的置信度为0.95的置信区间222222/21/2(1)(1)1919,18.14,18.14(190.33,702.01)(1)(1)32.8528.907n s n s n n ααχχ-⎛⎫--⎛⎫=⨯⨯= ⎪⎪--⎝⎭⎝⎭ 11.设总体X ~f (x )=(1),01;10,.x x θθθ⎧+<<>-⎨⎩其中其他 X 1,X 2,…,X n 是X 的一个样本,求θ的矩估计量及极大似然估计量.【解】(1)1101()()d (1)d ,2E X xf x x x x θθθθ+∞+-∞+==+=+⎰⎰ 又1(),2X E X θθ+==+ 故21ˆ1X Xθ-=- 所以θ的矩估计量 21ˆ.1X Xθ-=- (2) 似然函数11(1) 01(1,2,,)()()0n n ni i i i i x x i n L L f x θθθ==⎧+<<=⎪===⎨⎪⎩∏∏其他. 取对数11ln ln(1)ln (01;1),d ln ln 0,d 1nii i ni i L n x x i n L nx θθθθ===++<<≤≤=+=+∑∑所以θ的极大似然估计量为1ˆ1.ln nii nXθ==--∑12.设总体X ~f (x )= 36(),0;0,.xx x θθθ⎧-<<⎪⎨⎪⎩其他X 1,X 2,…,X n 为总体X 的一个样本 (1) 求θ的矩估计量ˆθ;(2) 求ˆ()D θ.【解】(1) 236()()d ()d ,2x E X xf x x x x θθθθ+∞-∞=-=⎰⎰令 ,2EX X θ==所以θ的矩估计量 ˆ2.X θ= (2)4ˆ()(2)4(),D D X D X DX nθ===, 又322236()63()d ,2010x x E X x θθθθθ-===⎰于是222223()()(),10420D XE X EX θθθ=-=-=,所以2ˆ().5D nθθ=13.设某种电子元件的使用寿命X 的概率密度函数为f (x ,θ)= 2()2,;0,.x x x θθθ--⎧>⎨≤⎩e其中θ(θ>0)为未知参数,又设x 1,x 2,…,x n 是总体X 的一组样本观察值,求θ的极大似然估计值.【解】似然函数12()12e 0;1,2,,;()0ln ln 22(),;1,2,,,ni i x n i n i i i x i n L L L n x x i n θθθθ=--=⎧∑⎪⋅≥===⎨⎪⎩=--≥=∑ 其他.由d ln 20ln (),d Ln L θθ=>↑知 那么当01ˆˆmin{}ln ()max ln ()ii nx L L θθθθ>≤≤==时 所以θ的极大似然估计量1ˆmin{}ii nx θ≤≤=其中θ(0<θ<12)是未知参数,利用总体的如下样本值3,1,3,0,3,1,2,3,求θ的矩估计值和极大似然估计值. 【解】813ˆ(1)()34,()4 28ii x E X E X x x x θθ=-=-====∑令得又 所以θ的矩估计值31ˆ.44x θ-== (2) 似然函数86241(,)4(1)(12).ii L P x θθθθ===--∏2ln ln 46ln 2ln(1)4ln(1),d ln 628628240,d 112(1)(12)L L θθθθθθθθθθθθ=++-+--+=--==---- 解2628240θθ-+=得1,272θ=. 由于71,122> 所以θ的极大似然估计值为7ˆ2θ-=. 15.设总体X 的分布函数为F (x ,β)=1,,0,.x xx ββααα⎧->⎪⎨⎪≤⎩其中未知参数β>1,α>0,设X 1,X 2,…,X n 为来自总体X 的样本(1) 当α=1时,求β的矩估计量;(2) 当α=1时,求β的极大似然估计量; (3) 当β=2时,求α的极大似然估计量. 【解】当α=1时,11,1;(,)(,1,)0,1.x x f x F x x x ββββ+⎧≥⎪==⎨⎪<⎩当β=2时, 2132,;(,)(,,2)0,.x x f x F x x x ααααα⎧≥⎪==⎨⎪<⎩(1) 111()d 11E X x x x βββββββ+∞-+∞===--⎰令()E X X =,于是ˆ,1XX β=- 所以β的矩估计量ˆ.1XX β=- (2) 似然函数(1)1111,1,(1,2,,);()(,)0,.ln ln (1)ln ,d ln ln 0,d n n ni i i i i ni i ni i x x i n L L f x L n x L n x ββββββββ-+====⎧⎛⎫>=⎪ ⎪===⎨⎝⎭⎪⎩=-+=-=∏∏∑∑ 其他所以β的极大似然估计量1ˆ.ln nii nxβ==∑(3) 似然函数23112,,(1,2,,);(,)0,.n ni nn i i i i x i n L f x x ααα==⎧≥=⎪⎪⎛⎫==⎨ ⎪⎝⎭⎪⎪⎩∏∏ 其他 显然(),L L α=↑那么当1ˆmin{}i i nx α≤≤=时,0ˆ()max ()a L L L αα>== , 所以α的极大似然估计量1ˆmin{}i i nx α≤≤=. 16.从正态总体X ~N (3.4,62)中抽取容量为n 的样本,如果其样本均值位于区间(1.4,5.4)内的概率不小于0.95,问n 至少应取多大?2/2()d zt z t ϕ-=⎰【解】26~3.4,X N n ⎛⎫⎪⎝⎭,则~(0,1),X Z N ={1.4 5.4}33210.95Z P X P PZ ΦΦΦ<<<<=⎧=-<<⎨⎩⎭⎛=-=-≥ ⎝于是0.975Φ≥ 1.96≥, ∴ n ≥35.17. 设总体X 的概率密度为f (x ,θ)=,01,1,12,0,.x x θθ<<⎧⎪-≤<⎨⎪⎩其他 其中θ是未知参数(0<θ<1),X 1,X 2,…,X n 为来自总体X 的简单随机样本,记N 为样本值x 1,x 2,…,x n 中小于1的个数.求: (1) θ的矩估计;(2) θ的最大似然估计. 解 (1) 由于121(;)d d (1)d EX xf x x x x x x θθθ+∞-∞==+⎰⎰⎰-133(1)222θθθ=+-=-. 令32X θ-=,解得32X θ=-, 所以参数θ的矩估计为32X θ=-. (2) 似然函数为1()(;)(1)nN n N i i L f x θθθθ-===-∏,取对数,得ln ()ln ()ln(1),L N n N θθθ=+--两边对θ求导,得d ln ().d 1L N n Nθθθθ-=-- 令 d ln ()0,d L θθ=得 Nnθ=,所以θ的最大似然估计为Nnθ=.。
概率论与数理统计第七章课后习题及参考答案
5.设总体 X 的概率密度为
f
(x,
)
(
1) x
,0
x
1,
0, 其他.
其中 1是未知参数, X1 , X 2 ,…, X n 是来自 X 的一个样本.试求参数
2
的矩估计和极大似然估计.现有样本观测值 0.1 ,0.2 ,0.9 ,0.8 ,0.7 及 0.7 ,
求参数 的矩估计值和极大似然估计值.
1 2 2 c 2 2 ( 1 c) 2 ,
n
n
取 c 1 即可. n
14.设总体 X 的均值为 ,方差为 2 ,从总体中抽取样本 X1 , X 2 , X 3 ,证明
(
x,
,
2
)
1
1
1
e 2 2
(ln x )2
,
x
0,
2 x
0,
x 0.
其中 , 0 为未知参数, X1 , X 2 ,…, X n 是取自该总体的一
个样本,求参数 , 2 的极大似然估计.
解: xi 时,似然函数为
L(, 2 )
(
1 2 )n
1 x1x2 xn
exp{
dL
d
n exp{
n i 1
( xi
)}
0,
所以 L( ) 是 的单调增函数,从而对满足条件 xi 的任意 ,有
n
n
L( ) exp{ i1 (xi )} exp{ i1 (xi m1iinn{xi})} ,
即 L( ) 在 m1iinn{xi} 时取最大值, 故 的极大似然估计值为ˆ m1iinn{xi} . 7.(1) 设总体 X 具有分布律
ˆ1 X1 ;
ˆ2
概率论与数理统计 第7.2
例5 从一批零件中,抽取9个零件,测得其直 径(mm)为: 19.7 20.1 19.8 19.9 20.2 20.0 19.9 20.2 20.3
设零件直径服从正态分布 N ( , 2 ),且已知 0.21
求这批零件直径的均值 的置信水平为0.95的 置信区间。 X 解: 因为 已知, ~N(0, 1) 取 U n 对给定的置信水平 1 0.95 , 得到 0.05
2 2
(n)为 的点
2
2
的上
分位点。
2 0.05, n 21, (21) 32.7
.
2 0.01, n 21, (21) 38.9
2
双
分位点:
2
2
2 1 / 2
2 /2
2 2 35 . 5 , 0.05, n 21, / 2 10.3 1 2 2 2 41 . 4 , 8.03 0.01, n 21, / 2 1 2
例7 从一批零件中,抽取9个零件,测得其直 径(mm)为: 19.7 20.1 19.8 19.9 20.2 20.0 19.9 20.2 20.3
设零件直径服从正态分布 N ( , 2 ),且未知
2 求这批零件直径的方差 的置信水平为0.95的 置信区间。
解:因 未知,取
2
查表得: t 2 2.31
X P{| | t 2 } 1 S n 从中解得
使
S S P{ X t 2 X t 2 } 1 n n
又 x 20.01, n 9, s 0.203 , 代入上式,得到
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5 / 29
Interval Estimation
Definition 2.1
Assume that the distribution function for population X is F (x; θ), θ is the unknown parameter, X1 , X2 , · · · , Xn is the sample from X . For some given α(0 < α < 1), if there exist two statistics ˆ1 = θ ˆ1 (X1 , X2 , · · · , Xn ) and θ ˆ2 = θ ˆ2 (X1 , X2 , · · · , Xn ), such θ that, for any θ, ˆ1 ≤ θ ≤ θ ˆ2 } = 1 − α Pθ {θ ˆ1 , θ ˆ2 ) is called as the two-sided Then the random interval (θ confidence interval for θ with confidence level(˜&Y ²) ˆ1 , θ ˆ2 are called the confidence lower limit and 1 − α, and θ ˆ1 , θ ˆ2 ) is called interval confidence upper limit respectively, also (θ estimation for parameter θ.
7 / 29
Remark
1. Confidence level 1 − α:
ˆ1 (X1 , X2 , · · · , Xn ), θ ˆ2 (X1 , X2 , · · · , Xn )) is a a. The interval (θ random interval, for each fixed sample observation value, there ˆ1 (x1 , x2 , · · · , xn ), θ ˆ2 (x1 , x2 , · · · , xn )), is one specific interval (θ which may contain θ, or may not contain θ.
5 / 29
Interval Estimation
ˆ(X1 , X2 , · · · , Xn ) is an estimator for In the point estimation, θ the parameter θ, for the given observation value of sample ˆ(x1 , x2 , · · · , xn ) (x1 , x2 , · · · , xn ), we can obtain one estimate θ for θ. By the randomness of sample, there exists deviation between the estimate and the real value of parameter. Sometimes, we hope to find a quantity to measure the extent of deviation. The aim of interval estimation is to determine the interval which contains the parameter in some probability based on the sample statistics.
a. The confidence level 1 − α reflects the reliability of the interval, the bigger 1 − α is, the higher the reliability is. b. While the length of the interval reflects the accuracy of the ˆ1 , θ ˆ2 ) is, the higher the accuracy is. interval, the shorter the Sample Size
3 / 29
Interval Estimation Interval Estimation Interval estimation for normal population
Interval estimation for a single normal population Interval estimation for two normal populations Interval estimation for large sample
a. The confidence level 1 − α reflects the reliability of the interval, the bigger 1 − α is, the higher the reliability is.
9 / 29
2. The reliability(Œ ‚ 5 ) and accuracy(° ( Ý) of interval estimation:
Determination of the Sample Size
4 / 29
Interval Estimation
ˆ(X1 , X2 , · · · , Xn ) is an estimator for In the point estimation, θ the parameter θ, for the given observation value of sample ˆ(x1 , x2 , · · · , xn ) (x1 , x2 , · · · , xn ), we can obtain one estimate θ for θ.
2 / 29
Interval Estimation Interval Estimation Interval estimation for normal population
Interval estimation for a single normal population Interval estimation for two normal populations Interval estimation for large sample
9 / 29
2. The reliability(Œ ‚ 5 ) and accuracy(° ( Ý) of interval estimation:
a. The confidence level 1 − α reflects the reliability of the interval, the bigger 1 − α is, the higher the reliability is. b. While the length of the interval reflects the accuracy of the ˆ1 , θ ˆ2 ) is, the higher the accuracy is. interval, the shorter of (θ c. Generally, when the sample size is fixed, the smaller α is (i.e. the bigger 1 − α is), the more longer the length of the confidence ˆ1 , θ ˆ2 ) is. That is, when the reliability increases, the interval (θ accuracy decreases, and the inverse conclusion still holds.
8 / 29
2. The reliability(Œ ‚ 5 ) and accuracy(° ( Ý) of interval estimation:
9 / 29
2. The reliability(Œ ‚ 5 ) and accuracy(° ( Ý) of interval estimation:
6 / 29
Interval Estimation
Theorem 2.1
If g (θ) is a strictly increasing (or decreasing) function, and ˆ1 , θ ˆ2 ] is a confidence interval for θ with confidence level 1 − α, [θ then ˆ1 ), g (θ ˆ2 )] (or [g (θ ˆ2 ), g (θ ˆ1 )]) is a confidence interval for g (θ) [g (θ with confidence level 1 − α.
8 / 29
Remark
1. Confidence level 1 − α:
ˆ1 (X1 , X2 , · · · , Xn ), θ ˆ2 (X1 , X2 , · · · , Xn )) is a a. The interval (θ random interval, for each fixed sample observation value, there ˆ1 (x1 , x2 , · · · , xn ), θ ˆ2 (x1 , x2 , · · · , xn )), is one specific interval (θ which may contain θ, or may not contain θ. b. In repeated sampling (with the same sample size n), when the number of sampling is sufficiently large, the proportion of the numbers that the real value of parameter lies in the interval ˆ1 (x1 , x2 , · · · , xn ), θ ˆ2 (x1 , x2 , · · · , xn )) is 100(1 − α)%. (θ