无偏估计量例题及答案
统计学试题答案(7、8)
统计学试题(7)姓名__________ 班级____________ 学号_____________一、名词解释1、次数密度2、皮尔逊偏度系数3、无偏性4、矩法估计5、估计量的标准误二、单项选择题1、对于甲、乙两个变量数列,若甲数列:χ= 30, σ=3;乙数列:χ= 40,σ=3,则_________。
(1)甲数列离散程度大(2)乙数列离散程度大(3)两数列离散程度相等(4)不能判断离散程度的大小2、某厂生产甲、乙、丙三种产品,2001年与2000年相比,价格未变,而总产值增长了10%,则产量总指数为___________。
(1)100% (2)10% (3)110% (4)30%3、人均国内生产总值是_____________。
(1)算术平均数(2)几何平均数(3)结构相对数(4)强度相对数4、埃马物量总指数公式为_____________(1) Σq1(p0 + p1) (2) Σp0q1Σq0(p+ p1) Σpq(3)Σp1(q+ q1) (4) Σpnq1Σp0(q+ q1) Σpnq5、在进行组距式分组时,凡遇到某个变量值刚好等于相邻两组重叠的上、下限数值时,一般将此值___________(1)归入下限所在组(2)归入上限所在组(3)归入二者均可(4)另行分组6、对于静态比率时间数列X1,X2,…,X n,若X1=a1/b1,X2=a2/b2,…,X n = a n /b n ,则其方差 S 2为____________。
(1)nx x ∑-2)((2)∑∑-b b x x 2)((3) ∑∑-a a x x 2)( (4)∑-b bx x7、对于年度资料时间数列,若其环比发展速度大致相同,宜采用___。
(1)直线趋势模型 (2)二次曲线趋势模型 (3)指数曲线趋势模型 (4)修正指数曲线趋势模型8、已知某工业公司各工业企业的产值利润率和利润额,要求计算该公司各工业企业的平均产值利润率,应采用_______。
数理统计考试试题及答案
一、(满分12分)设X X X n ,,,12为来自均匀分布θU (0,)的随机样本,θθ,ˆˆ12分别为未知参数θ的矩估计量和最大似然估计量。
(1)证明nT n =+θθ和ˆˆ112都是未知参数θ的无偏估计; (2)比较两个估计量的优劣性.二、(满分14分)设X 服从伽玛分布Γαβ(,),其特征函数为=−−βϕαt itX ()(1).(1) 利用特征函数法求X 的数学期望和方差; (2)设X X X n ,,,12是独立同分布的随机变量,其概率密度为,⎩≤⎨=>⎧λλx f x e x x 0,0.(),0-试用特征函数法证明:∑=Γ=λY X n i i n~(,)1 三、(满分14分)从两个独立的正态总体中抽取如下样本值: 甲(X ) 4.4 4.0 2.0 4.8 乙(Y )5.01.03.20.4经计算得x s y s ====3.8, 1.547, 2.4, 4.45312*2*2,在显著性水平=α0.05下,能否认为两个总体同分布? 四、(满分10分)设X X X ,,,129是总体μσX N ~(,)2的一个样本.记Y X Y X k k k k ∑∑===63,=,11171269SS X Y Z Y Y k k ∑=−=−=2(),12()7212229求统计量 Z 的分布。
五、(满分14分)设X X X n ,,,12是总体X 的一个样本,X 的密度函数为f x x x ⎩⎨=<<⎧−θθθ他其0,.(;),01,1>θ0求未知参数g =θθ()1的最大似然估计量gθ()ˆ,并求g θ()的有效估计量.六、 (满分20分)观测某种物质吸附量y 和温度x 时,得到数据如下:x i 1.5 1.8 2.4 3.0 3.5 3.9 4.4 4.8 5.0 y i4.85.77.08.310.912.413.113.615.3应用线性模型N y a bx ⎩⎨⎧=++εσε~(0,)2(1) 求a 和b 的最小二乘估计及回归方程;(2) 在显著性水平=α0.05下,检验原假设=H b :00;(3)在温度x =60时,求吸附量y 0的置信水平为α−=10.95的预测区间; (4) 若要使吸附量在5-10之间,温度应该如何控制(=α0.05).七、 (满分16分) 为了观察燃烧温度是否对砖块的密度有显著性影响,今在4种温度下做试验,得砖块密度的观察值如下: 温度(摄氏度) 砖块密度100 21.8 21.9 21.7 21.6 21.7 125 21.7 21.4 21.5 21.4 150 22.9 22. 8 22.8 22.6 22.5 17521.9 21.7 21.8 21.4试问燃烧温度对砖块密度是否有显著影响?(=α0.01) 附注:计算中可能用到的数据如下:t r F F t F F ===Φ=====5(7) 2.3646,(7)0.6664,(1,7) 5.59,(1.96)0.976(3,3)15.5,(6) 2.4469,(2,15) 3.68,(3,14) 5.50.9750.050.950.9750.9750.950.99一、(满分12分)解:(1)总体X 的密度函数为总体X 的分布函数为0,0(),01,x x F x x x θθθθ≤⎧⎪⎪=<<⎨⎪≥⎪⎩;由于2θ=EX ,得X 2ˆ1=θθ的矩估计量为 1ˆ[2]2θθ===E E X EX ,故的无偏估计量。
无偏估计量例题及答案
无偏估计量
定义:
无偏估计器意味着要估计的参数的估计器的期望值等于参数本身。
内容:
无偏估计量是样本均值的随机变量,其数学期望等于总体估计参数,即无偏估计量。
例如,尽管每个可能样本的样本平均值都是随机的,但它可能等于或不等于总体平均值,但平均而言,样本平均值的平均值(数学期望值)必须等于总体平均值。
此属性在数学统计中称为无偏估计,并且具有此属性的估计量称为无偏估计量,样本大小也称为无偏估计量,这是估计量的良好标准(无偏量)。
无偏估计量,数学期望等于估计量的统计估计量。
令'= g(x1,X2,...,xn)为未知参数A的点估计量。
如果a'满足e(a')= a,则a'被称为a的无偏估计量,否则是一个有偏估计。
如果无偏估计是系统误差为零的估计。
自由度不再是原始样本大小。
物质:
对于要估计的参数,不同的样本值将获得不同的估计值。
这样,为了确定估计量的质量,我们不仅可以测量某个采样的结果,还可以测量大量采样的结果。
在这方面,一种自然而基本的措施是要求估算者没有系统的偏见。
也就是说,虽然一次采样中获得的估计值不一定等于要估计的参数的真实值,但是在大量重复采样中,获得的估计值应与采样的真实值相同。
要估计的参数。
换句话说,期望估计器的平均值(数学期望)应等于未知参数的真实值,这是无偏性的要求。
估计有关的习题集及详解
§估计基本题型Ⅰ 矩估计法【例7.1】总体X 的概率密度函数为1,01(;)00,x x f x θθθθ-⎧<<=>⎨⎩()其他,求未知参数θ的 矩估计.【分析】先由题设所给含有未知参数θ的随机变量概率密度求出数学期望,解出未知参数θ与数学期望的关系,再由样本一阶原点矩替换总体期望,即得参数θ的矩估计. 【解】为求未知参数θ用总体原点矩表示的式子,先求出EX 110(;)1EX xf x dx x x dx θθθθθ+∞--∞==⋅=+⎰⎰因而 [1]EX EX θ=-在上式中用样本一阶原点矩替换总体一阶原点矩,即得未知参数θ的估计ˆ(1)X X θ=-. 【例7.2】设总体X 服从均匀分布[,]U a b ,12(,,)n X X X L 为来自此总体的样本,求,a b的矩估计.【分析】由于总体的分布中含有两个未知参数,a b ,故需要求出总体的两个矩,为简单起见,一般先求其一阶矩(即总体的期望)和二阶矩(也可以取总体的方差),然后按矩估计法相应的样本矩替换它们,得矩法方程,最后求解便可得到,a b 的矩估计. 【解】由于总体X 服从均匀分布[,]U a b ,故总体的期望和方差分别为12();212a b b a EX DX +-== 由矩估计法,用X 替换EX ,用2S 替换2σ,便得矩法方程组1222()12a bX b a S +⎧=⎪⎪⎨-⎪=⎪⎩,即22a b Xa b ⎧+=⎪⎨-+=⎪⎩ 于是解出,a b 的矩估计分别为ˆaX =,ˆb X =+. 【例7.3】设总体X 的概率密度函数为||1(;),(0,)2x f x e x θθθθ-=>-∞<<+∞,求θ的矩估计.【分析】由于总体的分布中只含有一个未知参数θ,但总体的一阶矩为常量,需要求总体的二阶矩,从而确定矩方程,最后求解θ的矩估计量. 【解】虽然总体X 只含有一个参数,但 ||102x EX x e dx θθ-+∞-∞=⋅=⎰不含θ,不能求解θ 故需求二阶原点矩||2212x EX x e dx θθ-+∞-∞=⋅⎰222021()()22x xx x x e dx e d θθθθθθθ--+∞+∞=⋅=⎰⎰22(3)2θθ=Γ=.令2211n i i X EX n ==∑,则有θ的矩估计量为ˆθ=基本题型Ⅱ 极大似然估计法【例7.4】设总体X 具有概率密度函数1,01(;)00,x x f x θθθθ-⎧<<=>⎨⎩()其他,θ的极大似然估计量是 .【分析】设12,,n x x x L 为总体X 的观测值,则其极大似然函数为11()()n n L x x θθθ-=L ,对数似然函数为1ln ()ln (1)ln ni i L n x θθθ==+-∑,解似然方程1ln ()ln 0ni i d L n x d θθθ==+=∑ 得参数θ的极大似然估计值为1ˆln nii nxθ==-∑,从而得参数θ的极大似然估计量为1ˆln nii nXθ==-∑.【例7.5】设总体X 的分布律为X 1a 2a 3a P2θ2(1)θθ-2(1)θ-又设12,,n X X X L 为来自此总体的样本,记j n 表示12,,n X X X L 中取值为,1,2,3j a j =,的个数,求θ的极大似然估计.【分析】求极大似然估计量时,关键是求似然函数,它是样本观测值的函数. 【解】设12,,n x x x L 是样本12,,n X X X L 的观测值,则参数θ的似然函数为 1()(;)nii L P x θθ==∏312123[()][()][()]n n n P x a P x a P x a ====323122122222[2(1)](1)2(1)n n n n n n n n θθθθθθ++=--=-对数似然函数为21223ln ()ln 2(2)ln (2)ln(1)L n n n n n θθθ=++++- 从而似然方程为231222ln ()01n n n n d L d θθθθ++=-=-. 得θ的极大似然估计量122ˆ2n n nθ+=. 【例7.6】设12,,n X X X L 为总体的一个样本,求下列总体概率密度中的未知参数的极大似然估计()1,(;)0,x u ex u f x θθθ--⎧≥⎪=⎨⎪⎩其他,其中0θ>,,u θ为常数.【解】设12,,n x x x L 是样本12,,n X X X L 的观测值,则参数θ的似然函数为1(())1,(,)0,ni i x u i n e x u L u θθθ=--⎧∑⎪≥=⎨⎪⎩其他. 取对数 1ln (,)ln ()nii L u n x u θθθ==---∑.对参数,u θ求偏导,令其为0,则21ln (,)()0ln (,)0n i i L u n x u L u n u θθθθθθ=∂⎧=-+-=⎪⎪∂⎨∂⎪==⎪∂⎩∑110n i i u x x n n θθ=⎧+==⎪⎪⇒⎨⎪=⎪⎩∑. 显然,上式第二式不能求出参数,u θ的关系,但由定义,当θ固定时,要使(,)L u θ最大,只需u 最大,因12,,n u x x x ≤L ,则参数u 的似然估计值为(1)ˆux =,从而得参数θ的极大似然值为(1)ˆx x θ=-,故,u θ的极大似然估计量为(1)ˆu X =,(1)ˆX X θ=-.基本题型Ⅲ 评价估计量的标准(无偏性与有效性)【例7.7】 样本12,,n X X X L 取自总体X ,2,EX u DX σ==,则可以作为2σ的无偏估计的是 【 】()A 当u 已知时,统计量21()ni i X u n =-∑. ()B 当u 已知时,统计量21()(1)ni i X u n =--∑.()C 当u 未知时,统计量21()ni i X u n =-∑. ()D 当u 未知时,统计量21()(1)ni i X u n =--∑.【分析】当u 已知时,21()nii Xu n =-∑为统计量,利用定义有22()i i DX E X u DX σ=-==.从而 222111[()]()nn nii i i i i E Xu E X u DX n σ===-=-==∑∑∑,故 222211[()][()]nnii i i E Xu n E X u n n n σσ==-=-==∑∑.而 222211[()(1)][()](1)1)nnii i i E Xu n E X u n n n σσ==--=--=-≠∑∑所以当u 已知时,()A 入选,()B 不能入选. 当u 未知时,样本函数21()ni i Xu n =-∑,21()(1)ni i X u n =--∑均不是统计量,因而不能作为2σ的估计量,更不能作为无偏估计量. 选()A .【例7.8】设12,,n X X X L 是总体X 的简单随机样本,则下列不是总体期望u 的无偏估计 【 】()A 11ni i X n =å. ()B 120.20.50.3n X X X ++.()C 12X X + . ()D 123X X X -+. 【分析】要验证统计量是否为无偏估计,即验证ˆE θθ=. 1111[]n n i i i i E X EX u n n====邋;1212[0.20.50.3]0.20.50.30.20.50.3n n E X X X EX EX EX u u u u ++=++=++=; 1212[]2E X X EX EX u u +=+=?;123123[]E X X X EX EX EX u u u u -+=-+=-+=;选()C .【例7.9】试证明均匀分布1,0(;)0,x f x θθθ⎧<≤⎪=⎨⎪⎩其他中未知参数θ的极大似然估计量不是无偏的.【分析】 涉及总体分布时,先求估计量的概率密度(或分布律). 【解】设12,,n x x x L 是样本12,,n X X X L 的观测值,则参数θ似然函数为1(),0,1,i nL x i n θθθ=<≤=L .是θ的一个单值递减函数.由于每一个i x θ≤,最大次序统计量的观测值()1max n i i nx x θ≤≤=≤ 在0,1,,i x i n θ<≤=L 中要使1()nL θθ=达到极大,就要使θ达到最小.但θ不能小于()n x ,否则样本观测值12,,n x x x L 就不是来自这一总母体,所以()ˆn x θ=是θ的极大似然估计值.故最大次序统计量()ˆn X θ=是参数θ的极大似然估计量. 为要证明估计量()ˆn X θ=不是θ的无偏估计量,需求出()[]n E X ,为此先求()n X 的概率密度.因统计量()ˆn X θ=为随机样本12,,n X X X L 的最大值,而12,,n X X X L 独立同分布,故()n X 的概率分布函数为()ˆ()()[()]n n X F x F x F x θ==,其中()F x 为总体X 的分布函数. 由X 的概率密度可知0,0(),01,xF x x x x θθθ≤⎧⎪=<≤⎨⎪>⎩.因此()111ˆˆ,0()()[()]{[()]}()()0,n n n n n X nx x f x f x F x F x nFx f x 其他θθθθ---⎧<≤''====⋅=⎨⎩从而 1ˆ()1n nnx n E xf x dx dx n θθθθθ-+∞-∞===≠+⎰⎰. 即极大似然估计量ˆθ不为参数θ的无偏估计.【例7.10】若未知参数θ的估计量是$θ,若θθ=)ˆ(E 称$θ是θ的无偏估计量.设$$12,θθ是未知参数θ的两个无偏估计量,若)ˆ()ˆ(21θθD D <则称$1θ较$2θ有效.【分析】由无偏估计量和有效性的定义可得.【评注】估计量的有效性是在无偏估计类的基础上定义的,这一点也特别明确. 【例7.11】设总体2(,2)X N u :,123,,X X X 为总体的一个样本,试证明11231ˆ(2)4uX X X =++和21231ˆ()3u X X X =++均为总体期望的无偏估计,并比较哪一个更有效.【证明】由于112311ˆ()(2)(4)44E uEX EX EX EX u =++== 21231ˆ()()3E uEX EX EX u =++= 故统计量12ˆˆ,uu 均为期望u 的无偏估计,又 2211231333ˆ()(4)216882D uDX DX DX σ=++==⨯=. 2221231314ˆ()()29933D uDX DX DX σ=++==⨯=. 由于12ˆˆ()()D uD u >,故2ˆu 是比1ˆu 更有效的估计量. 【例7.12】从总体X 中抽取样本12,,n X X X L ,设12,,n C C C L 为常数,且11nii C==∑,证明:(1)1ˆni ii uC X==∑为总体均值u 的无偏估计;(2)在所有这些无偏估计量1ˆni i i uC X ==∑中,样本均值11ni i X X n ==∑的方差最小. 【分析】注意到样本12,,n X X X L 相互独立,且与总体X 同分布,易得ˆu的无偏性及其方差ˆ()D u,利用拉格朗日乘数法则,不难证明,当ˆu X =时方差最小. 【证明】因为样本,(1,,)i X i n =L 与总体X 服从相同分布,故 ,1,2,,i EX EX u i n ===L又11nii C==∑,则11ˆ()()n ni i i i i i EuE C X C EX u =====∑∑ 从而1ˆni ii uC X==∑为总体均值u 的无偏估计.设总体方差2DX σ=,则2,1,2,i DX DX i n σ===L .又样本12,,n X X X L 相互独立,故222111ˆ()()n nniiii i i i i DuD C X CDX C σ======∑∑∑为确定u 的无偏估计量ˆu的方差ˆ()D u 在什么情况下最小,应当求ˆ()D u 满足条件11nii C==∑的条件极值.为此考虑函数 22111(,)()(1)nnn ii i i G C C CC σλ===+-∑∑L ,其中λ为常数.求偏导数(1,2,)iGi n C ∂=∂L ,并令它们等于零,得 220,1,2,i C i n σλ+==L (*)即 2,1,2,2i C i n λσ=-=L .代入11ni i C ==∑,得212n λσ-=,即22n σλ-= 代入方程(*)中,即得1,1,2,i C i n n==L 由此可知,当11ˆni i uX X n ===∑时,方差最小. 【例7.13】设分别来自总体21(,)N u σ和22(,)N u σ中抽取容量为12,n n 的两个独立样本,其样本方差分别为21S ,22S ,试证:对于任意常数,,(1)a b a b +=,2212Z aS bS =+都是2σ得无偏估计,并确定常数,a b ,使DZ 最小.【证明】由题意,222212()EZ aES bES a b σσ=+=+=. 故对任意常数,,(1)a b a b +=,2212Z aS bS =+都为2σ得无偏估计.由于222(1)(1)n S n χσ--:,则 22(1)()2(1)n S D n σ-=-,即224(1)2(1)n DS n σ-=-,故4221DS n σ=-,则 44222222121222(1)11DZ a DS b DS a a n n σσ=+=+--- 对a 求导,并令其为零,有 44122222(1)011dDZ a a da n n σσ=--=--解得 12121211,22n n a b n n n n --==+-+-.又 24421244011d DZ da n n σσ=+>--,故当12121211,22n n a b n n n n --==+-+-时,DZ 达到最小值. 11、设12,,n X X X L 为来自正态总体2(,)N u σ的简单随机样本,u 已知,22*11ˆS σ=,222ˆS σ=,22311ˆ()1n i i X X n σ==-+∑,22411ˆ()n i i X u n σ==-∑.问在21ˆσ,22ˆσ,23ˆσ,24ˆσ中(1)那个是2σ的无偏估计量;(2)那个比较有效;(3)那个方差最小;(4)那个是2σ的相合估计量.【分析】因为2222312222ˆˆˆ(1)(1)(1)n n n n σσσχσσσ+-==-:,又(0,1)i X uN σ-:,故22221()()(1)i i X uX u χσσ-=-:,由2χ分布性质知2242ˆ()n n σχσ:.从而可求诸估计量的数学期望与方差,并回答上述问题.【解】由分析知221ˆE σσ=,2222(1)ˆ()n E n nσσσ-=→→∞, 22231ˆ()1n E n n σσσ-=→→∞+,224ˆE σσ=. 且 4212ˆ0()1D n n σσ=→→∞-,24222(1)ˆ0()n D n n σσ-=→→∞,24322(1)ˆ0()(1)n D n n σσ-=→→∞+,4242ˆ0()D n nσσ=→→∞ 从而(1)21ˆσ与24ˆσ为2σ的无偏估计量; (2)24ˆσ比21ˆσ有效;(因为2241ˆˆD D σσ<);(3)22223241ˆˆˆˆD D D D σσσσ<<<, 即估计量23ˆσ方差最小. (4)21ˆσ,22ˆσ,23ˆσ与24ˆσ均为2σ的相合估计.基本题型Ⅳ 评价估计量的标准(一致性)【例7.14】 设总体的期望u 和方差2σ均存在,求证:(1)样本均值11ni i X X n ==∑是u 的一致估计.(2)如总体服从正态分布,则样本修正方差2211()1ni i S X X n ==--∑为2σ的一致估计. 【分析】要证明参数θ的估计量ˆθ的一致性,关键是要证明:对任意0ε>,有{}ˆlim 1n n P θθε→∞-<=.从事件对应概率{}ˆnP θθε-<的极限求解上,可以使用切比雪夫不等式,即{}2ˆ()ˆD P θθθεε-≥≤或{}2ˆ()ˆ||1D P θθθεε-<≥-. 【证明】(1)由切比雪夫不等式有,对0ε∀>2111()11(||)111()ni ni i i D X n P X u n n nσεεε==≥-<≥-=-→→∞⋅∑∑.由夹逼定理可得,{}lim 1n P X u ε→∞-<=,即11ni i X X n ==∑为参数u 的一致估计量.(2)因为2221111[()]()11n n i i i i ES E X X E X X n n ===-=---∑∑.22221111[][]11n ni i i i E X nX EX nEX n n ===-=---∑∑ 2222211[()()]1n i u n u n nσσσ==+-+=-∑,即2S 为2σ的无偏估计. 又样本来自正态总体,由抽样分布定律知222(1)(1)n S n χσ--:,有22(1)()2(1)n S D n σ-=-从而22424422222(1)(1)2()()()2(1)(1)(1)(1)1n S n S D S D D n n n n n σσσσσσ--===-=----. 由切比雪夫不等式有,0ε∀>2422()21(||)111()(1)D S P S n n σσεεε≥-<≥-=-→→∞-从而有22lim (||)1n P S σε→∞-<=,即2S 为2σ的一致估计量.【例7.15】设ˆnθ为θ的估计量(用容量为n 的样本),如果ˆlim n n E θθ→∞=,ˆlim 0n n D θ→∞=,则ˆnθ为θ的一致估计量. 【证明一】为证ˆnθ为θ的一致估计量,下证{}ˆlim 0n n P θθε→∞-≥=. 而 {}22ˆˆ22ˆˆˆ()()ˆ()()nnn nnnE P f x dx f x dx θθθθεθθθθθθεεε+∞-∞-≥---≥=≤=⎰⎰又 22222ˆˆˆˆˆ()(2)2n n n n n E E E E θθθθθθθθθθ-=-+=-+ 22ˆˆˆ()2n n nD E E θθθθθ=+-+ 故{}22ˆ()ˆlim lim[]0nnn n E P θθθθεε→∞→∞--≥≤=,即ˆnθ为θ的一致估计量. 【证明二】由切比雪夫不等式有{}2ˆˆ(||)n nP D θθεθθ-≥≤-. 而 222ˆˆˆˆ(||)()(||)()n n n nD E E E θθθθθθθθ-=---≤-. 由证明一知,2ˆlim (||)0nn E θθ→∞-=,或者用下列方法直接证明 22ˆˆˆˆ()()n n n nE E E E θθθθθθ-=-+-22ˆˆˆˆˆˆ()2[()()]()n n n n n n E E E E E E E θθθθθθθθ=-+--+- 222ˆˆˆˆˆ0()()2n n n n nD E D E E θθθθθθθθ=++-=+-+ 22222ˆˆˆˆ()220()n n n n D D E E n θθθθθθθθθ=++-+→-+=→∞ 故{}ˆlim 0n n P θθε→∞-≥=,即ˆnθ为θ的一致估计量. 【评注】用定义验证估计量是一致估计量,一般都不太容易,可利用上例中的结论证明之,从而将统计量的一致性的证明转化为统计量的期望与方差的极限性质的论述,这是一个比较实用的证法.【例7.16】设随机变量X 在[0,]θ上服从均匀分布,由此总体中抽取一随机样本1X ,试证明:1121ˆˆ2,X X θθ==都不为θ的一致估计.【分析】由上例(例7.16)可知,只需论证估计量的期望和方差的极限性质.【证明】因111ˆ(2)222E E X EX θθθ===⋅=,故1ˆθ为θ的无偏估计,且21ˆ2E EX θθθ==≠,故2ˆθ不为θ的无偏估计.为证1ˆθ不为θ的一致估计,只需证明1ˆlim 0n D θ→∞= 22111ˆlim lim (2)lim 4lim 4lim0123n n n n n D D X DX θθθ→∞→∞→∞→∞→∞===⋅=≠.故1ˆθ不为θ的一致估计. 【例7.17】设总体X 服从均匀分布[0,]U θ,试证明:θ的极大似然估计()1max n ii nX X ≤≤=为θ的一致估计.【证明】 设总体X 的密度函数为()f x ,则1,0()0,x f x θθ⎧≤≤⎪=⎨⎪⎩其他,故最大次序统计量()n X 的概率密度函数为1,0()0,n n n nx x f x θθ-⎧≤≤⎪=⎨⎪⎩其他,从而1()0()0()1n n nnx nE X xdx n n θθθ-==→→∞+⎰ 且 1222()()2n n nnx nE Xxdx n θθθ-==+⎰ 故222()()()()()()2n n n n D X E X EX EX θθθ=-=-+ 2222220()21(1)(2)n n n n n n n θθθθ=-+=→→∞++++ 由前例可知,θ的极大似然估计()1max n i i nX X ≤≤=为θ的一致估计.基本题型Ⅴ 求置信区间相关题型【例7.18】设θ是总体X 中的参数,称),(θθ为θ的置信度a -1的置信区间,即【 】()A ),(θθ以概率a -1包含θ . ()B θ 以概率a -1落入),(θθ.()C θ以概率a 落在),(θθ之外 . ()D 以),(θθ估计θ的范围,不正确的概率是a -1.【分析】由置信区间的定义可知, 区间(),θθ为随机区间. 选()A .【例7.19】设),(~2σμN X 且2σ未知,若样本容量为n ,且分位数均指定为“上侧分位数”时,则μ的95%的置信区间为 【 】()A )(025.0u n X σ±.()B ))1((05.0-±n t n S X .()C ))((025.0n t nS X ±. ()D ))1((025.0-±n t nSX .【分析】由题意,总体),(~2σμN X ,且2σ未知,故应构造统计量(1)X T t n =-:,则参数μ的置信水平为195%α-=的置信区间为))1((025.0-±n t nS X .选()D .【例7.20】假设00.2,80.0,25.1,50.0是总体X 的简单随机样本值,已知X Y ln =服从正态分布)1,(μN .(1)求X 的数学期望EX (记EX 为b ); (2)求μ的置信度为95.0的置信区间;(3)利用上述结果求b 的置信度为95.0的置信区间. 【解】(1)Y 的概率密度为: +∞<<-∞=--y y f e y ,21)(22)(μπ,于是,(令μ-=y t )dy Ee EX b ee y y Y⎰+∞∞---===2)(221μπ22111222(1)2t t t dt dt e e eem m m +??+-+--+??===蝌(2)当置信度95.01=-α时,05.0=α.标准正态分布的水平为05.0=α的分位数为96.105.0=μ.故由)41,(~μN Y ,可得95.096.12196.12196.121=⎭⎬⎫⎩⎨⎧⨯+<<⨯-=⎭⎬⎫⎩⎨⎧<-Y Y P Y P μμ其中01ln 41)2ln 125.0ln 8.0ln 5.0(ln 41==+++=Y . 于是 {}95.098.098.0=<<-μP 从而)98.0,98.0(-就是μ的置信度为95.0的置信区间. (3)由函数xe 的严格递增性,有 {}e e e P P 48.148.02148.12148.095.0<<=⎭⎬⎫⎩⎨⎧<+<-=+-μμ 因此b 的置信度为95.0的置信区间为),(48.148.0e e -.【例7.21】某工厂生产滚珠,从某日生产的产品中随机抽取9个,测得直径(单位:毫米)如下14.6,14.7,15.1,14.9,14.8,15.0,15.1,15.2,14.8 设滚珠直径服从正态分布,若(1) 已知滚珠直径的标准差为0.15σ=毫米; (2) 未知标准差σ;求直径均值u 的置信度0.95的置信区间.【分析】对于正态分布总体,若已知标准差σ时,均值u 的置信度1α-的置信区间为/2/2X u X u αα⎛-+ ⎝;未知标准差σ时,均值μ的置信度1α-的置信区间为/2/2((X t n X t n αα⎛--+- ⎝,其中S 时样本的标准差.【解】(1)0.025 1.96u =,9n =.经计算14.91x =.故已知滚珠直径的标准差0.15σ=毫米时,直径u 的置信度0.95的置信区间为:()14.91 1.96 1.9614.81,15.01⎛-+= ⎝.(2)经计算:样本标准差0.2028S =,查表可知0.025(8) 2.306t =,于是直径u 的置信度0.95的置信区间为:()14.91 2.306 2.30614.75,15.07⎛-+= ⎝.【例7.22】设某糖厂用自动包装机装箱外运糖果,由以往经验知标准差为1.15kg ,某日开工后在生产线上抽测9箱,测得数据如下(单位:kg )99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5 (1)试估计生产线上包装机装箱糖果的期望重量的区间估计(0.05α=);(2)试求总体标准差σ的置信度为0.95的置信区间,并判断以前经验数据标准差为1.15kg 是否仍然合理可用?【解】(1)由题设可知,总体方差1.15σ=为已知,根据经验数据有911899.899.9899i i x x ====∑,当0.05α=时,查表可得0.02521.96U U α==,故参数u 的置信度为0.95的置信区间为0.0250.025((99.23,100.73)x U x U -+=.(2)由题设可知总体均值未知,故根据经验数据有2211() 1.4694n i i S x x n ==-=∑,当0.05α=时,查表可得220.9750.025(8) 2.180,(8)17.35χχ==,从而参数2σ的置信度为0.95的置信区间为22220.0250.975(1)(1),(0.6704,5.3923)(8)(8)n S n S χχ⎛⎫--= ⎪⎝⎭,故参数σ的置信度为0.95的置信区间为(0.8188,2.3221).而以往经验数据标准差为 1.15S =,仍然在(0.8188,2.3221)内,故认为仍然合理可用.【例7.23】设总体X 服从正态分布2(,)N u σ,已知220σσ=,要使总体均值u 对应于置信水平1α-的置信区间的长度不大于l ,问应抽取多大容量的样本?【解】由于2(,)X N u σ:,且220σσ=为已知,因此当置信水平1α-时,均值u 的置信区间为22(,)X X αα+,其区间长度为2α,于是有2l α≤,即可得220224n U l ασ≥. 【例7.24】设总体X 服从正态分布2(,)N u σ,20,u σ均为未知参数,12,,n X X X L 为来自总体X 的一个随机样本,求关于u 的置信水平为1α-的置信区间的长度l 的平方的数学期望.【解】因20σ未知,选用统计量(1)X T t n =-:.得参数u 的置信水平为1α-的置信区间为/2/2((X t n X t n αα⎛--+- ⎝,其区间长度为/22(l t n α=-,于是2222222/2/2/244[4(1)](1)()(1)S El E t n t n E S t n n n n nααασ=-=-=-.【例7.25】在甲乙两城市进行家庭消费调查,在甲市抽取500户,平均每户每年消费支出3000元,标准差为1400S =元;在乙市抽取100户,平均每户每年支出4200元,标准差为2500S =元,设两城市家庭消费支出均服从正态分布211(,)N u σ和222(,)N u σ,试求:(1)甲乙两城市家庭平均每户年消费支出间差异的置信区间(置信度为0.95); (2)甲乙两城市家庭平均每户消费支出方差比的置信区间(置信度为0.90).【解】(1)在本题中虽211,u σ和222,u σ均未知,但由于抽取样本500,1000n m ==都很大(在使用中只要大于50即可),故可用U 统计量,即参数12u u -的置信度为1α-的置信区间为X Y uX Y u ⎛---+ ⎝,故由3000X =,4200Y =,1400S =,2500S =以及10.95α-=即0.05α=,查表可得0.025 1.96u =,因此30004000 1.96120046.79X Y u ⎛-±=-±-± ⎝ 即甲乙两城市家庭平均每户年消费支出间差异的置信度为0.95的置信区间为(1246.79,1153.21)--,由于此置信区间的上限小于零,在实际问题中可认为乙市家庭平均每户年消费支出要比甲市大.(2)由500,1000n m ==,1400S =,2500S =,10.90α-=即0.1α=,查表可得:0.052(1,1)(499,999) 1.13F n m F α--==,0.9510.05211(1,1)(499,999)(999,499) 1.11F n m F F α---=== ,且2212224000.64500S S == 于是所求的置信区间为22112220.0520.95110.64,(,0.64 1.11)(0.566,0.710)(499,999)(499,999) 1.13S S S F S F ⎛⎫=⨯= ⎪⎝⎭由于置信区间上限小于1,故可认为乙市家庭平均每户年消费支出的方差要比甲市大. 【例7.26】某商店销售的一种商品来自甲乙两个厂家,为考察商品性能上的差异,现从甲乙两个厂家生产产品中分别抽取了8见和9件产品,测其性能指标X 得到两组样本观测值,经计算得 2.190X =, 2.238Y =,210.006S =,220.008S =假设性能指标X 均服从正态分布2(,)(1,2)i iN u i σ=,试求方差比2122σσ及均值差12u u -的90%的置信区间.【解】(1)先求方差比2122σσ置信度为90%的置信区间.由10.90α-=即0.1α=,查F 分布表可得0.052(1,1)(7,8) 3.5F n m F α--==,0.9510.05211(1,1)(7,8)(8,7) 3.73Fn m F F α---===故所求置信区间为22112220.0520.95110.00610.006,(, 3.73)(0.214,2.798)(7,8)(7,8)0.0083.500.008S S S F S F ⎛⎫=⨯= ⎪⎝⎭. 由于此区间包含1,故可认为2212σσ=.(3)由(1)可知,2212,σσ未知,但22212σσσ==,因此12u u -的置信区间为()/220.048 1.75310.0840.4860.0480.0716X Y t n m S α-±+--±⨯⨯=± 即(0.1196,0.0236)-,其中0.05(15) 1.7531t =,()()22122110.00712wn S m S S n m -+-==+-,即两个厂家生产的产品性能上无显著性差异.§历年考研真题评析1、【02.3.3】 设总体X 的概率密度为(),,(;)0,.x e x f x x q q q q --ìï³ï=íï<ïî,而12,,,n X X X L 是来自总体X 的简单随机样本,则未知参数q 的矩估计量为_________.【分析】由于()()1x E X xe dx q qq +?--==+ò,因此,()1E X q =-,q 的矩估计量为11ˆ11ni i X X n q ==-=-å.2、【04.3.4】设总体X 服从正态分布21(,)N m s ,总体Y 服从正态分布22(,)N m s ,112,,,n X X X L 和 212,,,n Y Y Y L 分别是来自总体X 和 Y 的简单随机样本,则12221112()()2n n i i i j X X Y Y E n n ==轾犏-+-犏犏=犏+-犏犏臌邋__________. 【分析】由于11222211111(),()(1)1n n i i i i E X X EX X n n s s ==骣骣鼢珑鼢-=-=-珑鼢珑鼢-桫桫邋;22221()(1)n i j E Y Y n s =骣÷ç÷-=-ç÷ç÷ç桫å. 因此, 原式1212n n =+-1222211()()n n ii i j E X X Y Y s ==骣÷ç÷-+-=ç÷ç÷ç桫邋. 3、【97.1.5】设总体X 的概率密度为(1),01()0,x x f x θθ⎧+<<=⎨⎩其他其中1θ>-是未知参数,12,,n x x x L 是来自总体X 的一个容量为n 的简单随机样本,分别用矩估计法和极大似然估计法求θ的估计值. 【解】总体X 的数学期望为1101()(1)2EX xf x dx x dx θθθθ+∞+-∞+==+=+⎰⎰令12X θθ+=+,得参数θ的矩估计量为21ˆ1X X θ-=-. 设12,,n x x x L 是相应于样本12,,n X X X L 的一组观测值,则似然函数为1(1),01(1,2,)0,n ni i i x x i n L θθ=⎧⎛⎫+<<=⎪ ⎪=⎨⎝⎭⎪⎩∏L 其他 当01(1,2,)i x i n <<=L 时,0L >且1ln ln(1)ln nii L n xθθ==++∑令1ln ln 01ni i d L n x d θθ==+=+∑,得θ的极大似然估计值为 1ˆ1ln nii nxθ==--∑.从而θ的极大似然估计量为1ˆ1ln nii nXθ==--∑.4、【99.1.6】设总体X 的概率密度函数为36(),0()0,xx x f x θθθ⎧-<<⎪=⎨⎪⎩其他,12,,nX X X L 是取自总体X 的简单随机样本.(1)求θ的矩估计量ˆθ; (2)求ˆθ的方差ˆ()D θ. 【解】(1)236()()2x EX xf x dx x dx θθθθ+∞-∞==-=⎰⎰记11n i i X X n ==∑,令2X θ=,得θ的矩估计量ˆ2X θ=. (2)由于32223066()()20x EX x f x dx x dx θθθθ+∞-∞==-=⎰⎰222226()()20220DX EX EX θθθ=-=-=因此ˆ2X θ=的方差为 24ˆ(2)4()5D D X D X DX n nθθ====. 5、【00.1.6】设某种元件的使用寿命X 的概率密度函数为2()2,(,)0,x e x f x x θθθθ--⎧>=⎨≤⎩,其中0θ>为未知参数,又设12,,n x x x L 是X 的一组样本观测值,求参数θ的最大似然估计值.【解】似然函数为12()122,(1,2,)()(,,;)0,ni i x ni n e x i n L L x x x θθθθ=--⎧∑⎪≥===⎨⎪⎩L L 其他 当(1,2,)i x i n θ≥=L 时,()0L θ>,取对数,得 1ln ()ln 22()nii L n x θθ==--∑因为ln ()20d L n d θθ=>,所以()L θ单调增加.由于θ必须满足(1,2,)i x i n θ≥=L ,因此当θ取12,,n x x x L 中的最小值时,()L θ取最大值,所以θ的最大似然估计值为12ˆmin(,,)n x x x θ=L ,最大似然估计量为12ˆmin(,,)nX X X θ=L . 6、【04.1.9】 设总体X 的分布函数为11,1(,)0,1x F x xx ββ⎧->⎪=⎨⎪≤⎩,其中未知参数1β>,12,,n X X X L 为来自总体X 的简单随机样本,求(1)β的矩估计量; (2)β的极大似然估计量.【解】X 的概率密度函数为1,1(,)0,1x f x x x βββ+⎧>⎪=⎨⎪≤⎩(1)由于11(;)1EX xf x dx xdx xβββββ+∞+∞+-∞===-⎰⎰令1X ββ=-,解得ˆ1X X β=-,故参数β的矩估计量为ˆ1X X β=-. (2)似然函数为1121,1(1,2,)()(,)()0,1nni i n i x i n L f x x x x x ββββ+=⎧>=⎪==⎨⎪≤⎩∏L L当1(1,2,)i x i n >=L 时,()0L β>,取对数得1ln ()ln (1)ln nii L n x βββ==-+∑,两边对β求导,得1ln ()ln ni i d L n x d βββ==-∑, 令ln ()0d L d ββ=,可得1ˆln nii nxβ==∑,故β的极大似然估计量为1ˆln nii nXβ==∑.7、【06.1.9】设总体X 的概率密度为,01(,)1,120,x f x x θθθ<<⎧⎪=-≤≤⎨⎪⎩其他,其中(01)θθ<<是未知参数,12,,n X X X L 为来自总体的简单随机样本,记N 为样本值12,,n x x x L 中小于1的个数,求θ的最大似然估计.【解】 由题意,设样本12,,n x x x L 按照从小到大为序(即顺序统计量的观测值)有如下关系:(1)(2)()(1)()1N N n x x x x x +≤≤≤≤≤≤≤L L L似然函数为(1)(2)()(1)()(1),1()0,N n N N N n x x x x x L θθθ-+⎧-≤≤≤≤≤≤≤=⎨⎩L L L 其他对似然函数非零部分取对数得到 ln ()ln ()ln(1)L N n N θθθ=+--ln ()01d L N n N d θθθθ-=-=-,从而ˆN n θ=,即θ的最大似然估计值为N n. 【评注】本题着重考察了最大似然估计的概念和求似然估计的基本方法,本题的难点是“N 为样本值12,,n x x x L 中小于1的个数”的理解.8、【09.1.11】设总体X 的概率密度为2,0()0,x xe x f x λλ-⎧>=⎨⎩其他,其中参数λλ>(0)未知,12,,n X X X L 是来自总体X 的简单随机样本 (1)求参数λ的矩估计量; (2)求参数λ的最大似然估计量. 【解】(1)由题意,2202x EX x e dx X λλλ+∞-===⎰,从而2ˆXλ=为总体的矩估计量. (2)构造似然函数121211(,,;)(;)nii nnx nn iii i L x x x f x x eλλλλ=-==∑==⋅∏∏L .取对数11ln 2ln ln nniii i L n x x λλ===+-∑∑.令ln 0d L d λ=,有120n i i n x λ=-=∑,故λ的最大似然估计值为1122ˆ1nn i i i i n x x n λ====∑∑ 故其最大似然估计量为122ˆ1ni i XX n λ===∑. 9、【04.3.13】设随机变量X 的分布函数为1(),(,,)0,x F x xx βαααβα⎧->⎪=⎨⎪≤⎩,其中参数0,1αβ>>,设12,,n X X X L 为来自总体X 的简单随机样本.(1)当1α=时,求未知参数β的矩估计量; (2)当1α=时,求未知参数β的最大似然估计量; (3)当2β=时,求未知参数α的最大似然估计量.【解】当1α=时,X 的概率密度为1,1(,)0,1x f x x x βββ+⎧>⎪=⎨⎪≤⎩(1)由于11(,)1EX xf x dx x dx xβββββ+∞+∞+-∞==⋅=-⎰⎰令1X ββ=-,解得1XX β=- 从而得未知参数β的矩估计量为ˆ1XX β=-. (2)对于总体X 的样本值12,,n x x x L ,似然函数为1121,1(1,2,)()(;)()0,nni i n i x i n L f x x x x ββββ+=⎧>=⎪==⎨⎪⎩∏L L 其他当1(1,2,)i x i n >=L 时,()0L β>,取对数得1ln ()ln (1)ln ni i L n x βββ==-+∑对β求导数,得似然方程1[ln ()]ln 0ni i d L n x d βββ==-=∑ 解得 1ln nii nxβ==∑,于是β的最大似然估计量为1ˆln nii nXβ==∑.(3)当2β=时,X 的概率密度为232,(,)0,x f x x x ααβα⎧>⎪=⎨⎪≤⎩对于总体X 的样本值12,,n x x x L ,似然函数为231212,(1,2,)()(;)()0,n nni i n i x i n L f x x x x ααββ=⎧>=⎪==⎨⎪⎩∏L L 其他当(1,2,)i x i n α>=L 时,α越大,()L α越大,即α的最大似然估计值为12ˆmin{,,}n x x x α=L . 于是α的最大似然估计量为12ˆmin{,,}n X X X α=L . 10、【03.1.8】设总体X 的概率密度函数为2()2,(,)0,x e x f x x θθθθ--⎧>=⎨≤⎩,其中0θ>为未知参数.从总体X 中抽取简单随机样本12,,n X X X L ,记12ˆmin(,,)nX X X θ=L .(1)求总体X 的分布函数()F x ;(2)求统计量ˆθ的分布函数ˆ()F x θ; (3)如果用ˆθ作为θ的估计量,讨论它是否具有无偏性. 【解】(1)2()1,()()0,x xe x F xf t dt x θθθ---∞⎧->==⎨≤⎩⎰(2)ˆ12ˆ(){}{min(,,)}nF x P x P X X X x θθ=≤=≤L 12121{min(,,)}1{,,}n n P X X X x P X x X x X x =->=->>>L L2()1,1[1()]0,n x ne x F x x θθθ--⎧->=--=⎨≤⎩(3)ˆθ概率密度为 2()ˆˆ()2,()0,n x dF x ne x f x dxx θθθθθ--⎧>==⎨≤⎩ 因为 2()ˆ01ˆ()22n x E xf x dx nxe dx nθθθθθ+∞+∞---∞===+≠⎰⎰所以ˆθ作为θ的估计量不具有无偏性. 11、【07.1.11】设总体X 的概率密度为1,021(,),12(1)0,x f x x θθθθθ⎧<<⎪⎪⎪=≤≤⎨-⎪⎪⎪⎩其他,其中(01)θθ<<是未知参数,12,,n X X X L 为来自总体的简单随机样本,X 是样本均值.(1)求参数θ的矩估计量ˆθ; (2)判断24X 是否为2θ的无偏估计量,并说明理由. 【解】(1)10(,)22(1)x xEX xf x dx dx dx θθθθθ+∞-∞==+-⎰⎰⎰11(1)4424θθθ=++=+. 令124X θ+=,其中11n i i X X n ==∑,解方程得θ的矩估计量为:1ˆ22X θ=-.(2) 2222(4)4()4[()]4[()]DXE X E X DX E X E X n==+=+ 而22122(,)22(1)x x EX x f x dx dx dx θθθθθ+∞-∞==+-⎰⎰⎰22221111()()()36624DX E X E X θθθ=-=++-+211366θθ=++2115121248θθ=-+. 故2222313135(4)4[()]312DX n n n E X E X n n n nθθθ+-+=+=++≠所以24X 不是2θ的无偏估计量.12、【08.1(3).11】设12,,n X X X L 是总体2(,)N u σ的简单随机样本,记11n i i X X n ==∑,2211()1n ii S X X n ==--∑,221T X S n=- (1) 证T 是2u 的无偏估计量;(2) 当0,1u σ==时,求DT .【分析】(1)要证2ET u =;(2)求DT 时,利用2X 与2S 独立性.【解】(1)222211()()()ET E X S E X E S n n=-=- 222222111()()()D X E X E S u u n n nσσ=+-=+-=所以T 是2u 的无偏估计量.(2)当0,1u σ==时,(0,1)X N :,1(0,),0X N ET n=:2222211()()()DT D X S D X D S n n=-=+22222111[(1)](1)D D n S n n n =+-- 22221122(1)(1)(1)n n n n n n =+⋅-=--. 【评注】若2(,)X N u σ:,则22222222111,,,()2(1),((1))n n EX u DX ES D S n S n n σσχσσ--====--:.13、【03.1.4】已知一批零件的长度X (单位cm )服从正态分布(,1)N m ,从中随机地抽取16个零件,得到长度的平均值为40(cm ),则m 的置信度为0.95的置信区间是_____.(注:标准正态分布函数值(1.96)0.975,(1.645)0.95F =F =).【分析】这是一个正态分布方差已知求期望值m 的置信区间问题,该类型置信区间公式为(,)I x x =-+ 其中l 由{||}0.95P U l <=确定((0,1)U N :),即 1.96l =,将40,1,16x n s ===及1.96l =代入得到m 的置信度为0.95的置信区间为(39.51,40.49).14、【05.3.13】设12,,(2)n X X X n >L 为来自总体2(0,)N σ的简单随机样本,X 为样本均值,记,1,2,i i Y X X i n =-=L ,求 (1)i Y 的方差,1,2,i DY i n =L ; (2)1Y 与n Y 的协方差1(,)n Cov Y Y ;(3)若21()n c Y Y +是2σ的无偏估计量,求常数c .【解】由题设12,,(2)n X X X n >L 是简单随机样本,因此12,,(2)n X X X n >L 相互独立,且与总体同分布,即22(0,),0,(1,2,)i i i X N EX DX i n σσ===:L .(1)111(1)n i i j i j j iY X X X X n n=≠=-=-+-∑.111()[(1)]n i i j i j j iDY D X X D X X n n=≠=-=-+-∑22222211111(1)1()(1)n n j i j j j ij in n DX DX DX DX n n n n nσ==≠≠--=-+-=+=∑∑.(2)12,,(2)n X X X n >L 相互独立,所以 ,(,),1,2,,0,i i j DX i jCov X X i j n i jL =⎧==⎨≠⎩11(,)(,)n n Cov Y Y Cov X X X X =--11(,)(,)(,)(,)n n Cov X X Cov X X Cov X X Cov X X =--+;2111111111(,)(,)(,)n n i i i i Cov X X Cov X X Cov X X DX n n n nσ======∑∑;类似地, 21(,)n n Cov X X DX n nσ==又因为2DX nσ=,故22221(,)0n Cov Y Y nnnnσσσσ=--+=-.(3)首先计算21()n E Y Y +.由于11()0n n E Y Y EY EY +=+=所以 21111()()2cov(,)n n n n E Y Y D Y Y DY Y Y DY +=+=++22221122(2)n n n n n n nσσσσ---=+-= 若21()n c Y Y +是2σ的无偏估计量,c 应满足下面等式2222112(2)[()][()]n n c n E c Y Y cE Y Y nσσ-=+=+=故 2(2)nc n =-.§习题全解( A )1、设总体X 服从参数为N 和p 的二项分布,n X X X ,,,21Λ为取自X 的一个样本,试求参数p 的矩估计量与极大似然估计量.【解】由题意,X 的分布律为: ()(1),0k N kN P X k p p k N k -⎛⎫==-≤≤⎪⎝⎭.总体X 的数学期望为(1)(1)011(1)(1)1NNk N k k N k k k N N EX k p p Np p p k k ----==-⎛⎫⎛⎫=-=- ⎪ ⎪-⎝⎭⎝⎭∑∑ 1((1))N Np p p Np -=+-=则EX p N=.用X 替换EX 即得未知参数p 的矩估计量为ˆXpN =. 设12,,n x x x L 是相应于样本12,,n X X X L 的样本值,则似然函数为111211(,,;)()(1)nniii i nnx nN x n i i i i N L x x x p P X x p p x ==-==∑∑⎛⎫===⋅- ⎪⎝⎭∏∏L取对数111ln ln ln ()ln(1)nnni i i i i i N L x p nN x p x ===⎛⎫=+⋅+-⋅- ⎪⎝⎭∑∑∑,11ln (1)nni i i i x nN x d L dp p p ==-=--∑∑.令ln 0d L dp =,解得p 的极大似然估计值为 11ˆn i i x n p N==∑. 从而得p 的极大似然估计量为 11ˆni i X X npN N===∑. 2、设n X X X ,,,21Λ为取自总体X 的一个样本,X 的概率密度为22,0(;)0,xx f x θθθ⎧<<⎪=⎨⎪⎩其它.其中参数0θ>,求θ的矩估计. 【解】取n X X X ,,,21Λ为母体X 的一个样本容量为n 的样本,则2022()3xEX xf x dx x dx θθθ+∞-∞==⋅=⎰⎰32EX θ⇒= 用X 替换EX 即得未知参数θ的矩估计量为3ˆ2X θ=. 3、设12,,,n X X X L 总体X 的一个样本, X 的概率密度为⎪⎩⎪⎨⎧≤>=--0,0,0,);(1x x e x x f x αλαλαλ其中0>λ是未知参数,0>α是已知常数,求λ的最大似然估计.【解】设12,,,n x x x L 为样本12,,,n X X X L 的一组观测值,则似然函数为1()1121(),0(,,,;)0,ni i n x n n i i n i x e x L x x x αλαλαλ=--=⎧∑⎪⋅≥=⎨⎪⎩∏L 其他 取对数 11ln ln ln (1)(ln )()n niii i L n n x x αλααλ===++--∑∑.解极大似然方程1ln 0n i i d L n x d αλλ==-=∑,得λ的极大似然估计值为1ˆni i nx αλ==∑.4、设总体X 服从几何分布 ,10,,2,1,)1()(1<<=-==-p k p p k X P k Λ试利用样本值n x x x ,,,21Λ,求参数p 的矩估计和最大似然估计.【解】因11111(1)(1)k k k k EX k p p p k p p∞∞--===⋅-=⋅-=∑∑, 用X 替换EX 即得未知参数p 的矩估计量为1ˆpX=.在一次取样下,样本值12(,,,)n x x x L ,即事件1122{},{},,{}n n X x X x X x ===L 同时发生,由于12,,,n X X X L 相互独立,得联合分布律为121122(,,,;)()(),,()n n n L x x x p P X x P X x P X x ====L L12111(1)(1)(1)n x x x p p p p p p ---=-⋅--L ,即得极大似然函数为1()(1)ni i x nnL p p p =-∑=-取对数 1ln ()ln ()ln(1)nii L p n p x n p ==+--∑解极大似然方程1ln ()01ni i x nd L p n dp p p=-=-=-∑ 得p 的极大似然估计值为11ˆ1ni i px n ==∑,从而得p 的极大似然估计量为111ˆ1ni i pXX n ===∑. 5、设总体X 的概率密度为()1;exp ,2x f x σσσ⎧⎫=-⎨⎬⎩⎭0σ>为未知参数, n X X X ,,,21Λ为总体X 的一样本,求参数σ的最大似然估计.【解】设12,,,n x x x L 为样本12,,,n X X X L 的一组观测值,则似然函数为 121111(,,,;)(;)(;)exp{||}(2)nn n ini L x x x f x f x x σσσσσ====-∑L L 取对数1211ln (,,,;)ln(2)||nn ii L x x x n x σσσ==--∑L . 解极大似然方程21ln 1||0nii d L n x d σσσ==-+=∑.得σ的极大似然估计值11ˆ||ni i x n σ==∑. 6、证明第5题中σ的最大似然估计量为σ的无偏估计量.【证明】由第5题知σ的最大似然估计量为11ˆ||ni i X n σ==∑ 故 1111ˆ(||)||n ni i i i E E X E X n n σ====∑∑ 又 1||||||exp{}2i x E X x dx σσ+∞-∞=⋅-⎰ 0012exp{}exp{}()2x x x x dx x d σσσσ+∞+∞=⋅-=⋅-⎰⎰00[exp{}|exp{}]x xx dx σσσ+∞+∞=-⋅---=⎰.从而 ˆE σσ=,即ˆσ是σ的无偏估计.。
概率论与数理统计习题及答案第七章
习题7-11. 选择题(1) 设总体X 的均值μ与方差σ2都存在但未知, 而12,,,n X X X L 为来自X 的样本, 则均值μ与方差σ2的矩估计量分别是( ) .(A) X 和S 2. (B) X 和211()nii X nμ=-∑. (C) μ和σ2. (D) X 和211()nii X X n=-∑.解 选(D).(2) 设[0,]X U θ:, 其中θ>0为未知参数, 又12,,,n X X X L 为来自总体X 的样本, 则θ的矩估计量是( ) .(A) X . (B) 2X . (C) 1max{}i i nX ≤≤. (D) 1min{}i i nX ≤≤.解 选(B).2. 设总体X 的分布律为其中0<θ<12n , 试求θ的矩估计量.解 因为E (X )=(-2)×3θ+1×(1-4θ)+5×θ=1-5θ, 令15X θ-=得到θ的矩估计量为ˆ15X θ-=. 3. 设总体X 的概率密度为(1),01,(;)0, x x f x θθθ+<<=⎧⎨⎩其它.其中θ>-1是未知参数, X 1,X 2,…,X n 是来自X 的容量为n 的简单随机样本, 求: (1) θ的矩估计量;(2) θ的极大似然估计量. 解 总体 X 的数学期望为1101()()d (1)d 2E X xf x x x x θθθθ+∞+-∞+==+=+⎰⎰. 令()E X X =, 即12X θθ+=+, 得参数θ的矩估计量为21ˆ1X X θ-=-. 设x 1, x 2,…, x n 是相应于样本X 1, X 2,… , X n 的一组观测值, 则似然函数为1(1),01,0,n n i i i x x L θθ=⎧⎛⎫+<<⎪ ⎪=⎨⎝⎭⎪⎩∏其它. 当0<x i <1(i =1,2,3,…,n )时, L >0且 ∑=++=ni ixn L 1ln )1ln(ln θθ,令1d ln ln d 1ni i L nx θθ==++∑=0, 得θ的极大似然估计值为 1ˆ1ln nii nxθ==--∑,而θ的极大似然估计量为 1ˆ1ln nii nXθ==--∑.4. 设总体X 服从参数为λ的指数分布, 即X 的概率密度为e ,0,(,)0,0,x x f x x λλλ->=⎧⎨⎩≤ 其中0λ>为未知参数, X 1, X 2, …, X n 为来自总体X 的样本, 试求未知参数λ的矩估计量与极大似然估计量.解 因为E (X )=1λ =X , 所以λ的矩估计量为1ˆXλ=. 设x 1, x 2,…, x n 是相应于样本X 1, X 2,… ,X n 的一组观测值, 则似然函数11nii inxx nni L eeλλλλ=--=∑==∏,取对数 1ln ln ()ni i L n x λλ==-∑.令1d ln 0,d ni i L n x λλ==-=∑ 得λ的极大似然估计值为1ˆxλ=,λ的极大似然估计量为1ˆXλ=. 5. 设总体X 的概率密度为,01(,)1,120,x f x x θθθ<<=-⎧⎪⎨⎪⎩,≤≤,其它,其中θ(0<θ<1)是未知参数. X 1, X 2, …, X n 为来自总体的简单随机样本, 记N 为样本值12,,,n x x x L 中小于1的个数. 求: (1) θ的矩估计量; (2) θ的极大似然估计量.解 (1) 1213()d (1)d 2X E X x x x x θθθ==+-=-⎰⎰, 所以32X θ=-矩.(2) 设样本12,,n x x x L 按照从小到大为序(即顺序统计量的观测值)有如下关系:x (1) ≤ x (2) ≤…≤ x (N ) <1≤ x (N +1)≤ x (N +2)≤…≤x (n ) .似然函数为(1)(2)()(1)(2)(1),1()0,,N n N N N N n x x x x x x L θθθ-++-<=⎧⎨⎩L L ≤≤≤≤≤≤≤其它.考虑似然函数非零部分, 得到ln L (θ ) = N ln θ + (n − N ) ln(1−θ ),令d ln ()0d 1L N n N θθθθ-=-=-, 解得θ的极大似然估计值为ˆN nθ=. 习题7-21. 选择题: 设总体X 的均值μ与方差2σ都存在但未知, 而12,,,n X X X L 为X 的样本, 则无论总体X 服从什么分布, ( )是μ和2σ的无偏估计量.(A) 11nii X n=∑和211()nii X X n=-∑. (B)111nii X n =-∑和211()1nii X X n =--∑.(C)111nii X n =-∑和211()1nii X n μ=--∑. (D)11nii X n=∑和211()nii X nμ=-∑.解 选(D).2. 若1X ,2X ,3X 为来自总体2(,)X N μσ:的样本, 且Y 1231134X X kX =++为μ的无偏估计量, 问k 等于多少?解 要求1231111()3434E X X kX k μμμμ++=++=, 解之, k =512.3. 设总体X 的均值为0, 方差2σ存在但未知, 又12,X X 为来自总体X的样本, 试证:2121()2X X -为2σ的无偏估计.证 因为22212112211[()][(2)]22E X X E X X X X -=-+2222112212[()2()()]22E X E X X E X σσ=-+==,所以2121()2X X -为2σ的无偏估计.习题7-31. 选择题(1) 总体未知参数θ的置信水平为0.95的置信区间的意义是指( ). (A) 区间平均含总体95%的值. (B) 区间平均含样本95%的值.(C) 未知参数θ有95%的可靠程度落入此区间. (D) 区间有95%的可靠程度含参数θ的真值. 解 选(D).(2) 对于置信水平1-α(0<α<1), 关于置信区间的可靠程度与精确程度, 下列说法不正确的是( ).(A) 若可靠程度越高, 则置信区间包含未知参数真值的可能性越大. (B) 如果α越小, 则可靠程度越高, 精确程度越低. (C) 如果1-α越小, 则可靠程度越高, 精确程度越低. (D) 若精确程度越高, 则可靠程度越低, 而1-α越小. 解 选(C )习题7-41. 某灯泡厂从当天生产的灯泡中随机抽取9只进行寿命测试, 取得数据如下(单位:小时):1050, 1100, 1080, 1120, 1250, 1040, 1130, 1300, 1200. 设灯泡寿命服从正态分布N (μ, 902), 取置信度为0.95, 试求当天生产的全部灯泡的平均寿命的置信区间.解 计算得到1141.11,x = σ2 =902. 对于α = 0.05, 查表可得/20.025 1.96z z ==α.所求置信区间为/2/2(,)(1141.11 1.96,1141.11 1.96)(1082.31,1199.91).x x z +=-=αα2. 为调查某地旅游者的平均消费水平, 随机访问了40名旅游者, 算得平均消费额为105=x 元, 样本标准差28=s 元. 设消费额服从正态分布. 取置信水平为0.95, 求该地旅游者的平均消费额的置信区间.解 计算可得105,x = s 2 =282.对于α = 0.05, 查表可得0.0252(1)(39) 2.0227t n t α-==.所求μ的置信区间为22((1),(1))(105 2.0227,105 2.0227)x n x n αα--+-=+=(96.045, 113.955).3. 假设某种香烟的尼古丁含量服从正态分布. 现随机抽取此种香烟8支为一组样本, 测得其尼古丁平均含量为18.6毫克, 样本标准差s =2.4毫克. 试求此种香烟尼古丁含量的总体方差的置信水平为0.99的置信区间.解 已知n =8, s 2 =2.42, α = 0.01, 查表可得220.0052(1)(7)20.278n αχχ-==, 220.99512(1)(7)0.989n αχχ--==, 所以方差σ 2的置信区间为2222122(1)(1)(,)(1)(1)n S n S n n ααχχ---=--22(81) 2.4(81) 2.4(,)20.2780.989-⨯-⨯=(1.988, 40.768). 4. 某厂利用两条自动化流水线灌装番茄酱, 分别从两条流水线上抽取样本:X 1,X 2,…,X 12及Y 1,Y 2,…,Y 17, 算出221210.6g,9.5g, 2.4, 4.7x y s s ====.假设这两条流水线上装的番茄酱的重量都服从正态分布, 且相互独立, 其均值分别为12,μμ. 又设两总体方差2212σσ=. 求12μμ-置信水平为0.95的置信区间, 并说明该置信区间的实际意义.解 由题设22121210.6,9.5, 2.4, 4.7,12,17,x y s s n n ======2222112212(1)(1)(121) 2.4(171) 4.71.94212172wn s n s s n n -+--⨯+-⨯===+-+-120.0252(2)(27) 2.05181,t n n t α+-==所求置信区间为122(()(2)((10.69.5) 2.05181 1.94x y t n n s α-±+-=-±⨯ =(-0.40,2.60).结论“21μμ-的置信水平为0.95 的置信区间是(-0.40,2.60)”的实际意义是:在两总体方差相等时, 第一个正态总体的均值1μ比第二个正态总体均值2μ大-0.40~2.60,此结论的可靠性达到95%.5. 某商场为了了解居民对某种商品的需求, 调查了100户, 得出每户月平均需求量为10公斤, 方差为9 . 如果这种商品供应10000户, 取置信水平为0.99.(1) 取置信度为0.99,试对居民对此种商品的平均月需求量进行区间估计; (2) 问最少要准备多少这种商品才能以99%的概率满足需要? 解 (1) 每户居民的需求量的置信区间为2222((1),(1))()(10 2.575,10 2.575)(9.2275,10.7725).,x n x n x z x αααα-+-≈+=-=10000户居民对此种商品月需求量的置信度为0.99的置信区间为(92275,107725);(2)最少要准备92275公斤商品才能以99%的概率满足需要.。
浙大版概率论与数理统计答案---第七章
第七章 参数估计注意: 这是第一稿(存在一些错误)1、解 由θθθμθ2),()(01===⎰d x xf X E ,204103)(2221θθθ=-==X D v ,可得θ的矩估计量为X 2^=θ,这时θθ==)(2)(^X E E ,nnX D D 5204)2()(22^θθθ=⋅==。
3、解 由)1(2)1(2)1(2)(21θθθθμ-=-+-==X E ,得θ的矩估计量为:3262121^=-=-=X θ。
建立关于θ的似然函数:482232)1(4)1())1(2()()(θθθθθθθ-=--=L令0148))1ln(4ln 8()(ln =--=∂-+∂=∂∂θθθθθθθL ,得到θ的极大似然估计值:32^=θ 4、解:矩估计:()1012122μθλθλθλ=⋅+⋅+⋅--=--,()()()()2222222121νθλθθλλθλθλ=--++-++--, 11A =,234B =, 故()()()()222ˆˆ221,3ˆˆˆˆˆˆˆˆˆˆ222121.4θλθλθθλλθλθλ⎧--=⎪⎨--++-++--=⎪⎩解得1ˆ,43ˆ.8λθ⎧=⎪⎪⎨⎪=⎪⎩为所求矩估计。
极大似然估计:(){}()33214526837,0,2,11L P X X X X X X X X θλθλθλ==========--,()()(),ln ,3ln 2ln 3ln 1l L θλθλθλθλ==++--,()(),330,1,230.1l l θλθθθλθλλλθλ∂⎧=-=⎪⎪∂--⎨∂⎪=-=⎪∂--⎩解得3ˆ,81ˆ.4θλ⎧=⎪⎪⎨⎪=⎪⎩即为所求。
5、解 由33)1(3)1(3)(222+-=-+-+=p p p p p p X E ,所以得到p 的矩估计量为^394(3)34322X X p -----==建立关于p 的似然函数:3210)1()2)1(3()()2)1(()(22n n n n p p p p p p p L ---= 令0)(ln =∂∂pp L ,求得到θ的极大似然估计值:n n n n p 22210^++=6、解:(1)()1112EX x x dx θθθθ+=+=+⎰, 由ˆ1ˆ2X θθ+=+得21ˆ1X X θ-=-为θ的矩估计量。
概率论与数理统计教程习题(第六章参数估计)
习题15(参数估计)一.填空题1. 设1~()X e λ,n X X X ,,,21 为来自X 的样本,则λ的矩估计为 . 2. 设),(~2σμN X ,n X X X ,,,21 为来自X 的样本,则2σ的无偏估计量为 . 3. 设123,,X X X 是总体X 的样本,11231ˆ()4X aX X μ=++,21231ˆ()6bX X X μ=++是总体均值的两个无偏估计,则a = ,b = ,这两个无偏估计量中较有效的是 .二.判断题1. 参数矩估计是唯一的。
( )2. 用距估计和最大似然估计对某参数估计所得的估计一定不一样。
( )3. 一个未知参数的无偏估计一定唯一。
( )4. 设总体X 的数学期望为12,,,,n X X X μ 为来自X 的样本,则1X 是μ的无偏估计量。
() 三.解答题1. 设总体的密度为(1),01,(;)0,.x x f x ααα⎧+<<⎪=⎨⎪⎩其他试用样本12,,,n X X X 求参数α的距估计量和最大似然估计量.2. 设总体X 的概率密度为2,0()20,0xa xe x f x x λ-⎧⎪>=⎨⎪≤⎩,其中0λ>,且λ为未知参数,n X X X ,,,21 是来自总体X 的随机样本,(1)试求常数a ; (2)求λ的最大似然估计量ˆλ.3. 设总体()θe X ~,其中0θ>,抽取样本n X X X ,,,21 ,证明X 是θ的无偏估计量,但2X 却不是2θ的无偏估计量.习题16(置信区间1)一.填空题1. 设12100,,,x x x 为正态总体(,4)N μ的一个样本,x 表示样本均值,则μ的置信度为1α-的置信区间为 .2. 已知12,,,n X X X 为来自总体),(2σμN 的一组样本,其中2σ未知,则μ的置信水平为α-1的置信区间为 .3. 正态总体X 的均值未知,取25个样本,测得样本方差220.9S =,则方差2σ的0.95的置信区间的区间长度为 .二.判断题1. 正态总体均值μ的置信区间一定包含μ。
无偏估计量例题及答案
无偏估计量例题及答案
对于待估参数,不同的样本值就会得到不同的估计值。
这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来衡量。
对此,一个自然而基本的衡量标准是要求估计量无系统偏差。
也就是说,尽管在一次抽样中得到的估计值不一定恰好等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,换句话说,希望估计量的均值(数学期望)应等于未知参数的真值,这就是所谓无偏性(Unbiasedness)的要求。
数学期望等于被估计的量的统计估计量称为无偏估计量。
在实际应用中,对整个系统(整个实验)而言无系统偏差,就一次实验来讲,可能偏大也可能偏小,实质上并说明不了什么问题,只是平均来说它没有偏差,所以无偏性只有在大量的重复实验中才能体现出来;另一方面,无偏估计只涉及一阶矩(均值),虽然计算简便,但往往会出现一个参数的无偏估计有多个,而无法确定哪个估计量好。
因此,无偏性的作用在于可以把重复估计中的各次误差通过平均来消除。
这并不意味着该估计量在一次使用时并能获得良好的结果。
在具体问题中,无偏性是否合理,应当结合具体情况来考虑。
在有些问题中,无偏性的要求可能会导出不同的结果来。
事实上,中的每一个均可作为θ的无偏估计量,究竟哪个估计量更合理,就看哪个估计量的观察值更接近真实值,即估计量的观察值更密集地分布在真实值附近。
而方差能反映随机变量取值的分散程度,所
以无偏估计以方差最小者为最好、最合理,为此后人引进了估计量的有效性概念。
概率论与数理统计习题及答案第七章
概率论与数理统计习题及答案第七章习题7-1的样本,则0的矩估计量是().(A) X .(B) 2X .解选(B).2.设总体X 的分布律为X -215P301-40e其中0v 0< 0.25为未知参数,X 1, X 2, , , X n 为来自总体X 的样本,试求0的矩估计量.解因为 E(X)=(-2) >3 0+1X(1-4 0+5 X0=1-5 0 令 1_5v-X 得到v 的矩估计量为彳二1.53.设总体X 的概率密度为f A严 1)x ;0 ::: x :::1, f (X ; V)0, 其它.其中0>1是未知参数,X 1,X 2,, ,X n 是来自X 的容量为n 的简单随机样本求:(1) r 的矩估计量;(2) 0的极大似然估计量. 解总体X 的数学期望为址 1阳1 日+1E (X ) = f xf (x)d x =[(日 +1) x dx = ----------------------0+21.选择题(1)设总体X 的均值的样本, 则均值□与方差 (A) 2 X 和 S 2. (C)□和d . 解选(D).与方差都存在但未知 C 2的矩估计量分别是( 而X-X 2,…,X n 为来自X ).1(B) X 和 (X i(D)1X 和 (X i20>0为未知参数,又X i ,X 2,…,X n 为来自总体X(C) max{ X i }. 1 < i < n(D) min { X i }. 1 < i < n⑵设X : U [0, v],其中 -X)令E (X )= X ,即二! =X ,得参数0的矩估计量为彳■■ 2设X 1, X 2,, , X n 是相应于样本X 1, X 2,, , X n 的一组观测值,2X -1 1 -x则似然函数为0,当 0<x< p="">,n)时,L>0 且 nXiIn ,0 ::: x i :::1,L = n ln( v I))、In X i ,i =1Ad In L n 二令Ind v 71 -1 i 1X i =0,得0的极大似然估计值为 4-1nnvIn X ii土而的极大似然估计量为4.设总体X 服从参数为彳=-1.二 In Xii -4即X 的概率密度为■的指数分布, 3 x 0,f (X, ■)二I 0,其中,.0为未知参数,X i , X 2, , , X n 为来自总体的矩估计量与极大似然估计量1 -解因为E(X)= =X ,所以,的矩估计量为x < 0,X 的样本,试求未知参数■—.设 X 1, X 2,, , X n 是相X应于样本X i , X 2,, ,X n 的一组观测值,则似然函数n -n _L 二■■■■ In-'7 X i i 士取对数人 d In L n 二令. X i人 \=±1 然估计量为?==.X=0,得?的极大似然估计值为1 -,■的极大似X1.选择题:设总体X ’,X 2,…,X n 为X 的样本,的无偏估计量?X 的均值则无论总体与方差;「2都存在但未知,而服从什么分布,( 2)是.1和二(A)X i 和 (Xn i ±n i 生(C)—JX i 和1n -1 i ±n -1解选(D).2. 若x 1,X 2 ,X(B)1 nX i 和-1 i —, n —2(X i —X) ?1 12—7 X i 和—v (X i 7 .n i -4、 in i -4)的样本,且X 2 ? kX 3为」的无偏估计量,问k 等于多少?解要求1E(—X ! 31 1 1 ? — X2 ? kX 3)2 74 3 45解之,k=.1 25.设总体X 的概率密度为0 ::: x ::: 1,其它,,X n 为来自总体的简单随机样本,记N求:(1) B 的矩估计量;(2) B 的极大似然33 —解 (1) X =E(X)二 xvdx 亠 |X (1 - v)dx,所以 <1 矩 X .22(2)设样本X 1,X 2,…X n 按照从小到大为序(即顺序统计量的观测值)有如下关系:X (1) < X (2) w , wx (N) <1 w X (N+1) W X (N+2)W , W X (n).似然函数为,,■'N(^-r-,X (1) W x (2) W ' "W X (N) <1W X (N 1) W X (N 2) W X n , LQ|0, 其它.考虑似然函数非零部分,得到In L( 0) = N In 0+ (n - N) In(1- 0),令d s o 二‘ 一口 =o ,解得0的极大似然估计值为弓=楚.d B日1 —日n习题7-23.设总体X 的均值为0,方差匚2存在但未知,又X 1, X 2为来自总体X 的1 2 21< x < 2,f (x,=) ?1 七,0,.X 1, X 2,,1的个数? 其中-(0<二<1 )是未知参数为样本值x , ,x 2 , ,x n中小于估计量.nnn2i—'X ).3为来自总体2、(X i 」).(D)i :—样本,试证:一(X ’ 一X 2)为二的无偏估计21 2 1 2 2证因为E[—(X’-X?)] E[( X1^2X 1X2 X2 )]2 21 2 2【E(X’)_2E(X’X2)- E(X2 )]2所以一(X1-X2)2为L的无偏估计.2习题7-31. 选择题(1) 总体未知参数二的置信水平为0.95的置信区间的意义是指().(A) 区间平均含总体95%的值.(B) 区间平均含样本95%的值.(C) 未知参数二有95%的可靠程度落入此区间.(D) 区间有95%的可靠程度含参数n的真值?解选(D).(2) 对于置信水平1- a0< ad),关于置信区间的可靠程度与精确程度,下列说法不正确的是().(A) 若可靠程度越高,则置信区间包含未知参数真值的可能性越大(B) 如果a越小,则可靠程度越高,精确程度越低.(C) 如果1- a越小,则可靠程度越高,精确程度越低?(D) 若精确程度越高,则可靠程度越低,而1- a越小. 解选(C)习题7-41.某灯泡厂从当天生产的灯泡中随机抽取9只进行寿命测试,取得数据如下(单位:小时):1050, 1100, 1080, 1120, 1250, 1040, 1130, 1300,1200.设灯泡寿命服从正态分布N(卩902),取置信度为0.95,试求当天生产的全部灯泡的平均寿命的置信区间.解计算得到x -1141.11,3 =902.对于a= 0.05,查表可得Z -/2 = z0.025 二1-96.所求置信区间为22=(1141.11= (1082.31,1199.91).2. 为调查某地旅游者的平均消费水平,随机访问了40名旅游者,算得平均消费额为X =105元,样本标准差s =28元.设消费额服从正态分布.取置信水平为0.95,求该地旅游者的平均消费额的置信区间 .2 2解计算可得X =105, f =282.对于a = 0.05,查表可得t ..(n -1) =t °.025 (39) = 2.02272所求□的置信区间为=(96.045, 113.955).3?假设某种香烟的尼古丁含量服从正态分布 .现随机抽取此种香烟8支为一组样本,测得其尼古丁平均含量为18.6毫克,样本标准差s=2.4毫克.试求此种香烟尼古丁含量的总体方差的置信水平为0.99的置信区间.解已知 n =8, S 2=2.42, a = 0.01,查表可得笑厶一 1) = 30.005 ⑺=20.278 ,22..(n -1) =0.995⑺=0.989 ,所以方差/的置信区间为"2本:X 1,X 2,, ,X 12 及丫1,丫2,, ,丫17,算出 x =10.6g ,y = 9.5g , s : =2.4, s ;=4.7 .假设这两条流水线上装的番茄酱的重量都服从正态分布,且相互独立,其均值分别为叫,J 2.又设两总体方差打.求4 - J 2置信水平为0.95的置信区间并说明该置信区间的实际意义.解由题设 X =10.6, y =9.5, s : =2.4, s ; =4.7, n 1 =12, n 2 =17,(Xs (X「28\(n -1),x2\(n -1)) =(10522.0227, 28105—2.0227 )2 2(n -1)S(n -1)S 、(, )=( “-1) J -1)2 22(8 .1)2.420.2782(8 -1)2.40.989)=(1.988, 40.768).4.某厂利用两条自动化流水线灌装番茄酱分别从两条流水线上抽取样2s w2 丄 2(① -1) q ? (n ? -1)S 2 n 1 ' n 2「2 (12 —1) 2.4 ? (17 —1) 4.712 17「2= 1.94(J ■ n)90—1.96, 1141.11sQg +n2—2) =t0.°25 (27) = 2.05181,所求置信区间为2 21 11 1—■■_) =((10.6「9.5) _2.05181 1.94,—、一) n 1 n 2 .12 17 =(-0.40,2.60).结论“叫_ J 的置信水平为0.95的置信区间是(-0.40,2.60)”的实际意义是:在两总体方差相等时,第一个正态总体的均值叫比第二个正态总体均值J 大-0.40?2.60,此结论的可靠性达到95%.5.某商场为了了解居民对某种商品的需求,调查了100户,得出每户月平均需求量为10公斤,方差为9 .如果这种商品供应10000户,取置信水平为0.99.(1) (2) 解 _ s _ s (x ——t (n -1), x ——t (n -1))' 厂g厂?■ f n 2 ■. n 2= (102.575, 102.575) =(9.2275,10.7725).J 100J10010000户居民对此种商品月需求量的置信度为 0.99的置信区间为(92275,107725);(2)最少要准备92275公斤商品才能以 99%的概率满足需要?((X7) _t ,(n 1n2—2)S w2取置信度为0.99,试对居民对此种商品的平均月需求量进行区间估计问最少要准备多少这种商品才能以(1)每户居民的需求量的置信区间为99%的概率满足需要? _ s _ s:F (X ---- z , x ---------- z )厂a r ot ■- n 7 ?、n 2</x<>。
第五章 习题参考答案与提示
第五章习题参考答案与提示第五章数理统计初步习题参考答案与提示1.在总体中随机抽取一长度为36的样本,求样本均值)3.6,52(~2NXX落50.8到53.8之间的概率。
答案与提示:由于)/,(~2nNXσμ,所以{50.853.8}0.8293PX<<=。
2.在总体中随机抽取一长度为100的样本,问样本均值与总体均值的差的绝对值大3的概率是多少?)20,8(~2NX答案与提示:由于2~(,/XNnμσ),所以{83}0.1336PX−>=3.设为来自总体n XXX,,,21)(~λPX的一个样本,X、分别为样本均值和样本方差。
求2SXD及。
2ES答案与提示:此题旨在考察样本均值的期望、方差以及样本方差的期望与总体期望、总体方差的关系,显然应由定理5-1来解决这一问题。
2,DXDXESnnλλ===。
4.设是来自正态总体的随机样本,。
试确定、b使统计量4321XXXX,,,)30(2,N243221)32()2(XXbXXaX−+−=a X服从分布,并指出其自由度。
2χ答案与提示:依题意,要使统计量X服从分布,则必需使及服从标准正态分布。
解得2χ)2(212/1XXa−)32(432/1XXb−a=1/45;b=1/117。
5.设X和Y独立同分布和分别是来自N()032,,921XXX,,,921YYY,,,X和Y 的简单抽样,试确定统计量UXXYY=++++112929 所服从的分布。
答案与提示:应用t分布的定义,得UXXYY=++++191292~()t96.设随机变量~()Xtn(1n> ),试确定统计量21YX=所服从的分布。
答案与提示:先由t分布的定义知nVUX=,再利用F分布的定义即可。
—1—第五章习题参考答案与提示)1,(~12nFXY=。
7.设总体X服从正态分布,而是来自总体)2,0(2N1521,,,XXX X的简单随机样本,试确定随机变量)(221521121021XXXXY++++=所服从的分布。
无偏估计量例题及答案
无偏估计量例题及答案关于概率学中无偏估计量的问题设X1,X2,X3都是未知参数X的无偏估计量,若要使Y=2X1+aX2-4X3也是X的无偏估计量,则常数a=?EY=2EX1+aEX2-4EX3.根据已知EX1=EX2=EX3=X.所以a-2=1.a=3.估计量的期望等于真值称为无偏估计量?估计量的期望等于真值是无偏估计量的话,那么真值怎么确定呢?x横是E(X)的无偏估计量,是不是说E(x横)=E(X),这句话又是什么意思呢?平均值怎么会有数学期望?你说的这个比较难以理解,你慢慢听我说.首先,你说的每一句话都是对的:估计量的期望等于真值是无偏估计量.实际应用中,真正的真值永远无法确定.为了打字方便,我们用Y代替“X横”.Y是n次重复的随机试验的平均值,每一次都与X是相同分布的,也就是:Y=(X1+X2+...+Xn)/n,其中:X1、X2、...、Xn与X独立同分布. 无偏估计,就是指:E(Y)=E(X)这最初看来是个废话,但是用来进行估计的公式:Y=(X1+X2+...+Xn)/n 是人为确定的.如果我们成心捣乱,用另一个坑爹的公式估计,比如:Y'=(X1+X2+...+Xn)/(n-1),那么E(Y')就不再等于E(X),从而这个新的Y'就不是无偏估计了.所谓“平均值怎么会有数学期望”.因为Y是随机变量的平均值,所以它也是随机变量,所以它也有数学期望.Y本身也是个随机变量,你可以这样想:我们先进行n次随机试验,得到一个Y值;我们再进行n次试验,又得到一个Y值.这两次得到的Y 值是不同的,也就是说:Y本身是随机的.一次Y的随机试验是由n次X的随机试验合起来的.用抽象的公式表示出来,就是:Y=(X1+X2+...+Xn)/n这个公式和平常遇到的随机变量的公式是一样的,比如平时遇到的一些:X、Y是随机变量,那么Z=X+Y 也是一个随机变量.只不过我们这个公式中Y=(X1+X2+...+Xn)/n,合成Y的随机变量有n个,比平时多了一些而已.真正的真值,记为μ,永远无法确定.假设进行1万次试验,测得1万个Y 值,还是不能确定真正的μ值.只能从理论上说,由于是无偏估计,所以:E(Y)=μ.但不管试验1万次,还是1亿次,永远不可能得到真正的μ.说了这么多,你肯定还是不明白,因为还没说到真正的部分:为什么要弄个无偏估计的概念?!比如:通过平均值Y=(X1+X2+...+Xn)/n 来估计μ,是件很正常的事,当然有E(Y)=μ,那为什么还要费那么大劲,弄个无偏估计的概念?!这是因为:到方差的估计上,就不一样了.如果不看书,不知道书上的无偏估计公式,而让我们自己写个方差的估计公式,那么肯定写:Z=[(X1-Y)^2+(X2-Y)^2+...+(Xn-Y)^2]/n下面是难点,要理解这个公式的瑕疵:它不是无偏估计,也就是:E(Z)不等于E((X-μ)^2).为什么呢?因为Z的公式中用的是Y,而不是μ.如果把Z的公式中的Y全部换成μ,那么它是无偏估计.可是μ的真值无法得到,所以实际应用中,肯定要用Y来代替μ.这有什么影响呢?这个影响很微妙.因为Y本身是由X1、X2、...、Xn得到的,那么相对于这组的n个数据,Y不会像μ那么不偏不倚,而是会向着X1、X2、...、Xn的中心偏移,使得Y比较“适合”这组数据.这个“适合”的意思,就是说:如果这次的X1、X2、...、Xn偏小(随机试验嘛,总会有大有小,这次就偏小了一点儿),那么Y也会跟着偏小.正因为Y跟着X1、X2、 (X)同步的偏大偏小,当计算方差Z时,Z就会偏小那么一丁点.不知你能不能理解我说的,这很重要,但很难用语言描述.用几个极端的例子说明一下,就更明白了.比如:n=1时,就用一次试验来估计.Y=X1,Z=(X1-Y)^2.这就很明显了:Z永远等于0.为什么呢?因为Y跟着X1同步变大变小,再用Y来代替μ计算方差Z,那么Z肯定就偏小了.假设我们知道μ,用Z'=(X1-μ)^2来计算方差,那就没问题了.但我们不知道μ,用的是Y代替μ,而Y偏向那组数据的中心,所以计算出来的方差就有偏差了.再比如:n=2时.Y=(X1+X2)/2,位于两个数的平均值上.比如:μ=4,而这次试验的两个数X1=1,X2=5 偏小了一点儿.那么Y=3也跟着偏小了一点儿.如果用μ来计算方差:Z'=[(1-4)^2+(5-4)^2]/2=5而如果用跟着X1、X2一同偏小的Y来计算方差:Z=[(1-3)^2+(5-3)^2]/2=4可见,Z永远比真正的方差小.这不像Y的估计Y=(X1+X2+...+Xn)/n,Y的估计有大有小,最后E(Y)=μ.Z的估计永远偏小,E(Z)<>好了,就说这么多了,你慢慢理解一下吧.最后,书上的公式是经过很复杂的计算的,无偏的方差估计公式:[(X1-Y)^2+(X2-Y)^2+...+(Xn-Y)^2]/(n-1).。
无偏估计量例题及答案
无偏估计量
定义:
无偏估计是指估计参数的估计量的期望值等于参数本身。
内容:
无偏估计量是样本均值的随机变量,其数学期望值等于总体估计参数,即无偏估计量。
例如,虽然每个可能样本的样本平均值是随机的,但它可能等于也可能不等于总体平均值,但平均而言,样本平均值(数学期望值)的平均值必须等于总体平均值。
这个属性在数理统计中称为无偏估计量。
具有此属性的估计器称为无偏估计量。
样本量也称为无偏估计量。
这是一个很好的标准估计(无偏)。
无偏估计量,数学期望值等于估计量的统计估计量。
设'=g(x1,X2,…,xn)为未知参数A的点估计。
如果A'满足e(A')=A,则A'称为A的无偏估计量,否则它是有偏估计量。
如果无偏估计是系统误差为零的估计。
自由度不再是原始样本大小。
物质:
对于需要估计的参数,不同的样本值会得到不同的估计值。
这样,为了确定估计量的质量,我们不仅可以测量某个样本的结果,而且可以测量大量样本的结果。
在这方面,一个自然和基本的措施是要求估计器不受系统偏差的影响。
也就是说,虽然一次采样得到的估计值不一定等于待估计参数的实际值,但在大量的重复采样中,得到的估计值应该与样本的实际值相同。
要估计的参数。
换句话说,期望估计量(数学期望)的平均值应该等于未知参数的真值,这是一个无偏的要求。
的两个无偏估计量
的两个无偏估计量无偏估计是指估计值的期望等于所要估计的参数的真实值。
在统计学中,常用的无偏估计方法有很多,下面分别介绍两个常用的无偏估计量。
1.样本均值(Sample Mean)样本均值是一种常用的无偏估计量,用于估计总体的均值。
假设我们要估计总体的均值μ,我们可以从总体中抽取一个大小为n的简单随机样本,然后计算样本中观察值的平均值。
根据大数定律和中心极限定理,当样本容量足够大时,样本均值的分布会接近于正态分布,且其期望值等于总体的均值μ,即样本均值是一个无偏估计量。
样本均值的公式为:X̄ = (X1 + X2 + ... + Xn) / n其中,X̄表示样本均值,X1, X2, ..., Xn表示样本中的观察值。
无论总体分布是正态分布还是非正态分布,样本均值都是一个无偏估计量。
当总体分布是正态分布时,样本均值是最有效的估计量;当总体分布是非正态分布时,样本均值仍然是一个无偏估计量,但可能不是最有效的估计量。
2.无偏样本方差(Unbiased Sample Variance)无偏样本方差是一种用来估计总体方差的无偏估计量。
在统计学中,方差用来衡量数据的离散程度。
在计算样本方差时,需要对样本数据与样本均值的差异进行平方和求和,以得到总体方差的一个无偏估计。
无偏样本方差的公式为:S^2 = Σ(xi - X̄)^2 / (n - 1)其中,S^2表示无偏样本方差,xi表示样本中的观察值,X̄表示样本均值,n表示样本容量。
无偏样本方差的分母是(n - 1)而不是n,这是为了修正样本方差的偏差。
由于样本均值已经用来估计总体均值,所以样本方差中的差异需要考虑到这一点,所以分母为(n - 1)。
这样得到的无偏样本方差是总体方差的无偏估计。
需要注意的是,无偏样本方差仅适用于正态分布的总体。
对于非正态分布的总体,使用无偏样本方差进行估计可能会导致估计结果不准确。
在这种情况下,我们可以使用其他方法进行方差的估计。
无偏估计量例题及答案
无偏估计量例题及答案定义无偏估计:估计量的平均值等于真实值,即每次估计值可能大于或小于真实值,但不一定总是大于或小于真实值。
估计量的评价标准(1)没有偏见(2)有效性是指估计量与总体参数之间的离散程度。
如果两个估计量均无偏,则分散度较小的估计量相对有效。
换句话说,尽管每个估计都将大于或小于真实值,但偏差较小的估计更好。
(3)一致性,也称为一致性,是指随着样本量的增加,估计量接近总体参数的真实值。
为什么方差的分母为n-1?结论:首先,问题本身的概念是混乱的。
如果所有数据都是已知的,则可以直接计算均值和方差。
但是对于随机变量x,我们需要估算其均值和方差,然后使用分母为n-1的公式估算其方差。
因此,如果分母为n-1,则可以无偏估计差异(而不是方差)。
因此,问题应该变为:为什么随机变量n-1的方差估计的分母是?如果我们已经知道所有数据,那么我们可以找到平均值μ,σ,它直接是分母n的常规公式,但这不是估计!现在,对于随机变量x,我们需要估计其期望值和方差。
预期估计值是样本的平均值现在,在估计X的方差时,如果我们事先知道实际期望μ,则根据方差的定义:\ [E [(X_i-μ)^ 2] = \ frac {1} {n} \ sum_ i ^ n {(X_i-μ)^ 2} =σ^ 2 \]此时,分母为n的估计是正确的,这是无偏估计!但是,当我们估计随机变量x的方差时,我们并不知道它的真实期望。
相反,我们用期望的估计值估计方差img_ a6ca703276a7aa7165697d2bf626d3d7.png从上面的公式可以看出,必须只有\(\ \轮廓{x} =μ\)[[\ frac {1} {n} \ sum_ i ^ n(X_ i- \ overline {X})^ 2 <\ frac {1} {n} \ sum_ i ^ n(X_i-μ)^ 2 ]上述不等式的右边是方差的“正确估计”!这解释了为什么您不能使用(frac {1} {n})因此,将分母从n更改为n-1就是稍微增加了差的估计。
04-2.5 极大似然估计及估计量的无偏性
Σˆ
1 n 1
n i 1
xi
x xi
x
称为样本协方差矩阵,有
E(S)=Σ。 ❖ ρij的极大似然估计亦可表达为
rij
其中S sij 。
sij sii s jj
Σˆ
1 n
n i1
xi
x
பைடு நூலகம்
xi
x
rij
ˆ ij ˆi jjˆ
,其中Σˆ
ˆij
6
3
相关系数的极大似然估计
❖ 相关系数
ij
ij ii jj
的极大似然估计为
rij
ˆij ˆ ii ˆ jj
其中Σˆ ˆij 是Σ ij 的极大似然估计。
➢ 称rij为样本相关系数,称Rˆ rij 为样本相关矩阵,它是R的极大似然
估计。
4
估计量的无偏性
❖ 一个未知参数情形:
若E ˆ ,则称ˆ是θ的一个无偏估计,否则就称为有偏的。
多元统计分析mooc25极大似然估计及估计量的无偏性简单随机样本11122122由于总体分布的类型已知故可考虑采用极大似然估计这是一种参数估计方法
《多元统计分析》MO O C
2.5 极大似然估计及估计量的无偏性
王学民
简单随机样本
❖ 简单随机样本(简称样本):
➢ 一元情形:x1,x2,⋯ ,xn独立,且与总体x同分布。
➢ 多元情形:x1,x2,⋯ ,xn独立,且与总体x同分布。
❖ 设x~Np(μ, Σ) , Σ>0,x1,x2,⋯ ,xn是从中抽取的一个样本。
❖ 数据矩阵(或观测值矩阵):
x1 x11 x12 x1 p
X
x 2
x 21
无偏性
2 2 2 i 2 2 2 2
( )
∑d
2
2 i
Var ( u i ) =
1 ∑ d σ = σ s x2
2
∑d
2 i
1 2 σ2 ˆ sx = = Var β 1 ⋯⋯ (2.57) σ 2 2 sx sx
( )
OLS估计量的方差 OLS估计量的方差
2
Ε (u x ) = 0 σ = Ε u x
2 2
( )
2
Ε( u ) = 0 σ
2
( ) = Ε(u ) = Var(u )
2
• δ2是u 2的无条件期望值,δ2是u的无条件方差。因 此, δ2也被叫作误差方差(error variance)或干扰方 差。δ2的平方根是误差的标准误。较大的δ2表示 影响y的不可观测因素的分布较为分散。
σˆ = σˆ
2
= 回归标准误
ˆ sd β1 = σ 前面提到过: 前面提到过: sx
ˆ 替掉 就有 如 果 用 σ 替掉 σ 就 有:
ˆ 的标准误为: β1 的标准误为:
( )
ˆ ˆ se β1 = σ /
( )
(∑ ( x − x ) )
2 i
1
2
ˆ ˆ se β0 • 同理, 是通过将 sd β 0 成 σˆ 得到的。
n
n
其中与σn 相乘的项大于或等于1,但当且仅当x =0 时等于1。此时方差达到它可能达到的最小值: 2 ˆ )=(σ/n) Var(β)=(σ Var(β)=(σ/n)
0
• 为了建立置信区间和导出检验统计量,我们需要 s 用到 βˆ 0 和 βˆ 1 的标准误s d ( βˆ 0 ) 和d ( βˆ 1 ) 。我 βˆ 1 们就知道,这可通过取Var( )和Var( ) 的平 βˆ 0 方根得到。特别地,我们有ˆ 1 ) = δ/Sx。 sd ( β • 误差项方差未知的问题
估计有关的习题及详解
§估计基本题型Ⅰ 矩估计法【例】总体X 的概率密度函数为1,01(;)00,x x f x θθθθ-⎧<<=>⎨⎩()其他,求未知参数θ的 矩估计.【分析】先由题设所给含有未知参数θ的随机变量概率密度求出数学期望,解出未知参数θ与数学期望的关系,再由样本一阶原点矩替换总体期望,即得参数θ的矩估计. 【解】为求未知参数θ用总体原点矩表示的式子,先求出EX 110(;)1EX xf x dx x x dx θθθθθ+∞--∞==⋅=+⎰⎰因而 ]EX EX θ=-在上式中用样本一阶原点矩替换总体一阶原点矩,即得未知参数θ的估计ˆ(1)X X θ=-. 【例】设总体X 服从均匀分布[,]U a b ,12(,,)n X X X L 为来自此总体的样本,求,a b 的矩估计.【分析】由于总体的分布中含有两个未知参数,a b ,故需要求出总体的两个矩,为简单起见,一般先求其一阶矩(即总体的期望)和二阶矩(也可以取总体的方差),然后按矩估计法相应的样本矩替换它们,得矩法方程,最后求解便可得到,a b 的矩估计. 【解】由于总体X 服从均匀分布[,]U a b ,故总体的期望和方差分别为12();212a b b a EX DX +-== 由矩估计法,用X 替换EX ,用2S 替换2σ,便得矩法方程组1222()12a bX b a S +⎧=⎪⎪⎨-⎪=⎪⎩,即22a b Xa b ⎧+=⎪⎨-+=⎪⎩ 于是解出,a b 的矩估计分别为ˆaX =,ˆb X =. 【例】设总体X 的概率密度函数为||1(;),(0,)2x f x e x θθθθ-=>-∞<<+∞,求θ的矩估计.【分析】由于总体的分布中只含有一个未知参数θ,但总体的一阶矩为常量,需要求总体的二阶矩,从而确定矩方程,最后求解θ的矩估计量. 【解】虽然总体X 只含有一个参数,但 ||102x EX x e dx θθ-+∞-∞=⋅=⎰不含θ,不能求解θ 故需求二阶原点矩||2212x EX x e dx θθ-+∞-∞=⋅⎰222021()()22x xx x x e dx e d θθθθθθθ--+∞+∞=⋅=⎰⎰22(3)2θθ=Γ=.令2211n i i X EX n ==∑,则有θ的矩估计量为ˆθ=基本题型Ⅱ 极大似然估计法【例】设总体X 具有概率密度函数1,01(;)00,x x f x θθθθ-⎧<<=>⎨⎩()其他,θ的极大似然估计量是 .【分析】设12,,n x x x L 为总体X 的观测值,则其极大似然函数为11()()n n L x x θθθ-=L ,对数似然函数为1ln ()ln (1)ln ni i L n x θθθ==+-∑,解似然方程1ln ()ln 0ni i d L n x d θθθ==+=∑ 得参数θ的极大似然估计值为1ˆln nii nxθ==-∑,从而得参数θ的极大似然估计量为1ˆln nii nXθ==-∑.【例】设总体X 的分布律为X 1a 2a 3a P2θ2(1)θθ-2(1)θ-又设12,,n X X X L 为来自此总体的样本,记j n 表示12,,n X X X L 中取值为,1,2,3j a j =,的个数,求θ的极大似然估计.【分析】求极大似然估计量时,关键是求似然函数,它是样本观测值的函数. 【解】设12,,n x x x L 是样本12,,n X X X L 的观测值,则参数θ的似然函数为 1()(;)nii L P x θθ==∏312123[()][()][()]n n n P x a P x a P x a ====323122122222[2(1)](1)2(1)n n n n n n n n θθθθθθ++=--=-对数似然函数为21223ln ()ln 2(2)ln (2)ln(1)L n n n n n θθθ=++++- 从而似然方程为231222ln ()01n n n n d L d θθθθ++=-=-. 得θ的极大似然估计量122ˆ2n n nθ+=. 【例】设12,,n X X X L 为总体的一个样本,求下列总体概率密度中的未知参数的极大似然估计()1,(;)0,x u ex u f x θθθ--⎧≥⎪=⎨⎪⎩其他,其中0θ>,,u θ为常数.【解】设12,,n x x x L 是样本12,,n X X X L 的观测值,则参数θ的似然函数为1(())1,(,)0,ni i x u i n e x u L u θθθ=--⎧∑⎪≥=⎨⎪⎩其他. 取对数 1ln (,)ln ()nii L u n x u θθθ==---∑.对参数,u θ求偏导,令其为0,则21ln (,)()0ln (,)0n i i L u n x u L u n u θθθθθθ=∂⎧=-+-=⎪⎪∂⎨∂⎪==⎪∂⎩∑110n i i u x x n n θθ=⎧+==⎪⎪⇒⎨⎪=⎪⎩∑. 显然,上式第二式不能求出参数,u θ的关系,但由定义,当θ固定时,要使(,)L u θ最大,只需u 最大,因12,,n u x x x ≤L ,则参数u 的似然估计值为(1)ˆux =,从而得参数θ的极大似然值为(1)ˆx x θ=-,故,u θ的极大似然估计量为(1)ˆu X =,(1)ˆX X θ=-.基本题型Ⅲ 评价估计量的标准(无偏性与有效性)【例】 样本12,,n X X X L 取自总体X ,2,EX u DX σ==,则可以作为2σ的无偏估计的是 【 】()A 当u 已知时,统计量21()ni i X u n =-∑. ()B 当u 已知时,统计量21()(1)ni i X u n =--∑.()C 当u 未知时,统计量21()ni i X u n =-∑. ()D 当u 未知时,统计量21()(1)ni i X u n =--∑.【分析】当u 已知时,21()nii Xu n =-∑为统计量,利用定义有22()i i DX E X u DX σ=-==.从而 222111[()]()nn nii i i i i E Xu E X u DX n σ===-=-==∑∑∑,故 222211[()][()]nni i i i E Xu n E X u n n n σσ==-=-==∑∑.而 222211[()(1)][()](1)1)nnii i i E Xu n E X u n n n σσ==--=--=-≠∑∑所以当u 已知时,()A 入选,()B 不能入选.当u 未知时,样本函数21()nii Xu n =-∑,21()(1)ni i X u n =--∑均不是统计量,因而不能作为2σ的估计量,更不能作为无偏估计量. 选()A .【例】设12,,n X X X L 是总体X 的简单随机样本,则下列不是总体期望u 的无偏估计 【 】()A 11ni i X n =å. ()B 120.20.50.3n X X X ++.()C 12X X + . ()D 123X X X -+. 【分析】要验证统计量是否为无偏估计,即验证ˆE θθ=.1111[]n ni i i i E X EX u n n====邋;1212[0.20.50.3]0.20.50.30.20.50.3n n E X X X EX EX EX u u u u ++=++=++=; 1212[]2E X X EX EX u u +=+=?;123123[]E X X X EX EX EX u u u u -+=-+=-+=;选()C .【例】试证明均匀分布1,0(;)0,x f x θθθ⎧<≤⎪=⎨⎪⎩其他中未知参数θ的极大似然估计量不是无偏的.【分析】 涉及总体分布时,先求估计量的概率密度(或分布律).【解】设12,,n x x x L 是样本12,,n X X X L 的观测值,则参数θ似然函数为1(),0,1,i nL x i n θθθ=<≤=L .是θ的一个单值递减函数.由于每一个i x θ≤,最大次序统计量的观测值()1max n i i nx x θ≤≤=≤ 在0,1,,i x i n θ<≤=L 中要使1()nL θθ=达到极大,就要使θ达到最小.但θ不能小于()n x ,否则样本观测值12,,n x x x L 就不是来自这一总母体,所以()ˆn x θ=是θ的极大似然估计值.故最大次序统计量()ˆn X θ=是参数θ的极大似然估计量. 为要证明估计量()ˆn X θ=不是θ的无偏估计量,需求出()[]n E X ,为此先求()n X 的概率密度.因统计量()ˆn X θ=为随机样本12,,n X X X L 的最大值,而12,,n X X X L 独立同分布,故()n X 的概率分布函数为()ˆ()()[()]n n X F x F x F x θ==,其中()F x 为总体X 的分布函数. 由X 的概率密度可知0,0(),01,xF x x x x θθθ≤⎧⎪=<≤⎨⎪>⎩.因此()111ˆˆ,0()()[()]{[()]}()()0,n n n n n X nx x f x f x F x F x nFx f x 其他θθθθ---⎧<≤''====⋅=⎨⎩从而 1ˆ()1n nnx n E xf x dx dx n θθθθθ-+∞-∞===≠+⎰⎰. 即极大似然估计量ˆθ不为参数θ的无偏估计. 【例】若未知参数θ的估计量是$θ,若θθ=)ˆ(E 称$θ是θ的无偏估计量.设$$12,θθ是未知参数θ的两个无偏估计量,若)ˆ()ˆ(21θθD D <则称$1θ较$2θ有效.【分析】由无偏估计量和有效性的定义可得.【评注】估计量的有效性是在无偏估计类的基础上定义的,这一点也特别明确. 【例】设总体2(,2)X N u :,123,,X X X 为总体的一个样本,试证明11231ˆ(2)4uX X X =++和21231ˆ()3u X X X =++均为总体期望的无偏估计,并比较哪一个更有效.【证明】由于112311ˆ()(2)(4)44E uEX EX EX EX u =++== 21231ˆ()()3E uEX EX EX u =++= 故统计量12ˆˆ,uu 均为期望u 的无偏估计,又 2211231333ˆ()(4)216882D uDX DX DX σ=++==⨯=. 2221231314ˆ()()29933D uDX DX DX σ=++==⨯=. 由于12ˆˆ()()D uD u >,故2ˆu 是比1ˆu 更有效的估计量. 【例】从总体X 中抽取样本12,,n X X X L ,设12,,n C C C L 为常数,且11nii C==∑,证明:(1)1ˆni ii uC X==∑为总体均值u 的无偏估计;(2)在所有这些无偏估计量1ˆni i i uC X ==∑中,样本均值11ni i X X n ==∑的方差最小. 【分析】注意到样本12,,n X X X L 相互独立,且与总体X 同分布,易得ˆu的无偏性及其方差ˆ()D u,利用拉格朗日乘数法则,不难证明,当ˆu X =时方差最小. 【证明】因为样本,(1,,)i X i n =L 与总体X 服从相同分布,故 ,1,2,,i EX EX u i n ===L又11nii C==∑,则11ˆ()()n ni i i i i i EuE C X C EX u =====∑∑ 从而1ˆni ii uC X==∑为总体均值u 的无偏估计.设总体方差2DX σ=,则2,1,2,i DX DX i n σ===L .又样本12,,n X X X L 相互独立,故222111ˆ()()n nniiii i i i i DuD C X CDX C σ======∑∑∑为确定u 的无偏估计量ˆu的方差ˆ()D u 在什么情况下最小,应当求ˆ()D u 满足条件11nii C==∑的条件极值.为此考虑函数 22111(,)()(1)nnn ii i i G C C CC σλ===+-∑∑L ,其中λ为常数.求偏导数(1,2,)iGi n C ∂=∂L ,并令它们等于零,得 220,1,2,i C i n σλ+==L (*)即 2,1,2,2i C i n λσ=-=L .代入11ni i C ==∑,得212n λσ-=,即22n σλ-= 代入方程(*)中,即得1,1,2,i C i n n==L 由此可知,当11ˆni i uX X n ===∑时,方差最小. 【例】设分别来自总体21(,)N u σ和22(,)N u σ中抽取容量为12,n n 的两个独立样本,其样本方差分别为21S ,22S ,试证:对于任意常数,,(1)a b a b +=,2212Z aS bS =+都是2σ得无偏估计,并确定常数,a b ,使DZ 最小.【证明】由题意,222212()EZ aES bES a b σσ=+=+=. 故对任意常数,,(1)a b a b +=,2212Z aS bS =+都为2σ得无偏估计.由于222(1)(1)n S n χσ--:,则22(1)()2(1)n S D n σ-=-,即224(1)2(1)n DS n σ-=-,故4221DS n σ=-,则 44222222121222(1)11DZ a DS b DS a a n n σσ=+=+--- 对a 求导,并令其为零,有 44122222(1)011dDZ a a da n n σσ=--=--解得 12121211,22n n a b n n n n --==+-+-.又 24421244011d DZ da n n σσ=+>--,故当12121211,22n n a b n n n n --==+-+-时,DZ 达到最小值. 11、设12,,n X X X L 为来自正态总体2(,)N u σ的简单随机样本,u 已知,22*11ˆS σ=,222ˆS σ=,22311ˆ()1n i i X X n σ==-+∑,22411ˆ()n i i X u n σ==-∑.问在21ˆσ,22ˆσ,23ˆσ,24ˆσ中(1)那个是2σ的无偏估计量;(2)那个比较有效;(3)那个方差最小;(4)那个是2σ的相合估计量.【分析】因为2222312222ˆˆˆ(1)(1)(1)n n n n σσσχσσσ+-==-:,又(0,1)i X uN σ-:,故22221()()(1)i i X uX u χσσ-=-:,由2χ分布性质知2242ˆ()n n σχσ:.从而可求诸估计量的数学期望与方差,并回答上述问题.【解】由分析知221ˆE σσ=,2222(1)ˆ()n E n nσσσ-=→→∞, 22231ˆ()1n E n n σσσ-=→→∞+,224ˆE σσ=. 且 4212ˆ0()1D n n σσ=→→∞-,24222(1)ˆ0()n D n n σσ-=→→∞, 24322(1)ˆ0()(1)n D n n σσ-=→→∞+,4242ˆ0()D n nσσ=→→∞ 从而(1)21ˆσ与24ˆσ为2σ的无偏估计量; (2)24ˆσ比21ˆσ有效;(因为2241ˆˆD D σσ<);(3)22223241ˆˆˆˆD D D D σσσσ<<<, 即估计量23ˆσ方差最小. (4)21ˆσ,22ˆσ,23ˆσ与24ˆσ均为2σ的相合估计.基本题型Ⅳ 评价估计量的标准(一致性)【例】 设总体的期望u 和方差2σ均存在,求证:(1)样本均值11ni i X X n ==∑是u 的一致估计.(2)如总体服从正态分布,则样本修正方差2211()1ni i S X X n ==--∑为2σ的一致估计. 【分析】要证明参数θ的估计量ˆθ的一致性,关键是要证明:对任意0ε>,有{}ˆlim 1n n P θθε→∞-<=.从事件对应概率{}ˆnP θθε-<的极限求解上,可以使用切比雪夫不等式,即{}2ˆ()ˆD Pθθθεε-≥≤或{}2ˆ()ˆ||1D Pθθθεε-<≥-.【证明】(1)由切比雪夫不等式有,对0ε∀>2111()11(||)111()ni ni i i D X n P X u n n nσεεε==≥-<≥-=-→→∞⋅∑∑.由夹逼定理可得,{}lim 1n P X u ε→∞-<=,即11ni i X X n ==∑为参数u 的一致估计量.(2)因为2221111[()]()11n n i i i i ES E X X E X X n n ===-=---∑∑. 22221111[][]11nn i i i i E X nX EX nEX n n ===-=---∑∑ 2222211[()()]1n i u n u n nσσσ==+-+=-∑,即2S 为2σ的无偏估计. 又样本来自正态总体,由抽样分布定律知222(1)(1)n S n χσ--:,有22(1)()2(1)n S D n σ-=-从而22424422222(1)(1)2()()()2(1)(1)(1)(1)1n S n S D S D D n n n n n σσσσσσ--===-=----.由切比雪夫不等式有,0ε∀>2422()21(||)111()(1)D S P S n n σσεεε≥-<≥-=-→→∞-从而有22lim (||)1n P S σε→∞-<=,即2S 为2σ的一致估计量.【例】设ˆn θ为θ的估计量(用容量为n 的样本),如果ˆlim n n E θθ→∞=,ˆlim 0n n D θ→∞=,则ˆnθ为θ的一致估计量.【证明一】为证ˆnθ为θ的一致估计量,下证{}ˆlim 0n n P θθε→∞-≥=. 而 {}22ˆˆ22ˆˆˆ()()ˆ()()nnn nnnE P f x dx f x dx θθθθεθθθθθθεεε+∞-∞-≥---≥=≤=⎰⎰又 22222ˆˆˆˆˆ()(2)2n n n n n E E E E θθθθθθθθθθ-=-+=-+ 22ˆˆˆ()2n n nD E E θθθθθ=+-+ 故{}22ˆ()ˆlim lim[]0n n n n E P θθθθεε→∞→∞--≥≤=,即ˆn θ为θ的一致估计量. 【证明二】由切比雪夫不等式有{}2ˆˆ(||)n nP D θθεθθε-≥≤-. 而 222ˆˆˆˆ(||)()(||)()n n n nD E E E θθθθθθθθ-=---≤-. 由证明一知,2ˆlim (||)0nn E θθ→∞-=,或者用下列方法直接证明 22ˆˆˆˆ()()n n n nE E E E θθθθθθ-=-+- 22ˆˆˆˆˆˆ()2[()()]()n n n n n n E E E E E E E θθθθθθθθ=-+--+- 222ˆˆˆˆˆ0()()2n n n n nD E D E E θθθθθθθθ=++-=+-+ 22222ˆˆˆˆ()220()n n n n D D E E n θθθθθθθθθ=++-+→-+=→∞ 故{}ˆlim 0n n P θθε→∞-≥=,即ˆnθ为θ的一致估计量. 【评注】用定义验证估计量是一致估计量,一般都不太容易,可利用上例中的结论证明之,从而将统计量的一致性的证明转化为统计量的期望与方差的极限性质的论述,这是一个比较实用的证法.【例】设随机变量X 在[0,]θ上服从均匀分布,由此总体中抽取一随机样本1X ,试证明:1121ˆˆ2,X X θθ==都不为θ的一致估计.【分析】由上例(例)可知,只需论证估计量的期望和方差的极限性质.【证明】因111ˆ(2)222E E X EX θθθ===⋅=,故1ˆθ为θ的无偏估计,且21ˆ2E EX θθθ==≠,故2ˆθ不为θ的无偏估计.为证1ˆθ不为θ的一致估计,只需证明1ˆlim 0n D θ→∞= 22111ˆlim lim (2)lim 4lim 4lim0123n n n n n D D X DX θθθ→∞→∞→∞→∞→∞===⋅=≠.故1ˆθ不为θ的一致估计. 【例】设总体X 服从均匀分布[0,]U θ,试证明:θ的极大似然估计()1max n i i nX X ≤≤=为θ的一致估计.【证明】 设总体X 的密度函数为()f x ,则1,0()0,x f x θθ⎧≤≤⎪=⎨⎪⎩其他,故最大次序统计量()n X 的概率密度函数为1,0()0,n n n nx x f x θθ-⎧≤≤⎪=⎨⎪⎩其他,从而1()0()0()1n n nnx nE X xdx n n θθθ-==→→∞+⎰ 且 1222()()2n n nnx nE Xxdx n θθθ-==+⎰ 故222()()()()()()2n n n n D X E X EX EX θθθ=-=-+ 2222220()21(1)(2)n n n n n n n θθθθ=-+=→→∞++++ 由前例可知,θ的极大似然估计()1max n i i nX X ≤≤=为θ的一致估计.基本题型Ⅴ 求置信区间相关题型【例】设θ是总体X 中的参数,称),(θθ为θ的置信度a -1的置信区间,即【 】()A ),(θθ以概率a -1包含θ . ()B θ 以概率a -1落入),(θθ.()C θ以概率a 落在),(θθ之外 . ()D 以),(θθ估计θ的范围,不正确的概率是a -1.【分析】由置信区间的定义可知, 区间(),θθ为随机区间. 选()A .【例】设),(~2σμN X 且2σ未知,若样本容量为n ,且分位数均指定为“上侧分位数”时,则μ的95%的置信区间为 【 】()A )(025.0u n X σ±.()B ))1((05.0-±n t nS X .()C ))((025.0n t nS X ±. ()D ))1((025.0-±n t nS X .【分析】由题意,总体),(~2σμN X ,且2σ未知,故应构造统计量(1)X T t n =-:,则参数μ的置信水平为195%α-=的置信区间为))1((025.0-±n t nS X .选()D .【例】假设00.2,80.0,25.1,50.0是总体X 的简单随机样本值,已知X Y ln =服从正态分布)1,(μN .(1)求X 的数学期望EX (记EX 为b ); (2)求μ的置信度为95.0的置信区间;(3)利用上述结果求b 的置信度为95.0的置信区间.【解】(1)Y 的概率密度为: +∞<<-∞=--y y f e y ,21)(22)(μπ,于是,(令μ-=y t )dy Ee EX b ee y y Y ⎰+∞∞---===2)(221μπ22111222(1)2t t t dt dt e e eem m m +??+-+--+??===蝌(2)当置信度95.01=-α时,05.0=α.标准正态分布的水平为05.0=α的分位数为96.105.0=μ.故由)41,(~μN Y ,可得95.096.12196.12196.121=⎭⎬⎫⎩⎨⎧⨯+<<⨯-=⎭⎬⎫⎩⎨⎧<-Y Y P Y P μμ其中01ln 41)2ln 125.0ln 8.0ln 5.0(ln 41==+++=Y . 于是 {}95.098.098.0=<<-μP 从而)98.0,98.0(-就是μ的置信度为95.0的置信区间. (3)由函数xe 的严格递增性,有{}e e eP P 48.148.02148.12148.095.0<<=⎭⎬⎫⎩⎨⎧<+<-=+-μμ 因此b 的置信度为95.0的置信区间为),(48.148.0e e-.【例】某工厂生产滚珠,从某日生产的产品中随机抽取9个,测得直径(单位:毫米)如下,,,,,,,,设滚珠直径服从正态分布,若(1) 已知滚珠直径的标准差为0.15σ=毫米; (2) 未知标准差σ;求直径均值u 的置信度的置信区间.【分析】对于正态分布总体,若已知标准差σ时,均值u 的置信度1α-的置信区间为/2/2X u X u αα⎛-+ ⎝;未知标准差σ时,均值μ的置信度1α-的置信区间为/2/2((X t n X t n αα⎛--+- ⎝,其中S 时样本的标准差.【解】(1)0.025 1.96u =,9n =.经计算14.91x =.故已知滚珠直径的标准差0.15σ=毫米时,直径u 的置信度的置信区间为:()14.91 1.96 1.9614.81,15.01⎛-+= ⎝.(2)经计算:样本标准差0.2028S =,查表可知0.025(8) 2.306t =,于是直径u 的置信度的置信区间为:()14.91 2.306 2.30614.75,15.07⎛-+= ⎝.【例】设某糖厂用自动包装机装箱外运糖果,由以往经验知标准差为,某日开工后在生产线上抽测9箱,测得数据如下(单位:kg ),,,,,,,,(1)试估计生产线上包装机装箱糖果的期望重量的区间估计(0.05α=);(2)试求总体标准差σ的置信度为的置信区间,并判断以前经验数据标准差为是否仍然合理可用?【解】(1)由题设可知,总体方差 1.15σ=为已知,根据经验数据有911899.899.9899i i x x ====∑,当0.05α=时,查表可得0.02521.96U U α==,故参数u 的置信度为的置信区间为0.0250.025((99.23,100.73)x U x U -+=.(2)由题设可知总体均值未知,故根据经验数据有2211() 1.4694n i i S x x n ==-=∑,当0.05α=时,查表可得220.9750.025(8) 2.180,(8)17.35χχ==,从而参数2σ的置信度为的置信区间为22220.0250.975(1)(1),(0.6704,5.3923)(8)(8)n S n S χχ⎛⎫--= ⎪⎝⎭,故参数σ的置信度为的置信区间为(0.8188,2.3221).而以往经验数据标准差为 1.15S =,仍然在(0.8188,2.3221)内,故认为仍然合理可用.【例】设总体X 服从正态分布2(,)N u σ,已知220σσ=,要使总体均值u 对应于置信水平1α-的置信区间的长度不大于l ,问应抽取多大容量的样本?【解】由于2(,)X N u σ:,且220σσ=为已知,因此当置信水平1α-时,均值u 的置信区间为22(,)X X αα,其区间长度为2α,于是有2l α≤,即可得220224n U l ασ≥. 【例】设总体X 服从正态分布2(,)N u σ,20,u σ均为未知参数,12,,n X X X L 为来自总体X 的一个随机样本,求关于u 的置信水平为1α-的置信区间的长度l 的平方的数学期望.【解】因20σ未知,选用统计量(1)X T t n =-:.得参数u 的置信水平为1α-的置信区间为/2/2((X t n X t n αα⎛--+- ⎝,其区间长度为/22(l t n α=-,于是2222222/2/2/244[4(1)](1)()(1)S El E t n t n E S t n n n n nααασ=-=-=-.【例】在甲乙两城市进行家庭消费调查,在甲市抽取500户,平均每户每年消费支出3000元,标准差为1400S =元;在乙市抽取100户,平均每户每年支出4200元,标准差为2500S =元,设两城市家庭消费支出均服从正态分布211(,)N u σ和222(,)N u σ,试求: (1)甲乙两城市家庭平均每户年消费支出间差异的置信区间(置信度为);(2)甲乙两城市家庭平均每户消费支出方差比的置信区间(置信度为).【解】(1)在本题中虽211,u σ和222,u σ均未知,但由于抽取样本500,1000n m ==都很大(在使用中只要大于50即可),故可用U 统计量,即参数12u u -的置信度为1α-的置信区间为X Y uX Y u ⎛---+ ⎝,故由3000X =,4200Y =,1400S =,2500S =以及10.95α-=即0.05α=,查表可得0.025 1.96u =,因此30004000 1.96120046.79X Y u ⎛-±=-±-± ⎝ 即甲乙两城市家庭平均每户年消费支出间差异的置信度为的置信区间为(1246.79,1153.21)--,由于此置信区间的上限小于零,在实际问题中可认为乙市家庭平均每户年消费支出要比甲市大.(2)由500,1000n m ==,1400S =,2500S =,10.90α-=即0.1α=,查表可得: 0.052(1,1)(499,999) 1.13F n m F α--==,0.9510.05211(1,1)(499,999)(999,499) 1.11F n m F F α---=== ,且2212224000.64500S S == 于是所求的置信区间为22112220.0520.95110.64,(,0.64 1.11)(0.566,0.710)(499,999)(499,999) 1.13S S S F S F ⎛⎫=⨯= ⎪⎝⎭ 由于置信区间上限小于1,故可认为乙市家庭平均每户年消费支出的方差要比甲市大. 【例】某商店销售的一种商品来自甲乙两个厂家,为考察商品性能上的差异,现从甲乙两个厂家生产产品中分别抽取了8见和9件产品,测其性能指标X 得到两组样本观测值,经计算得 2.190X =, 2.238Y =,210.006S =,220.008S =假设性能指标X 均服从正态分布2(,)(1,2)i iN u i σ=,试求方差比2122σσ及均值差12u u -的90%的置信区间.【解】(1)先求方差比2122σσ置信度为90%的置信区间.由10.90α-=即0.1α=,查F 分布表可得0.052(1,1)(7,8) 3.5F n m F α--==,0.9510.05211(1,1)(7,8)(8,7) 3.73Fn m F F α---===故所求置信区间为22112220.0520.95110.00610.006,(, 3.73)(0.214,2.798)(7,8)(7,8)0.0083.500.008S S S F S F ⎛⎫=⨯= ⎪⎝⎭. 由于此区间包含1,故可认为2212σσ=.(3)由(1)可知,2212,σσ未知,但22212σσσ==,因此12u u -的置信区间为()/220.048 1.75310.0840.4860.0480.0716X Y t n m S α-±+-=-±⨯⨯=± 即(0.1196,0.0236)-,其中0.05(15) 1.7531t =,()()22122110.00712wn S m S S n m -+-==+-,即两个厂家生产的产品性能上无显著性差异.§历年考研真题评析1、【02.3.3】 设总体X 的概率密度为(),,(;)0,.x e x f x x q q q q --ìï³ï=íï<ïî,而12,,,n X X X L 是来自总体X 的简单随机样本,则未知参数q 的矩估计量为_________.【分析】由于()()1x E X xe dx q qq +?--==+ò,因此,()1E X q =-,q 的矩估计量为11ˆ11ni i X X n q ==-=-å.2、【04.3.4】设总体X 服从正态分布21(,)N m s ,总体Y 服从正态分布22(,)N m s ,112,,,n X X X L 和 212,,,n Y Y Y L 分别是来自总体X 和 Y 的简单随机样本,则12221112()()2n n i i i j X X Y Y E n n ==轾犏-+-犏犏=犏+-犏犏臌邋__________. 【分析】由于11222211111(),()(1)1n n i i i i E X X EX X n n s s ==骣骣鼢珑鼢-=-=-珑鼢珑鼢-桫桫邋;22221()(1)n i j E Y Y n s =骣÷ç÷-=-ç÷ç÷ç桫å. 因此, 原式1212n n =+-1222211()()n n i i i j E X X Y Y s ==骣÷ç÷-+-=ç÷ç÷ç桫邋. 3、【】设总体X 的概率密度为(1),01()0,x x f x θθ⎧+<<=⎨⎩其他其中1θ>-是未知参数,12,,n x x x L 是来自总体X 的一个容量为n 的简单随机样本,分别用矩估计法和极大似然估计法求θ的估计值.【解】总体X 的数学期望为1101()(1)2EX xf x dx x dx θθθθ+∞+-∞+==+=+⎰⎰ 令12X θθ+=+,得参数θ的矩估计量为21ˆ1X X θ-=-. 设12,,n x x x L 是相应于样本12,,n X X X L 的一组观测值,则似然函数为1(1),01(1,2,)0,n ni i i x x i n L θθ=⎧⎛⎫+<<=⎪ ⎪=⎨⎝⎭⎪⎩∏L 其他 当01(1,2,)i x i n <<=L 时,0L >且1ln ln(1)ln nii L n xθθ==++∑令1ln ln 01ni i d L n x d θθ==+=+∑,得θ的极大似然估计值为 1ˆ1ln nii nxθ==--∑.从而θ的极大似然估计量为1ˆ1ln nii nXθ==--∑.4、【】设总体X 的概率密度函数为36(),0()0,xx x f x θθθ⎧-<<⎪=⎨⎪⎩其他,12,,n X X X L 是取自总体X 的简单随机样本.(1)求θ的矩估计量ˆθ; (2)求ˆθ的方差ˆ()D θ. 【解】(1)236()()2x EX xf x dx x dx θθθθ+∞-∞==-=⎰⎰记11n i i X X n ==∑,令2X θ=,得θ的矩估计量ˆ2X θ=. (2)由于32223066()()20x EX x f x dx x dx θθθθ+∞-∞==-=⎰⎰222226()()20220DX EX EX θθθ=-=-=因此ˆ2X θ=的方差为 24ˆ(2)4()5D D X D X DX n nθθ====. 5、【00.1.6】设某种元件的使用寿命X 的概率密度函数为2()2,(,)0,x e x f x x θθθθ--⎧>=⎨≤⎩,其中0θ>为未知参数,又设12,,n x x x L 是X 的一组样本观测值,求参数θ的最大似然估计值.【解】似然函数为12()122,(1,2,)()(,,;)0,ni i x ni n e x i n L L x x x θθθθ=--⎧∑⎪≥===⎨⎪⎩L L 其他 当(1,2,)i x i n θ≥=L 时,()0L θ>,取对数,得 1ln ()ln 22()nii L n x θθ==--∑因为ln ()20d L n d θθ=>,所以()L θ单调增加.由于θ必须满足(1,2,)i x i n θ≥=L ,因此当θ取12,,n x x x L 中的最小值时,()L θ取最大值,所以θ的最大似然估计值为12ˆmin(,,)n x x x θ=L ,最大似然估计量为12ˆmin(,,)nX X X θ=L . 6、【04.1.9】 设总体X 的分布函数为11,1(,)0,1x F x xx ββ⎧->⎪=⎨⎪≤⎩,其中未知参数1β>,12,,n X X X L 为来自总体X 的简单随机样本,求(1)β的矩估计量; (2)β的极大似然估计量.【解】X 的概率密度函数为1,1(,)0,1x f x x x βββ+⎧>⎪=⎨⎪≤⎩(1)由于11(;)1EX xf x dx xdx xβββββ+∞+∞+-∞===-⎰⎰令1X ββ=-,解得ˆ1X X β=-,故参数β的矩估计量为ˆ1X X β=-. (2)似然函数为1121,1(1,2,)()(,)()0,1nni i n i x i n L f x x x x x ββββ+=⎧>=⎪==⎨⎪≤⎩∏L L当1(1,2,)i x i n >=L 时,()0L β>,取对数得1ln ()ln (1)ln nii L n x βββ==-+∑,两边对β求导,得1ln ()ln ni i d L n x d βββ==-∑, 令ln ()0d L d ββ=,可得1ˆln nii nxβ==∑,故β的极大似然估计量为1ˆln nii nXβ==∑.7、【06.1.9】设总体X 的概率密度为,01(,)1,120,x f x x θθθ<<⎧⎪=-≤≤⎨⎪⎩其他,其中(01)θθ<<是未知参数,12,,n X X X L 为来自总体的简单随机样本,记N 为样本值12,,n x x x L 中小于1的个数,求θ的最大似然估计.【解】 由题意,设样本12,,n x x x L 按照从小到大为序(即顺序统计量的观测值)有如下关系:(1)(2)()(1)()1N N n x x x x x +≤≤≤≤≤≤≤L L L似然函数为(1)(2)()(1)()(1),1()0,N n N N N n x x x x x L θθθ-+⎧-≤≤≤≤≤≤≤=⎨⎩L L L 其他对似然函数非零部分取对数得到 ln ()ln ()ln(1)L N n N θθθ=+--ln ()01d L N n N d θθθθ-=-=-,从而ˆN n θ=,即θ的最大似然估计值为N n. 【评注】本题着重考察了最大似然估计的概念和求似然估计的基本方法,本题的难点是“N 为样本值12,,n x x x L 中小于1的个数”的理解.8、【09.1.11】设总体X 的概率密度为2,0()0,x xe x f x λλ-⎧>=⎨⎩其他,其中参数λλ>(0)未知,12,,n X X X L 是来自总体X 的简单随机样本 (1)求参数λ的矩估计量;(2)求参数λ的最大似然估计量. 【解】(1)由题意,2202x EX x e dx X λλλ+∞-===⎰,从而2ˆXλ=为总体的矩估计量. (2)构造似然函数121211(,,;)(;)nii nnx nn iii i L x x x f x x eλλλλ=-==∑==⋅∏∏L .取对数11ln 2ln ln nniii i L n x x λλ===+-∑∑.令ln 0d L d λ=,有120n i i n x λ=-=∑,故λ的最大似然估计值为1122ˆ1nn i i i i n x x n λ====∑∑ 故其最大似然估计量为122ˆ1ni i XX n λ===∑. 9、【04.3.13】设随机变量X 的分布函数为1(),(,,)0,x F x xx βαααβα⎧->⎪=⎨⎪≤⎩,其中参数0,1αβ>>,设12,,n X X X L 为来自总体X 的简单随机样本.(1)当1α=时,求未知参数β的矩估计量; (2)当1α=时,求未知参数β的最大似然估计量; (3)当2β=时,求未知参数α的最大似然估计量.【解】当1α=时,X 的概率密度为1,1(,)0,1x f x x x βββ+⎧>⎪=⎨⎪≤⎩(1)由于11(,)1EX xf x dx x dx xβββββ+∞+∞+-∞==⋅=-⎰⎰令1X ββ=-,解得1XX β=- 从而得未知参数β的矩估计量为ˆ1XX β=-. (2)对于总体X 的样本值12,,n x x x L ,似然函数为1121,1(1,2,)()(;)()0,nni i n i x i n L f x x x x ββββ+=⎧>=⎪==⎨⎪⎩∏L L 其他当1(1,2,)i x i n >=L 时,()0L β>,取对数得1ln ()ln (1)ln ni i L n x βββ==-+∑对β求导数,得似然方程1[ln ()]ln 0ni i d L n x d βββ==-=∑ 解得 1ln nii nxβ==∑,于是β的最大似然估计量为1ˆln nii nXβ==∑.(3)当2β=时,X 的概率密度为232,(,)0,x f x x x ααβα⎧>⎪=⎨⎪≤⎩对于总体X 的样本值12,,n x x x L ,似然函数为231212,(1,2,)()(;)()0,n nni i n i x i n L f x x x x ααββ=⎧>=⎪==⎨⎪⎩∏L L 其他当(1,2,)i x i n α>=L 时,α越大,()L α越大,即α的最大似然估计值为12ˆmin{,,}n x x x α=L . 于是α的最大似然估计量为12ˆmin{,,}n X X X α=L . 10、【03.1.8】设总体X 的概率密度函数为2()2,(,)0,x e x f x x θθθθ--⎧>=⎨≤⎩,其中0θ>为未知参数.从总体X 中抽取简单随机样本12,,n X X X L ,记12ˆmin(,,)nX X X θ=L . (1)求总体X 的分布函数()F x ;(2)求统计量ˆθ的分布函数ˆ()F x θ; (3)如果用ˆθ作为θ的估计量,讨论它是否具有无偏性. 【解】(1)2()1,()()0,x xe x F xf t dt x θθθ---∞⎧->==⎨≤⎩⎰(2)ˆ12ˆ(){}{min(,,)}nF x P x P X X X x θθ=≤=≤L 12121{min(,,)}1{,,}n n P X X X x P X x X x X x =->=->>>L L2()1,1[1()]0,n x ne x F x x θθθ--⎧->=--=⎨≤⎩(3)ˆθ概率密度为 2()ˆˆ()2,()0,n x dF x ne x f x dx x θθθθθ--⎧>==⎨≤⎩因为 2()ˆ01ˆ()22n x E xf x dx nxe dx nθθθθθ+∞+∞---∞===+≠⎰⎰ 所以ˆθ作为θ的估计量不具有无偏性. 11、【07.1.11】设总体X 的概率密度为1,021(,),12(1)0,x f x x θθθθθ⎧<<⎪⎪⎪=≤≤⎨-⎪⎪⎪⎩其他,其中(01)θθ<<是未知参数,12,,n X X X L 为来自总体的简单随机样本,X 是样本均值.(1)求参数θ的矩估计量ˆθ; (2)判断24X 是否为2θ的无偏估计量,并说明理由. 【解】(1)10(,)22(1)x xEX xf x dx dx dx θθθθθ+∞-∞==+-⎰⎰⎰11(1)4424θθθ=++=+. 令124X θ+=,其中11n i i X X n ==∑,解方程得θ的矩估计量为:1ˆ22X θ=-. (2) 2222(4)4()4[()]4[()]DXE X E X DX E X E X n==+=+ 而22122(,)22(1)x x EX x f x dx dx dx θθθθθ+∞-∞==+-⎰⎰⎰22221111()()()36624DX E X E X θθθ=-=++-+211366θθ=++2115121248θθ=-+. 故2222313135(4)4[()]312DX n n n E X E X n n n nθθθ+-+=+=++≠所以24X 不是2θ的无偏估计量.12、【(3).11】设12,,n X X X L 是总体2(,)N u σ的简单随机样本,记11n i i X X n ==∑,2211()1n ii S X X n ==--∑,221T X S n=- (1) 证T 是2u 的无偏估计量; (2) 当0,1u σ==时,求DT .【分析】(1)要证2ET u =;(2)求DT 时,利用2X 与2S 独立性.【解】(1)222211()()()ET E X S E X E S n n=-=- 222222111()()()D X E X E S u u n n nσσ=+-=+-=所以T 是2u 的无偏估计量.(2)当0,1u σ==时,(0,1)X N :,1(0,),0X N ET n=:2222211()()()DT D X S D X D S n n=-=+22222111[(1)](1)D D n S n n n =+-- 22221122(1)(1)(1)n n n n n n =+⋅-=--. 【评注】若2(,)X N u σ:,则22222222111,,,()2(1),((1))n n EX u DX ES D S n S n n σσχσσ--====--:.13、【03.1.4】已知一批零件的长度X (单位cm )服从正态分布(,1)N m ,从中随机地抽取16个零件,得到长度的平均值为40(cm ),则m 的置信度为的置信区间是_____.(注:标准正态分布函数值(1.96)0.975,(1.645)0.95F =F =).【分析】这是一个正态分布方差已知求期望值m 的置信区间问题,该类型置信区间公式为(,)I x x=-+ 其中l 由{||}0.95P U l <=确定((0,1)U N :),即 1.96l =,将40,1,16x n s ===及1.96l =代入得到m 的置信度为的置信区间为(,).14、【05.3.13】设12,,(2)n X X X n >L 为来自总体2(0,)N σ的简单随机样本,X 为样本均值,记,1,2,i i Y X X i n =-=L ,求 (1)i Y 的方差,1,2,i DY i n =L ; (2)1Y 与n Y 的协方差1(,)n Cov Y Y ;(3)若21()n c Y Y +是2σ的无偏估计量,求常数c .【解】由题设12,,(2)n X X X n >L 是简单随机样本,因此12,,(2)n X X X n >L 相互独立,且与总体同分布,即22(0,),0,(1,2,)i i i X N EX DX i n σσ===:L .(1)111(1)n i i j i j j iY X X X X n n=≠=-=-+-∑.111()[(1)]n i i j i j j iDY D X X D X X n n=≠=-=-+-∑22222211111(1)1()(1)n n j i j j j ij in n DX DX DX DX n n n n nσ==≠≠--=-+-=+=∑∑. (2)12,,(2)n X X X n >L 相互独立,所以 ,(,),1,2,,0,i i j DX i jCov X X i j n i j L =⎧==⎨≠⎩11(,)(,)n n Cov Y Y Cov X X X X =--11(,)(,)(,)(,)n n Cov X X Cov X X Cov X X Cov X X =--+;2111111111(,)(,)(,)n n i i i i Cov X X Cov X X Cov X X DX n n n nσ======∑∑;类似地, 21(,)n n Cov X X DX n nσ==又因为2DX nσ=,故22221(,)0n Cov Y Y nnnnσσσσ=--+=-.(3)首先计算21()n E Y Y +.由于11()0n n E Y Y EY EY +=+=所以 21111()()2cov(,)n n n n E Y Y D Y Y DY Y Y DY +=+=++22221122(2)n n n n n n nσσσσ---=+-= 若21()n c Y Y +是2σ的无偏估计量,c 应满足下面等式2222112(2)[()][()]n n c n E c Y Y cE Y Y nσσ-=+=+=故 2(2)nc n =-.§习题全解( A )1、设总体X 服从参数为N 和p 的二项分布,n X X X ,,,21Λ为取自X 的一个样本,试求参数p 的矩估计量与极大似然估计量.【解】由题意,X 的分布律为: ()(1),0k N kN P X k p p k N k -⎛⎫==-≤≤ ⎪⎝⎭. 总体X 的数学期望为(1)(1)011(1)(1)1NNk N k k N k k k N N EX k p p Np p p k k ----==-⎛⎫⎛⎫=-=- ⎪ ⎪-⎝⎭⎝⎭∑∑ 1((1))N Np p p Np -=+-=则EXp N=.用X 替换EX 即得未知参数p 的矩估计量为ˆX pN =. 设12,,n x x x L 是相应于样本12,,n X X X L 的样本值,则似然函数为111211(,,;)()(1)nniii i nnx nN x n i i i i N L x x x p P X x p p x ==-==∑∑⎛⎫===⋅- ⎪⎝⎭∏∏L取对数111ln ln ln ()ln(1)nnni i i i i i N L x p nN x p x ===⎛⎫=+⋅+-⋅- ⎪⎝⎭∑∑∑,11ln (1)nni i i i x nN x d L dp p p ==-=--∑∑.令ln 0d L dp =,解得p 的极大似然估计值为 11ˆn i i x n p N==∑. 从而得p 的极大似然估计量为 11ˆni i X X n pN N===∑. 2、设n X X X ,,,21Λ为取自总体X 的一个样本,X 的概率密度为22,0(;)0,xx f x θθθ⎧<<⎪=⎨⎪⎩其它.其中参数0θ>,求θ的矩估计. 【解】取n X X X ,,,21Λ为母体X 的一个样本容量为n 的样本,则2022()3xEX xf x dx x dx θθθ+∞-∞==⋅=⎰⎰32EX θ⇒=用X 替换EX 即得未知参数θ的矩估计量为3ˆ2X θ=. 3、设12,,,n X X X L 总体X 的一个样本, X 的概率密度为⎪⎩⎪⎨⎧≤>=--0,0,0,);(1x x e x x f x αλαλαλ其中0>λ是未知参数,0>α是已知常数,求λ的最大似然估计. 【解】设12,,,n x x x L 为样本12,,,n X X X L 的一组观测值,则似然函数为1()1121(),0(,,,;)0,ni i n x n n i i n i x e x L x x x αλαλαλ=--=⎧∑⎪⋅≥=⎨⎪⎩∏L 其他取对数 11ln ln ln (1)(ln )()n niii i L n n x x αλααλ===++--∑∑.解极大似然方程1ln 0n i i d L n x d αλλ==-=∑,得λ的极大似然估计值为1ˆni i nx αλ==∑.4、设总体X 服从几何分布 ,10,,2,1,)1()(1<<=-==-p k p p k X P k Λ试利用样本值n x x x ,,,21Λ,求参数p 的矩估计和最大似然估计.【解】因11111(1)(1)k k k k EX k p p p k p p∞∞--===⋅-=⋅-=∑∑, 用X 替换EX 即得未知参数p 的矩估计量为1ˆpX=.在一次取样下,样本值12(,,,)n x x x L ,即事件1122{},{},,{}n n X x X x X x ===L 同时发生,由于12,,,nX X X L 相互独立,得联合分布律为121122(,,,;)()(),,()n n n L x x x p P X x P X x P X x ====L L12111(1)(1)(1)n x x x p p p p p p ---=-⋅--L ,即得极大似然函数为1()(1)ni i x nnL p p p =-∑=-取对数 1ln ()ln ()ln(1)ni i L p n p x n p ==+--∑解极大似然方程1ln ()01ni i x nd L p n dp p p=-=-=-∑得p 的极大似然估计值为11ˆ1ni i px n ==∑,从而得p 的极大似然估计量为111ˆ1ni i pXX n ===∑. 5、设总体X 的概率密度为()1;exp ,2x f x σσσ⎧⎫=-⎨⎬⎩⎭0σ>为未知参数, n X X X ,,,21Λ为总体X 的一样本,求参数σ的最大似然估计.【解】设12,,,n x x x L 为样本12,,,n X X X L 的一组观测值,则似然函数为 121111(,,,;)(;)(;)exp{||}(2)nn n ini L x x x f x f x x σσσσσ====-∑L L取对数1211ln (,,,;)ln(2)||nn ii L x x x n x σσσ==--∑L . 解极大似然方程21ln 1||0nii d L n x d σσσ==-+=∑.得σ的极大似然估计值11ˆ||ni i x n σ==∑. 6、证明第5题中σ的最大似然估计量为σ的无偏估计量.【证明】由第5题知σ的最大似然估计量为11ˆ||ni i X n σ==∑ 故 1111ˆ(||)||n ni i i i E E X E X n n σ====∑∑ 又 1||||||exp{}2i x E X x dx σσ+∞-∞=⋅-⎰ 0012exp{}exp{}()2x x x x dx x d σσσσ+∞+∞=⋅-=⋅-⎰⎰00[exp{}|exp{}]x xx dx σσσ+∞+∞=-⋅---=⎰.从而 ˆE σσ=,即ˆσ是σ的无偏估计. 7,、设总体X 的概率密度为()222220;0x x e x f x σσσ-⎧⎪>=⎨⎪⎩,,,其它.,20σ>为未知参数,n X X X ,,,21Λ为总体X 的一个样本,求参数2σ的的矩估计量和最大似然估计量.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无偏估计量:
对于待估参数,不同的样本值就会得到不同的估计值。
这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来衡量。
对此,一个自然而基本的衡量标准是要求估计量无系统偏差。
也就是说,尽管在一次抽样中得到的估计值不一定恰好等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,换句话说,希望估计量的均值(数学期望)应等于未知参数的真值,这就是所谓无偏性(Unbiasedness)的要求。
数学期望等于被估计的量的统计估计量称为无偏估计量。
应用:
在实际应用中,对整个系统(整个实验)而言无系统偏差,就一次实验来讲,可能偏大也可能偏小,实质上并说明不了什么问题,只是平均来说它没有偏差,所以无偏性只有在大量的重复实验中才能体现出来;另一方面,无偏估计只涉及一阶矩(均值),虽然计算简便,但往往会出现一个参数的无偏估计有多个,而无法确定哪个估计量好。
因此,无偏性的作用在于可以把重复估计中的各次误差通过平均来消除。
这并不意味着该估计量在一次使用时并能获得良好的结果。
在具体问题中,无偏性是否合理,应当结合具体情况来考虑。
在有些问题中,无偏性的要求可能会导出不同的结果来。
事实上,X1,X2...,Xn中的每一个均可作为θ的无偏估计量,究竟哪个估计量更合理,就看哪个估计量的观察值更接近真实值,即估
计量的观察值更密集地分布在真实值附近。
而方差能反映随机变量取值的分散程度,所以无偏估计以方差最小者为最好、最合理,为此后人引进了估计量的有效性概念。