概率论与数理统计第七章7-1
概率论与数理统计复习7章
( n − 1) S 2 ( n − 1) S 2 = 1 − α 即P 2 <σ2 < 2 χα 2 ( n − 1) χ1−α 2 ( n − 1) ( n − 1) S 2 ( n − 1) S 2 置信区间为: 2 , χα 2 ( n − 1) χ12−α 2 ( n − 1)
则有:E ( X v ) = µv (θ1 , θ 2 ,⋯ , θ k ) 其v阶样本矩是:Av = 1 ∑ X iv n i =1
n
估计的未知参数,假定总体X 的k阶原点矩E ( X k ) 存在,
µ θ , θ ,⋯ , θ = A k 1 1 1 2 µ2 θ1, θ 2 ,⋯ , θ k = A2 用样本矩作为总体矩的估计,即令: ⋮ µ θ , θ ,⋯ , θ = A k k k 1 2 ɵ ɵ ˆ 解此方程即得 (θ1 , θ 2 ,⋯ , θ k )的一个矩估计量 θ 1 , θ 2 ,⋯ , θ k
+∞
−∞
xf ( x ) dx = ∫ θ x θ dx =
1 0
令E ( X ) = X ⇒
θ +1
θ
ˆ = X ⇒θ =
( )
X 1− X
θ +1
2
θ
7.2极大似然估计法
极大似然估计法: 设总体X 的概率密度为f ( x,θ ) (或分布率p( x,θ )),θ = (θ1 ,θ 2 ,⋯ ,θ k ) 为 未知参数,θ ∈ Θ, Θ为参数空间,即θ的取值范围。设 ( x1 , x2 ,⋯ , xn ) 是 样本 ( X 1 , X 2 ,⋯ , X n )的一个观察值:
i =1 n
概率论与数理统计第7章参数估计PPT课件
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
《概率论与数理统计》第七章假设检验.
《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。
能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。
参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。
当然由于样本的随机性,这种推断只能具有⼀定的可靠性。
本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。
由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。
第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。
例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。
现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。
问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。
灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。
即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。
另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。
这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。
究竟是哪种情况与实际情况相符合,这需要作检验。
假如给定显著性⽔平05.0=α。
在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。
概率论与数理统计(理工类,第四版)吴赣昌主编课后习题答案第七章
写在前面:由于答案是一个个复制到word rh,比校耗时耗力,故下载收取5分・希望需要的朋友给予理解和支持!PS网上有一些没经我同总就将我的答案整合、转换成pdf,放在文库里的.虽然是免费的.但是窃取f我的劳动成果,希望有心的朋友支持我一下.下载我的原版答案。
第七章假设检验假设检验的基本談念习题1 样木容fin确定后,在一个假设检验中•给定显著水平为*设此第一类错的概率为。
•则必有()•(A)a+p=l; (B)a+p>l; (C)a+p<l; {D)a+p<2.解答: 应选(D)・当样木容Sn确定后.aQ不能同时都很小.即a变小时,p变大:而P变小时• a变大.理论上,自然希望犯这两类错误的概率都很小・但a*的大小关系不能确定.并且这两类错谋不能同时发生,即a=l且p=l不会发生.故选(D).习題2设总休X^(g,a2b其中02已知,着要检验W需川统计a U=X"-gOa/n,(1)若对敢边检验,统计假设为则拒绝区间为(2)若肌边假设为H0:g=g0,Hl:n<^0,则拒绝区间为. (给定显着性水平为4样木均值为X•,样木容fi 为n,且可记ul・a为标准正态分布的(l・a)分位数).解答:由敢侧检验及拒绝的概念即可御到.习題3 如何理解假设检验所作出的〃拒绝原假设H0"和“接受原假设Hcr的判断解答:拒绝H0是有说服力的,接受H0是没有充分说服力的•因为假设检验的方法是概率性质的反证法.作为反证法就是必然要〃推出矛盾r才能得出"拒绝HO"的结论.这是有说服力的・如果“推不出矛盾化这时只能说〃目前还找不到拒绝H0的充分理由W此“不拒绝H0”或〃接受HCr\这并没有肯定H0—定成立•由于样木观察值是随机的• W此拒绝H0.不童味着H0是假的•接受H0也不意味着H0是真的•都存在着错误决策的可能.当原假设H0为真,而作出r拒绝H0的判断,这类决策错谋称为第一类错谋.又叫弃真错洪•显然犯这类错渓的概率为前述的小槪率a:a=P(拒绝HOIHO为真);而原假设HO不真•却作出接受H0的判断•称这类错误为第二类错误,又称取伪错误.它发生的槪率P为P二P(接受HO|H0不真).习題4 犯第一类错误的概率a与犯第二类错谋的概率P之间有何关系一般來说.当样木容g固定时,若减少犯一类错误的槪率.则犯另一类错渓的概率往往会增大•要它们同时减少,只有増加样木容a n.在实际问题中,总是控制犯節一类错误的概率a而使犯第二类错谋的概率尽可能小・a的大小视具体实际问题而定.通常取a弓等tfL 习題5 在假设检验中•如何理解指定的显著水平a 解答:我们希望所作的检验犯两类错谋的槪率尽可能都小・但实际上这是不可能的•当样木容Sn固定时,一般地•减少犯其中一个错谋的槪帑就会增加犯另一个错误的概率• W此,通常的作法是只要求犯第一类错误的概率不大于指定的显著水平6因而根据小概率原理,最终结论为拒绝H0较为可靠,而最终判断力接受H0则不大可靠,«原因是不知道犯第二类错误的概率P处竟有多少.且a小,P就大.所以通常用JW 相容r 〃不拒绝HO"等词语來代替“接受H0".而"不拒绝HO"还包含有再进一步作抽样检验的意思.习题6 在假设检验中•如何确定原假设H0和备择假设H1 解答: 在实际中・通常把那些需要着重考虑的假设视为原假设H0.而与之对应的假设视为备择假设H1.(1)如果问题是要决定新方案是否比原方案好,往往将原方案取假设.而将新方案取为备择假设:(2)若提出一个假设・检验的目的仅仅是为r判断这个假设是否成立.这时直接取此假设为原假设H0即可. 习題7 假设检验的基木步腺有哪些解答:根据反证法的思想和小概率原理•可将假设检验的步骤归纳如下:(1)根据问题的要求.提出原理假设H0和备择假设HL (2)根据检验对紀构造检验统计gT(Xl,X2宀Xn),使肖H0为真时汀有确定的分布.(3)由给定的显著水平6直统计址T所服从的分布表,定出临界值K使P{ 1 T I >A)=a,或P(T>M)=P(T<X2)=a/2,从而求出H0的拒绝域:I T I >入或T>MJ<X2,(4)由样木观察值计算统i|・fi T的观察值t(5)作出判断,将t的值与临界值比较大小作出结论:当tW拒绝域g时,则拒绝H0.否则,不拒绝H0.即认为在显著水平a下,H0与实际悄况差界不显著.习題8 假设检验与区间估il•有何异同解答:假设检验与区间估ii•的提法虽不同,但解决问题的途径是相通的.参数0的a信水平为i・a的a信区间对应于双边假设检验在駄着性水平a下的接受域:参数e的a信水平为1-a的爪侧置信区对应于爪边假设检验在显著性水平a下的接受域.在总休的分布已知的条件下•假设检验与区间估计是从不同的角度回答同一个问題•假设检验是判别原假设H0是否成立,而区间估计解决的是“多少"(或范前者是宦性的.后者是定fi的.习题9 某天开工时,需检验自动包装工作是否正常•根据以往的经验,其装包的质a在正常情况下服从正态分布N(100,仲位:kg).现抽测了9包,其质S为:问这天包装机工作是否正常将这一问题化为假设检验问题.写出假设检验的步驟(am 解答: ⑴提出假设检验问题H0:尸100, Hl:"100;(2)选取检验统il S U:U=X; HO成立时,UW((U);(3)a=,ua/2=,拒绝域W={ 1 u 1 >};(4))f勺I u I =. hM 1 u I <ua/2=,故接受HO,认为包装机.I:作正常.设总休X^(pJbXl,X2/7Xn是取自X的样木.对于假设检验HO:|i=O'Hl:pMO,取显著水平a,拒绝域为W={ i U i >ua/2b其中u=nX-,求:H0成立时,犯第一类错误的槪率aO;(2)十HO不成立时(若"0),犯第二类错的概率p.(l)X^(H4)/X'MM(g,l/n),故nX'=uMM(O,l). a0=P{ I u I >ua/2 I g=0}=l-P{-ua/2<u<ua/2}=1-[<D(ua/2)-(D(-ua/2)]=l-[(l-a2)-a2]=a,即犯第一类错误的概率是显著水平a.(2)F H0不成立.即PMO时.犯第二类错误的概率为P=P{ I U I 30/2 I E(X)=n}=P{・uct/2<u<ua/2 I E(X)=A}=P{-ua/2<nX'<ua/2 I E(X)=|i}=P{-ua/2-nn<n(X'-n)<ua/2-nn I E(X)=n}=(I)(ua/2-niJi)-®(-ua/2-nn),注1 '^1 H T+8或时,PTO.由此可见.当实际均值H偏离原假设校大时,犯第二类错误的概率很小.检验效果较好.注2!勺卩工0但接近于0时.Pdw.Wa很小.故犯第一娄错误的概率很大.检验效果较差.单正态总体的假设检験习题1 已知某炼铁厂铁水含碳量服从正态分布N,・现在测定r 9炉铁水•其平均含碳虽为•如果估计方差没有变化.可否认为现在生产的饮水平均含碳fi仍为(a=解答^ 木问题是在a二下检验假设HO:ns由r a2=已知,所以可选取统计sU=X •在HO 成立的条件下• UW(OJ),且此检验问题的拒绝域为I U 1 = I X •这里 说明U 没有落在拒绝域中.从而接受H0.即认为现在生产之饮水平均含碳S 仍为•习題2要求一种元件平均便用寿命不斜低于1000小肘,生产者从一批这种元件中随机抽取25件,测御其寿命的 平均值为950小时.已知该种元件寿命服从标准差为0=100小时的正态分布,试在显著性水平(1=卜确定 这批元件是否合格设总体均值为卩川未知.即需检验假设H0:H >1000,H1:H <1000.解答:检验假设 HO :n>1000,Hl :n<1000.这是飛边假设检验问题.由于方差02二,故用U 检验法.对于显着性水平a 二,拒绝域为W={X"-1000a/n<-ua.査标准正态分布表•得 又知n=25X=950,故可计算出x'-1000a/n=950-1000100/25=,因为&故在a=下拒绝H0,认为这批元件不合格.习题3 打包机装糖入包,每包标准重为100kg.毎天开工后,要检验所装糖包的总体期望值是否合乎标准 (100kg)•某日开工后.测御9包糖重如下位:kg):打包机装糖的包得服从正态分布•问该天打包机1:作是否正常(a 二 解答: 木问题是在a 二下检验假设HO:p=100,Hl :"100・由于02未知.所以可选取统讣fi T=X--100S/n,在HO 成立的条件下.W(n-1K 且此检验问題的拒绝域为I T I = 1 X'-lOOS/n I >ta/2(n-l).I t 1 =<=(8),即t 未落在拒绝域中・从而接受H0,即可以认为该天打包工作正常.习題4机器包装食盐.假设毎袋盐的净重服从正态分布•规定毎俊标准含fi 为500g,标准差不斜趙过lOg •某天开 工后•随机抽取9袋.测得浄重如下仲位:g):497, 507, 510, 475, 515, 484, 488, 524, 491,I U I =<=ua/2・这里 t=x"-100s/ns :试在駄著性水平a二下检验假设:HO:n=500,Hl:n#500,解答:x'=499,ss:,n=9,t=(x~-|jiO)sn==,a=, (8)=.Will <(8b故接受HO,认为该天每袋平均质a可视为500g・习«5从清凉饮料自动售货机・随机抽样36杯,其平均含g为219(mL),标准差为/在a二的显I?性水平下・试检验假设S HO:A=|I O=222,H1:H<M=222・解答: 设总休X-W(g,a2bX代表自动售货机售出的清凉饮料含S・检验假设H0:n=n0=222(mL), Hl:n<222(mL),由asn=36,査表毎(36・1)弓拒绝域为W={t=x'-nOs/n<-ta(n-l).il•算t值并判断:t=36»习題6 某种寻线的电阻服从正态分布N(x・今从新生产的一批导线中抽取9根・测«电阻•得s=Q,对于a®能否认为这批导线电阴的标准差仍为解答:木问题是在a二下检验假设H0:a2=, Hl:o2匕选取统计fi x2=n-la2S2,在HO成立的条件下,X2^2(n-1),且此检验问題的拒绝域为X2>xa/22(n-l)或x2<xl-a/22(n-l).这里X2==x=,X(8)=,x(8)-落在拒绝域中,从而拒绝HO,即不能认为这批导线电阻的标准差仍为.习题7某厂生产的铜线,要求其折断力的方差不超过16N2.今从某日生产的铜丝中随机抽取容fi为9的样木•测得其折断力如下(飛位:N):289, 286, 285, 286, 285, 284, 285, 286, 298, 292设总体服从正态分布,问该日生产的铜线的折斷力的方差是否符合标准(a二解答: 检验问題为n=9, s2勺X2=8XS216勺am X(8)=・因X2<X(8)s故接受HO,可认为铜丝的折断力的方差不超过16N2.习题8过去经验示.商三学生完成标准考试的时间为一正态变其标准差为6min.若随机样木为20位学生, 其标准差为X,试在显着性水平a= b\检验假设:H0:a>6,Hl:a<6,解答:HO:a>6,Hl:a<6,a=,n-l=19,ssx(19)-拒绝域为W={x2<},i l•算X2值X2=(20-l)x^.因为>■故接受H0,认为a>6.习題9测定某种潯液中的水分・它的10个测定值给出*%,设测定值总体服从正态分布.02为总休方差.02未知,试在a二水平下检验假设:在a= b\拒绝域为W={(n-l)S2a02<xl-a2(9).查X2分布表得X(9)m讣算得(n-l)s2o02=(10-l)x\per)2\per)2^>,未落入拒绝域•故接受H0.取正态总体的假设检越习題1制造厂家宜称•线A的平均张力比线B至少强120N,为证实其说法.在同样情况下测试两种线各50条.线A的平均张力x-=867N,标准差为01=;而线B的平均张力为y・=778N,标准差为o2m在a二的显善性水平下,试检验此制造厂家的说法.解答:H0:nl4l2=120,Hl:pl 屮2<120・am=・W={u=x'-y~-120ol2nl+a22n2<-ua,拒绝域为由x'=867,y'=778,nl=n2=50, 012=2,o22=2,得□=867-778-120250+250^^^,因为&故拒绝H0,认为pl-rx2<120,即厂家的说法不对.习题2 欲知某新血清是否能抑制白血球过多症,选择已患该病的老畝9只•并将其中5只施予此种血清,另外4 只则不热•从实验开始.其存活年限表示如下假设两总体均服从方差相同的正态分布,试在显著性水平a二下检验此种血清是否有效解答^ 设pl- p2分别为老鼠接受和未接受血清的平均存活年限。
《概率论与数理统计》7
未知参数 , ,, 的函数.分别令
12
k
L(1,,k ) 0,(i 1,2,...,k)
或令
i
ln L(1,,k ) 0,(i 1,2,...,k)
i
由此方程组可解得参数 i 的极大似然估计值 ˆi.
例5 设X~b(1,p), X1, X2 , …,Xn是来自X的一个样本,
求参数 p 的最大似然估计量.
解 E( X ) ,E( X 2 ) D( X ) [E( X )]2 2 2
由矩估计法,
【注】
X
1
n
n i 1
X
2 i
2
2
ˆ X ,
ˆ
2
1 n
n i 1
(Xi
X )2
对任何总体,总体均值与方差的矩估计量都不变.
➢常见分布的参数矩估计量
(1)若总体X~b(1, p), 则未知参数 p 的矩估计量为
7-1
第七章
参数估计
统计 推断
的 基本 问题
7-2
参数估 计问题
(第七章)
点估计 区间估 计
假设检 验问题 (第八章)
什么是参数估计?
参数是刻画总体某方面概率特性的数量.
当此数量未知时,从总体抽出一个样本, 用某种方法对这个未知参数进行估计就 是参数估计.
例如,X ~N ( , 2),
若, 2未知, 通过构造样本的函数, 给出
k = k(A1, A2 , …, A k)
用i 作为i的估计量------矩估计量.
例1 设总体X服从[a,b]上的均匀分布,a,b未知,
X1, X2 , …,Xn为来自总体X的样本,试求a,b的 矩估计量.
解 E(X ) a b , D(X ) (b a)2
《概率论与数理统计》第7章作业题
第七章
(2)
1 x x 0
1
1
dx
2
1
0
1 由此得 1 , 在上式中以 X 1
x dx , 1
代替1 ,
得到 的矩估计量和矩估计值分别为:
X x ˆ ˆ . 1 X , 1 x
解 由题设可得 1-2 的一个置信水平为1- 的置信区间为
第七章
1 1 ( X Y ) t 2 ( n1 n2 2) S w n1 n2
由题设1- = 0.95, /2 = 0.025, n1 = 4, n2 = 5, n1+ n2-2 = 7,查表和计算得
x1 0.14125,
3s12 0.00002475,
x2 0.1392,
2 2 3 s 4 s 2 2 1 2 4s2 0.0000208, s 2 ( 0 . 00255 ) w 7 t 2 (n1 n2 2) t 0.025 (7) 2.3646, x1 x2 0.00205,
1 0.95,n A n B 10 F (n A - 1, n B - 1) F0.025(9,9) 4.03,
2
1 F (n A - 1, n B - 1) F0.975(9,9) 14.03 2
第七章
2 2 / 故方差比 A B
得 1-2 的一个置信水平为0.95的置信区间为
1 1 ( x1 x2 ) t 2 ( n1 n2 2) s w n1 n2 1 1 0 . 00205 2 . 3646 0 . 00255 4 5 (0.002 0.004) (0.002,0.006).
概率论与数理统计课后习题答案 第七章
习题 7.2 1. 证明样本均值 是总体均值
证:
的相合估计
由定理
知 是 的相合估计
2. 证明样本的 k 阶矩
是总体 阶矩
证:
的相合估计量
3. 设总体 (1)
(2)
是
的相合估计
为其样品 试证下述三个估计量
(3)
都是 的无偏估计,并求出每一估计量的方差,问哪个方差最小? 证:
都是 的无偏估计
故 的方差最小.
大?(附
)
解: (1) 的置信度为 的置信区间为
(2) 的置信度为 故区间长度为
的置信区间为
解得
四、某大学从来自 A,B 两市的新生中分别随机抽取 5 名与 6 名新生,测其身高(单位:厘米)后,算的
.假设两市新生身高分别服从正态分布:
,
其中 未知 试求
的置信度为 0.95 的置信区间.(附:
解:
.从该车床加工的零件中随机抽取
4 个,测得长度分别为:12.6,13.4,12.8,13.2.
试求: (1)样本方差 ;(2)总体方差 的置信度为 95%的置信区间.
(附:
解: (1)
(2) 置信度 的置信区间为
三、设总体
抽取样本
为样本均值
(1) 已知
求 的置信度为 的置信区间
(2) 已知
问 要使 的置信度为 的置信区间长度不超过 ,样本容量 n 至少应取多
施磷肥的
620 570 650 600 630 580 570 600 600 580
设不施磷肥亩产和施磷肥亩产均服从正态分布,其方差相同.试对施磷肥平均亩产与不施磷肥平均
亩产之差作区间估计(
).
解:
查表知
概率论与数理统计教程(茆诗松)第7章
第七章 假设检验
第18页
对单侧检验 H0 : 0 vs H1 : 0是类似的, 只是拒绝域变为: W {u u1 } 其势函数为 g n 0 u 对双侧检验问题(7.2.3),拒绝域为 W { u u1 2} 其势函数为
5(c 110) g (110) 0.05 4
成立即可。这给出c 的值为 c 110 0.8u0.05 110 0.8 1.645=108.684 检验的拒绝域为 W {x 108.684}
16 July 2013
华东师范大学
第七章 假设检验
第七章 假设检验
第1页
第七章 假设检验
§7.1 §7.2 §7.3 §7.4 假设检验的基本思想与概念 正态总体参数假设检验 其它分布参数的假设检验 分布拟合检验
16 July 2013
华东师范大学
第七章 假设检验
第2页
§7.1
假设检验的基本思想与概念
7.1.1 假设检验问题
例7.1.1 某厂生产的合金强度服从 N ( ,16),其中 的设计值 为不低于110(Pa)。为保证质量,该 厂每天都要对生产情况做例行检查,以判断生 产是否正常进行,即该合金的平均强度不低于 110(Pa)。某天从生产中随机抽取25块合金,
x 0 u / n
三种假设的拒绝域形式分别见下图:
16 July 2013
华东师范大学
第七章 假设检验
第15页
W {u c}
W {u c} W {u c1 或 u c2}
(a) H1 : 0
16 July 2013
(b) H1 : 0
概率论与数理统计教程第七章答案
.第七章假设检验7.1设总体J〜N(4Q2),其中参数4, /为未知,试指出下面统计假设中哪些是简洁假设,哪些是复合假设:(1) W o: // = 0, σ = 1 ;(2) W o√∕ = O, σ>l5(3) ∕70:// <3, σ = 1 ;(4) % :0< 〃 <3 ;(5)W o :// = 0.解:(1)是简洁假设,其余位复合假设7.2设配么,…,25取自正态总体息(19),其中参数〃未知,无是子样均值,如对检验问题“0 :〃 = 〃o, M :4工从)取检验的拒绝域:c = {(x1,x2,∙∙∙,x25)r∣x-χ∕0∖≥c},试打算常数c ,使检验的显著性水平为0. 05_ Q解:由于J〜N(〃,9),故J~N(",二)在打。
成立的条件下,一/3 5cP o(∖ξ-^∖≥c) = P(∖ξ-μJ^∖≥-)=2 1-Φ(y) =0.05Φ(-) = 0.975,-= 1.96,所以c=L176°3 37. 3 设子样。
,乙,…,25取自正态总体,cr:已知,对假设检验%邛=μ0, H2> /J。
,取临界域c = {(X[,w,…,4):片>9)},(1)求此检验犯第一类错误概率为α时,犯其次类错误的概率夕,并争论它们之间的关系;(2)设〃o=0∙05, σ~=0. 004, a =0.05, n=9,求"=0.65 时不犯其次类错误的概率。
解:(1)在儿成立的条件下,F~N(∕o,军),此时a = P^ξ≥c^ = P0< σo σo )所以,包二为册=4_,,由此式解出c°=窄4f+为% ∖∣n在H∣成立的条件下,W ~ N",啊 ,此时nS = %<c°) = AI。
气L =①(^^~品)二①匹%=①(2δξ^历σoA∣-σ+A)-A-------------- y∕n)。
东华大学《概率论与数理统计》课件 第七章 假设检验
1. 2为已知, 关于的检验(U 检验 )
在上节中讨论过正态总体 N ( , 2 ) 当 2为已知时, 关于 = 0的检验问题 :
假设检验 H0 : = 0 , H1 : 0 ;
我们引入统计量U
=
− 0 0
,则U服从N(0,1)
n
对于给定的检验水平 (0 1)
由标准正态分布分位数定义知,
~
N (0,1),
由标准正态分布分位点的定义得 k = u1− / 2 ,
当 x − 0 / n
u1− / 2时, 拒绝H0 ,
x − 0 / n
u1− / 2时,
接受H0.
假设检验过程如下:
在实例中若取定 = 0.05, 则 k = u1− / 2 = u0.975 = 1.96, 又已知 n = 9, = 0.015, 由样本算得 x = 0.511, 即有 x − 0 = 2.2 1.96,
临界点为 − u1− / 2及u1− / 2.
3. 两类错误及记号
假设检验是根据样本的信息并依据小概率原
理,作出接受还是拒绝H0的判断。由于样本具有 随机性,因而假设检验所作出的结论有可能是错
误的. 这种错误有两类:
(1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称做第一类错误, 又叫弃
设 1,2, ,n 为来自总体 的样本,
因为 2 未知, 不能利用 − 0 来确定拒绝域. / n
因为 Sn*2 是 2 的无偏估计, 故用 Sn* 来取代 ,
即采用 T = − 0 来作为检验统计量.
Sn* / n
当H0为真时,
− 0 ~ t(n −1),
Sn* / n
由t分布分位数的定义知
概率论与数理统计第七章-精品
湖南商学院信息系 数学教研室
第七章 参数估计
第一节 第二节
第三节 第四节 第五节
矩估计 极大似然估计
估计量的优良性准则 正态总体的区间估计(一) 正态总体的区间估计(二)
总体是由总体分布来刻画的.
总体分布类型的判断──在实际问题中, 我们根据问题本身的专业知识或以往的经验 或适当的统计方法,有时可以判断总体分布 的类型.
即
uX
2 2
1 n n i1
Xl2
求解得
u ˆˆ2 Xn 1i n1Xl2X2n 1i n1( XiX)2
∴均值,方差2的矩估计是:
uˆˆ 2Xn1
n
(Xi
i1
,2)两个未知参
两点说明:
1、求似然函数L( ) 的最大值点,可以应
用微积分中的技巧。由于ln(x)是x的增函
数,lnL( )与L( )在 的同一值处达到 它的最大值,假定是一实数,且lnL( ) 是 的一个可微函数。通过求解所谓“似 然方程”: dlnL() 0
d
可以得到 的MLE .
(1) 由总体分布导出样本的联合概率函数 (或联合密度);
(2) 把样本联合概率函数(或联合密度)中自变
量看成已知常数,而把参数 看作自变量, 得到似然函数L( ); (3) 求似然函数L( ) 的最大值点(常常转化 为求ln L()的最大值点) ,即 的MLE;
(4) 在最大值点的表达式中, 用样本值代入 就得参数的极大似然估计值 .
Var(X-)= 2
即 E(X)=
Var(X)= 2
即 E(X)=
Var(X)= 2
令 X
2
概率论与数理统计(第三版)课后答案习题7
第七章 参数估计1. 解 )1()(,)(),,(~p np X D np X E p n B X -==∴⎩⎨⎧=-=⎩⎨⎧==22)1(,)()(B p np X np B X D X X E 即由解之,得n,p 的矩估计量为XB p B X X n 2221,-=⎥⎥⎦⎤⎢⎢⎣⎡-=∧∧注:“[ ]”表示取整。
2. 解 因为:220)(22)(1)1()(1)()(λλθλλθλθλθλ++=⋅=+=⋅==⎰⎰⎰∞+--∞+--∞+∞-dx e x x E dx e x dx x xf x E x x所以,由矩估计法得方程组: ⎪⎩⎪⎨⎧++=+=2221)1(1λλθλθA X 解得λθ,的矩估计量为 ⎪⎩⎪⎨⎧=-=∧∧221B B X λθ3. 解 (1) 由于 222)]([)()(X E X E X D -==σ令 ∑===n i iX n A X E 12221)( 又已知 μ=)(X E故 2σ的矩估计值为 ∑∑==∧-=-=-=n i i n i i X n X n A 12122222)(11μμμσ(2) μ已知时,似然函数为:⎭⎬⎫⎩⎨⎧--⋅=∑=-ni in x L 122222)(21exp )2()(μσπσσ因此∑=---=ni ixn L 12222)(21)2ln(2)(ln μσπσσ令 0)(2112)(ln 124222=-+-=∑=ni ixn L d dμσσσσ解得2σ的极大似然估计为: ∑=∧-=n i i X n 122)(1μσ4. 解 矩估计:λλ=∴=)()(X E X E 令X X E =)(故X =∧λ为所求矩估计量。
注意到 λ=)(X D 若令 2)(B X D =, 可得: 2B =∧λ似然估计:因为λλ-==e k k X P k!)(所以,λ的似然函数为∏=-=ni i xe x L i1!)(λλλ取对数λλλn x x L ni i ni i --=∑∑==11)!ln(ln )(ln令ln 1=-=∑=n xd d ni iλλλ, 解得∑=∧=ni ix n 11λ故,λ极大似然估计量为 X =∧λ5. 解 矩估计:21)1()()(11++=+==⎰⎰+∞+∞-θθθθdx x dx x xf X E令 X X E =)(, 即 X=++21θθ; 解之X X --=∧112θ 似然估计: 似然函数为⎪⎩⎪⎨⎧<<+=⎪⎩⎪⎨⎧<<+=∏∏==其它其它,010,)()1(,010,)1()(11i ni i ni n i i x x x x L θθθθθ 只需求10,)()1()(11<<+=∏=i ni i nx x L θθθ的驻点即可.又∑=++=ni ix n L 11ln )1ln()(ln θθθ令∑=++=ni ix n L d d 11ln 1)(ln θθθ; 解之∑=∧--=ni ixn1ln 1θ6. 解:似然函数为∑===---=-=---∏∏ni i i xn i i n ni x i ex ex L 12222)(l n 21112212)(l n 12)()2(21),(μσσμπσσπσμ取对数得 ∑----===∏n i ini i x x n L 122122)(l n 21)l n ()2l n (2),(ln μσπσσμ由 0)(l n 2112),(ln 0)1()(ln 221),(ln 124222122=∑-+⋅-=∂∂=∑-⋅--=∂∂==n i i n i i x n L x L μσσσμσμσσμμ联立解之,2,σμ的极大似然估计值为 ∑∑-=∑===∧=∧n i n i i in i i x n x n x n 12121)ln 1(ln 1,ln 1σμ7. 解:似然函数为 n i x x e ax L i i n i x a i ai ,,2,1;0,00,)(11 =⎪⎩⎪⎨⎧≤>=∏=--λλλ只需求∑⋅===--==--∏∏ni ai ai x a n i n n ni x a i ex a eax L 111111)()(λλλλλ的最值点。
《概率论与数理统计》课件 第七章 随机变量的数字特征
i 1,2, , 如果 xi pi , 则称 i 1 E( X ) xi pi 为随机变量X的数学期望; i 1
或称为该分布的数学期望,简称期望或均值.
(2)设连续随机变量X的密度函数为p( x),
如果
+
x p( x)dx ,
则称
-
E( X ) xp( x)dx 为随机变量X的数学期望.
5
例2.求二项分布B(n, p)的数学期望.
P(X
k)
n!
k!n
k !
pk
(1
p)nk ,k
1, 2,
, n.
n
解:EX kP{ X k}
k0
n
k
k0
n!
k!n
k !
pk
(1
p)nk
n
np
k 1
k
n 1! 1!n
pk1
k!
(1
p)nk
np[ p (1 p)]n1 np.
特别地,若X服从0 1分布,则EX p.
6
例3. 求泊松分布P( )的数学期望.
注:P( X k) k e , k 1, 2, .
k!
解:EX k k e e
k1
e
k1
k0 k !
k1 k 1 !
k1 k 1 !
ee
e x 1 x 1 x2 1 xn [这里,x ]
当 a 450时,平均收益EY 最大.
28
第二节 方差与标准差
29
引例
比较随机变量X、Y 的期望
X3 4 5 Y1 4 7 P 0.1 0.8 0.1 P 0.4 0.2 0.4
01 2 3 4 5 67
概率论与数理统计(理工类,第四版)吴赣昌主编课后习题答案第七章
写在前面:由于答案是一个个复制到word中,比较耗时耗力,故下载收取5分,希望需要的朋友给予理解和支持!PS:网上有一些没经我同意就将我的答案整合、转换成pdf,放在文库里的,虽然是免费的,但是窃取了我的劳动成果,希望有心的朋友支持我一下,下载我的原版答案。
第七章假设检验7.1 假设检验的基本概念习题1样本容量n确定后,在一个假设检验中,给定显著水平为α,设此第二类错误的概率为β,则必有(). (A)α+β=1;(B)α+β>1;(C)α+β<1;(D)α+β<2.解答:应选(D).当样本容量n确定后,α,β不能同时都很小,即α变小时,β变大;而β变小时,α变大.理论上,自然希望犯这两类错误的概率都很小,但α,β的大小关系不能确定,并且这两类错误不能同时发生,即α=1且β=1不会发生,故选(D).习题2设总体X∼N(μ,σ2),其中σ2已知,若要检验μ,需用统计量U=X¯-μ0σ/n.(1)若对单边检验,统计假设为H0:μ=μ0(μ0已知),H1:μ>μ0,则拒绝区间为;(2)若单边假设为H0:μ=μ0,H1:μ<μ0,则拒绝区间为(给定显著性水平为α,样本均值为X¯,样本容量为n,且可记u1-α为标准正态分布的(1-α)分位数).解答:应填(1)U>u1-α;(2)U<uα.由单侧检验及拒绝的概念即可得到.习题3如何理解假设检验所作出的“拒绝原假设H0”和“接受原假设H0”的判断?解答:拒绝H0是有说服力的,接受H0是没有充分说服力的. 因为假设检验的方法是概率性质的反证法,作为反证法就是必然要“推出矛盾”,才能得出“拒绝H0”的结论,这是有说服力的,如果“推不出矛盾”,这时只能说“目前还找不到拒绝H0的充分理由”,因此“不拒绝H0”或“接受H0”,这并没有肯定H0一定成立. 由于样本观察值是随机的,因此拒绝H0,不意味着H0是假的,接受H0也不意味着H0是真的,都存在着错误决策的可能.当原假设H0为真,而作出了拒绝H0的判断,这类决策错误称为第一类错误,又叫弃真错误,显然犯这类错误的概率为前述的小概率α:α=P(拒绝H0|H0为真);而原假设H0不真,却作出接受H0的判断,称这类错误为第二类错误,又称取伪错误,它发生的概率β为β=P(接受H0|H0不真).习题4犯第一类错误的概率α与犯第二类错误的概率β之间有何关系?解答:一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往会增大.要它们同时减少,只有增加样本容量n.在实际问题中,总是控制犯第一类错误的概率α而使犯第二类错误的概率尽可能小.α的大小视具体实际问题而定,通常取α=0.05,0.005等值.习题5在假设检验中,如何理解指定的显著水平α?解答:我们希望所作的检验犯两类错误的概率尽可能都小,但实际上这是不可能的. 当样本容量n固定时,一般地,减少犯其中一个错误的概率就会增加犯另一个错误的概率. 因此,通常的作法是只要求犯第一类错误的概率不大于指定的显著水平α,因而根据小概率原理,最终结论为拒绝H0较为可靠,而最终判断力接受H0则不大可靠,其原因是不知道犯第二类错误的概率β究竟有多少,且α小,β就大,所以通常用“H0相容”,“不拒绝H0”等词语来代替“接受H0”,而“不拒绝H0”还包含有再进一步作抽样检验的意思.习题6在假设检验中,如何确定原假设H0和备择假设H1?解答:在实际中,通常把那些需要着重考虑的假设视为原假设H0,而与之对应的假设视为备择假设H1.(1)如果问题是要决定新方案是否比原方案好,往往将原方案取假设,而将新方案取为备择假设;(2)若提出一个假设,检验的目的仅仅是为了判断这个假设是否成立,这时直接取此假设为原假设H0即可.习题7假设检验的基本步骤有哪些?解答:根据反证法的思想和小概率原理,可将假设检验的步骤归纳如下:(1)根据问题的要求,提出原理假设H0和备择假设H1.(2)根据检验对象,构造检验统计量T(X1,X2,⋯,Xn),使当H0为真时,T有确定的分布.(3)由给定的显著水平α,查统计量T所服从的分布表,定出临界值λ,使P(∣T∣>λ)=α,或P(T>λ1)=P(T<λ2)=α/2,从而求出H0的拒绝域:∣T∣>λ或T>λ1,T<λ2.(4)由样本观察值计算统计量T的观察值t.(5)作出判断,将t的值与临界值比较大小作出结论:当t∈拒绝域量时,则拒绝H0,否则,不拒绝H0,即认为在显著水平α下,H0与实际情况差异不显著.习题8假设检验与区间估计有何异同?解答:假设检验与区间估计的提法虽不同,但解决问题的途径是相通的. 参数θ的置信水平为1-α的置信区间对应于双边假设检验在显著性水平α下的接受域;参数θ的置信水平为1-α的单侧置信区对应于单边假设检验在显著性水平α下的接受域.在总体的分布已知的条件下,假设检验与区间估计是从不同的角度回答同一个问题. 假设检验是判别原假设H0是否成立,而区间估计解决的是“多少”(或范围),前者是定性的,后者是定量的.习题9某天开工时,需检验自动包装工作是否正常. 根据以往的经验,其装包的质量在正常情况下服从正态分布N(100,1.52)(单位:kg).现抽测了9包,其质量为:99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.0,100.5.问这天包装机工作是否正常?将这一问题化为假设检验问题. 写出假设检验的步骤(α=0.05).解答:(1)提出假设检验问题H0:μ=100,H1:μ≠100;(2)选取检验统计量U:U=X¯-1001.59,H0成立时, U∼N(0,1);(3)α=0.05,uα/2=1.96,拒绝域W={∣u∣>1.96};(4)x¯≈99.97,∣u∣=0.06.因∣u∣<uα/2=1.96,故接受H0,认为包装机工作正常.习题10设总体X∼N(μ,1),X1,X2,⋯,Xn是取自X的样本. 对于假设检验H0:μ=0,H1:μ≠0,取显著水平α,拒绝域为W={∣u∣>uα/2},其中u=nX¯,求:(1)当H0成立时, 犯第一类错误的概率α0;(2)当H0不成立时(若μ≠0),犯第二类错误的概率β.解答:(1)X∼N(μ,1),X¯∼N(μ,1/n),故nX¯=u∼N(0,1).α0=P{∣u∣>uα/2∣μ=0}=1-P{-uα/2≤u≤uα/2}=1-[Φ(uα/2)-Φ(-uα/2)]=1-[(1-α2)-α2]=α,即犯第一类错误的概率是显著水平α.(2)当H0不成立,即μ≠0时,犯第二类错误的概率为β=P{∣u∣≤uα/2∣E(X)=μ}=P{-uα/2≤u≤uα/2∣E(X)=μ}=P{-uα/2≤nX¯≤uα/2∣E(X)=μ}=P{-uα/2-nμ≤n(X¯-μ)≤uα/2-nμ∣E(X)=μ}=Φ(uα/2-nμ)-Φ(-uα/2-nμ).注1当μ→+∞或μ→-∞时,β→0.由此可见,当实际均值μ偏离原假设较大时,犯第二类错误的概率很小,检验效果较好.注2当μ≠0但接近于0时,β≈1-α.因α很小,故犯第二类错误的概率很大,检验效果较差.7.2 单正态总体的假设检验习题1已知某炼铁厂铁水含碳量服从正态分布N(4.55,0.1082).现在测定了9炉铁水,其平均含碳量为4.484.如果估计方差没有变化,可否认为现在生产的铁水平均含碳量仍为4.55(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=4.55,H1:μ≠4.55.由于σ2=0.1082已知,所以可选取统计量U=X¯-4.550.108/9,在H0成立的条件下,U∼N(0,1),且此检验问题的拒绝域为∣U∣=∣X¯-4.550.108/9∣>uα/2,这里u=4.484-4.550.108/9≈-1.833,uα/2=1.96.显然∣u∣=1.833<1.96=uα/2.说明U没有落在拒绝域中,从而接受H0,即认为现在生产之铁水平均含碳量仍为4.55.习题2要求一种元件平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时. 已知该种元件寿命服从标准差为σ=100小时的正态分布,试在显著性水平α=0.05下确定这批元件是否合格?设总体均值为μ,μ未知,即需检验假设H0:μ≥1000,H1:μ<1000.解答:检验假设H0:μ≥1000,H1:μ<1000.这是单边假设检验问题. 由于方差σ2=0.05,故用u检验法. 对于显著性水平α=0.05,拒绝域为W={X¯-1000σ/n<-uα.查标准正态分布表,得u0.05=1.645.又知n=25,x¯=950,故可计算出x¯-1000σ/n=950-1000100/25=-2.5.因为-2.5<-1.645,故在α=0.05下拒绝H0,认为这批元件不合格.习题3打包机装糖入包,每包标准重为100kg.每天开工后,要检验所装糖包的总体期望值是否合乎标准(100kg).某日开工后,测得9包糖重如下(单位:kg):99.398.7100.5101.298.399.799.5102.1100.5打包机装糖的包得服从正态分布,问该天打包机工作是否正常(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=100,H1:μ≠100.由于σ2未知,所以可选取统计量T=X¯-100S/n,在H0成立的条件下,T∼t(n-1),且此检验问题的拒绝域为∣T∣=∣X¯-100S/n∣>tα/2(n-1),这里t=x¯-100s/n≈99.978-1001.2122/9≈-0.0544,t0.025(8)=2.306.显然∣t∣=0.0544<2.306=t0.025(8),即t未落在拒绝域中,从而接受H0,即可以认为该天打包工作正常.习题4机器包装食盐,假设每袋盐的净重服从正态分布,规定每袋标准含量为500g,标准差不得超过10g.某天开工后,随机抽取9袋,测得净重如下(单位:g):497,507,510,475,515,484,488,524,491,试在显著性水平α=0.05下检验假设:H0:μ=500,H1:μ≠500.解答:x¯=499,s≈16.031,n=9,t=(x¯-μ0)sn=499-50016.0319=-0.1871,α=0.05,t0.025(8)=2.306.因∣t∣<t0.025(8),故接受H0,认为该天每袋平均质量可视为500g.习题5从清凉饮料自动售货机,随机抽样36杯,其平均含量为219(mL),标准差为14.2mL,在α=0.05的显著性水平下,试检验假设:H0:μ=μ0=222,H1:μ<μ0=222.解答:设总体X∼N(μ,σ2),X代表自动售货机售出的清凉饮料含量,检验假设H0:μ=μ0=222(mL),H1:μ<222(mL).由α=0.05,n=36,查表得t0.05(36-1)=1.6896,拒绝域为W={t=x¯-μ0s/n<-tα(n-1).计算t值并判断:t=219-22214.2/36≈-1.27>-1.6896,习题6某种导线的电阻服从正态分布N(μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s=0.008Ω,对于α=0.05,能否认为这批导线电阻的标准差仍为0.005?解答:本问题是在α=0.05下检验假设H0:σ2=0.0052,H1:σ2≠0.0052.选取统计量χ2=n-1σ2S2,在H0成立的条件下,χ2∼χ2(n-1),且此检验问题的拒绝域为χ2>χα/22(n-1)或χ2<χ1-α/22(n-1).这里χ2=9-10.0052s2=80.0052×0.0082=20.48,χ0.9752(8)=2.18,χ0.0252(8)=17.5.显然χ2落在拒绝域中,从而拒绝H0,即不能认为这批导线电阻的标准差仍为0.005.习题7某厂生产的铜丝,要求其折断力的方差不超过16N2.今从某日生产的铜丝中随机抽取容量为9的样本,测得其折断力如下(单位:N):289,286,285,286,285,284,285,286,298,292设总体服从正态分布,问该日生产的铜线的折断力的方差是否符合标准(α=0.05)?解答:检验问题为H0:σ2≤16,H1:σ2>16,n=9,s2≈20.3611,χ2=8×s216≈10.181,α=0.05,χ0.052(8)=15.507.因χ2<χ0.052(8)=15.507,故接受H0,可认为铜丝的折断力的方差不超过16N2.习题8过去经验显示,高三学生完成标准考试的时间为一正态变量,其标准差为6min.若随机样本为20位学生,其标准差为s=4.51,试在显著性水平α=0.05下,检验假设:H0:σ≥6,H1:σ<6.解答:H0:σ≥6,H1:σ<6.α=0.05,n-1=19,s=4.51,χ0.952(19)=10.117.拒绝域为W={χ2<10.117}.计算χ2值χ2=(20-1)×4.51262≈10.74.因为10.74>10.117,故接受H0,认为σ≥6.习题9测定某种溶液中的水分,它的10个测定值给出s=0.037%,设测定值总体服从正态分布,σ2为总体方差,σ2未知,试在α=0.05水平下检验假设:H0:σ≥0.04%,H1:σ<0.04%.解答:在α=0.05下,拒绝域为W={(n-1)S2σ02<χ1-α2(9).查χ2分布表得χ0.952(9)=3.325.计算得(n-1)s2σ02=(10-1)×(0.037\per)2(0.04\per)2≈7.7006>3.325,未落入拒绝域,故接受H0.sw=(5-1)×(1.971)2+(4-1)×(1.167)25+4-2≈1.674.查表得t0.005(7)=1.895.算得t=2.86-2.075-01.67415+14≈0.699<1.895.因为0.699<1.895,故不拒绝H0,认为此药无效.习题3据现在的推测,矮个子的人比高个子的人寿命要长一些.下面给出美国31个自然死亡的总统的寿命,将他们分为矮个子与高个子2类,列表如下:矮个子总统8579679080高个子总统6853637088746466606078716790737177725778675663648365假设2个寿命总体均服从正态分布且方差相等,试问这些数据是否符合上述推陈出推测(α=0.05)?解答:设μ1,μ2分别为矮个子与高个子总统的平均寿命,则检验问题为H0:μ1≤μ2,H1:μ1>μ2,n1=5,x¯=80.2,s1≈8.585,n2=26,y¯≈69.15,s2≈9.315,sw=4×8.5852+9.315229≈9.218,n1n2n1+n2≈2.048,t=(80.2-69.15)9.218×2.048≈2.455,α=0.05,t0.05(29)=1.6991,因t>t0.05(29)=1.6991,故拒绝H0,认为矮个子总统的寿命比高个子总统寿命长.习题4在20世纪70年代后期人们发现,酿造啤酒时,在麦芽干燥过程中形成致癌物质亚硝基二甲胺(NDMA).到了20世纪80年代初期,人们开发了一种新的麦芽干燥过程,下面给出了分别在新、老两种过程中形成的NDMA含量(以10亿份中的份数计):故拒绝H0,认为新、老过程中形成的NDMA平均含量差大于2.习题5有两台车床生产同一种型号的滚珠. 根据过去的经验,可以认为这两台车床生产的滚珠的直径都服从正态分布. 现要比较两台车床所生产滚珠的直径的方差,分别抽出8个和9个样品,测得滚珠的直径如下(单位:mm).甲车床xi:15.014.515.215.514.815.115.214.8乙车床yi:15.215.014.815.215.015.014.815.114.8问乙车床产品的方差是否比甲车床的小(α=0.05)?解答:以X,Y分别表示甲,乙二车床产品直径.X∼N(μ1,σ12),Y∼N(μ2,σ22),X,Y独立. 检验假设H0:σ12=σ22,H1:σ22<σ22.用F检验法, 在H0成立时F=S12S22∼F(n1-1,n2-1).由已知数据算得x¯≈15.01,y¯≈14.99,s12≈0.0955,s22≈0.0261,n1=8,n2=9,α=0.05.拒绝域为Rα={F>Fα(n1-1,n2-1)}.查F分布表得F0.05(8-1,9-1)=3.50.计算F值F=s12/s22=0.0955/0.0261≈3.66.因为3.66>3.50,故应否定H0,即认为乙车床产品的直径的方差比甲车床的小.习题6某灯泡厂采用一项新工艺的前后,分别抽取10个灯泡进行寿命试验. 计算得到:采用新工艺前灯泡寿命的样本均值为2460小时. 样本标准差为56小时;采用新工艺后灯泡寿命的样本均值为2550小时,样本标准差为48小时. 设灯泡的寿命服从正态分布,是否可以认为采用新工艺后灯泡的平均寿命有显著提高(α=0.01)?解答:(1)检验假设H0:σ12=σ22,H1:σ12≠σ22.应选取检验统计量F=S12/S22,若H0真, 则F∼F(m-1,n-1);对于给定的检验水平α=0.01,查自由度为(9,9)的F分布表得F0.005(9,9)=6.54;已知m=n=10,s1=56,s2=48,由此得统计量F的观察值为F=562/482≈1.36;因为F<F0.005(9,9),所以接受原假设H0,即可认为这两个总体的方差无显著差异.(2)检验假设H0′:μ1=μ2,H1′:μ1<μ2.按上述关于双总体方差的假设检验的结论知这两个总体的方差未知但相等,σ12=σ22,所以应选取检验统计量:T=X¯-Y¯(m-1)S12+(n-1)S22m+n-2(1m+1n),若H0′真,则T∼t(m+n-2);对给定的检验水平α=0.01,查自由度为m+n-2=18的t分布表得临界值计算t值t=z¯-0sz/n=-0.1-00.141/5≈-1.59>-2.776,故接受H0:μz=0,即在α=0.05下,认为两种分析方法所得的均值结果相同.7.4 关于一般总体数学期望的假设检验习题1设两总体X,Y分别服从泊松分布P(λ1),P(λ2),给定显著性水平α,试设计一个检验统计量,使之能确定检验H0:λ1=λ2,H1:λ1≠λ2的拒绝域,并说明设计的理论依据.解答:因非正态总体,故宜用大样统计,设X¯=1n1∑i=1n1Xi,S12=1n1-1∑i=1n1(Xi-X¯)2;Y¯=1n2∑i=1n2Yi,S22=1n2-1∑i=1n2(Yi-Y¯)2.\because(X¯-Y¯)-(λ1-λ2)S12n1+S22n2→N(0,1)∴可选用样本函数u=(X¯-Y¯)-(λ1-λ2)S12n1+S22n2作为拒绝域的检验统计量.习题2设某段高速公路上汽车限制速度为104.6km/h,现检验n=85辆汽车的样本,测出平均车速为x¯=106.7km/h,已知总体标准差为σ=13.4km/h,但不知总体是否服从正态分布. 在显著性水平α=0.05下,试检验高速公路上的汽车是否比限制速度104.6km/h显著地快?解答:设高速公路上的车速为随机变量X,近似有X∼N(μ,σ2),σ=13.4km/h,要检验假设H0:μ=μ0=104.6,H1:μ>104.6.α=0.05,n=85,uα=u0.05=1.645.拒绝域W={u=x¯-μ0σ/n>uα.由x¯=106.7,σ=13.4,μ0=104.6,n=85得u=106.7-104.613.4/85≈1.44<1.645.因为1.44<1.645,所以接受H0,即要α=0.05显著性水平下,没有明显的证据说明汽车行驶快于限制速度.习题3某药品广告上声称该药品对某种疾病和治愈率为90%,一家医院对该种药品临床使用120例,治愈85人,问该药品广告是否真实(α=0.02)?解答:设该药品对某种疾病的治愈率为p,随机变量X为X={1,临床者使用该药品治愈0,反之则X∼b(1,p),问题该归结为检验假设:H0:p=0.9,H1:p≠0.9.由于n=120足够大,可以用u检验法,所给样值(x1,x2,⋯,x120)中有85个1,35个0,所以x¯=1120∑i=1120xi=1120∑i=1851=85120≈0.71,又p0=0.9,以之代入统计量U得U的观察值为∣u∣=∣0.71-0.9∣0.9×0.1120=6.94>u0.01=2.33,故拒绝H0,即认为该药品不真实.习题4一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看8小时电视.”她认为她所领导的学校,学生看电视时间明显小于该数字. 为此,她向她的学校的100名初中学生作了调查,得知平均每周看电视的时间x¯=6.5小时,样本标准差为s=2小时,问是否可以认为这位校长的看法是对的(α=0.05)?解答:检验假设H0:μ=8,H1:μ<8.由于n=100,所以T=X¯-μS/n近似服从N(0,1)分布,α=0.05,u0.05=1.645.又知x¯=6.5,s=2,故计算得t=6.5-82/100=-7.5,否定域W={X¯-8S/n<-u0.05.因为-7.5<-1.645,故否定H0,认为这位校长的看法是对的.习题5已知某种电子元件的使用寿命X(h)服从指数分布e(λ),抽查100个元件,得样本均值x¯=950(h),能否认为参数λ=0.001(α=0.05)?解答:由题意知X∼e(λ),E(X)=1/λ,D(X)=1/λ2,故当n充分大时u=x¯-1/λ1nλ=(x¯-1λ)λn=(λx¯-1)n(0,1).现在检验问题为H0:λ=0.001,H1:λ≠0.001,样本值u=(0.001×950-1)×100=0.5,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即可认为参数λ=0.001(即元件平均合适用寿命为1000h).习题6某产品的次品率为0.17,现对此产品进行新工艺试验,从中抽取400检查,发现次品56件,能否认为这项新工艺显著地影响产品质量(α=0.05)?解答:检验问题为H0:p=0.17,H1:p≠0.17,由题意知⌢p=mn=56400=0.14,u=(⌢p-p0)p0q0n=0.14-0.170.17×0.83×400≈-1.597,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即认为新工艺没有显著地影响产品质量.习题7某厂生产了一大批产品,按规定次品率p≤0.05才能出厂,否则不能出厂,现从产品中随机抽查50件,发现有4件次品,问该批产品能否出厂(α=0.05)?解答:问题归结为在α=0.05下,检验假设H0:p≤0.05,H1:p>0.05.这是一个单侧检验问题,用u检验法,H0的拒绝域为U=X¯-p0p0(1-p0)n>uα.已知n=50,p0=0.05,x¯=450=0.08,代入U的表达式得u=0.08-0.050.05×0.9550≈0.97<uα=u0.05=1.645,故接受H0,即认为这批产品可以出厂.习题8从选区A中抽取300名选民的选票,从选区B中抽取200名选民的选票,在这两组选票中,分别有168票和96票支持所提候选人,试在显著水平α=0.05下,检验两个选区之间对候选人的支持是否存在差异. 解答:这是两个比率的比较问题,待检假设为H0:p1=p2,H1:p1≠p2.由题设知n=300,μn=168,m=200,μm=96,p1=168320=0.56,p2=96200=0.48,p=μn+μmm+n=264500=0.528.U0∼=p1-p2p(1-p)(1n+1m)=0.56-0.480.528×0.472×1120≈1.755,由P{∣U∼∣>1.96}=α=0.05,得拒绝域∣U∼∣>1.96,因为U0∼=1.755<1.96,故接受H0,即两个选区之间无显著差异.7.5 分布拟合检验Ai k概率pi npi频数fi(fi-npi)2(fi-npi)2npiA001/108085250.3125A111/108093169 2.1125A221/108084160.2A331/10807910.0125A441/10807840.05A551/108069121 1.5125A661/108074360.45A771/10807181 1.0125A881/108091121 1.5125A991/108076160.2∑18007.375由于当H0为真时,χ2=∑i=0k(fi-npi)2npi∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r).这里χ2=7.375,查表知χ0.052(10-1-0)=χ0.052(9)=16.9,显然χ2=7.375<16.9=χ0.052(9),即χ2未落在拒绝域中,所以接受H0,即认为这个正20面体是由均匀材料制面的.习题2根据观察到的数据疵点数0 1 2 3 4 5 6频数fi 14 27 26 20 7 3 3检验整批零件上的疵点数是否服从泊松分布(α=0.05).解答:设X表示整批零件上的疵点数,则本问题是在α=0.05下检验假设H0:P{X=i}=λie-λi!,i=0,1,2,⋯.由于在H0中参数λ未具体给出,所以先估计λ的值. 由极大似然估计法得λ=x¯=1100(0×14+1×27+2×26+3×20+4×7+5×3+6×3)=2.将试验的所有可能结果分为7个互不相容的事件A0,A1,⋯,A7, 当H0成立时,P{X=i}有估计值p0=P{X=0}=e-2≈0.135335,p1=P{X=1}=2e-2≈0.27067,p2=P{X=2}=2e2≈0.270671,p3=P{X=3}≈0.180447,p4=P{X=4}=2/3e-2≈0.090224,p5=P{X=5}=4/15e-2≈0.036089, p6=P{X=6}=4/45e-2≈0.0120298. 列表如下:Ai k 概率pi npi 频数fi (fi-npi)2 (fi-npi)2npiA0 A1 A2 A3 A4 A5 A6 0 1 2 3 4 5 6 0.1353350.270671 0.270671 0.180447 0.090224 0.036089 0.0120298 13.5335 27.0671 27.0672 18.0447 9.02243.60891.2029813.83428 14 27 26 2073313 0.2176 0.0045 1.1387 3.8232 0.6960 0.01608 0.000166 0.04207 0.2118740.050310∑1000.3205当H0为真时,χ2=∑i=0k(fi-npi)2npi ∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r), 这里χ2=0.3205, 查表知χ0.052(5-1-1)=χ0.052(3)=7.815. 显然 χ2=0.3205<7.815=χ0.052(3).即χ2未落在拒绝域中,接受H0, 故可认为整批零件上的疵点数服从泊松分布.习题3检查了一本书的100页,记录各页中印刷错误的个数,其结果为错误个数fi0 1 2 3 4 5 6 ≥7含fi 个错误的页数 36 40 19 2 0 2 1 0问能否认为一页的印刷错误个数服从泊松分布(取α=0.05)? 解答:检验假设H0: 一页的印刷错误个数X 服从泊松分布, P{X=i}=λie -λi!,i=0,1,2,⋯.H0 不成立. 先估计未知参数λλ=x¯=1/100(0×36+1×40+2×19+3×2+4×0+5×2+6×1)=1. 在H0成立下pi =P {X=i}=(λ)ie-λi!=e-1i!,i=0,1,2,⋯. 用χ2检验法χ2=∑i =1k(fi-npi )2npi ∼χ2(k -r-1). 本题中r=1, 其中fi 为频数. H0的拒绝域为 Rα={χ2>χα2(k -r-1)}. 列表计算如下:n=100, 对每个{X=i}计算pi ,npi ,fi-npi ,(fi-npi )2/(npi )(i=1,2,⋯,7). 要求每一个npi ≥5.计算χ2值χ2=0.0170+0.2801+0.0202+1.1423=1.4596.习题6下表记录了2880个婴儿的出生时刻:试问婴儿的出生时刻是否服从均匀分布U[0,24](显著性水平α=0.05)?解答:原假设H0:F0(x), 由F0(x)算得pi=F0(i)-F0(i-1)=124,npi=2880×124=120 (i=1,2,⋯,24),于是χ2=∑i=124(fi-npi)2npi≈40.47,对α=0.05, 自由度n-1=23, 查χ2-分布表,得χα2(n-1)=35.17,因为χ2=40.47>35.17, 所以拒绝H0, 即可以认为婴儿出生时刻不服从均匀分布U[0,24].总习题解答习题1下面列出的是某工厂随机选取的20只部件的装配时间(min):9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7.设装配时间的总体服从正态分布N(μ,σ2),μ,σ2均未知,是否可以认为装配时间的均值显著地大于10(取α=0.05)?解答:检验假设H0:μ≤μ0=10,H1:μ>10.已知n=20,α=0.05,由数据算得x¯=10.2,s≈0.5099.因σ2未知,故用t检验法,拒绝域为W={X¯-μ0S/n>tα(n-1).计算得x¯-μ0s/n=10.2-100.5099/20≈1.7541.查t分布表得t0.05(19)=1.7291.因为1.7541>1.7291,故拒绝H0,可以认为装配时间的均值显著地大于10.习题2某地早稻收割根据长势估计平均亩产为310kg,收割时,随机抽取了10块,测出每块的实际亩产量为x1,x2,⋯,x10,计算得x¯=110∑i=110xi=320.如果已知早稻亩产量X服从正态分布N(μ,144),显著性水平α=0.05,试问所估产量是否正确?解答:这是一个正态分布总体,方差已知,对期望的假设检验问题,如果估计正确,则应有μ=310,因此我们先将问题表示成两个假设:①H0:μ=310,H1:μ≠310.接下来就要分析样本值来确定是接受H0,还是接受H1.当H0为真时,统计量②U=X¯-31012/10∼N(0,1),从而有③P{∣U∣>1.96}=0.05,拒绝域为(-∞,-1.96)∪(1.96,+∞).④计算U0=∣320-310∣12/n≈2.64>1.96,即拒绝H0,也就是有理由不相信H0是真的,故认为估产310kg不正确.习题3设某次考试的考生成绩服从正态分布,从中随机地抽取36位考生的成绩,算得平均成绩为66.5分,样本标准差为15分,问在显著水平0.05下,是否可认为这次考试全体考生的平均成绩为70分?并给出检验过程.(1)设这次考试全体考生的平均成绩X∼N(μ,σ2),则待检验假设H0:μ=70,备择假设H1:μ≠70;(2)在H0成立条件下选择统计量T=X¯-μ0S/n∼t(n-1);(3)在显著性水平0.05下,查t分布表,找出临界值tα/2(n-1)=t0.025(35)=2.0301,则拒绝域为(-∞,-2.0301)∪(2.0301,+∞);(4)计算t=∣66.5-70∣15/36=1.4∈(-2.0301,2.0301),故接受H0,因此可认为这次考试全体考生的平均成绩为70分.习题4设有来自正态总体的容量为100的样本,样本均值x¯=2.7,μ,σ2均未知,而∑i=1n(xi-x¯)2=225,在α=0.05水平下,检验下列假设(1)H0:μ=3,H1:μ≠3;(2)H0:σ2=2.5,H1:σ2≠2.5.解答:(1)由题意知n=100,x¯=2.7,s=199×225≈1.508,t=(2.7-3)1.508×100≈-1.9894,α=0.05,t0.025(99)≈t0.025(100)=1.984.因∣t∣=1.9894>t0.025(99)=1.984,故拒绝H0,即认为μ≠3.(2)由题意知χ2=∑i=1n(x1-x¯)22.5=2252.5=90,α=0.05,χ0.0252(99)≈χ0.0252(100)=129.56,χ0.9752(99)≈χ0.9752(100)=74.22,因χ0.9752(99)<χ2=90<χ0.0252(99),故接受H0,即可以认为σ2=2.5.习题5设某大学的男生体重X为正态总体,X∼N(μ,σ2),欲检验假设:H0:μ=68kg,H1:μ>68kg.已知σ=5,取显著性水平α=0.05,若当真正均值为69kg时,犯第二类错误的概率不超过β=0.05,求所需样本大小.解答:由第一类、第二类错误及分位数的定义,易于证明:对于某个给定的δ>0(∣μ-μ0∣≥δ),样本容量n应满足:n≥(uα+uβ)2σ2δ2.因为α=β=0.05,故uα=uβ=1.645,对其对立假设μ=69而言,取δ=1,则n=(uα+uβ)2σ2δ2=(1.645+1.645)2×251≈270.6,故取n=271.某装置的平均工作温度据制造厂家称不高于190∘C.今从一个由16台装置构成的随机样本测得工作温度的平均值和标准差分别为195∘C和8∘C,根据这些数据能否说明平均工作温度比制造厂所说的要高?(设α=0.05,并假设工作温度近似服从正态分布.)解答:设X为工作温度,则X∼N(μ,σ2).①待检假设H0:μ≤190,备择假设H1:μ>190;②在H0成立条件下,选择统计量T=X¯-μ0S/n≈t(n-1);③在显著性水平0.05下,查t分布表,找出临界值tα(n-1)=t0.05(15)=1.75,拒绝域为(1.75,+∞);④计算t=X¯-μ0S/n=195-1908/16=2.5>1.75,所以否定原假设H0,说明平均工作温度比制造厂所说的要高.习题7电工器材厂生产一批保险丝,抽取10根试验其熔断时间,结果为42657578715957685455假设熔断时间服从正态分布,能否认为整批保险丝的熔断时间的方差不大于80(α=0.05)?解答:①待检假设H0:σ2≤80,备择假设H1:σ2>80;②在H0成立时,选取统计量χ2=(n-1)S2σ02∼χ2(n-1);③由α=0.05,n-1=9,查χ2分布表,χα2(n-1)=χ0.052(9)=16.919;④计算样本值:x¯=110(42+65+75+78+71+59+57+68+54+55)=62.4,s2=19∑i=110(xi-x¯)2≈121.8,χ2=9×121.880≈13.7∈(0,16.919).故接受原假设H0即在α=0.05下,可认为整批保险丝的熔断时间的方差不大于80.习题8某系学生可以被允许选修3学分有实验物理课和4学分无实验物理课,11名学生选3学分的课,考试平均分数为85分,标准差为4.7分;17名学生选4学分的课,考试平均分数为79分,标准差为6.1分. 假定两总体近似服从方差相同的正态分布,试在显著性水平α=0.05下检验实验课程是否能使平均分数增加8分?解答:设有实验的课程考分X1∼N(μ1,σ12),无实验的课程考分X2∼N(μ2-σ22).假定σ12=σ22=σ2未知,检验假设H0:μ1-μ2=8,H1:μ1-μ2≠8.由题意知,选用t检验统计量,则拒绝域为W={∣x1¯-x2¯-(μ1-μ2)sw1n1+1n2∣>tα/2(n1+n2-2),其中sw2=(n1-1)s12+(n2-1)s22n1+n2-2.由x1¯=85,x2¯=79,n1=11,n2=17,s1=4.7,s2=6.1,算出sw=(11-1)×4.72+(17-1)×6.1211+17-2≈5.603.从而算出t值为t=85-79-85.603111+117≈-0.92,由α=0.05,查表得t0.025(11+17-2)=t0.025(25)=2.056,因为∣t∣=0.92<2.056,故接受H0,认为μ1-μ2=8.习题9某校从经常参加体育锻炼的男生中随机地选出50名,测得平均身高174.34厘米;从不经常参加体育锻炼的男生中随机地选50名,测得平均身高172.42厘米. 统计资料表明两种男生的身高都服从正态分布,其标准差分别为5.35厘米和6.11厘米,问该校经常参加锻炼的男生是否比不常参加锻炼的男生平均身高要高些(α=0.05)?解答:设X,Y分别表示常锻炼和不常锻炼男生的身高,由题设X∼N(μ1,5.352),Y∼N(μ2,6.112).①待检假设H0:μ1≤μ2,备择假设H1:μ1>μ2;②选取统计量U=X¯-Y¯σ12n+σ22m∼(H0成立)N(0,1);③对于α=0.05,查标准正态分布表,uα=u0.05=1.64;则拒绝域为(1.64,+∞);④计算u=174.34-172.425.35250+6.11250≈1.67>1.64,故否定原假设H0,即表明经常体育锻炼的男生平均身高比不经常体育锻炼的男生平均身高高些.习题10在漂白工艺中要改变温度对针织品断裂强力的影响,在两种不同温度下分别作了8次试验,测得断裂强力的数据如下(单位:kg):70∘C:20.818.819.820.921.519.521.021.280∘C:17.720.320.018.819.020.120.219.1判断两种温度下的强力有无差别(断裂强力可认为服从正态分布α=0.05)?解答:(1)本问题是在α=0.05下检验假设μ1=μ2,为此需要先检验σ12=σ22是否成立.H01:σ12=σ22,H11:σ12≠σ22.选取统计量F=S12S22,在H01成立的条件下,F∼F(n1-1,n2-1),且此检验问题的拒绝域为F>Fα/2(n1-1,n2-1)或F<F1-α/2(n1-1,n2-1).这里F=s12s22≈0.90550.8286≈1.0928,F0.025(7,7)=4.99,F0.975(7,7)=1F0.025(7,7)=14.99≈0.2004.显然F0.975(7,7)=0.2004<1.0928<4.99=F0.025(7,7).说明F未落在拒绝域中,从而接受H01,即认为两温度下的强力的方差没有显著变化,亦即σ12=σ22. (2)再检验假设H0ʹ:μ1=μ2,H0ʹ:μ1≠μ2,在H0ʹ成立的条件下,T=X1¯-X2¯(n1-1)S12+(n2-1)S22n1+n2-21n1+1n2∼t(n1+n2-2),且此检验问题的拒绝域为∣T∣>tα/2(n1+n2-2),这里T≈20.4-19.47×0.9055+7×0.82868+8-218+18≈2.148,显然∣T∣=2.148>2.145=t0.025(14).说明T落在拒绝域中,从而拒绝H0,即认为两种温度下的断裂强力有显著差别.习题11一出租车公司欲检验装配哪一种轮胎省油,以12部装有Ⅰ型轮胎的车辆进行预定的测试. 在不变换驾驶员的情况下,将这12部车辆换装Ⅱ型轮并重复测试,其汽油耗量如下表所示(单位:km/L).汽车编号i123456789101112Ⅰ型胎(xi)4.24.76.67.06.74.55.76.07.44.96.15.2Ⅱ型胎(yi)4.14.96.26.96.84.45.75.86.94.76.04.9假定两总体均服从正态分布,试在α=0.025的显著性水平下,检验安装Ⅰ型轮胎是否要双安装Ⅱ型轮胎省油?解答:设两种轮胎汽油消耗量之差为随机变量D,则取值为zi=xi-yi=0.1,-0.2,0.4,0.1,-0.1,0.1,0,0.2,0.5,0.2,0.1,0.3.设Z∼N(μz,σz2),σz2未知. 若消耗油相同,则μz=0;若Ⅰ型比Ⅱ型轮胎省油,则μz>0,于是检验假设H0:μz=0,H1:μz>0.由题意知z¯≈0.142,s≈0.198,n-1=12-1=11.α=0.025,查t分布表得t0.025(11)=2.201.所以,拒绝域为W={t>2.201}.由于样本值t=z¯-0s/n=0.142-00.198/12≈2.48>2.201,故拒绝H0:μz=0,即说明Ⅰ型轮胎省油.习题12有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量n1=60,n2=40的样本,测得部件重量(以kg计)的样本方差分别为s12=15.46,s22=9.66. 设两样本相互独立,两总体分别服从分布N(μ1,σ12),N(μ2,σ22).μi,σi2(i=1,2)均未知,试在α=0.05水平下检验假设H0:σ12≤σ22,H1:σ12>σ22.解答:在α=0.05下,检验假设H0:σ12≤σ22,H1:σ12>σ22,经计算p=1100×10(45+2×17+3×4+4×1+5×1)=1/10,故检验假设为H0:X∼B(10,1/10),即pi=P{X=i}=C10i(1/10)i(9/10)10-i,i=0,1,2,⋯,10.为了使npi≥5,将xi≥3合并,于是k=4,r=1.计算χ2的观察值,计算结果如下表:[200,300) [300,+∞)435843.466.9-0.4-8.90.0041.184∑300300 1.8631其中理论概率pi=p{ti≤T≤ti+1}=∫titi+1f(t)dt(i=1,2,3),p4=1-∑i=13pi,例如p1=P{T<100}=∫01000.005e-0.005tdt=1-e-0.5≈0.393.由k=4,未知参数个数r=0,查表知χα2(k-r-1)=χ0.052(3)=7.815.因χ2=1.8631<χ0.052(3)=7.815.故接受H0,即可认为灯泡的寿命服从该指数分布.习题16关于正态总体X∼N(μ,1)的数学期望有如下二者必居其一的假设,H0:μ=0,H1:μ=1.考虑检验规则:当X¯≥0.98时否定假设H0接受H1,其中X¯=(X1+⋯+X4)/4,而X1,⋯,X4是来自总体X的简单随机样本,试求检验的两类错误概率α和β.解答:易见,在假设“H0:μ=0”成立的条件下,X¯∼N(0,1/4),2X¯∼N(0,1);在假设“H1:μ=1”成立的条件下,X¯∼N(1,1/4),2(X¯-1)∼N(0,1).因此,由定义得α=P{X¯≥0.98∣μ=0}=P{2X¯≥1.96∣μ=0}=0.025,β=P{X¯<0.98∣μ=1}=P{2(X¯-1)<-0.04∣μ=1}=0.4840.习题17考察某城市购买A公司牛奶的比例,作假设H0:p=0.6,H1:p<0.6,随机抽取50个家属,设x为其中购买A公司牛奶的家庭数,拒绝域W={x≤24}.(1)H0成立时,求第一类错误的α;(2)H1成立且p=0.4时,求第二类错误的β(0.4);又当p=0.5时,求第二类错误的β(0.5).解答:由定义知(1)α=P{x≤24∣p=0.6}=Φ(24-50×0.650×0.6×0.4)≈Φ(-1.73)=1-Φ(1.73)=1-0.9528=0.0418.(2)β(0.4)=P{x>24∣p=0.4}=1-Φ(24-50×0.450×0.4×0.6)≈1-Φ(1.15)=1-0.8749=0.1251;。
概率论与数理统计习题及答案第七章
概率论与数理统计习题及答案第七章习题7-1的样本,则0的矩估计量是().(A) X .(B) 2X .解选(B).2.设总体X 的分布律为X -215P301-40e其中0v 0< 0.25为未知参数,X 1, X 2, , , X n 为来自总体X 的样本,试求0的矩估计量.解因为 E(X)=(-2) >3 0+1X(1-4 0+5 X0=1-5 0 令 1_5v-X 得到v 的矩估计量为彳二1.53.设总体X 的概率密度为f A严 1)x ;0 ::: x :::1, f (X ; V)0, 其它.其中0>1是未知参数,X 1,X 2,, ,X n 是来自X 的容量为n 的简单随机样本求:(1) r 的矩估计量;(2) 0的极大似然估计量. 解总体X 的数学期望为址 1阳1 日+1E (X ) = f xf (x)d x =[(日 +1) x dx = ----------------------0+21.选择题(1)设总体X 的均值的样本, 则均值□与方差 (A) 2 X 和 S 2. (C)□和d . 解选(D).与方差都存在但未知 C 2的矩估计量分别是( 而X-X 2,…,X n 为来自X ).1(B) X 和 (X i(D)1X 和 (X i20>0为未知参数,又X i ,X 2,…,X n 为来自总体X(C) max{ X i }. 1 < i < n(D) min { X i }. 1 < i < n⑵设X : U [0, v],其中 -X)令E (X )= X ,即二! =X ,得参数0的矩估计量为彳■■ 2设X 1, X 2,, , X n 是相应于样本X 1, X 2,, , X n 的一组观测值,2X -1 1 -x则似然函数为0,当 0<x< p="">,n)时,L>0 且 nXiIn ,0 ::: x i :::1,L = n ln( v I))、In X i ,i =1Ad In L n 二令Ind v 71 -1 i 1X i =0,得0的极大似然估计值为 4-1nnvIn X ii土而的极大似然估计量为4.设总体X 服从参数为彳=-1.二 In Xii -4即X 的概率密度为■的指数分布, 3 x 0,f (X, ■)二I 0,其中,.0为未知参数,X i , X 2, , , X n 为来自总体的矩估计量与极大似然估计量1 -解因为E(X)= =X ,所以,的矩估计量为x < 0,X 的样本,试求未知参数■—.设 X 1, X 2,, , X n 是相X应于样本X i , X 2,, ,X n 的一组观测值,则似然函数n -n _L 二■■■■ In-'7 X i i 士取对数人 d In L n 二令. X i人 \=±1 然估计量为?==.X=0,得?的极大似然估计值为1 -,■的极大似X1.选择题:设总体X ’,X 2,…,X n 为X 的样本,的无偏估计量?X 的均值则无论总体与方差;「2都存在但未知,而服从什么分布,( 2)是.1和二(A)X i 和 (Xn i ±n i 生(C)—JX i 和1n -1 i ±n -1解选(D).2. 若x 1,X 2 ,X(B)1 nX i 和-1 i —, n —2(X i —X) ?1 12—7 X i 和—v (X i 7 .n i -4、 in i -4)的样本,且X 2 ? kX 3为」的无偏估计量,问k 等于多少?解要求1E(—X ! 31 1 1 ? — X2 ? kX 3)2 74 3 45解之,k=.1 25.设总体X 的概率密度为0 ::: x ::: 1,其它,,X n 为来自总体的简单随机样本,记N求:(1) B 的矩估计量;(2) B 的极大似然33 —解 (1) X =E(X)二 xvdx 亠 |X (1 - v)dx,所以 <1 矩 X .22(2)设样本X 1,X 2,…X n 按照从小到大为序(即顺序统计量的观测值)有如下关系:X (1) < X (2) w , wx (N) <1 w X (N+1) W X (N+2)W , W X (n).似然函数为,,■'N(^-r-,X (1) W x (2) W ' "W X (N) <1W X (N 1) W X (N 2) W X n , LQ|0, 其它.考虑似然函数非零部分,得到In L( 0) = N In 0+ (n - N) In(1- 0),令d s o 二‘ 一口 =o ,解得0的极大似然估计值为弓=楚.d B日1 —日n习题7-23.设总体X 的均值为0,方差匚2存在但未知,又X 1, X 2为来自总体X 的1 2 21< x < 2,f (x,=) ?1 七,0,.X 1, X 2,,1的个数? 其中-(0<二<1 )是未知参数为样本值x , ,x 2 , ,x n中小于估计量.nnn2i—'X ).3为来自总体2、(X i 」).(D)i :—样本,试证:一(X ’ 一X 2)为二的无偏估计21 2 1 2 2证因为E[—(X’-X?)] E[( X1^2X 1X2 X2 )]2 21 2 2【E(X’)_2E(X’X2)- E(X2 )]2所以一(X1-X2)2为L的无偏估计.2习题7-31. 选择题(1) 总体未知参数二的置信水平为0.95的置信区间的意义是指().(A) 区间平均含总体95%的值.(B) 区间平均含样本95%的值.(C) 未知参数二有95%的可靠程度落入此区间.(D) 区间有95%的可靠程度含参数n的真值?解选(D).(2) 对于置信水平1- a0< ad),关于置信区间的可靠程度与精确程度,下列说法不正确的是().(A) 若可靠程度越高,则置信区间包含未知参数真值的可能性越大(B) 如果a越小,则可靠程度越高,精确程度越低.(C) 如果1- a越小,则可靠程度越高,精确程度越低?(D) 若精确程度越高,则可靠程度越低,而1- a越小. 解选(C)习题7-41.某灯泡厂从当天生产的灯泡中随机抽取9只进行寿命测试,取得数据如下(单位:小时):1050, 1100, 1080, 1120, 1250, 1040, 1130, 1300,1200.设灯泡寿命服从正态分布N(卩902),取置信度为0.95,试求当天生产的全部灯泡的平均寿命的置信区间.解计算得到x -1141.11,3 =902.对于a= 0.05,查表可得Z -/2 = z0.025 二1-96.所求置信区间为22=(1141.11= (1082.31,1199.91).2. 为调查某地旅游者的平均消费水平,随机访问了40名旅游者,算得平均消费额为X =105元,样本标准差s =28元.设消费额服从正态分布.取置信水平为0.95,求该地旅游者的平均消费额的置信区间 .2 2解计算可得X =105, f =282.对于a = 0.05,查表可得t ..(n -1) =t °.025 (39) = 2.02272所求□的置信区间为=(96.045, 113.955).3?假设某种香烟的尼古丁含量服从正态分布 .现随机抽取此种香烟8支为一组样本,测得其尼古丁平均含量为18.6毫克,样本标准差s=2.4毫克.试求此种香烟尼古丁含量的总体方差的置信水平为0.99的置信区间.解已知 n =8, S 2=2.42, a = 0.01,查表可得笑厶一 1) = 30.005 ⑺=20.278 ,22..(n -1) =0.995⑺=0.989 ,所以方差/的置信区间为"2本:X 1,X 2,, ,X 12 及丫1,丫2,, ,丫17,算出 x =10.6g ,y = 9.5g , s : =2.4, s ;=4.7 .假设这两条流水线上装的番茄酱的重量都服从正态分布,且相互独立,其均值分别为叫,J 2.又设两总体方差打.求4 - J 2置信水平为0.95的置信区间并说明该置信区间的实际意义.解由题设 X =10.6, y =9.5, s : =2.4, s ; =4.7, n 1 =12, n 2 =17,(Xs (X「28\(n -1),x2\(n -1)) =(10522.0227, 28105—2.0227 )2 2(n -1)S(n -1)S 、(, )=( “-1) J -1)2 22(8 .1)2.420.2782(8 -1)2.40.989)=(1.988, 40.768).4.某厂利用两条自动化流水线灌装番茄酱分别从两条流水线上抽取样2s w2 丄 2(① -1) q ? (n ? -1)S 2 n 1 ' n 2「2 (12 —1) 2.4 ? (17 —1) 4.712 17「2= 1.94(J ■ n)90—1.96, 1141.11sQg +n2—2) =t0.°25 (27) = 2.05181,所求置信区间为2 21 11 1—■■_) =((10.6「9.5) _2.05181 1.94,—、一) n 1 n 2 .12 17 =(-0.40,2.60).结论“叫_ J 的置信水平为0.95的置信区间是(-0.40,2.60)”的实际意义是:在两总体方差相等时,第一个正态总体的均值叫比第二个正态总体均值J 大-0.40?2.60,此结论的可靠性达到95%.5.某商场为了了解居民对某种商品的需求,调查了100户,得出每户月平均需求量为10公斤,方差为9 .如果这种商品供应10000户,取置信水平为0.99.(1) (2) 解 _ s _ s (x ——t (n -1), x ——t (n -1))' 厂g厂?■ f n 2 ■. n 2= (102.575, 102.575) =(9.2275,10.7725).J 100J10010000户居民对此种商品月需求量的置信度为 0.99的置信区间为(92275,107725);(2)最少要准备92275公斤商品才能以 99%的概率满足需要?((X7) _t ,(n 1n2—2)S w2取置信度为0.99,试对居民对此种商品的平均月需求量进行区间估计问最少要准备多少这种商品才能以(1)每户居民的需求量的置信区间为99%的概率满足需要? _ s _ s:F (X ---- z , x ---------- z )厂a r ot ■- n 7 ?、n 2</x<>。
概率论与数理统计第七章
点估计 区间估计
参数估计的类型
点估计 —— 估计未知参数的值
区间估计—— 估计未知参数的取值范围, 并使此范围包含未知参数 真值的概率为给定的值。
§7.1 点估计
要求: (1) 理解参数的点估计、估计量和估计值的概念。 (2)掌握矩估计法和最大似然估计法。
第七章 参数估计
总体是由总体分布来刻画的。
总体分布类型的判断──在实际问题中,我们根据 问题本身的专业知识或以往的经验或适当的统计 方法,有时可以判断总体分布的类型。
总体分布的未知参数的估计──总体分布的参数往 往是未知的,需要通过样本来估计。通过样本来 估计总体的参数。称为参数估计,它是统计推断 的一种重要形式。
例如
(1)为了研究人们的市场消费行为,我们要 先搞清楚人们的收入状况。
假设某城市人均年收入X∼N(, 2)。但参数 和 2 的具体值并不知道,需要通过样本来估计。
(2)假定某城市在单位时间(譬如一个月)内
交通事故发生次数 X ∼ p()。
参数未知,需要从样本来估计。
点估计
参数估计 区间估计
例如, X∼N(, 2), 若, 2未知, 通过构造样本的函数,给出它
矩估计法的具体做法如下
设总体的分布函数中含有k个未知参数1,2, ,k 。
(1) 写出总体的前k阶矩μ1, μ2, , μk ,一般是这 k 个 未知参数的函数, 记为:
μi μi (θ1,θ2 , ,θk ) i=1, 2, … , k
(2)从这 k 个方程中解出
θ j θ j ( μ1, μ2 , , μk ) j=1, 2, …, k
(3) 那么用诸 μi 的估计量 Ai 分别代替上式中的诸 μi,
概率论与数理统计第七章课后习题及参考答案
5.设总体 X 的概率密度为
f
(x,
)
(
1) x
,0
x
1,
0, 其他.
其中 1是未知参数, X1 , X 2 ,…, X n 是来自 X 的一个样本.试求参数
2
的矩估计和极大似然估计.现有样本观测值 0.1 ,0.2 ,0.9 ,0.8 ,0.7 及 0.7 ,
求参数 的矩估计值和极大似然估计值.
1 2 2 c 2 2 ( 1 c) 2 ,
n
n
取 c 1 即可. n
14.设总体 X 的均值为 ,方差为 2 ,从总体中抽取样本 X1 , X 2 , X 3 ,证明
(
x,
,
2
)
1
1
1
e 2 2
(ln x )2
,
x
0,
2 x
0,
x 0.
其中 , 0 为未知参数, X1 , X 2 ,…, X n 是取自该总体的一
个样本,求参数 , 2 的极大似然估计.
解: xi 时,似然函数为
L(, 2 )
(
1 2 )n
1 x1x2 xn
exp{
dL
d
n exp{
n i 1
( xi
)}
0,
所以 L( ) 是 的单调增函数,从而对满足条件 xi 的任意 ,有
n
n
L( ) exp{ i1 (xi )} exp{ i1 (xi m1iinn{xi})} ,
即 L( ) 在 m1iinn{xi} 时取最大值, 故 的极大似然估计值为ˆ m1iinn{xi} . 7.(1) 设总体 X 具有分布律
ˆ1 X1 ;
ˆ2
概率论与数理统计第七章参数估计
例1. 设总体X的数学期望和方差分别是μ,
σ2 ,求μ , σ2的矩估计量。
E(X )
E( X 2 ) D( X ) [EX ]2 2 2
(3) 写出方程 ln L 0
i1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..x.n,)
于 是 ˆ ˆ ( X 1 , X 2 , . . . , X n ) 即 为 的 极 大 似 然 估 计 量
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
ˆ(x1,x2,..x.n,),使得
L (ˆ) m a x L (), (或 L (ˆ) s u p L ())
则 称 ˆ ( x 1 ,x 2 , . . . ,x n ) 为 的 极 大 似 然 估 计 值
称 ˆ ( X 1 ,X 2 ,...,X n ) 为 极 大 似 然 估 计 量
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 (可以是向量) .
概率论与数理统计课件:ch7-1 假设检验的概念和步骤
应用中, 一般原则是:控制犯第一类错误的概率,
即给定 , 然后通过增大样本容量 n来减小 .
关于 显著性水平 的选取: 若注重经济效益, 可小些,如 0.01; 若注重社 会效益, 可大些,如 0.1;若要兼顾经济效益和
则没有理由怀疑假设 H0 的正确性. 而取出的是红球,
小概率事件竟然在一次试验中发生了,故有理由拒绝
假设 H0 , 即认为甲的说法不正确.
Probability and Statistics– Chapter 7 Hypothesis Testing
5
二 假设检验的基本思想
假设检验的基本思想 实质上是带有某种概率性质
的反证法. 为了检验一个假设 H0是否正确,首先假 定该 H0 正确,然后根据抽取到的样本对假设 H0
作出接受或拒绝的决策. 如果样本观察值导致了不
合理的现象的发生,就应拒绝假设 H0 , 否则应接受 假设 H0 .
假设检验中所谓“不合理”并,非逻辑中的绝对矛盾,
而是基于人们在实践中广泛采用的原则, 即小概率 事件在一次试验中是几乎不发生的。
社会效益,一般可取 0.05.
Probability and Statistics– Chapter 7 Hypothesis Testing
10
理论上,自然希望犯这两类错误的概率都很小,但
当样本容量 n 固定时, , 不能同时都小,即 变
小时, 就变大;而 变小时, 就变大. 在实际
应用中, 一般原则是:控制犯第一类错误的概率,
14
353 345 357 339 355 360
试问生产线工作是否正常?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
着火次数 k 发生 k 次着 火的天数nk
解
0
1
2
3
4 5 6
75 90 54 22 6 2 1 250
所以 E ( X ).
因为 X ~ π( ),
knk k 0
6
用样本均值来估计总体的均值 E(X).
1 x 6 (0 75 1 90 2 54 3 22 250 n k 4 6 5 2 6 1) 1.22. k 0
故 E ( X ) 的估计为1.22 .
点估计问题的一般提法 设总体 X 的分布函数 F ( x; )的形式为已
知, 是待估参数 . X 1 , X 2 ,, X n 是 X 的一个样 本, x1 , x2 ,, xn 为相应的一个样本值 .
点估计问题就是要构造 一个适当的统计量 ˆ ( X 1 , X 2 ,, X n ), 用它的观察值 ˆ ( x1 , x2 ,, xn ) 来估计未知参数 . ˆ ( X 1 , X 2 ,, X n )称为 的估计量. 通称估计, ˆ. ˆ ( x1 , x2 ,, xn )称为 的估计值. 简记为
解 先确定一个统计量 X , 再计算出 X 的观察值 x ,
把 x 作为参数 的估计值.
x 1.133 .
的估计值为 1.133.
二、估计量的求法
由于估计量是样本的函数, 是随机变量, 故 对不同的样本值, 得到的参数值往往不同, 如何 求估计量是关键问题.
常用构造估计量的方法: (两种) 矩估计法和最大似然估计法.
1. 矩估计法
设 X 为连续型随机变量 , 其概率密度为 f ( x;1 , 2 ,, k ), 或 X 为离散型随机变量 , 其分布律为 P { X x } p ( x;1 , 2 ,, k ), 其中 1 , 2 ,, k 为待估参数 ,
若 X1 , X 2 ,, X n 为来自 X 的样本, 假设总体 X 的前 k 阶矩存在,
最大似然估计法也适用于分布中含有多个 未知参数的情况. 此时只需令 ln L 0, i 1,2,, k . 对数似然方程组 i
解出由 k 个方程组成的方程组 , 即可得各未知参 ˆi . 数 i ( i 1,2,, k ) 的最大似然估计值
练习册 P49 三、2
P49
L e
i 1
n
1
xi
1
1
n
e
xi
i 1
n
取对数;
ln L n ln
对此式求导得:
x
i 1
1
n
i
d ln L n 1 n 2 xi d i 1
令
n
1
2
x
i 1
n
i
0
解得参数的最大似然估计为;
最大似然估计法是由费舍尔引进的. 求最大似然估计量的步骤:
费舍尔
(一) 写出似然函数 L( ) L( x1 , x2 ,, xn ; ) p( xi ; )
i 1 n
或
L( ) L( x1 , x2 ,, xn ; ) f ( xi ; );
i 1
X1 , X 2 ,, X n 是来自总体 X 的样本,
则 X 1 , X 2 ,, X n 的联合密度为 f ( xi ; ).
i 1 n
又设 x1 , x2 ,, xn 为相应于样本 X 1 , X 2 ,, X n 的 一个样本值 .
则随机点 ( X 1 , X 2 ,, X n ) 落在点( x1 , x 2 ,, x n )的 邻域 (边长分别为dx1 , dx 2 ,, dx n的n维立方体)内 的 概率近似地为 f ( xi ; )dxi ,
2. 最大似然估计法
(1) 设总体 X 属离散型
似然函数的定义
设分布律 P{ X k } p( x; ), 为待估参数, , (其中 是 可能的取值范围 ) X1 , X 2 ,, X n是来自总体X 的样本,
则 X 1 , X 2 ,, X n 的联合分布律为 p( xi ; ).
1 n xi x n i 1
^
x
^
0
x e dx
1
x
是 的无偏估计
三、小结
矩估计法 两种求点估计的方法: 最大似然估计法 在统计问题中往往先使用最大似然估计法, 在最大似然估计法使用不方便时, 再用矩估计法.
似然函数 L( ) L( x1 , x2 ,, xn ; ) p( xi ; )
i 1
n
L( )称为样本似然函数.
最大似然估计法
得到样本值x1 , x2 ,, xn时, 选取使似然函数 L( )
ˆ 作为未知参数 的估计值, 取得最大值的 ˆ ) max L( x1 , x2 ,, xn ; ). 即 L( x1 , x2 ,, xn ;
( 其中 是 可能的取值范围 )
解
ˆ 2 X 为所求 的估计量. 所以
例4
设总体 X 在[a , b]上服从均匀分布 , 其中a ,
b 未知, ( X 1 , X 2 ,, X n ) 是来自总体X的样本, 求a , b 的估计量.
a b 1 E ( X ) 解 , 2 2 2 a b a b 2 E ( X 2 ) D( X ) [ E ( X )]2 , 12 4 n ab 1 令 A1 X i , 2 n i 1 1 n 2 (a b)2 (a b)2 A2 X i , n i 1 12 4
且均为 1 , 2 ,, k 的函数, 即
l E ( X ) x l f ( x;1 , 2 ,, k )dx (X为连续型)
l
或 l E ( X l )
xRX
l x p( x;1 , 2 ,, k ), (X为离散型)
其中 RX 是 x 可能取值的范围, l 1,2,, k 1 n l 因为样本矩 Al X i 依概率收敛于相应的 n i 1
ˆ 与样本值 x1 , x2 ,, xn有关, 记为 这样得到的 ˆ ( x1 , x2 ,, xn ), 参数 的最大似然估计值 ,
ˆ ( X 1 , X 2 ,, X n ) 参数 的最大似然估计量 .
( 2) 设总体 X 属连续型
似然函数的定义
设概率密度为 f ( x; ), 为待估参数, , ( 其中 是 可能的取值范围 )
i 1 n
Байду номын сангаас
又设 x1 , x2 ,, xn 为相应于样本 X 1 , X 2 ,, X n 的 一个样本值.
则样本 X1 , X 2 ,, X n 取到观察值x1 , x2 ,, xn 的概率,
即事件 X1 x1 , X 2 x2 ,, X n xn 发生的概率为
L( ) L( x1 , x2 ,, xn ; ) p( xi ; ), ,
i 1 n
或 L( ) L( x1 , x2 ,, xn ; ) f ( xi ; );
i 1
n
第一节
点估计
一、点估计问题的提法
二、估计量的求法 三、小结
一、点估计问题的提法
设总体 X 的分布函数形式已知, 但它的一个 或多个参数为未知, 借助于总体 X 的一个样本来 估计总体未知参数的值的问题称为点估计问题. 例1
在某炸药制造厂, 一天中发生着火现象的
次数 X 是一个随机变量 , 假设它服从以 0 为参 数的泊松分布, 参数 为未知, 设有以下的样本值 , 试估计参数 .
总体矩 l ( l 1, 2,, k ),
样本矩的连续函数依概率收敛于相应的总体矩 的连续函数.
矩估计法的定义 用样本矩来估计总体矩,用样本矩的连续函 数来估计总体矩的连续函数,这种估计法称为矩 估计法. 矩估计法的具体做法: 令 l Al , l 1, 2,, k .
这是一个包含k 个未知参数1 , 2 ,, k 的方程组, 解出其中1 , 2 ,, k . ˆ1 , ˆ2 ,, ˆk 分别作为 1 , 2 ,, k 的 用方程组的解
例题
1. 设总体 X 的密度函数为
x 1 x 0, 0 e f x; 0 其他
的最大似然估计值 ; 求(1)
^
(2)判断 是否为 的无偏估计 ;
解(1)最大似然估计值,当 xi 0 i 1, 2,, n 时
^
似然函数为;
i 1 n
L( ) L( x1 , x2 ,, xn ; ) f ( xi ; ),
n
L( )称为样本的似然函数 . ˆ ) max L( x1 , x2 , , xn ; ). 若 L( x1 , x2 , , xn ;
i 1
ˆ ( x1 , x2 ,, xn ) 参数 的最大似然估计值 , ˆ ( X 1 , X 2 ,, X n ) 参数 的最大似然估计量 .
n
(二) 取对数
n i 1
ln L( ) ln p( xi ; ) 或 ln L( ) ln f ( xi ; );
i 1
n
d ln L( ) d ln L( ) 对数似 (三) 对 求导 , 并令 0,然方程 d d ˆ. 解方程即得未知参数 的最大似然估计值
估计量, 这个估计量称为矩估计 量.
矩估计量的观察值称为矩估计值.
例3