概率论与数理统计7-1
概率论与数理统计复习7章
( n − 1) S 2 ( n − 1) S 2 = 1 − α 即P 2 <σ2 < 2 χα 2 ( n − 1) χ1−α 2 ( n − 1) ( n − 1) S 2 ( n − 1) S 2 置信区间为: 2 , χα 2 ( n − 1) χ12−α 2 ( n − 1)
则有:E ( X v ) = µv (θ1 , θ 2 ,⋯ , θ k ) 其v阶样本矩是:Av = 1 ∑ X iv n i =1
n
估计的未知参数,假定总体X 的k阶原点矩E ( X k ) 存在,
µ θ , θ ,⋯ , θ = A k 1 1 1 2 µ2 θ1, θ 2 ,⋯ , θ k = A2 用样本矩作为总体矩的估计,即令: ⋮ µ θ , θ ,⋯ , θ = A k k k 1 2 ɵ ɵ ˆ 解此方程即得 (θ1 , θ 2 ,⋯ , θ k )的一个矩估计量 θ 1 , θ 2 ,⋯ , θ k
+∞
−∞
xf ( x ) dx = ∫ θ x θ dx =
1 0
令E ( X ) = X ⇒
θ +1
θ
ˆ = X ⇒θ =
( )
X 1− X
θ +1
2
θ
7.2极大似然估计法
极大似然估计法: 设总体X 的概率密度为f ( x,θ ) (或分布率p( x,θ )),θ = (θ1 ,θ 2 ,⋯ ,θ k ) 为 未知参数,θ ∈ Θ, Θ为参数空间,即θ的取值范围。设 ( x1 , x2 ,⋯ , xn ) 是 样本 ( X 1 , X 2 ,⋯ , X n )的一个观察值:
i =1 n
概率论与数理统计 第七章2
P{θ1 ≤ θ ≤ θ 2 } ≥ 1 − α , (0 < α < 1)
称区间(θ1,θ 2 )为θ的置信水平为1 − α 该区间的置信区间 。
区间(θ1,θ2)是一个随机区间; α给出该区间含真 1− 值θ的可靠程度。α表示该区间不包含真值θ的可能性。
ch7-1 2
上海理工大学
University of Shanghai for Science and Technology
( X −u1−α
σ
2
n
,
X + u1−α
σ
2
n
)
可得所求的置信区间为
2 (12.35 ± 1.96 × ) = (12.35 ± 1.307) = (11.043,13.657) 9
ch7-1 8
上海理工大学
University of Shanghai for Science and Technology
上海理工大学
University of Shanghai for Science and Technology
College of Science
理学院
概率论与数理统计
区 间 估 计
ch7-1
1
上海理工大学
University of Shanghai for Science and Technology
1001,1004,1003,997,999,1000, , , , , , , 1004,1000,996, 1002,998,999. , , , , ,
求σ2的置信水平为 的置信水平为0.95的置信区间 的置信区间. 的置信区间 −α的置信区间如 解:本例中 µ未知, σ2的置信水平为 −α的置信区间如 本例中 未知, 的置信水平为1−α的置信区间如. (n −1)S2 (n −1)S2 2 , 2 χ1−α (n −1) χα (n −1) 其中n=12,计算得:(n−1)s2=11×6.932=76.25.又 计算得: − 其中 计算得 × 又 查自由度为11的 分布分位数表,得 α=1− 0.95=0.05, 查自由度为 的 χ 2分布分位数表 得 −
茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解-第7~8章【圣才出品】
,xn;
)
0
2.分类数据的χ2 拟合优度检验
定理:在实际观测数与期望观测数相差不大的假定下,在 H0 成立时,对统计量
2
r i 1
(ni
npi0 )2 npi0
有 2
L 2 (r 1) 。
根据定理,采取显著性水平为α 的显著性检验:检验统计量为:
2
r i 1
(ni
npi0 )2 npi0
,拒绝域为W
{ 2
2 1
(r
1)} 。
五、正态性检验 1.W 检验 W 统计量
3 / 117
圣才电子书 十万种考研考证电子书、题库视频学习平台
W
n
(ai
i 1
a
)( x ( i )
x
)
2
n
n
(ai a )2 (x(i) x )2
i 1
i 1
拒绝域{W≤Wa}。
2.比率 p 的检验(见表 7-1-2)
表 7-1-2 比率 p 的检验
2 / 117
圣才电子书 十万种考研考证电子书、题库视频学习平台
四、似然比检验与分布拟合检验
1.似然比检验的思想
假设的似然比
sup p(x1,K ,xn; )
( x1,K
,xn
)
sup
p( x1,K
+(n)}。
7.2 课后习题详解
习题 7.1
1.设 x1,…,xn 是来自 N(μ,1)的样本,考虑如下假设检验问题
4 / 117
圣才电子书 十万种考研考证电子书、题库视频学习平台
H0:μ=2 vs H1:μ=3
若检验由拒绝域为 W {x 2.6}确定。
概率论与数理统计课后习题答案(非常全很详细)
概率论与数理统计复旦大学此答案非常详细非常全,可供大家在平时作业或考试前使用,预祝大家考试成功习题一1.略.见教材习题参考答案.2.设A,B,C为三个事件,试用A,B,C的运算关系式表示下列事件:(1)A发生,B,C都不发生;(2)A与B发生,C不发生;(3)A,B,C都发生;(4)A,B,C至少有一个发生;(5)A,B,C都不发生;(6)A,B,C不都发生;(7)A,B,C至多有2个发生;(8)A,B,C至少有2个发生.【解】(1)A BC(2)AB C(3)ABC(4)A∪B∪C=AB C∪A B C∪A BC∪A BC∪A B C∪AB C∪ABC=ABC(5) ABC=A B C(6) ABC(7) A BC∪A B C∪AB C∪AB C∪A BC∪A B C∪ABC=ABC=A∪B∪C(8) AB∪BC∪CA=AB C∪A B C∪A BC∪ABC3.略.见教材习题参考答案4.设A,B为随机事件,且P(A)=0.7,P(A-B)=0.3,求P(AB).【解】P(AB)=1-P(AB)=1-[P(A)-P(A-B)]=1-[0.7-0.3]=0.65.设A,B是两事件,且P(A)=0.6,P(B)=0.7,求:(1)在什么条件下P(AB)取到最大值?(2)在什么条件下P(AB)取到最小值?【解】(1) 当AB =A 时,P (AB )取到最大值为0.6.(2) 当A ∪B =Ω时,P (AB )取到最小值为0.3.6.设A ,B ,C 为三事件,且P (A )=P (B )=1/4,P (C )=1/3且P (AB )=P (BC )=0,P (AC )=1/12,求A ,B ,C 至少有一事件发生的概率.【解】 P (A ∪B ∪C )=P (A )+P (B )+P (C )-P (AB )-P (BC )-P (AC )+P (ABC ) =14+14+13-112=347.从52张扑克牌中任意取出13张,问有5张黑桃,3张红心,3张方块,2张梅花的概率是多少?【解】 p =5332131313131352C C C C /C8.对一个五人学习小组考虑生日问题:(1) 求五个人的生日都在星期日的概率; (2) 求五个人的生日都不在星期日的概率;(3) 求五个人的生日不都在星期日的概率.【解】(1) 设A 1={五个人的生日都在星期日},基本事件总数为75,有利事件仅1个,故 P (A 1)=517=(17)5 (亦可用独立性求解,下同) (2) 设A 2={五个人生日都不在星期日},有利事件数为65,故P (A 2)=5567=(67)5 (3) 设A 3={五个人的生日不都在星期日}P (A 3)=1-P (A 1)=1-(17)5 9.略.见教材习题参考答案.10.一批产品共N 件,其中M 件正品.从中随机地取出n 件(n <N ).试求其中恰有m 件(m ≤M )正品(记为A )的概率.如果:(1) n 件是同时取出的;(2) n 件是无放回逐件取出的;(3) n 件是有放回逐件取出的.【解】(1) P (A )=C C /C mn m n M N M N --(2) 由于是无放回逐件取出,可用排列法计算.样本点总数有P n N 种,n 次抽取中有m次为正品的组合数为C mn 种.对于固定的一种正品与次品的抽取次序,从M 件正品中取m 件的排列数有P m M 种,从N -M 件次品中取n -m 件的排列数为P n m N M --种,故P (A )=C P P P mm n m n M N M n N-- 由于无放回逐渐抽取也可以看成一次取出,故上述概率也可写成P (A )=C C C m n m M N M n N-- 可以看出,用第二种方法简便得多.(3) 由于是有放回的抽取,每次都有N 种取法,故所有可能的取法总数为N n 种,n次抽取中有m 次为正品的组合数为C m n 种,对于固定的一种正、次品的抽取次序,m 次取得正品,都有M 种取法,共有M m 种取法,n -m 次取得次品,每次都有N -M 种取法,共有(N -M )n -m 种取法,故()C ()/m m n m n nP A M N M N -=- 此题也可用贝努里概型,共做了n 重贝努里试验,每次取得正品的概率为M N,则取得m 件正品的概率为 ()C 1m n m mn M M P A N N -⎛⎫⎛⎫=- ⎪ ⎪⎝⎭⎝⎭11.略.见教材习题参考答案.12. 50只铆钉随机地取来用在10个部件上,其中有3个铆钉强度太弱.每个部件用3只铆钉.若将3只强度太弱的铆钉都装在一个部件上,则这个部件强度就太弱.求发生一个部件强度太弱的概率是多少?【解】设A ={发生一个部件强度太弱}133103501()C C /C 1960P A == 【解】 设A i ={甲进i 球},i =0,1,2,3,B i ={乙进i 球},i =0,1,2,3,则33312123330()(0.3)(0.4)C 0.7(0.3)C 0.6(0.4)i i i P A B ==+⨯⨯+22223333C (0.7)0.3C (0.6)0.4+(0.7)(0.6)⨯=0.3207617.从5双不同的鞋子中任取4只,求这4只鞋子中至少有两只鞋子配成一双的概率.【解】 4111152222410C C C C C 131C 21p =-= 18.某地某天下雪的概率为0.3,下雨的概率为0.5,既下雪又下雨的概率为0.1,求:(1) 在下雨条件下下雪的概率;(2) 这天下雨或下雪的概率.【解】 设A ={下雨},B ={下雪}.(1) ()0.1()0.2()0.5P AB p B A P A === (2) ()()()()0.30.50.10.7p A B P A P B P AB =+-=+-=19.已知一个家庭有3个小孩,且其中一个为女孩,求至少有一个男孩的概率(小孩为男为女是等可能的).【解】 设A ={其中一个为女孩},B ={至少有一个男孩},样本点总数为23=8,故 ()6/86()()7/87P AB P B A P A === 或在缩减样本空间中求,此时样本点总数为7. 6()7P B A =20.已知5%的男人和0.25%的女人是色盲,现随机地挑选一人,此人恰为色盲,问此人是男人的概率(假设男人和女人各占人数的一半).【解】 设A ={此人是男人},B ={此人是色盲},则由贝叶斯公式()()()()()()()()()P A P B A P AB P A B P B P A P B A P A P B A ==+ 0.50.05200.50.050.50.002521⨯==⨯+⨯ 21.两人约定上午9∶00~10∶00在公园会面,求一人要等另一人半小时以上的概率.题21图 题22图【解】设两人到达时刻为x,y ,则0≤x ,y ≤60.事件“一人要等另一人半小时以上”等价于|x -y |>30.如图阴影部分所示.22301604P == 22.从(0,1)中随机地取两个数,求:(1) 两个数之和小于65的概率; (2) 两个数之积小于14的概率. 【解】 设两数为x ,y ,则0<x ,y <1.(1) x +y <65. 11441725510.68125p =-== (2) xy =<14. 1111244111d d ln 242x p x y ⎛⎫=-=+ ⎪⎝⎭⎰⎰ 23.设P (A )=0.3,P (B )=0.4,P (A B )=0.5,求P (B |A ∪B )【解】 ()()()()()()()()P AB P A P AB P B A B P A B P A P B P AB -==+- 0.70.510.70.60.54-==+- 24.在一个盒中装有15个乒乓球,其中有9个新球,在第一次比赛中任意取出3个球,比赛后放回原盒中;第二次比赛同样任意取出3个球,求第二次取出的3个球均为新球的概率.【解】 设A i ={第一次取出的3个球中有i 个新球},i =0,1,2,3.B ={第二次取出的3球均为新球}由全概率公式,有30()()()i i i P B P B A P A ==∑33123213336996896796333333331515151515151515C C C C C C C C C C C C C C C C C C =•+•+•+•0.089=25. 按以往概率论考试结果分析,努力学习的学生有90%的可能考试及格,不努力学习的学生有90%的可能考试不及格.据调查,学生中有80%的人是努力学习的,试问:(1)考试及格的学生有多大可能是不努力学习的人?(2)考试不及格的学生有多大可能是努力学习的人?【解】设A ={被调查学生是努力学习的},则A ={被调查学生是不努力学习的}.由题意知P(A )=0.8,P (A )=0.2,又设B ={被调查学生考试及格}.由题意知P (B |A )=0.9,P (B |A )=0.9,故由贝叶斯公式知(1)()()()()()()()()()P A P B A P AB P A B P B P A P B A P A P B A ==+0.20.110.027020.80.90.20.137⨯===⨯+⨯ 即考试及格的学生中不努力学习的学生仅占2.702% (2) ()()()()()()()()()P A P B A P AB P A B P B P A P B A P A P B A ==+ 0.80.140.30770.80.10.20.913⨯===⨯+⨯ 即考试不及格的学生中努力学习的学生占30.77%.26. 将两信息分别编码为A 和B 传递出来,接收站收到时,A 被误收作B 的概率为0.02,而B 被误收作A 的概率为0.01.信息A 与B 传递的频繁程度为2∶1.若接收站收到的信息是A ,试问原发信息是A 的概率是多少?【解】 设A ={原发信息是A },则={原发信息是B }C ={收到信息是A },则={收到信息是B }由贝叶斯公式,得()()()()()()()P A P C A P A C P A P C A P A P C A =+ 2/30.980.994922/30.981/30.01⨯==⨯+⨯ 27.在已有两个球的箱子中再放一白球,然后任意取出一球,若发现这球为白球,试求箱子中原有一白球的概率(箱中原有什么球是等可能的颜色只有黑、白两种)【解】设A i ={箱中原有i 个白球}(i =0,1,2),由题设条件知P (A i )=13,i =0,1,2.又设B ={抽出一球为白球}.由贝叶斯公式知 111120()()()()()()()i i i P B A P A P A B P A B P B P B A P A ===∑ 2/31/311/31/32/31/311/33⨯==⨯+⨯+⨯ 28.某工厂生产的产品中96%是合格品,检查产品时,一个合格品被误认为是次品的概率为0.02,一个次品被误认为是合格品的概率为0.05,求在被检查后认为是合格品产品确是合格品的概率.【解】 设A ={产品确为合格品},B ={产品被认为是合格品}由贝叶斯公式得()()()()()()()()()P A P B A P AB P A B P B P A P B A P A P B A ==+ 0.960.980.9980.960.980.040.05⨯==⨯+⨯ 29.某保险公司把被保险人分为三类:“谨慎的”,“一般的”,“冒失的”.统计资料表明,上述三种人在一年内发生事故的概率依次为0.05,0.15和0.30;如果“谨慎的”被保险人占20%,“一般的”占50%,“冒失的”占30%,现知某被保险人在一年内出了事故,则他是“谨慎的”的概率是多少?【解】 设A ={该客户是“谨慎的”},B ={该客户是“一般的”},C ={该客户是“冒失的”},D ={该客户在一年内出了事故}则由贝叶斯公式得 ()()(|)(|)()()(|)()(|)()(|)P AD P A P D A P A D P D P A P D A P B P D B P C P D C ==++ 0.20.050.0570.20.050.50.150.30.3⨯==⨯+⨯+⨯ 30.加工某一零件需要经过四道工序,设第一、二、三、四道工序的次品率分别为0.02,0.03,0.05,0.03,假定各道工序是相互独立的,求加工出来的零件的次品率.【解】设A i ={第i 道工序出次品}(i =1,2,3,4).412341()1()i i P A P A A A A ==- 12341()()()()P A P A P A P A =-10.980.970.950.970.124=-⨯⨯⨯=31.设每次射击的命中率为0.2,问至少必须进行多少次独立射击才能使至少击中一次的概率不小于0.9?【解】设必须进行n 次独立射击.1(0.8)0.9n -≥即为 (0.8)0.1n ≤故 n ≥11至少必须进行11次独立射击.32.证明:若P (A |B )=P (A |B ),则A ,B 相互独立.【证】 (|)(|)P A B P A B =即()()()()P AB P AB P B P B = 亦即 ()()()()P AB P B P AB P B =()[1()][()()]()P AB P B P A P AB P B -=-因此 ()()()P AB P A P B =故A 与B 相互独立.33.三人独立地破译一个密码,他们能破译的概率分别为15,13,14,求将此密码破译出的概率.【解】 设A i ={第i 人能破译}(i =1,2,3),则 31231231()1()1()()()i i P A P A A A P A P A P A ==-=-42310.6534=-⨯⨯= 34.甲、乙、丙三人独立地向同一飞机射击,设击中的概率分别是0.4,0.5,0.7,若只有一人击中,则飞机被击落的概率为0.2;若有两人击中,则飞机被击落的概率为0.6;若三人都击中,则飞机一定被击落,求:飞机被击落的概率.【解】设A ={飞机被击落},B i ={恰有i 人击中飞机},i =0,1,2,3由全概率公式,得30()(|)()i i i P A P A B P B ==∑=(0.4×0.5×0.3+0.6×0.5×0.3+0.6×0.5×0.7)0.2+(0.4×0.5×0.3+0.4×0.5×0.7+0.6×0.5×0.7)0.6+0.4×0.5×0.7=0.45835.已知某种疾病患者的痊愈率为25%,为试验一种新药是否有效,把它给10个病人服用,且规定若10个病人中至少有四人治好则认为这种药有效,反之则认为无效,求:(1) 虽然新药有效,且把治愈率提高到35%,但通过试验被否定的概率.(2) 新药完全无效,但通过试验被认为有效的概率.【解】(1) 3101100C(0.35)(0.65)0.5138k k k k p -===∑ (2) 10102104C(0.25)(0.75)0.2241kk k k p -===∑36.一架升降机开始时有6位乘客,并等可能地停于十层楼的每一层.试求下列事件的概率:(1) A =“某指定的一层有两位乘客离开”;(2) B =“没有两位及两位以上的乘客在同一层离开”;(3) C =“恰有两位乘客在同一层离开”;(4) D =“至少有两位乘客在同一层离开”.【解】 由于每位乘客均可在10层楼中的任一层离开,故所有可能结果为106种.(1) 2466C 9()10P A =,也可由6重贝努里模型: 224619()C ()()1010P A = (2) 6个人在十层中任意六层离开,故6106P ()10P B = (3) 由于没有规定在哪一层离开,故可在十层中的任一层离开,有110C 种可能结果,再从六人中选二人在该层离开,有26C 种离开方式.其余4人中不能再有两人同时离开的情况,因此可包含以下三种离开方式:①4人中有3个人在同一层离开,另一人在其余8层中任一层离开,共有131948C C C 种可能结果;②4人同时离开,有19C 种可能结果;③4个人都不在同一层离开,有49P 种可能结果,故1213114610694899()C C (C C C C P )/10P C =++ (4) D=B .故 6106P ()1()110P D P B =-=- 37. n 个朋友随机地围绕圆桌而坐,求下列事件的概率:(1) 甲、乙两人坐在一起,且乙坐在甲的左边的概率;(2) 甲、乙、丙三人坐在一起的概率;(3) 如果n 个人并排坐在长桌的一边,求上述事件的概率.【解】 (1) 111p n =- (2) 23!(3)!,3(1)!n p n n -=>- (3) 12(1)!13!(2)!;,3!!n n p p n n n n --''===≥ 38.将线段[0,a ]任意折成三折,试求这三折线段能构成三角形的概率【解】 设这三段长分别为x ,y ,a -x -y .则基本事件集为由0<x <a ,0<y <a ,0<a -x -y <a 所构成的图形,有利事件集为由()()x y a x y x a x y y y a x y x+>--⎡⎢+-->⎢⎢+-->⎣ 构成的图形,即02022a x a y a x y a ⎡<<⎢⎢⎢<<⎢⎢⎢<+<⎢⎣ 如图阴影部分所示,故所求概率为14p =. 39. 某人有n 把钥匙,其中只有一把能开他的门.他逐个将它们去试开(抽样是无放回的).证明试开k 次(k =1,2,…,n )才能把门打开的概率与k 无关.【证】 11P 1,1,2,,P k n k n p k n n --===40.把一个表面涂有颜色的立方体等分为一千个小立方体,在这些小立方体中,随机地取出一个,试求它有i 面涂有颜色的概率P (A i )(i =0,1,2,3).【解】 设A i ={小立方体有i 面涂有颜色},i =0,1,2,3.在1千个小立方体中,只有位于原立方体的角上的小立方体是三面有色的,这样的小立方体共有8个.只有位于原立方体的棱上(除去八个角外)的小立方体是两面涂色的,这样的小立方体共有12×8=96个.同理,原立方体的六个面上(除去棱)的小立方体是一面涂色的,共有8×8×6=384个.其余1000-(8+96+384)=512个内部的小立方体是无色的,故所求概率为01512384()0.512,()0.38410001000P A P A ====, 24968()0.096,()0.00810001000P A P A ====. 41.对任意的随机事件A ,B ,C ,试证P (AB )+P (AC )-P (BC )≤P (A ).【证】 ()[()]()P A P A B C P AB AC ≥=()()()P AB P AC P ABC =+-()()()P AB P AC P BC ≥+-42.将3个球随机地放入4个杯子中去,求杯中球的最大个数分别为1,2,3的概率.【解】 设i A ={杯中球的最大个数为i },i =1,2,3.将3个球随机放入4个杯子中,全部可能放法有43种,杯中球的最大个数为1时,每个杯中最多放一球,故3413C 3!3()48P A == 而杯中球的最大个数为3,即三个球全放入一个杯中,故1433C 1()416P A == 因此 213319()1()()181616P A P A P A =--=--= 或 12143323C C C 9()416P A == 43.将一枚均匀硬币掷2n 次,求出现正面次数多于反面次数的概率.【解】掷2n 次硬币,可能出现:A ={正面次数多于反面次数},B ={正面次数少于反面次数},C ={正面次数等于反面次数},A ,B ,C 两两互斥.可用对称性来解决.由于硬币是均匀的,故P (A )=P (B ).所以1()()2P C P A -= 由2n 重贝努里试验中正面出现n 次的概率为211()()()22n n n n P C C =故 2211()[1C ]22n n n P A =- 44.掷n 次均匀硬币,求出现正面次数多于反面次数的概率.【解】设A ={出现正面次数多于反面次数},B ={出现反面次数多于正面次数},由对称性知P (A )=P (B )(1) 当n 为奇数时,正、反面次数不会相等.由P (A )+P (B )=1得P (A )=P (B )=0.5(2) 当n 为偶数时,由上题知211()[1C ()]22nn n P A =-45.设甲掷均匀硬币n +1次,乙掷n 次,求甲掷出正面次数多于乙掷出正面次数的概率.【解】 令甲正=甲掷出的正面次数,甲反=甲掷出的反面次数.乙正=乙掷出的正面次数,乙反=乙掷出的反面次数. 显然有>正正(甲乙)=(甲正≤乙正)=(n +1-甲反≤n -乙反) =(甲反≥1+乙反)=(甲反>乙反)由对称性知P (甲正>乙正)=P (甲反>乙反) 因此P (甲正>乙正)=1246.证明“确定的原则”(Sure -thing ):若P (A |C )≥P (B |C ),P (A |C )≥P (B |C ),则P (A )≥P (B ).【证】由P (A |C )≥P (B |C ),得()(),()()P AC P BC P C P C ≥即有 ()()P AC P BC ≥ 同理由 (|)(|),P A C P B C ≥ 得 ()(),P AC P BC ≥故 ()()()()()()P A P AC P AC P BC P BC P B =+≥+= 47.一列火车共有n 节车厢,有k (k ≥n )个旅客上火车并随意地选择车厢.求每一节车厢内至少有一个旅客的概率.【解】 设A i ={第i 节车厢是空的},(i =1,…,n ),则121(1)1()(1)2()(1)1()(1)n k ki kki j ki i i n P A n nP A A n n P A A A n--==-=--=-其中i 1,i 2,…,i n -1是1,2,…,n 中的任n -1个. 显然n 节车厢全空的概率是零,于是2112111122111111123111()(1)C (1)2()C (1)1()C (1)0()(1)n n nk ki ni ki j n i j nn kn i i i n i i i nn nn i ni S P A n n n S P A A n n S P A A A nS P A S S S S --=≤<≤--≤<<≤+===-=-==--==-==-+-+-∑∑∑121121C (1)C (1)(1)C (1)kkn n kn n n n nnn--=---++--故所求概率为121121()1C (1)C (1)nk i i n ni P A n n=-=--+--+111(1)C (1)n n kn n n+----48.设随机试验中,某一事件A 出现的概率为ε>0.试证明:不论ε>0如何小,只要不断地独立地重复做此试验,则A 迟早会出现的概率为1. 【证】在前n 次试验中,A 至少出现一次的概率为1(1)1()n n ε--→→∞49.袋中装有m 只正品硬币,n 只次品硬币(次品硬币的两面均印有国徽).在袋中任取一只,将它投掷r 次,已知每次都得到国徽.试问这只硬币是正品的概率是多少? 【解】设A ={投掷硬币r 次都得到国徽}B ={这只硬币为正品} 由题知 (),()m nP B P B m n m n==++ 1(|),(|)12r P A B P A B ==则由贝叶斯公式知()()(|)(|)()()(|)()(|)P AB P B P A B P B A P A P B P A B P B P A B ==+121212rrrm m m n m nm n m n m n+==++++ 50.巴拿赫(Banach )火柴盒问题:某数学家有甲、乙两盒火柴,每盒有N 根火柴,每次用火柴时他在两盒中任取一盒并从中任取一根.试求他首次发现一盒空时另一盒恰有r 根的概率是多少?第一次用完一盒火柴时(不是发现空)而另一盒恰有r 根的概率又有多少? 【解】以B 1、B 2记火柴取自不同两盒的事件,则有121()()2P B P B ==.(1)发现一盒已空,另一盒恰剩r 根,说明已取了2n -r 次,设n 次取自B 1盒(已空),n -r 次取自B 2盒,第2n -r +1次拿起B 1,发现已空。
概率论第7章
频率分布直方图
步骤如下: (1)决定组距与组数
选取起点与终点。起点a选得比最小值略小些, 终点b选得比最大值略大些,确定组距:d=(b-a)/m
将[a,b]进行等分,即在[a,b]内插入 m-1个分点:
a x1' x2' xm' 1 b
把[a,b]分成m个组(即小区间)。 通常在试验数据较多(即样本容量n较大)
时,可分成10~20组,数据在100以内可分成 5~12组。这里的起点、终点、组距、组数可视 具体情况来定。
(2)数出频数,列出分组频率分布 数出样本值x1,x2,…,xn 落在每个组的数目,
计算每个组的频数与频率。
(3)绘出频率分布直方图 以样本值为横轴,以(频率÷组距)为纵轴,
在横轴上标出各分组的点,以各组的组距为底, 画出高度等于(频率÷组距)的小矩形。整个图 形称为频率分布直方图,简称为直方图。
F n1
n2
服从第一自由度为n1、第二自由度为n2的F分布。 记为F~F(n1,n2)。
如F~F(n1,n2),则其密度函数为
f
(x)
( n1
n2 2
)
(
n1 2
)(
n2 2
)
(
n1
)
n1 2
n2
n1 1
x 2 (1
n1 n2
n1 n2
x) 2
0
x0 x0
下图描绘了F(10,50),F(10,10),F(10,4)的密度曲线。
数理统计研究的是:一个随机变量所服从的分布是 未知的,或者知其分布而不知其中所含的参数,需 要确定这个随机变量的分布或参数。 数理统计的研究方法是归纳法,同概率论相反。
例如,通过检查某厂家一批产品中的100个产品, 从而设法估计这批产品的合格率。
概率论与数理统计教程第七章答案
.第七章假设检验7.1设总体J〜N(4Q2),其中参数4, /为未知,试指出下面统计假设中哪些是简洁假设,哪些是复合假设:(1) W o: // = 0, σ = 1 ;(2) W o√∕ = O, σ>l5(3) ∕70:// <3, σ = 1 ;(4) % :0< 〃 <3 ;(5)W o :// = 0.解:(1)是简洁假设,其余位复合假设7.2设配么,…,25取自正态总体息(19),其中参数〃未知,无是子样均值,如对检验问题“0 :〃 = 〃o, M :4工从)取检验的拒绝域:c = {(x1,x2,∙∙∙,x25)r∣x-χ∕0∖≥c},试打算常数c ,使检验的显著性水平为0. 05_ Q解:由于J〜N(〃,9),故J~N(",二)在打。
成立的条件下,一/3 5cP o(∖ξ-^∖≥c) = P(∖ξ-μJ^∖≥-)=2 1-Φ(y) =0.05Φ(-) = 0.975,-= 1.96,所以c=L176°3 37. 3 设子样。
,乙,…,25取自正态总体,cr:已知,对假设检验%邛=μ0, H2> /J。
,取临界域c = {(X[,w,…,4):片>9)},(1)求此检验犯第一类错误概率为α时,犯其次类错误的概率夕,并争论它们之间的关系;(2)设〃o=0∙05, σ~=0. 004, a =0.05, n=9,求"=0.65 时不犯其次类错误的概率。
解:(1)在儿成立的条件下,F~N(∕o,军),此时a = P^ξ≥c^ = P0< σo σo )所以,包二为册=4_,,由此式解出c°=窄4f+为% ∖∣n在H∣成立的条件下,W ~ N",啊 ,此时nS = %<c°) = AI。
气L =①(^^~品)二①匹%=①(2δξ^历σoA∣-σ+A)-A-------------- y∕n)。
(完整版)概率论与数理统计知识点总结
p k q nk
其中 q 1 p,0 p 1, k 0,1,2,, n ,
则称随机变量 X 服从参数为 n , p 的二项分布。记为
X ~ B(n, p) .
当 n 1时, P(X k) pk q1k , k 0.1,这就是(0—1)分布,
所以(0-1)分布是二项分布的特例。
泊 松 设随机变量 X 的分布律为
1
(完整版)概率论与数理统计知识点总结
A—B,也可表示为 A—AB 或者 AB ,它表示 A 发生而 B 不发生的事
件.
A、B 同时发生:A B,或者 AB。A B=Ø ,则表示 A 与 B 不可能 同时发生,称事件 A 与事件 B 互不相容或者互斥。基本事件是
互不相容的.
—A 称为事件 A 的逆事件,或称 A 的对立事件,记为 A .它表 示 A 不发生的事件。互斥未必对立。
P(A)= (1) (2 ) (m ) = P(1) P(2 ) P(m )
m n
A所包含的基本事件数 基本事件总数
(6)几 若随机试验的结果为无限不可数并且每个结果出现的可能性均
1
(完整版)概率论与数理统计知识点总结
何概型 匀,同时样本空间中的每一个基本事件可以使用一个有界区域 来描述,则称此随机试验为几何概型。对任一事件 A,
3° F() lim F(x) 0, F() lim F(x) 1;
x
x
4° F(x 0) F(x) ,即 F(x) 是右连续的;
5° P(X x) F(x) F(x 0) .
对于离散型随机变量, F(x) pk ; xk x x
对于连续型随机变量, F(x) f (x)dx .
概型 用 p 表示每次试验 A 发生的概率,则 A 发生的概率为1 p q ,用
概率论与数理统计第七章参数估计习题答案
æ çè
x
±
ua
/
2
s n
ö ÷ø
=
(14.95
±
0.1´1.96)
=
(14.754,15.146)
大学数学云课堂
3028709.总体X ~ N (m,s 2 ),s 2已知,问需抽取容量n多大的样本,
才能使m的置信概率为1 -a,且置信区间的长度不大于L?
解:由s
2已知可知m的置信度为1
-
a的置信区间为
64 69 49 92 55 97 41 84 88 99 84 66 100 98 72 74 87 84 48 81 (1)求m的置信概率为0.95的置信区 间.
(2)求s 2的置信概率为0.95的置信区间.
解:x = 76.6, s = 18.14,a = 1- 0.95 = 0.05, n = 20,
大学数学云课堂
3028706.设X1,X 2,L,X n是取自总体X的样本,E(X)= m,D(X)= s 2,
n -1
å sˆ 2 = ( X i+1 - X i )2 ,问k为何值时sˆ 2为s 2的无偏估计. i =1 解:令 Yi = X i+1 - X i , i = 1, 2,¼, n -1, 则E(Yi ) = E( X i+1) - E( X i ) = m - m = 0, D(Yi ) = 2s 2 , n -1 å 于是Esˆ 2 = E[k ( Yi2 )] = k(n -1)EY12 = 2s 2 (n -1)k, i =1 那么当E(sˆ 2 ) = s 2 ,即2s 2 (n -1)k = s 2时, 有k = 1 . 2(n -1)
的密度函数为f
(x,q
概率论与数理统计(第三版)课后答案习题7
第七章 参数估计1. 解 )1()(,)(),,(~p np X D np X E p n B X -==∴⎩⎨⎧=-=⎩⎨⎧==22)1(,)()(B p np X np B X D X X E 即由解之,得n,p 的矩估计量为XB p B X X n 2221,-=⎥⎥⎦⎤⎢⎢⎣⎡-=∧∧注:“[ ]”表示取整。
2. 解 因为:220)(22)(1)1()(1)()(λλθλλθλθλθλ++=⋅=+=⋅==⎰⎰⎰∞+--∞+--∞+∞-dx e x x E dx e x dx x xf x E x x所以,由矩估计法得方程组: ⎪⎩⎪⎨⎧++=+=2221)1(1λλθλθA X 解得λθ,的矩估计量为 ⎪⎩⎪⎨⎧=-=∧∧221B B X λθ3. 解 (1) 由于 222)]([)()(X E X E X D -==σ令 ∑===n i iX n A X E 12221)( 又已知 μ=)(X E故 2σ的矩估计值为 ∑∑==∧-=-=-=n i i n i i X n X n A 12122222)(11μμμσ(2) μ已知时,似然函数为:⎭⎬⎫⎩⎨⎧--⋅=∑=-ni in x L 122222)(21exp )2()(μσπσσ因此∑=---=ni ixn L 12222)(21)2ln(2)(ln μσπσσ令 0)(2112)(ln 124222=-+-=∑=ni ixn L d dμσσσσ解得2σ的极大似然估计为: ∑=∧-=n i i X n 122)(1μσ4. 解 矩估计:λλ=∴=)()(X E X E 令X X E =)(故X =∧λ为所求矩估计量。
注意到 λ=)(X D 若令 2)(B X D =, 可得: 2B =∧λ似然估计:因为λλ-==e k k X P k!)(所以,λ的似然函数为∏=-=ni i xe x L i1!)(λλλ取对数λλλn x x L ni i ni i --=∑∑==11)!ln(ln )(ln令ln 1=-=∑=n xd d ni iλλλ, 解得∑=∧=ni ix n 11λ故,λ极大似然估计量为 X =∧λ5. 解 矩估计:21)1()()(11++=+==⎰⎰+∞+∞-θθθθdx x dx x xf X E令 X X E =)(, 即 X=++21θθ; 解之X X --=∧112θ 似然估计: 似然函数为⎪⎩⎪⎨⎧<<+=⎪⎩⎪⎨⎧<<+=∏∏==其它其它,010,)()1(,010,)1()(11i ni i ni n i i x x x x L θθθθθ 只需求10,)()1()(11<<+=∏=i ni i nx x L θθθ的驻点即可.又∑=++=ni ix n L 11ln )1ln()(ln θθθ令∑=++=ni ix n L d d 11ln 1)(ln θθθ; 解之∑=∧--=ni ixn1ln 1θ6. 解:似然函数为∑===---=-=---∏∏ni i i xn i i n ni x i ex ex L 12222)(l n 21112212)(l n 12)()2(21),(μσσμπσσπσμ取对数得 ∑----===∏n i ini i x x n L 122122)(l n 21)l n ()2l n (2),(ln μσπσσμ由 0)(l n 2112),(ln 0)1()(ln 221),(ln 124222122=∑-+⋅-=∂∂=∑-⋅--=∂∂==n i i n i i x n L x L μσσσμσμσσμμ联立解之,2,σμ的极大似然估计值为 ∑∑-=∑===∧=∧n i n i i in i i x n x n x n 12121)ln 1(ln 1,ln 1σμ7. 解:似然函数为 n i x x e ax L i i n i x a i ai ,,2,1;0,00,)(11 =⎪⎩⎪⎨⎧≤>=∏=--λλλ只需求∑⋅===--==--∏∏ni ai ai x a n i n n ni x a i ex a eax L 111111)()(λλλλλ的最值点。
概率论与数理统计习题册 第七章 答案
上是不可能的.再设有无顾客来到与服务是否完毕是相互独立的.试用马氏链描述
这个服务系统,并求其一步转移概率矩阵.(参考陕西人民教育出版社,概率论与数
理统计辅导,P214)
- 106 -
第十一章 马尔可夫莲
系别
班级
姓名
学号
.
作业 19 多步转移概率的确定、遍历性
一、设任意相继的两天中,雨天转晴天的概率为 1 ,晴天转雨天的概率为 1 ,
要服务的顾客到达系统时发现系统内已有 3
个顾客(一个正在接受服务,两个在等候室
排队),则该顾客即离去.设时间间隔 ∆t 内
将有一个顾客进入系统的概率为 q ,有一原
来被服务的顾客离开系统(即服务完毕)的
第 11.5 题图
概率为 p .又设当 ∆t 充分小时,在这时间间隔内多于一个顾客进入或离开系统实际
⎡1 1⎤
P
=
⎢ ⎢
2
2
⎥ ⎥
⎢1 2⎥
⎢⎣3 3 ⎥⎦
⎡5 P 2 = ⎢⎢12
⎢7 ⎢⎣18
7⎤
12
⎥ ⎥,
11 ⎥
18 ⎥⎦
所以已知
5
月
1
日为晴天,5
月
3
日为晴天的概率为
p00
(2)
=
5 12
;已知
5
月
3
日为晴天,5
月
5
日为雨天的概率等于
p01
(2)
=
7 12
,已知
5
月
1
日为晴天,5
月
3
日为晴天,且
5
月
5
日为雨天
的概率
P{X3 = 0, X5 = 1| X1 = 0} = P{X3 = 0 | X1 = 0} P{X5 = 1| X3 = 0, X1 = 0}
概率论与数理统计(理工类,第四版)吴赣昌主编课后习题答案第七章
写在前面:由于答案是一个个复制到word中,比较耗时耗力,故下载收取5分,希望需要的朋友给予理解和支持!PS:网上有一些没经我同意就将我的答案整合、转换成pdf,放在文库里的,虽然是免费的,但是窃取了我的劳动成果,希望有心的朋友支持我一下,下载我的原版答案。
第七章假设检验7.1 假设检验的基本概念习题1样本容量n确定后,在一个假设检验中,给定显著水平为α,设此第二类错误的概率为β,则必有(). (A)α+β=1;(B)α+β>1;(C)α+β<1;(D)α+β<2.解答:应选(D).当样本容量n确定后,α,β不能同时都很小,即α变小时,β变大;而β变小时,α变大.理论上,自然希望犯这两类错误的概率都很小,但α,β的大小关系不能确定,并且这两类错误不能同时发生,即α=1且β=1不会发生,故选(D).习题2设总体X∼N(μ,σ2),其中σ2已知,若要检验μ,需用统计量U=X¯-μ0σ/n.(1)若对单边检验,统计假设为H0:μ=μ0(μ0已知),H1:μ>μ0,则拒绝区间为;(2)若单边假设为H0:μ=μ0,H1:μ<μ0,则拒绝区间为(给定显著性水平为α,样本均值为X¯,样本容量为n,且可记u1-α为标准正态分布的(1-α)分位数).解答:应填(1)U>u1-α;(2)U<uα.由单侧检验及拒绝的概念即可得到.习题3如何理解假设检验所作出的“拒绝原假设H0”和“接受原假设H0”的判断?解答:拒绝H0是有说服力的,接受H0是没有充分说服力的. 因为假设检验的方法是概率性质的反证法,作为反证法就是必然要“推出矛盾”,才能得出“拒绝H0”的结论,这是有说服力的,如果“推不出矛盾”,这时只能说“目前还找不到拒绝H0的充分理由”,因此“不拒绝H0”或“接受H0”,这并没有肯定H0一定成立. 由于样本观察值是随机的,因此拒绝H0,不意味着H0是假的,接受H0也不意味着H0是真的,都存在着错误决策的可能.当原假设H0为真,而作出了拒绝H0的判断,这类决策错误称为第一类错误,又叫弃真错误,显然犯这类错误的概率为前述的小概率α:α=P(拒绝H0|H0为真);而原假设H0不真,却作出接受H0的判断,称这类错误为第二类错误,又称取伪错误,它发生的概率β为β=P(接受H0|H0不真).习题4犯第一类错误的概率α与犯第二类错误的概率β之间有何关系?解答:一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往会增大.要它们同时减少,只有增加样本容量n.在实际问题中,总是控制犯第一类错误的概率α而使犯第二类错误的概率尽可能小.α的大小视具体实际问题而定,通常取α=0.05,0.005等值.习题5在假设检验中,如何理解指定的显著水平α?解答:我们希望所作的检验犯两类错误的概率尽可能都小,但实际上这是不可能的. 当样本容量n固定时,一般地,减少犯其中一个错误的概率就会增加犯另一个错误的概率. 因此,通常的作法是只要求犯第一类错误的概率不大于指定的显著水平α,因而根据小概率原理,最终结论为拒绝H0较为可靠,而最终判断力接受H0则不大可靠,其原因是不知道犯第二类错误的概率β究竟有多少,且α小,β就大,所以通常用“H0相容”,“不拒绝H0”等词语来代替“接受H0”,而“不拒绝H0”还包含有再进一步作抽样检验的意思.习题6在假设检验中,如何确定原假设H0和备择假设H1?解答:在实际中,通常把那些需要着重考虑的假设视为原假设H0,而与之对应的假设视为备择假设H1.(1)如果问题是要决定新方案是否比原方案好,往往将原方案取假设,而将新方案取为备择假设;(2)若提出一个假设,检验的目的仅仅是为了判断这个假设是否成立,这时直接取此假设为原假设H0即可.习题7假设检验的基本步骤有哪些?解答:根据反证法的思想和小概率原理,可将假设检验的步骤归纳如下:(1)根据问题的要求,提出原理假设H0和备择假设H1.(2)根据检验对象,构造检验统计量T(X1,X2,⋯,Xn),使当H0为真时,T有确定的分布.(3)由给定的显著水平α,查统计量T所服从的分布表,定出临界值λ,使P(∣T∣>λ)=α,或P(T>λ1)=P(T<λ2)=α/2,从而求出H0的拒绝域:∣T∣>λ或T>λ1,T<λ2.(4)由样本观察值计算统计量T的观察值t.(5)作出判断,将t的值与临界值比较大小作出结论:当t∈拒绝域量时,则拒绝H0,否则,不拒绝H0,即认为在显著水平α下,H0与实际情况差异不显著.习题8假设检验与区间估计有何异同?解答:假设检验与区间估计的提法虽不同,但解决问题的途径是相通的. 参数θ的置信水平为1-α的置信区间对应于双边假设检验在显著性水平α下的接受域;参数θ的置信水平为1-α的单侧置信区对应于单边假设检验在显著性水平α下的接受域.在总体的分布已知的条件下,假设检验与区间估计是从不同的角度回答同一个问题. 假设检验是判别原假设H0是否成立,而区间估计解决的是“多少”(或范围),前者是定性的,后者是定量的.习题9某天开工时,需检验自动包装工作是否正常. 根据以往的经验,其装包的质量在正常情况下服从正态分布N(100,1.52)(单位:kg).现抽测了9包,其质量为:99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.0,100.5.问这天包装机工作是否正常?将这一问题化为假设检验问题. 写出假设检验的步骤(α=0.05).解答:(1)提出假设检验问题H0:μ=100,H1:μ≠100;(2)选取检验统计量U:U=X¯-1001.59,H0成立时, U∼N(0,1);(3)α=0.05,uα/2=1.96,拒绝域W={∣u∣>1.96};(4)x¯≈99.97,∣u∣=0.06.因∣u∣<uα/2=1.96,故接受H0,认为包装机工作正常.习题10设总体X∼N(μ,1),X1,X2,⋯,Xn是取自X的样本. 对于假设检验H0:μ=0,H1:μ≠0,取显著水平α,拒绝域为W={∣u∣>uα/2},其中u=nX¯,求:(1)当H0成立时, 犯第一类错误的概率α0;(2)当H0不成立时(若μ≠0),犯第二类错误的概率β.解答:(1)X∼N(μ,1),X¯∼N(μ,1/n),故nX¯=u∼N(0,1).α0=P{∣u∣>uα/2∣μ=0}=1-P{-uα/2≤u≤uα/2}=1-[Φ(uα/2)-Φ(-uα/2)]=1-[(1-α2)-α2]=α,即犯第一类错误的概率是显著水平α.(2)当H0不成立,即μ≠0时,犯第二类错误的概率为β=P{∣u∣≤uα/2∣E(X)=μ}=P{-uα/2≤u≤uα/2∣E(X)=μ}=P{-uα/2≤nX¯≤uα/2∣E(X)=μ}=P{-uα/2-nμ≤n(X¯-μ)≤uα/2-nμ∣E(X)=μ}=Φ(uα/2-nμ)-Φ(-uα/2-nμ).注1当μ→+∞或μ→-∞时,β→0.由此可见,当实际均值μ偏离原假设较大时,犯第二类错误的概率很小,检验效果较好.注2当μ≠0但接近于0时,β≈1-α.因α很小,故犯第二类错误的概率很大,检验效果较差.7.2 单正态总体的假设检验习题1已知某炼铁厂铁水含碳量服从正态分布N(4.55,0.1082).现在测定了9炉铁水,其平均含碳量为4.484.如果估计方差没有变化,可否认为现在生产的铁水平均含碳量仍为4.55(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=4.55,H1:μ≠4.55.由于σ2=0.1082已知,所以可选取统计量U=X¯-4.550.108/9,在H0成立的条件下,U∼N(0,1),且此检验问题的拒绝域为∣U∣=∣X¯-4.550.108/9∣>uα/2,这里u=4.484-4.550.108/9≈-1.833,uα/2=1.96.显然∣u∣=1.833<1.96=uα/2.说明U没有落在拒绝域中,从而接受H0,即认为现在生产之铁水平均含碳量仍为4.55.习题2要求一种元件平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时. 已知该种元件寿命服从标准差为σ=100小时的正态分布,试在显著性水平α=0.05下确定这批元件是否合格?设总体均值为μ,μ未知,即需检验假设H0:μ≥1000,H1:μ<1000.解答:检验假设H0:μ≥1000,H1:μ<1000.这是单边假设检验问题. 由于方差σ2=0.05,故用u检验法. 对于显著性水平α=0.05,拒绝域为W={X¯-1000σ/n<-uα.查标准正态分布表,得u0.05=1.645.又知n=25,x¯=950,故可计算出x¯-1000σ/n=950-1000100/25=-2.5.因为-2.5<-1.645,故在α=0.05下拒绝H0,认为这批元件不合格.习题3打包机装糖入包,每包标准重为100kg.每天开工后,要检验所装糖包的总体期望值是否合乎标准(100kg).某日开工后,测得9包糖重如下(单位:kg):99.398.7100.5101.298.399.799.5102.1100.5打包机装糖的包得服从正态分布,问该天打包机工作是否正常(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=100,H1:μ≠100.由于σ2未知,所以可选取统计量T=X¯-100S/n,在H0成立的条件下,T∼t(n-1),且此检验问题的拒绝域为∣T∣=∣X¯-100S/n∣>tα/2(n-1),这里t=x¯-100s/n≈99.978-1001.2122/9≈-0.0544,t0.025(8)=2.306.显然∣t∣=0.0544<2.306=t0.025(8),即t未落在拒绝域中,从而接受H0,即可以认为该天打包工作正常.习题4机器包装食盐,假设每袋盐的净重服从正态分布,规定每袋标准含量为500g,标准差不得超过10g.某天开工后,随机抽取9袋,测得净重如下(单位:g):497,507,510,475,515,484,488,524,491,试在显著性水平α=0.05下检验假设:H0:μ=500,H1:μ≠500.解答:x¯=499,s≈16.031,n=9,t=(x¯-μ0)sn=499-50016.0319=-0.1871,α=0.05,t0.025(8)=2.306.因∣t∣<t0.025(8),故接受H0,认为该天每袋平均质量可视为500g.习题5从清凉饮料自动售货机,随机抽样36杯,其平均含量为219(mL),标准差为14.2mL,在α=0.05的显著性水平下,试检验假设:H0:μ=μ0=222,H1:μ<μ0=222.解答:设总体X∼N(μ,σ2),X代表自动售货机售出的清凉饮料含量,检验假设H0:μ=μ0=222(mL),H1:μ<222(mL).由α=0.05,n=36,查表得t0.05(36-1)=1.6896,拒绝域为W={t=x¯-μ0s/n<-tα(n-1).计算t值并判断:t=219-22214.2/36≈-1.27>-1.6896,习题6某种导线的电阻服从正态分布N(μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s=0.008Ω,对于α=0.05,能否认为这批导线电阻的标准差仍为0.005?解答:本问题是在α=0.05下检验假设H0:σ2=0.0052,H1:σ2≠0.0052.选取统计量χ2=n-1σ2S2,在H0成立的条件下,χ2∼χ2(n-1),且此检验问题的拒绝域为χ2>χα/22(n-1)或χ2<χ1-α/22(n-1).这里χ2=9-10.0052s2=80.0052×0.0082=20.48,χ0.9752(8)=2.18,χ0.0252(8)=17.5.显然χ2落在拒绝域中,从而拒绝H0,即不能认为这批导线电阻的标准差仍为0.005.习题7某厂生产的铜丝,要求其折断力的方差不超过16N2.今从某日生产的铜丝中随机抽取容量为9的样本,测得其折断力如下(单位:N):289,286,285,286,285,284,285,286,298,292设总体服从正态分布,问该日生产的铜线的折断力的方差是否符合标准(α=0.05)?解答:检验问题为H0:σ2≤16,H1:σ2>16,n=9,s2≈20.3611,χ2=8×s216≈10.181,α=0.05,χ0.052(8)=15.507.因χ2<χ0.052(8)=15.507,故接受H0,可认为铜丝的折断力的方差不超过16N2.习题8过去经验显示,高三学生完成标准考试的时间为一正态变量,其标准差为6min.若随机样本为20位学生,其标准差为s=4.51,试在显著性水平α=0.05下,检验假设:H0:σ≥6,H1:σ<6.解答:H0:σ≥6,H1:σ<6.α=0.05,n-1=19,s=4.51,χ0.952(19)=10.117.拒绝域为W={χ2<10.117}.计算χ2值χ2=(20-1)×4.51262≈10.74.因为10.74>10.117,故接受H0,认为σ≥6.习题9测定某种溶液中的水分,它的10个测定值给出s=0.037%,设测定值总体服从正态分布,σ2为总体方差,σ2未知,试在α=0.05水平下检验假设:H0:σ≥0.04%,H1:σ<0.04%.解答:在α=0.05下,拒绝域为W={(n-1)S2σ02<χ1-α2(9).查χ2分布表得χ0.952(9)=3.325.计算得(n-1)s2σ02=(10-1)×(0.037\per)2(0.04\per)2≈7.7006>3.325,未落入拒绝域,故接受H0.sw=(5-1)×(1.971)2+(4-1)×(1.167)25+4-2≈1.674.查表得t0.005(7)=1.895.算得t=2.86-2.075-01.67415+14≈0.699<1.895.因为0.699<1.895,故不拒绝H0,认为此药无效.习题3据现在的推测,矮个子的人比高个子的人寿命要长一些.下面给出美国31个自然死亡的总统的寿命,将他们分为矮个子与高个子2类,列表如下:矮个子总统8579679080高个子总统6853637088746466606078716790737177725778675663648365假设2个寿命总体均服从正态分布且方差相等,试问这些数据是否符合上述推陈出推测(α=0.05)?解答:设μ1,μ2分别为矮个子与高个子总统的平均寿命,则检验问题为H0:μ1≤μ2,H1:μ1>μ2,n1=5,x¯=80.2,s1≈8.585,n2=26,y¯≈69.15,s2≈9.315,sw=4×8.5852+9.315229≈9.218,n1n2n1+n2≈2.048,t=(80.2-69.15)9.218×2.048≈2.455,α=0.05,t0.05(29)=1.6991,因t>t0.05(29)=1.6991,故拒绝H0,认为矮个子总统的寿命比高个子总统寿命长.习题4在20世纪70年代后期人们发现,酿造啤酒时,在麦芽干燥过程中形成致癌物质亚硝基二甲胺(NDMA).到了20世纪80年代初期,人们开发了一种新的麦芽干燥过程,下面给出了分别在新、老两种过程中形成的NDMA含量(以10亿份中的份数计):故拒绝H0,认为新、老过程中形成的NDMA平均含量差大于2.习题5有两台车床生产同一种型号的滚珠. 根据过去的经验,可以认为这两台车床生产的滚珠的直径都服从正态分布. 现要比较两台车床所生产滚珠的直径的方差,分别抽出8个和9个样品,测得滚珠的直径如下(单位:mm).甲车床xi:15.014.515.215.514.815.115.214.8乙车床yi:15.215.014.815.215.015.014.815.114.8问乙车床产品的方差是否比甲车床的小(α=0.05)?解答:以X,Y分别表示甲,乙二车床产品直径.X∼N(μ1,σ12),Y∼N(μ2,σ22),X,Y独立. 检验假设H0:σ12=σ22,H1:σ22<σ22.用F检验法, 在H0成立时F=S12S22∼F(n1-1,n2-1).由已知数据算得x¯≈15.01,y¯≈14.99,s12≈0.0955,s22≈0.0261,n1=8,n2=9,α=0.05.拒绝域为Rα={F>Fα(n1-1,n2-1)}.查F分布表得F0.05(8-1,9-1)=3.50.计算F值F=s12/s22=0.0955/0.0261≈3.66.因为3.66>3.50,故应否定H0,即认为乙车床产品的直径的方差比甲车床的小.习题6某灯泡厂采用一项新工艺的前后,分别抽取10个灯泡进行寿命试验. 计算得到:采用新工艺前灯泡寿命的样本均值为2460小时. 样本标准差为56小时;采用新工艺后灯泡寿命的样本均值为2550小时,样本标准差为48小时. 设灯泡的寿命服从正态分布,是否可以认为采用新工艺后灯泡的平均寿命有显著提高(α=0.01)?解答:(1)检验假设H0:σ12=σ22,H1:σ12≠σ22.应选取检验统计量F=S12/S22,若H0真, 则F∼F(m-1,n-1);对于给定的检验水平α=0.01,查自由度为(9,9)的F分布表得F0.005(9,9)=6.54;已知m=n=10,s1=56,s2=48,由此得统计量F的观察值为F=562/482≈1.36;因为F<F0.005(9,9),所以接受原假设H0,即可认为这两个总体的方差无显著差异.(2)检验假设H0′:μ1=μ2,H1′:μ1<μ2.按上述关于双总体方差的假设检验的结论知这两个总体的方差未知但相等,σ12=σ22,所以应选取检验统计量:T=X¯-Y¯(m-1)S12+(n-1)S22m+n-2(1m+1n),若H0′真,则T∼t(m+n-2);对给定的检验水平α=0.01,查自由度为m+n-2=18的t分布表得临界值计算t值t=z¯-0sz/n=-0.1-00.141/5≈-1.59>-2.776,故接受H0:μz=0,即在α=0.05下,认为两种分析方法所得的均值结果相同.7.4 关于一般总体数学期望的假设检验习题1设两总体X,Y分别服从泊松分布P(λ1),P(λ2),给定显著性水平α,试设计一个检验统计量,使之能确定检验H0:λ1=λ2,H1:λ1≠λ2的拒绝域,并说明设计的理论依据.解答:因非正态总体,故宜用大样统计,设X¯=1n1∑i=1n1Xi,S12=1n1-1∑i=1n1(Xi-X¯)2;Y¯=1n2∑i=1n2Yi,S22=1n2-1∑i=1n2(Yi-Y¯)2.\because(X¯-Y¯)-(λ1-λ2)S12n1+S22n2→N(0,1)∴可选用样本函数u=(X¯-Y¯)-(λ1-λ2)S12n1+S22n2作为拒绝域的检验统计量.习题2设某段高速公路上汽车限制速度为104.6km/h,现检验n=85辆汽车的样本,测出平均车速为x¯=106.7km/h,已知总体标准差为σ=13.4km/h,但不知总体是否服从正态分布. 在显著性水平α=0.05下,试检验高速公路上的汽车是否比限制速度104.6km/h显著地快?解答:设高速公路上的车速为随机变量X,近似有X∼N(μ,σ2),σ=13.4km/h,要检验假设H0:μ=μ0=104.6,H1:μ>104.6.α=0.05,n=85,uα=u0.05=1.645.拒绝域W={u=x¯-μ0σ/n>uα.由x¯=106.7,σ=13.4,μ0=104.6,n=85得u=106.7-104.613.4/85≈1.44<1.645.因为1.44<1.645,所以接受H0,即要α=0.05显著性水平下,没有明显的证据说明汽车行驶快于限制速度.习题3某药品广告上声称该药品对某种疾病和治愈率为90%,一家医院对该种药品临床使用120例,治愈85人,问该药品广告是否真实(α=0.02)?解答:设该药品对某种疾病的治愈率为p,随机变量X为X={1,临床者使用该药品治愈0,反之则X∼b(1,p),问题该归结为检验假设:H0:p=0.9,H1:p≠0.9.由于n=120足够大,可以用u检验法,所给样值(x1,x2,⋯,x120)中有85个1,35个0,所以x¯=1120∑i=1120xi=1120∑i=1851=85120≈0.71,又p0=0.9,以之代入统计量U得U的观察值为∣u∣=∣0.71-0.9∣0.9×0.1120=6.94>u0.01=2.33,故拒绝H0,即认为该药品不真实.习题4一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看8小时电视.”她认为她所领导的学校,学生看电视时间明显小于该数字. 为此,她向她的学校的100名初中学生作了调查,得知平均每周看电视的时间x¯=6.5小时,样本标准差为s=2小时,问是否可以认为这位校长的看法是对的(α=0.05)?解答:检验假设H0:μ=8,H1:μ<8.由于n=100,所以T=X¯-μS/n近似服从N(0,1)分布,α=0.05,u0.05=1.645.又知x¯=6.5,s=2,故计算得t=6.5-82/100=-7.5,否定域W={X¯-8S/n<-u0.05.因为-7.5<-1.645,故否定H0,认为这位校长的看法是对的.习题5已知某种电子元件的使用寿命X(h)服从指数分布e(λ),抽查100个元件,得样本均值x¯=950(h),能否认为参数λ=0.001(α=0.05)?解答:由题意知X∼e(λ),E(X)=1/λ,D(X)=1/λ2,故当n充分大时u=x¯-1/λ1nλ=(x¯-1λ)λn=(λx¯-1)n(0,1).现在检验问题为H0:λ=0.001,H1:λ≠0.001,样本值u=(0.001×950-1)×100=0.5,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即可认为参数λ=0.001(即元件平均合适用寿命为1000h).习题6某产品的次品率为0.17,现对此产品进行新工艺试验,从中抽取400检查,发现次品56件,能否认为这项新工艺显著地影响产品质量(α=0.05)?解答:检验问题为H0:p=0.17,H1:p≠0.17,由题意知⌢p=mn=56400=0.14,u=(⌢p-p0)p0q0n=0.14-0.170.17×0.83×400≈-1.597,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即认为新工艺没有显著地影响产品质量.习题7某厂生产了一大批产品,按规定次品率p≤0.05才能出厂,否则不能出厂,现从产品中随机抽查50件,发现有4件次品,问该批产品能否出厂(α=0.05)?解答:问题归结为在α=0.05下,检验假设H0:p≤0.05,H1:p>0.05.这是一个单侧检验问题,用u检验法,H0的拒绝域为U=X¯-p0p0(1-p0)n>uα.已知n=50,p0=0.05,x¯=450=0.08,代入U的表达式得u=0.08-0.050.05×0.9550≈0.97<uα=u0.05=1.645,故接受H0,即认为这批产品可以出厂.习题8从选区A中抽取300名选民的选票,从选区B中抽取200名选民的选票,在这两组选票中,分别有168票和96票支持所提候选人,试在显著水平α=0.05下,检验两个选区之间对候选人的支持是否存在差异. 解答:这是两个比率的比较问题,待检假设为H0:p1=p2,H1:p1≠p2.由题设知n=300,μn=168,m=200,μm=96,p1=168320=0.56,p2=96200=0.48,p=μn+μmm+n=264500=0.528.U0∼=p1-p2p(1-p)(1n+1m)=0.56-0.480.528×0.472×1120≈1.755,由P{∣U∼∣>1.96}=α=0.05,得拒绝域∣U∼∣>1.96,因为U0∼=1.755<1.96,故接受H0,即两个选区之间无显著差异.7.5 分布拟合检验Ai k概率pi npi频数fi(fi-npi)2(fi-npi)2npiA001/108085250.3125A111/108093169 2.1125A221/108084160.2A331/10807910.0125A441/10807840.05A551/108069121 1.5125A661/108074360.45A771/10807181 1.0125A881/108091121 1.5125A991/108076160.2∑18007.375由于当H0为真时,χ2=∑i=0k(fi-npi)2npi∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r).这里χ2=7.375,查表知χ0.052(10-1-0)=χ0.052(9)=16.9,显然χ2=7.375<16.9=χ0.052(9),即χ2未落在拒绝域中,所以接受H0,即认为这个正20面体是由均匀材料制面的.习题2根据观察到的数据疵点数0 1 2 3 4 5 6频数fi 14 27 26 20 7 3 3检验整批零件上的疵点数是否服从泊松分布(α=0.05).解答:设X表示整批零件上的疵点数,则本问题是在α=0.05下检验假设H0:P{X=i}=λie-λi!,i=0,1,2,⋯.由于在H0中参数λ未具体给出,所以先估计λ的值. 由极大似然估计法得λ=x¯=1100(0×14+1×27+2×26+3×20+4×7+5×3+6×3)=2.将试验的所有可能结果分为7个互不相容的事件A0,A1,⋯,A7, 当H0成立时,P{X=i}有估计值p0=P{X=0}=e-2≈0.135335,p1=P{X=1}=2e-2≈0.27067,p2=P{X=2}=2e2≈0.270671,p3=P{X=3}≈0.180447,p4=P{X=4}=2/3e-2≈0.090224,p5=P{X=5}=4/15e-2≈0.036089, p6=P{X=6}=4/45e-2≈0.0120298. 列表如下:Ai k 概率pi npi 频数fi (fi-npi)2 (fi-npi)2npiA0 A1 A2 A3 A4 A5 A6 0 1 2 3 4 5 6 0.1353350.270671 0.270671 0.180447 0.090224 0.036089 0.0120298 13.5335 27.0671 27.0672 18.0447 9.02243.60891.2029813.83428 14 27 26 2073313 0.2176 0.0045 1.1387 3.8232 0.6960 0.01608 0.000166 0.04207 0.2118740.050310∑1000.3205当H0为真时,χ2=∑i=0k(fi-npi)2npi ∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r), 这里χ2=0.3205, 查表知χ0.052(5-1-1)=χ0.052(3)=7.815. 显然 χ2=0.3205<7.815=χ0.052(3).即χ2未落在拒绝域中,接受H0, 故可认为整批零件上的疵点数服从泊松分布.习题3检查了一本书的100页,记录各页中印刷错误的个数,其结果为错误个数fi0 1 2 3 4 5 6 ≥7含fi 个错误的页数 36 40 19 2 0 2 1 0问能否认为一页的印刷错误个数服从泊松分布(取α=0.05)? 解答:检验假设H0: 一页的印刷错误个数X 服从泊松分布, P{X=i}=λie -λi!,i=0,1,2,⋯.H0 不成立. 先估计未知参数λλ=x¯=1/100(0×36+1×40+2×19+3×2+4×0+5×2+6×1)=1. 在H0成立下pi =P {X=i}=(λ)ie-λi!=e-1i!,i=0,1,2,⋯. 用χ2检验法χ2=∑i =1k(fi-npi )2npi ∼χ2(k -r-1). 本题中r=1, 其中fi 为频数. H0的拒绝域为 Rα={χ2>χα2(k -r-1)}. 列表计算如下:n=100, 对每个{X=i}计算pi ,npi ,fi-npi ,(fi-npi )2/(npi )(i=1,2,⋯,7). 要求每一个npi ≥5.计算χ2值χ2=0.0170+0.2801+0.0202+1.1423=1.4596.习题6下表记录了2880个婴儿的出生时刻:试问婴儿的出生时刻是否服从均匀分布U[0,24](显著性水平α=0.05)?解答:原假设H0:F0(x), 由F0(x)算得pi=F0(i)-F0(i-1)=124,npi=2880×124=120 (i=1,2,⋯,24),于是χ2=∑i=124(fi-npi)2npi≈40.47,对α=0.05, 自由度n-1=23, 查χ2-分布表,得χα2(n-1)=35.17,因为χ2=40.47>35.17, 所以拒绝H0, 即可以认为婴儿出生时刻不服从均匀分布U[0,24].总习题解答习题1下面列出的是某工厂随机选取的20只部件的装配时间(min):9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7.设装配时间的总体服从正态分布N(μ,σ2),μ,σ2均未知,是否可以认为装配时间的均值显著地大于10(取α=0.05)?解答:检验假设H0:μ≤μ0=10,H1:μ>10.已知n=20,α=0.05,由数据算得x¯=10.2,s≈0.5099.因σ2未知,故用t检验法,拒绝域为W={X¯-μ0S/n>tα(n-1).计算得x¯-μ0s/n=10.2-100.5099/20≈1.7541.查t分布表得t0.05(19)=1.7291.因为1.7541>1.7291,故拒绝H0,可以认为装配时间的均值显著地大于10.习题2某地早稻收割根据长势估计平均亩产为310kg,收割时,随机抽取了10块,测出每块的实际亩产量为x1,x2,⋯,x10,计算得x¯=110∑i=110xi=320.如果已知早稻亩产量X服从正态分布N(μ,144),显著性水平α=0.05,试问所估产量是否正确?解答:这是一个正态分布总体,方差已知,对期望的假设检验问题,如果估计正确,则应有μ=310,因此我们先将问题表示成两个假设:①H0:μ=310,H1:μ≠310.接下来就要分析样本值来确定是接受H0,还是接受H1.当H0为真时,统计量②U=X¯-31012/10∼N(0,1),从而有③P{∣U∣>1.96}=0.05,拒绝域为(-∞,-1.96)∪(1.96,+∞).④计算U0=∣320-310∣12/n≈2.64>1.96,即拒绝H0,也就是有理由不相信H0是真的,故认为估产310kg不正确.习题3设某次考试的考生成绩服从正态分布,从中随机地抽取36位考生的成绩,算得平均成绩为66.5分,样本标准差为15分,问在显著水平0.05下,是否可认为这次考试全体考生的平均成绩为70分?并给出检验过程.(1)设这次考试全体考生的平均成绩X∼N(μ,σ2),则待检验假设H0:μ=70,备择假设H1:μ≠70;(2)在H0成立条件下选择统计量T=X¯-μ0S/n∼t(n-1);(3)在显著性水平0.05下,查t分布表,找出临界值tα/2(n-1)=t0.025(35)=2.0301,则拒绝域为(-∞,-2.0301)∪(2.0301,+∞);(4)计算t=∣66.5-70∣15/36=1.4∈(-2.0301,2.0301),故接受H0,因此可认为这次考试全体考生的平均成绩为70分.习题4设有来自正态总体的容量为100的样本,样本均值x¯=2.7,μ,σ2均未知,而∑i=1n(xi-x¯)2=225,在α=0.05水平下,检验下列假设(1)H0:μ=3,H1:μ≠3;(2)H0:σ2=2.5,H1:σ2≠2.5.解答:(1)由题意知n=100,x¯=2.7,s=199×225≈1.508,t=(2.7-3)1.508×100≈-1.9894,α=0.05,t0.025(99)≈t0.025(100)=1.984.因∣t∣=1.9894>t0.025(99)=1.984,故拒绝H0,即认为μ≠3.(2)由题意知χ2=∑i=1n(x1-x¯)22.5=2252.5=90,α=0.05,χ0.0252(99)≈χ0.0252(100)=129.56,χ0.9752(99)≈χ0.9752(100)=74.22,因χ0.9752(99)<χ2=90<χ0.0252(99),故接受H0,即可以认为σ2=2.5.习题5设某大学的男生体重X为正态总体,X∼N(μ,σ2),欲检验假设:H0:μ=68kg,H1:μ>68kg.已知σ=5,取显著性水平α=0.05,若当真正均值为69kg时,犯第二类错误的概率不超过β=0.05,求所需样本大小.解答:由第一类、第二类错误及分位数的定义,易于证明:对于某个给定的δ>0(∣μ-μ0∣≥δ),样本容量n应满足:n≥(uα+uβ)2σ2δ2.因为α=β=0.05,故uα=uβ=1.645,对其对立假设μ=69而言,取δ=1,则n=(uα+uβ)2σ2δ2=(1.645+1.645)2×251≈270.6,故取n=271.某装置的平均工作温度据制造厂家称不高于190∘C.今从一个由16台装置构成的随机样本测得工作温度的平均值和标准差分别为195∘C和8∘C,根据这些数据能否说明平均工作温度比制造厂所说的要高?(设α=0.05,并假设工作温度近似服从正态分布.)解答:设X为工作温度,则X∼N(μ,σ2).①待检假设H0:μ≤190,备择假设H1:μ>190;②在H0成立条件下,选择统计量T=X¯-μ0S/n≈t(n-1);③在显著性水平0.05下,查t分布表,找出临界值tα(n-1)=t0.05(15)=1.75,拒绝域为(1.75,+∞);④计算t=X¯-μ0S/n=195-1908/16=2.5>1.75,所以否定原假设H0,说明平均工作温度比制造厂所说的要高.习题7电工器材厂生产一批保险丝,抽取10根试验其熔断时间,结果为42657578715957685455假设熔断时间服从正态分布,能否认为整批保险丝的熔断时间的方差不大于80(α=0.05)?解答:①待检假设H0:σ2≤80,备择假设H1:σ2>80;②在H0成立时,选取统计量χ2=(n-1)S2σ02∼χ2(n-1);③由α=0.05,n-1=9,查χ2分布表,χα2(n-1)=χ0.052(9)=16.919;④计算样本值:x¯=110(42+65+75+78+71+59+57+68+54+55)=62.4,s2=19∑i=110(xi-x¯)2≈121.8,χ2=9×121.880≈13.7∈(0,16.919).故接受原假设H0即在α=0.05下,可认为整批保险丝的熔断时间的方差不大于80.习题8某系学生可以被允许选修3学分有实验物理课和4学分无实验物理课,11名学生选3学分的课,考试平均分数为85分,标准差为4.7分;17名学生选4学分的课,考试平均分数为79分,标准差为6.1分. 假定两总体近似服从方差相同的正态分布,试在显著性水平α=0.05下检验实验课程是否能使平均分数增加8分?解答:设有实验的课程考分X1∼N(μ1,σ12),无实验的课程考分X2∼N(μ2-σ22).假定σ12=σ22=σ2未知,检验假设H0:μ1-μ2=8,H1:μ1-μ2≠8.由题意知,选用t检验统计量,则拒绝域为W={∣x1¯-x2¯-(μ1-μ2)sw1n1+1n2∣>tα/2(n1+n2-2),其中sw2=(n1-1)s12+(n2-1)s22n1+n2-2.由x1¯=85,x2¯=79,n1=11,n2=17,s1=4.7,s2=6.1,算出sw=(11-1)×4.72+(17-1)×6.1211+17-2≈5.603.从而算出t值为t=85-79-85.603111+117≈-0.92,由α=0.05,查表得t0.025(11+17-2)=t0.025(25)=2.056,因为∣t∣=0.92<2.056,故接受H0,认为μ1-μ2=8.习题9某校从经常参加体育锻炼的男生中随机地选出50名,测得平均身高174.34厘米;从不经常参加体育锻炼的男生中随机地选50名,测得平均身高172.42厘米. 统计资料表明两种男生的身高都服从正态分布,其标准差分别为5.35厘米和6.11厘米,问该校经常参加锻炼的男生是否比不常参加锻炼的男生平均身高要高些(α=0.05)?解答:设X,Y分别表示常锻炼和不常锻炼男生的身高,由题设X∼N(μ1,5.352),Y∼N(μ2,6.112).①待检假设H0:μ1≤μ2,备择假设H1:μ1>μ2;②选取统计量U=X¯-Y¯σ12n+σ22m∼(H0成立)N(0,1);③对于α=0.05,查标准正态分布表,uα=u0.05=1.64;则拒绝域为(1.64,+∞);④计算u=174.34-172.425.35250+6.11250≈1.67>1.64,故否定原假设H0,即表明经常体育锻炼的男生平均身高比不经常体育锻炼的男生平均身高高些.习题10在漂白工艺中要改变温度对针织品断裂强力的影响,在两种不同温度下分别作了8次试验,测得断裂强力的数据如下(单位:kg):70∘C:20.818.819.820.921.519.521.021.280∘C:17.720.320.018.819.020.120.219.1判断两种温度下的强力有无差别(断裂强力可认为服从正态分布α=0.05)?解答:(1)本问题是在α=0.05下检验假设μ1=μ2,为此需要先检验σ12=σ22是否成立.H01:σ12=σ22,H11:σ12≠σ22.选取统计量F=S12S22,在H01成立的条件下,F∼F(n1-1,n2-1),且此检验问题的拒绝域为F>Fα/2(n1-1,n2-1)或F<F1-α/2(n1-1,n2-1).这里F=s12s22≈0.90550.8286≈1.0928,F0.025(7,7)=4.99,F0.975(7,7)=1F0.025(7,7)=14.99≈0.2004.显然F0.975(7,7)=0.2004<1.0928<4.99=F0.025(7,7).说明F未落在拒绝域中,从而接受H01,即认为两温度下的强力的方差没有显著变化,亦即σ12=σ22. (2)再检验假设H0ʹ:μ1=μ2,H0ʹ:μ1≠μ2,在H0ʹ成立的条件下,T=X1¯-X2¯(n1-1)S12+(n2-1)S22n1+n2-21n1+1n2∼t(n1+n2-2),且此检验问题的拒绝域为∣T∣>tα/2(n1+n2-2),这里T≈20.4-19.47×0.9055+7×0.82868+8-218+18≈2.148,显然∣T∣=2.148>2.145=t0.025(14).说明T落在拒绝域中,从而拒绝H0,即认为两种温度下的断裂强力有显著差别.习题11一出租车公司欲检验装配哪一种轮胎省油,以12部装有Ⅰ型轮胎的车辆进行预定的测试. 在不变换驾驶员的情况下,将这12部车辆换装Ⅱ型轮并重复测试,其汽油耗量如下表所示(单位:km/L).汽车编号i123456789101112Ⅰ型胎(xi)4.24.76.67.06.74.55.76.07.44.96.15.2Ⅱ型胎(yi)4.14.96.26.96.84.45.75.86.94.76.04.9假定两总体均服从正态分布,试在α=0.025的显著性水平下,检验安装Ⅰ型轮胎是否要双安装Ⅱ型轮胎省油?解答:设两种轮胎汽油消耗量之差为随机变量D,则取值为zi=xi-yi=0.1,-0.2,0.4,0.1,-0.1,0.1,0,0.2,0.5,0.2,0.1,0.3.设Z∼N(μz,σz2),σz2未知. 若消耗油相同,则μz=0;若Ⅰ型比Ⅱ型轮胎省油,则μz>0,于是检验假设H0:μz=0,H1:μz>0.由题意知z¯≈0.142,s≈0.198,n-1=12-1=11.α=0.025,查t分布表得t0.025(11)=2.201.所以,拒绝域为W={t>2.201}.由于样本值t=z¯-0s/n=0.142-00.198/12≈2.48>2.201,故拒绝H0:μz=0,即说明Ⅰ型轮胎省油.习题12有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量n1=60,n2=40的样本,测得部件重量(以kg计)的样本方差分别为s12=15.46,s22=9.66. 设两样本相互独立,两总体分别服从分布N(μ1,σ12),N(μ2,σ22).μi,σi2(i=1,2)均未知,试在α=0.05水平下检验假设H0:σ12≤σ22,H1:σ12>σ22.解答:在α=0.05下,检验假设H0:σ12≤σ22,H1:σ12>σ22,经计算p=1100×10(45+2×17+3×4+4×1+5×1)=1/10,故检验假设为H0:X∼B(10,1/10),即pi=P{X=i}=C10i(1/10)i(9/10)10-i,i=0,1,2,⋯,10.为了使npi≥5,将xi≥3合并,于是k=4,r=1.计算χ2的观察值,计算结果如下表:[200,300) [300,+∞)435843.466.9-0.4-8.90.0041.184∑300300 1.8631其中理论概率pi=p{ti≤T≤ti+1}=∫titi+1f(t)dt(i=1,2,3),p4=1-∑i=13pi,例如p1=P{T<100}=∫01000.005e-0.005tdt=1-e-0.5≈0.393.由k=4,未知参数个数r=0,查表知χα2(k-r-1)=χ0.052(3)=7.815.因χ2=1.8631<χ0.052(3)=7.815.故接受H0,即可认为灯泡的寿命服从该指数分布.习题16关于正态总体X∼N(μ,1)的数学期望有如下二者必居其一的假设,H0:μ=0,H1:μ=1.考虑检验规则:当X¯≥0.98时否定假设H0接受H1,其中X¯=(X1+⋯+X4)/4,而X1,⋯,X4是来自总体X的简单随机样本,试求检验的两类错误概率α和β.解答:易见,在假设“H0:μ=0”成立的条件下,X¯∼N(0,1/4),2X¯∼N(0,1);在假设“H1:μ=1”成立的条件下,X¯∼N(1,1/4),2(X¯-1)∼N(0,1).因此,由定义得α=P{X¯≥0.98∣μ=0}=P{2X¯≥1.96∣μ=0}=0.025,β=P{X¯<0.98∣μ=1}=P{2(X¯-1)<-0.04∣μ=1}=0.4840.习题17考察某城市购买A公司牛奶的比例,作假设H0:p=0.6,H1:p<0.6,随机抽取50个家属,设x为其中购买A公司牛奶的家庭数,拒绝域W={x≤24}.(1)H0成立时,求第一类错误的α;(2)H1成立且p=0.4时,求第二类错误的β(0.4);又当p=0.5时,求第二类错误的β(0.5).解答:由定义知(1)α=P{x≤24∣p=0.6}=Φ(24-50×0.650×0.6×0.4)≈Φ(-1.73)=1-Φ(1.73)=1-0.9528=0.0418.(2)β(0.4)=P{x>24∣p=0.4}=1-Φ(24-50×0.450×0.4×0.6)≈1-Φ(1.15)=1-0.8749=0.1251;。
概率论与数理统计习题及答案-第七章
1 F(x,β)=
x
,
x ,
0,
x .
其中未知参数 β>1,α>0,设 X1,X2,…,Xn 为来自总体 X 的样本 (1) 当 α=1 时,求 β 的矩估计量; (2) 当 α=1 时,求 β 的极大似然估计量; (3) 当 β=2 时,求 α 的极大似然估计量. 【解】
2 0.025
(19)
32.852,
2 0.975
(19)
8.907
(1) μ的置信度为 0.95 的置信区间
s
18.14
x ta/2 (n 1) 76.6
2.093 (68.11,85.089)
n
20
(2) 2 的置信度为 0.95 的置信区间
(2)
D( ˆ1 )
2
2
D( X1 )
1
2
D(X2 )
4
X
2
5
2
,
3
3
9
9
3
2
1
2
3
5 2
D(ˆ2 ) D( X1) D( X 2 ) ,
4
4
8
D(ˆ3
)
1
2
D( X1 )
D(X
2
)
2
(
x),
0 x ,
0,
其他.
X1,X2,…,Xn 为其样本,试求参数θ的矩法估计.
概率论与数理统计习题及答案第七章
概率论与数理统计习题及答案第七章习题7-1的样本,则0的矩估计量是().(A) X .(B) 2X .解选(B).2.设总体X 的分布律为X -215P301-40e其中0v 0< 0.25为未知参数,X 1, X 2, , , X n 为来自总体X 的样本,试求0的矩估计量.解因为 E(X)=(-2) >3 0+1X(1-4 0+5 X0=1-5 0 令 1_5v-X 得到v 的矩估计量为彳二1.53.设总体X 的概率密度为f A严 1)x ;0 ::: x :::1, f (X ; V)0, 其它.其中0>1是未知参数,X 1,X 2,, ,X n 是来自X 的容量为n 的简单随机样本求:(1) r 的矩估计量;(2) 0的极大似然估计量. 解总体X 的数学期望为址 1阳1 日+1E (X ) = f xf (x)d x =[(日 +1) x dx = ----------------------0+21.选择题(1)设总体X 的均值的样本, 则均值□与方差 (A) 2 X 和 S 2. (C)□和d . 解选(D).与方差都存在但未知 C 2的矩估计量分别是( 而X-X 2,…,X n 为来自X ).1(B) X 和 (X i(D)1X 和 (X i20>0为未知参数,又X i ,X 2,…,X n 为来自总体X(C) max{ X i }. 1 < i < n(D) min { X i }. 1 < i < n⑵设X : U [0, v],其中 -X)令E (X )= X ,即二! =X ,得参数0的矩估计量为彳■■ 2设X 1, X 2,, , X n 是相应于样本X 1, X 2,, , X n 的一组观测值,2X -1 1 -x则似然函数为0,当 0<x< p="">,n)时,L>0 且 nXiIn ,0 ::: x i :::1,L = n ln( v I))、In X i ,i =1Ad In L n 二令Ind v 71 -1 i 1X i =0,得0的极大似然估计值为 4-1nnvIn X ii土而的极大似然估计量为4.设总体X 服从参数为彳=-1.二 In Xii -4即X 的概率密度为■的指数分布, 3 x 0,f (X, ■)二I 0,其中,.0为未知参数,X i , X 2, , , X n 为来自总体的矩估计量与极大似然估计量1 -解因为E(X)= =X ,所以,的矩估计量为x < 0,X 的样本,试求未知参数■—.设 X 1, X 2,, , X n 是相X应于样本X i , X 2,, ,X n 的一组观测值,则似然函数n -n _L 二■■■■ In-'7 X i i 士取对数人 d In L n 二令. X i人 \=±1 然估计量为?==.X=0,得?的极大似然估计值为1 -,■的极大似X1.选择题:设总体X ’,X 2,…,X n 为X 的样本,的无偏估计量?X 的均值则无论总体与方差;「2都存在但未知,而服从什么分布,( 2)是.1和二(A)X i 和 (Xn i ±n i 生(C)—JX i 和1n -1 i ±n -1解选(D).2. 若x 1,X 2 ,X(B)1 nX i 和-1 i —, n —2(X i —X) ?1 12—7 X i 和—v (X i 7 .n i -4、 in i -4)的样本,且X 2 ? kX 3为」的无偏估计量,问k 等于多少?解要求1E(—X ! 31 1 1 ? — X2 ? kX 3)2 74 3 45解之,k=.1 25.设总体X 的概率密度为0 ::: x ::: 1,其它,,X n 为来自总体的简单随机样本,记N求:(1) B 的矩估计量;(2) B 的极大似然33 —解 (1) X =E(X)二 xvdx 亠 |X (1 - v)dx,所以 <1 矩 X .22(2)设样本X 1,X 2,…X n 按照从小到大为序(即顺序统计量的观测值)有如下关系:X (1) < X (2) w , wx (N) <1 w X (N+1) W X (N+2)W , W X (n).似然函数为,,■'N(^-r-,X (1) W x (2) W ' "W X (N) <1W X (N 1) W X (N 2) W X n , LQ|0, 其它.考虑似然函数非零部分,得到In L( 0) = N In 0+ (n - N) In(1- 0),令d s o 二‘ 一口 =o ,解得0的极大似然估计值为弓=楚.d B日1 —日n习题7-23.设总体X 的均值为0,方差匚2存在但未知,又X 1, X 2为来自总体X 的1 2 21< x < 2,f (x,=) ?1 七,0,.X 1, X 2,,1的个数? 其中-(0<二<1 )是未知参数为样本值x , ,x 2 , ,x n中小于估计量.nnn2i—'X ).3为来自总体2、(X i 」).(D)i :—样本,试证:一(X ’ 一X 2)为二的无偏估计21 2 1 2 2证因为E[—(X’-X?)] E[( X1^2X 1X2 X2 )]2 21 2 2【E(X’)_2E(X’X2)- E(X2 )]2所以一(X1-X2)2为L的无偏估计.2习题7-31. 选择题(1) 总体未知参数二的置信水平为0.95的置信区间的意义是指().(A) 区间平均含总体95%的值.(B) 区间平均含样本95%的值.(C) 未知参数二有95%的可靠程度落入此区间.(D) 区间有95%的可靠程度含参数n的真值?解选(D).(2) 对于置信水平1- a0< ad),关于置信区间的可靠程度与精确程度,下列说法不正确的是().(A) 若可靠程度越高,则置信区间包含未知参数真值的可能性越大(B) 如果a越小,则可靠程度越高,精确程度越低.(C) 如果1- a越小,则可靠程度越高,精确程度越低?(D) 若精确程度越高,则可靠程度越低,而1- a越小. 解选(C)习题7-41.某灯泡厂从当天生产的灯泡中随机抽取9只进行寿命测试,取得数据如下(单位:小时):1050, 1100, 1080, 1120, 1250, 1040, 1130, 1300,1200.设灯泡寿命服从正态分布N(卩902),取置信度为0.95,试求当天生产的全部灯泡的平均寿命的置信区间.解计算得到x -1141.11,3 =902.对于a= 0.05,查表可得Z -/2 = z0.025 二1-96.所求置信区间为22=(1141.11= (1082.31,1199.91).2. 为调查某地旅游者的平均消费水平,随机访问了40名旅游者,算得平均消费额为X =105元,样本标准差s =28元.设消费额服从正态分布.取置信水平为0.95,求该地旅游者的平均消费额的置信区间 .2 2解计算可得X =105, f =282.对于a = 0.05,查表可得t ..(n -1) =t °.025 (39) = 2.02272所求□的置信区间为=(96.045, 113.955).3?假设某种香烟的尼古丁含量服从正态分布 .现随机抽取此种香烟8支为一组样本,测得其尼古丁平均含量为18.6毫克,样本标准差s=2.4毫克.试求此种香烟尼古丁含量的总体方差的置信水平为0.99的置信区间.解已知 n =8, S 2=2.42, a = 0.01,查表可得笑厶一 1) = 30.005 ⑺=20.278 ,22..(n -1) =0.995⑺=0.989 ,所以方差/的置信区间为"2本:X 1,X 2,, ,X 12 及丫1,丫2,, ,丫17,算出 x =10.6g ,y = 9.5g , s : =2.4, s ;=4.7 .假设这两条流水线上装的番茄酱的重量都服从正态分布,且相互独立,其均值分别为叫,J 2.又设两总体方差打.求4 - J 2置信水平为0.95的置信区间并说明该置信区间的实际意义.解由题设 X =10.6, y =9.5, s : =2.4, s ; =4.7, n 1 =12, n 2 =17,(Xs (X「28\(n -1),x2\(n -1)) =(10522.0227, 28105—2.0227 )2 2(n -1)S(n -1)S 、(, )=( “-1) J -1)2 22(8 .1)2.420.2782(8 -1)2.40.989)=(1.988, 40.768).4.某厂利用两条自动化流水线灌装番茄酱分别从两条流水线上抽取样2s w2 丄 2(① -1) q ? (n ? -1)S 2 n 1 ' n 2「2 (12 —1) 2.4 ? (17 —1) 4.712 17「2= 1.94(J ■ n)90—1.96, 1141.11sQg +n2—2) =t0.°25 (27) = 2.05181,所求置信区间为2 21 11 1—■■_) =((10.6「9.5) _2.05181 1.94,—、一) n 1 n 2 .12 17 =(-0.40,2.60).结论“叫_ J 的置信水平为0.95的置信区间是(-0.40,2.60)”的实际意义是:在两总体方差相等时,第一个正态总体的均值叫比第二个正态总体均值J 大-0.40?2.60,此结论的可靠性达到95%.5.某商场为了了解居民对某种商品的需求,调查了100户,得出每户月平均需求量为10公斤,方差为9 .如果这种商品供应10000户,取置信水平为0.99.(1) (2) 解 _ s _ s (x ——t (n -1), x ——t (n -1))' 厂g厂?■ f n 2 ■. n 2= (102.575, 102.575) =(9.2275,10.7725).J 100J10010000户居民对此种商品月需求量的置信度为 0.99的置信区间为(92275,107725);(2)最少要准备92275公斤商品才能以 99%的概率满足需要?((X7) _t ,(n 1n2—2)S w2取置信度为0.99,试对居民对此种商品的平均月需求量进行区间估计问最少要准备多少这种商品才能以(1)每户居民的需求量的置信区间为99%的概率满足需要? _ s _ s:F (X ---- z , x ---------- z )厂a r ot ■- n 7 ?、n 2</x<>。
概率论与数理统计(王明慈第二版)第2章随机变量及其分布7-1节
D
1
dx
1 x e( x y)dy.
00
y
1
x y1
1e xdx 1 x e ydy
0
0
D
0
1x
1e x (e y )1 x dx
0
0
1e x (1 ex1) dx 1(e x e1) dx
0
0
1 2e1 0.2642
4/4/2020
26
例 4 设二维随机变量X, Y 的密度函数为
x 0
y 0
f (u, v) du dv,
x 0, y 0,
0,
其他.
x 0
y e(uv) dudv,
0
x 0, y 0,
0,
其他.
(1
e
x
)(1
e
y
),
0,
x 0, y 0, 其他.
4/4/2020
25
(2) P{(X ,Y ) D} p( x, y)dx dy.
4/4/2020
18
X Y
x1 x2 xi
y1
p11 p21 … pi1 …
y2 p12 p22 … pi2 …
……
…… ……
y j p1 j p2 j … pij …
其中 pij满足: (1) pij 0, (i, j 1,2, );
(2) pij 1.
i1 j1
4/4/2020
预备知识回顾 二重积分的计算法
4/4/2020
1
利用直角坐标计算二重积分
被积函数 f (x, y) 且在积分区域D上连续时,
若D为 X - 型区域
y y 2(x)
则
概率论与数理统计第七章课后习题及参考答案
5.设总体 X 的概率密度为
f
(x,
)
(
1) x
,0
x
1,
0, 其他.
其中 1是未知参数, X1 , X 2 ,…, X n 是来自 X 的一个样本.试求参数
2
的矩估计和极大似然估计.现有样本观测值 0.1 ,0.2 ,0.9 ,0.8 ,0.7 及 0.7 ,
求参数 的矩估计值和极大似然估计值.
1 2 2 c 2 2 ( 1 c) 2 ,
n
n
取 c 1 即可. n
14.设总体 X 的均值为 ,方差为 2 ,从总体中抽取样本 X1 , X 2 , X 3 ,证明
(
x,
,
2
)
1
1
1
e 2 2
(ln x )2
,
x
0,
2 x
0,
x 0.
其中 , 0 为未知参数, X1 , X 2 ,…, X n 是取自该总体的一
个样本,求参数 , 2 的极大似然估计.
解: xi 时,似然函数为
L(, 2 )
(
1 2 )n
1 x1x2 xn
exp{
dL
d
n exp{
n i 1
( xi
)}
0,
所以 L( ) 是 的单调增函数,从而对满足条件 xi 的任意 ,有
n
n
L( ) exp{ i1 (xi )} exp{ i1 (xi m1iinn{xi})} ,
即 L( ) 在 m1iinn{xi} 时取最大值, 故 的极大似然估计值为ˆ m1iinn{xi} . 7.(1) 设总体 X 具有分布律
ˆ1 X1 ;
ˆ2
概率论与数理统计第七章习题讲解
1 6
1 3
因此T1,T3是的无偏估计量. (2) X1,X2,X3,X4相互独立
1 1 1 5 2 2 1 D(T1 ) [ D( X1 ) D( X 2 )] [ D( X 3 ) D( X 4 )] 2 ( ) 36 9 36 9 18 1 1 5 D(T3 ) [ D( X1 ) D( X 2 ) D( X 3 ) D( X 4 )] (1 1 1 1) 2 2 16 16 20
故 E(Y)=aE(X1)+bE(X2)=(a+b)=, (a+b=1) 所以,对于任意常数,a,b(a+b=1), Y=aX1+bX2都是的无偏估计. 由于两样本独立,故两样本均值X1和X2独立,所以
2 2 2 2 a ( 1 a ) a b ] 2 D(Y ) a 2 D( X 1 ) b 2 D( X 2 ) [ ] 2 [ n1 n2 n1 n2 dD(Y ) 2a 2(1 a ) 2 由极值必要条件 [ ] 0 da n1 n2
1 E( X )
1 0
xf ( x)dx.
1 1 0
x dx x 1 1 解出 ( )2 1 1
1
将总体一阶矩1换成样本一阶矩A1=X ,
得到参数的矩估计量
矩估计值
X 2 ( ) 1 X
x 2 ( ) 1 x
( x1 x2 t / 2 ( n1 n2 2) sw
1 1 2 (n1 1) S12 (n2 1) S22 2 ) Sw , Sw Sw . n1 n2 n1 n2 2
n1=4,n2=5,1-=0.95, =0.05, t/2(n1+n2-2)=t0.025(7)= 2.3646
概率论与数理统计第七章参数估计
例1. 设总体X的数学期望和方差分别是μ,
σ2 ,求μ , σ2的矩估计量。
E(X )
E( X 2 ) D( X ) [EX ]2 2 2
(3) 写出方程 ln L 0
i1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..x.n,)
于 是 ˆ ˆ ( X 1 , X 2 , . . . , X n ) 即 为 的 极 大 似 然 估 计 量
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
ˆ(x1,x2,..x.n,),使得
L (ˆ) m a x L (), (或 L (ˆ) s u p L ())
则 称 ˆ ( x 1 ,x 2 , . . . ,x n ) 为 的 极 大 似 然 估 计 值
称 ˆ ( X 1 ,X 2 ,...,X n ) 为 极 大 似 然 估 计 量
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 (可以是向量) .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节点估计一、点估计问题的提法设总体 X 的分布函数形式已知, 但它的一个 或多个参数为未知, 借助于总体 X 的一个样本来 估计总体未知参数的值的问题称为点估计问题. 例1在某炸药制造厂 , 一天中发生着火现象的 次数 X 是一个随机变量 , 假设它服从以 λ > 0 为参 数的泊松分布, 参数 λ 为未知 , 设有以下的样本值 , 试估计参数 λ .一、点估计问题的提法 二、估计量的求法 三、小结着火次数 k 发生 k 次着 火的天数 nk01234 5 675 90 54 22 6 2 1 Σ = 250点估计问题的一般提法 设总体 X 的分布函数 F ( x;θ )的形式为已知, θ 是待估参数 . X 1 , X 2 , 本, x1 , x2 , , X n 是 X 的一个样 , xn 为相应的一个样本值 .解因为 X ~ π(λ ),所以 λ = E ( X ).用样本均值来估计总体的均值 E(X).x=∑ knk k =0 ∑ nk k =066=1 (0 × 75 + 1 × 90 + 2 × 54 + 3 × 22 + 250 4 × 6 + 5 × 2 + 6 × 1)= 1.22.点估计问题就是要构造 一个适当的统计量 ( X 1 , X 2 , , X n ), 用它的观察值 θ ( x1 , x2 , , xn ) θ 来估计未知参数 θ . θ ( X 1 , X 2 , , X n )称为 θ 的估计量 . 通称估计 , θ ( x , x , , x )称为θ 的估计值 . 简记为 θ .1 2 n故 E ( X ) = λ 的估计为 1.22 .例2在某纺织厂细纱机上的 断头次数 X 是一个随机变量 , 假设它服从以 λ > 0 为参数的泊松分布 , 参数 λ 为未知, 现检查了150只纱锭在某一时间段 内断头的次数 , 数据如下, 试估计参数 λ .断头次数 k 断头 k 次的纱锭数 nk 0 1 2 3 4 5 6 45 60 32 9 2 1 1 150二、估计量的求法由于估计量是样本的函数, 是随机变量, 故 对不同的样本值, 得到的参数估计值往往不同, 如何求估计量是关键问题. 常用构造估计量的方法: (两种)矩估计法、最大似然估计法.解 先确定一个统计量 X , 再计算出 X 的观察值 x ,把 x 作为参数 λ 的估计值 .x = 1.133 .λ 的估计值为 1.133.11. 矩估计法设 X 为连续型随机变量 , 其概率密度为 f ( x;θ1 ,θ 2 , 其中 θ1 ,θ 2 , ,θ k ), 或 X 为离散型随机变量 , ,θ k ), ,θ k 为待估参数 , 其分布律为 P { X = x } = p ( x;θ1 ,θ 2 ,l = E ( X l ) = ∫ x l f ( x;θ1 ,θ 2 , ,θ k )dx (X为连续型) ∞或 l = E ( X l ) =x∈R X+∞∑ x l p( x;θ1 ,θ 2 ,,θ k ), (X为离散型)若 X1 , X 2 ,, X n 为来自 X 的样本,,θ k 的函数 , 即其中 RX 是 x 可能取值的范围 , l = 1,2, , k 1 n 因为样本矩 Al = ∑ X il 依概率收敛于相应的 n i =1总体矩 l ( l = 1, 2, 的连续函数 . , k ), 样本矩的连续函数依概 率收敛于相应的总体矩假设总体 X 的前 k 阶矩存在 ,且均为 θ1 ,θ 2 ,矩估计法的定义 用样本矩来估计总体矩,用样本矩的连续函 数来估计总体矩的连续函数,这种估计法称为矩 估计法. 矩估计法的具体做法: 令 l = Al , l = 1, 2, , k .这是一个包含 k 个未知参数 θ 1 ,θ 2 , 解出其中θ 1 ,θ 2 ,例3设总体 X 在[a , b]上服从均匀分布 , 其中a , , X n ) 是来自总体 X的样本, 求a ,b 未知, ( X 1 , X 2 , b 的估计量.解1 = E ( X ) = a + b ,2,θ k 的方程组,,θ k 的,θ k . ,θ k 分别作为 θ1 ,θ 2 , 2 = E ( X 2 ) = D( X ) + [ E ( X )]2 =a+b 1 n 令 = A1 = ∑ X i , 2 n i =1(a b)2 + (a + b )2 ,12 4 用方程组的解 θ1 ,θ 2 ,估计量 , 这个估计量称为矩估计 量.矩估计量的观察值称为矩估计值.1 n 2 (a b )2 (a + b )2 + = A2 = ∑ X i , n i =1 12 4a + b = 2 A1 , 即 b a = 12( A2 A12 ) . 例4 设总体 X 服从几何分布 , 即有分布律P{ X = k } = p(1 p )k 1 体 X 的样本 , 求 p的估计量 . ( k = 1,2, ), , X n ) 是来自总 1 , p 其中 p ( 0 < p < 1) 未知, ( X 1 , X 2 ,∞解方程组得到a, b的矩估计量分别为2 a = A1 3( A2 A1 ) = X 3 ∑ ( X i X )2 , n i =1n解1 = E ( X ) = ∑ k p(1 p )k 1 =k =13 n 2 b = A1 + 3( A2 A1 ) = X + ∑ ( X X )2 . n i =1 i1 令 = A1 = X , p 1 所以 p = 为所求 p的估计量 . X2例52设总体 X 的均值 和方差 σ 2 都存在, 且有2σ > 0, 但 和σ 均为未知, 又设 X 1 , X 2 , , X n 是一个样本 , 求 和σ 2 的矩估计量 . 1 = E ( X ) = , 解 2 = E ( X 2 ) = D( X ) + [ E ( X )]2 = σ 2 + 2 , = A1 , 令 2 2 σ + = A2 . 解方程组得到矩估计量分别为 = A1 = X ,σ 2 = A2 A12 = 1 n 1 n 2 2 ∑ Xi X 2 = n ∑(Xi X ) . n i =1 i =1上例表明: 总体均值与方差的矩估计量的表达式不因不 同的总体分布而异. 例 X ~ N ( ,σ 2 ), , σ 2 未知, 即得 ,σ 2 的矩估计量 1 n 2 = X, σ 2 = ∑(Xi X ) . n i =1 一般地, 1 n 用样本均值 X = ∑ X i作为总体 X的均值的矩估计 , n i =1 1 n 用样本二阶中心矩 B2 = ∑ ( X i X )2 作为总体 n i =1X的方差的矩估计 .2. 最大似然估计法(1) 设总体 X 属离散型又设 x1 , x2 , 一个样本值 ., xn 为相应于样本 X 1 , X 2 , , X n 取到观察值 x1 , x2 ,n, Xn 的 , xn 的概率 ,似然函数的定义设分布律 P{ X = k } = p( x;θ ), θ 为待估参数 , θ ∈ Θ ,则样本 X 1 , X 2 ,即事件 X 1 = x1 , X 2 = x2 ,, X n = xn 发生的概率为i =1(其中 Θ 是 θ 可能的取值范围 ) X1 , X 2 , , X n是来自总体 X 的样本 , , X n 的联合分布律为 ∏ p( xi ;θ ).i =1 nL(θ ) = L( x1 , x2 ,, xn ;θ ) = ∏ p( xi ;θ ), θ ∈ Θ ,则 X1 , X 2 ,L(θ )称为样本似然函数 .注: L(θ ) = P{ X 1 = x1 , X 2 = x2 , , X n = xn } 表示样本X 1 , X 2 , , X n 取到观察值x1 , x2 , , xn的概率最大似然估计法得到样本值 x1 , x2 ,( 2) 设总体 X 属连续型, xn时, 选取使似然函数 L(θ )似然函数的定义设概率密度为 f ( x;θ ), θ 为待估参数 , θ ∈ Θ , 取得最大值的θ 作为未知参数θ 的估计值,即 L( x1 , x2 , , xn ;θ ) = max L( x1 , x2 ,θ ∈Θ, xn ;θ ).( 其中 Θ 是 θ 可能的取值范围 ) X1 , X 2 ,则 X1 , X 2 , 又设 x1 , x2 , 一个样本值 .( 其中 Θ 是 θ 可能的取值范围 ) 这样得到的 θ 与样本值 x1 , x2 , , x n有关 , 记为 ( x1 , x 2 , , xn ), 参数 θ 的最大似然估计值 , θ, X n 是来自总体 X 的样本 , , X n 的联合密度为 ∏ f ( xi ;θ ).i =1 nθ ( X 1 , X 2 ,, X n ) 参数 θ 的最大似然估计量 ., xn 为相应于样本 X 1 , X 2 ,, Xn 的3则随机点 (X 1 , X 2 , 的 概率近似地为, X n ) 落在点(x1 , x2 ,, xn ) 的邻域 (边长分别为dx1 , dx2 ,n i =1, dxn的n维立方体)内最大似然估计法是由费舍尔引进的. 求最大似然估计量的步骤:(一 ) 写出似然函数L(θ ) = L( x1 , x2 ,n费舍尔∏ f ( x i ;θ )dx i ,, xn ;θ ) = ∏ f ( xi ;θ ),i =1 nL(θ ) = L( x1 , x2 ,L(θ )称为样本的似然函数 . 若 L( x1 , x2 , , x n ;θ ) = max L( x1 , x2 ,θ ∈Θ, xn ;θ ) = ∏ p( xi ;θ )i =1, xn ;θ ).或L(θ ) = L( x1 , x2 ,n, xn ;θ ) = ∏ f ( xi ;θ );i =1 nnθ ( x1 , x2 , , xn ) 参数 θ 的最大似然估计值 , θ ( X 1 , X 2 , , X n ) 参数 θ 的最大似然估计量 .(二) 取对数i =1ln L(θ ) = ∑ ln p( xi ;θ ) 或 ln L(θ ) = ∑ ln f ( xi ;θ );i =1(三 ) 对 θ 求导d ln L(θ ) d ln L(θ ) = 0,对数似 , 并令 然方程 dθ dθ . 解方程即得未知参数 θ 的最大似然估计值 θ例6设 X ~ B(1, p ), X 1 , X 2 ,, X n是来自 X 的一个样本, 求 p的最大似然估计量 .解 设 x1 , x2 ,一个样本值 , X的分布律为, xn为相应于样本 X 1 , X 2 ,, Xn的最大似然估计法也适用于分布中含有多个 未知参数的情况. 此时只需令 ln L = 0, i = 1,2, , k . 对数似然方程组 θ i解出由 k 个方程组成的方程组 , 即可得各未知参 数 θ i ( i = 1,2, , k ) 的最大似然估计值 θ i .P{ X = x } = p x (1 p )1 x , x = 0, 1 ,n i =1n似然函数 L( p ) = ∏ p xi (1 p )1 xi=p ∑ xii =1(1 p )n∑ xii =1n,n n ln L( p ) = ∑ xi ln p + n ∑ xi ln(1 p ), i =1 i =1例8设 X 服从参数为 λ ( λ > 0) 的泊松分布 , , X n 是来自 X 的一个样本 , 求 λ 的最大X1 , X 2 ,令∑ xi n ∑ xi d i =1 ln L( p ) = i =1 = 0, dp 1 p p 1 n p = ∑ xi = x . n i =1 p= 1 n ∑ Xi = X . n i =1nn似然估计量 .解因为 X 的分布律为 P{ X = x} = e λ , ( x = 0, 1, 2, , n) x! 所以 λ 的似然函数为 n ∑ xi xi n i =1 λ λ nλ λ L(λ ) = ∏ , x !e = e n i =1 i ∏ ( xi !)i =1λx解得 p 的最大似然估计值 p 的最大似然估计量为这一估计量与矩估计量是相同的.4n n ln L(λ ) = nλ + ∑ xi ln λ ∑ ( xi !), i =1 i =1例9x1 , x2 ,设总体 X ~ N ( ,σ 2 ), ,σ 2为未知参数 , , xn 是来自 X 的一个样本值 , 求 和σ 2令∑ xi d ln L(λ ) = n + i =1 = 0, dλ λn的最大似然估计量 .解X的概率密度为 f ( x; , σ 2 ) = 1 e 2 πσ( x )2 2σ 21 n 解得 λ 的最大似然估计值 λ = ∑ xi = x , n i =1 n 1 λ 的最大似然估计量为 λ = ∑ X i = X . n i =1,X 的似然函数为L( , σ ) = ∏2 i =1 n这一估计量与矩估计量是相同的.1 e 2 πσ( xi )2 2σ 2,n n 1 n ln L( , σ 2 ) = ln( 2 π ) ln σ 2 ∑ ( x i )2 , 2 2 2σ 2 i =1 2 ln L( , σ ) = 0, 令 ln L( , σ 2 ) = 0, σ 2 1 n 2 ∑ x i n = 0 , σ i =1 n n + 1 ∑ ( x i ) 2 = 0 , 2σ 2 2(σ 2 )2 i =1由 1 n ∑ x n = 0 解得 σ 2 i =1 i n 2σ2 = ∑ xi = x , 1 n n i =1由+1 2(σ )2 2∑ ( xi )2 = 0 解得 i =1n1 n σ 2 = ∑ ( xi x ) 2 , n i =1 故 和σ 2 的最大似然估计量分别 为 = X , σ 2 = ∑ ( X i X )2 . 它们与相应的矩 估计量相同.1 n n i =1例10设总体 X 在 [a , b] 上服从均匀分布 , 其中 a ,因为 a ≤ x1 , x2 ,, xn ≤ b 等价于a ≤ x( l ) , x( h ) ≤ b,b 未知, x1 , x2 ,, xn 是来自总体 X 的一个样本值 ,作为a, b的函数的似然函数为 1 a ≤ x( l ) , b ≥ x( h ) , n, L( a , b ) = (b a ) 0, 其他 于是对于满足条件 a ≤ x( l ) , b ≥ x( h )的任意 a , b有求 a , b 的最大似然估计量 .解记x( l ) = min( x1 , x2 ,x( h ) = max( x1 , x2 ,, xn ),, xn ),X 的概率密度为 1 , a ≤ x ≤ b, f ( x; a , b ) = b a 0, 其他 . L( a , b ) =1 1 , ≤ ( b a ) n ( x( h ) x( l ) ) n5即似然函数 L(a , b) 在 a = x( l ) , b = x( h ) 时 取到最大值 ( x( h ) x( l ) ) n , a, b 的最大似然估计值 a = x( l ) = min xi ,1≤ i ≤ n最大似然估计的性质 设 θ 的函数 u = u(θ ), θ ∈ Θ 具有单值反函 数 θ = θ ( u), u ∈ U. 又设 θ 是 X 的概率密度函数 f ( x;θ ) ( f 形式已知 ) 中的参数 θ 的最大似然 估计 , 则 u = u(θ ) 是 u(θ ) 的最大似然估计 . b = x( h ) = max xi ,1≤ i ≤ na, b 的最大似然估计量 a = min X i ,1≤ i ≤ n b = max X i .1≤ i ≤ n 因为θ 是θ 的最大似然估计值 , 所以 L( x1 , x 2 , , xn ;θ ) = max L( x1 , x 2 ,证明θ ∈Θ, xn ;θ ),其中x1 , x2 ,, xn是来自总体 X的一个样本值 ,它们与相应的矩估计量不同. 由于 u = u(θ ), θ = θ ( u),故 L( x1 , x2 , , xn ;θ ( u)) = max L( x1 , x2 ,u∈U, xn ;θ ( u)),三、小结 矩估计法 两种求点估计的方法: 最大似然估计法 在统计问题中往往先使用最大似然估计法, 在最大似然估计法使用不方便时, 再用矩估计法. 于是 u = u(θ )是 u(θ )的最大似然估计 .此性质可以推广到总体分布中含有多个未知 参数的情况. 1 n 如例9中σ 2 的最大似然估计值为 σ 2 = ∑ ( X i X )2 , , n i =1 函数 u = u(σ 2 ) = σ 2 有单值反函数 σ 2 = u2 ( u ≥ 0),故标准差 σ 的最大似然估计值为1 n 2 ∑ ( X i X ) . n i =1似然函数 L(θ ) = L( x1 , x2 , 或L(θ ) = L( x1 , x2 ,, xn ;θ ) = ∏ p( xi ;θ )i =1 nnσ = σ2 = , xn ;θ ) = ∏ f ( xi ;θ );i =1费舍尔资料Ronald Aylmer FisherBorn: 17 Feb. 1890 in London, England Died: 29 Jul. 1962 in Adelaide, Australia6。