概率论与数理统计 第5章

合集下载

概率论与数理统计 第五章

概率论与数理统计 第五章

Xn ⎯ ⎯→ X 2. 依概率收敛与依分布收敛的关系
依概率收敛 ⇒ 依分布收敛
L
3. 定义:中心极限定理 设随机变量 X ~ N(0,1),{Xi },i = 1, 2, … 相互独 立,且数学期望和方差都存在, 若标准化随机变量序列

n
i =1
Xi −
∑ E(X
i =1
n
i
)

n
i =1
D(X i)
所以结论成立。 由此有,若X ~ B( n, p ),对于足够大的n,有 ⎧ m1 − np X − np m2 − np ⎫ ⎪ ⎪ < ≤ P{m1 < X ≤ m2 }= P ⎨ ⎬ np(1 − p) np(1 − p) ⎪ ⎪ np(1 − p) ⎩ ⎭
⎧ Yn − np ⎫ ⎪ ⎪ ≤ x ⎬ = Φ( x ) lim P ⎨ n →∞ ⎪ np(1 − p ) ⎪ ⎩ ⎭
证明:对于任意正整数n,随机变量Yn 可表示为 证明:对于任意正整数n Yn = X1+ X2+…+ Xn X1, X2,…, Xn 相互独立,Xi ~ B( 1, p ),且有 E( Xi ) = p , D( Xi ) = p(1-p) 所以随机变量序列{ Xi }, i =1,2,…满足独立同分布 中心极限定理条件。即有
切比雪夫不等式的应用 1)估计随机变量落在某个区间内的概率 (P125例5.5.2) 2)估计ε的值, 使 P(│X - E(X)│<ε) ≥ a (0<a<1) 3)证明大数定律。
二. 大数定律 定义: 依概率收敛 设{Xn}是一个随机变量序列,X 是一个随机变量 或常数,若对于任意的ε> 0,有 lim P{| X n − X |≥ ε } = 0

第五章《概率论与数理统计教程》课件

第五章《概率论与数理统计教程》课件

试决定常数 3.
X ,Y
C
使得随机变量 cY 服从分布

2
分布。
相互独立,都与 N ( 0 , 9 ) 有相同分布, X 分别是来自总体
X ,Y
1
, X 2 , , X 9和
Y1 ,Y 2 , ,Y 9
的样本,

Z
9
X
i
i1
6 - 23
Y
i1
9
则Z 服从—— ,自由度为——。
2 i
4.
X1, X 2, X 3, X 4
是来自总体
X ~ N ( , )
2
的样本,则随机变
量 Y
X3 X4
服从——分布,其自由度为———。
2
(X i )
i1
2
5.

X 1 , X 2 , , X 10
是来自总体 X
~ N ( ,4 )
2
的样本, ( S 2 P
a ) 0 .1
一. 单个正态总体的统计量的分布
X 1 , X 2 , X n是来自正态总体 ~ N ( , 2 )的样本, X
X , S 分别是样本均值和样本 方差
2
定理1
X
n
1
n
X i ~ N ( ,

n
2
);
i1
定理2 U
1
X
/
~ N ( 0 ,1 );
n
定理3
6 - 18
定理7
当 1
2
2 2
2 2 时, 令 S w
( n1 1) S 1 ( n 2 1) S 2
2

概率论与数理统计 第5章

概率论与数理统计 第5章
i 1 4 i 2 2 i i 1
n
n
性质2.(分布可加性):若X~2(n1),Y~2(n2),X与 Y独立,则
X + Y~2(n1+n2 )
3、2分布表及有关计算
(1)构成 P{2(n)>λ}=α,已知n, α可查表求得λ; (2)有关计算P 2 (n) 2 (n) 称为上侧α分位数
例5.1 设 X ~ N ( , 2 ) (X1,X2,…,Xn)为X的一个样本,
求(X1,X2,…,Xn)的密度。 解 (X1,X2,…,Xn)为X的一个样本,故
X i ~ N ( , 2 )
n
i 1,2,, n
f ( x1 , x2 ,, xn ) f ( xi )
16 2

i 1,2,,16
2 1 16 2 2 P ( X i ) P 8 2 (16) 16 2 16 i 1
2—分布的密度函数f(y)曲线
n/2 1 f ( y) 2 ( n / 2) y 0,
n y 1 2 2
e , y0 y0
2 例5.4 X ~ N ( , ) (X1,X2,X3)为X的一个样本
X 1 X 2 X 3 的分布。 求


(n)为整体记号
2
2 (n) 2 2 查表得 0 ( 25 ) 34 . 382 10) 18.307 .1 0.05 (
1 当n充分大时,近似有 (n ) (u 2n - 1) 2 2
2
练习1. P(2(n)<s)=1-p ∵P(2(n) < s)=1- P(2(n) s )=1-p ∴ P(2(n) s )=p 2 s p (n) 练习2. P(2(11)>s)=0.05,求s

概率论与数理统计 第五章 大数定律与中心极限定理

概率论与数理统计 第五章 大数定律与中心极限定理
nA 一种提法是: “当 n 足够大时,频率 n 与概率 p 有较大偏差
的概率很小” ,用数学语言表达,就是要证明: 0 ,有
nA nA lim P p 0 lim P p 1 n ,或 n n . n
另一种提法是:研究随机变量 n A 的分布的极限行为,即讨 论分布函数
nA lim P p 0 lim P n n 或 n
nA p 1 . n
证 引入
1 , 第i次试验中事件A发生 Xi ,i 1 , 2 , , n , 0 , 第i次试验中事件A不发生
下面我们进一步来讨论贝努利试验.若记 n A 为 n 次贝努利试
nA 验中事件 A 发生的次数, 则事件 A 发生的频率为 n . 所谓 “频 率的稳定性” ,无非是指当试验次数 n 无限增大(即 n )时,
nA 频率 n 无限接近于某个固定常数.这个固定的常数就是“事 件 A 在一次试验中发生的的概率 p” . nA 由此可见,讨论频率 n 的极限行为,是理解概率论中最基本
2019年1月14日星期一
11 / 102
§5.1
大数定律
作为预备知识,我们先明确随机变量序列收敛的
相关概念,同时给出一个重要的不等式,它是以下理 论证明所用的主要工具之一.
定 义 1.1 设 a 是常数,对于随机变量序列 ,如果 0 ,有
X1 , X 2 ,
, Xn ,
lim P
n
个常数,即在这个常数的附近摆动,这就是所谓的“频
率稳定性”.但对这一点,至今为止我们尚未给予理论 上的说明.另外,在第二章我们给出了二项分布的泊松 逼近,那么更一般的近似计算方案又是怎样呢?

概率论与数理统计(茆诗松)课后第五章习题参考答案

概率论与数理统计(茆诗松)课后第五章习题参考答案

第五章 统计量及其分布习题5.11. 某地电视台想了解某电视栏目(如:每日九点至九点半的体育节目)在该地区的收视率情况,于是委托一家市场咨询公司进行一次电话访查. (1)该项研究的总体是什么? (2)该项研究的样本是什么? 解:(1)总体是该地区的全体用户;(2)样本是被访查的电话用户.2. 某市要调查成年男子的吸烟率,特聘请50名统计专业本科生作街头随机调查,要求每位学生调查100名成年男子,问该项调查的总体和样本分别是什么,总体用什么分布描述为宜?解:总体是任意100名成年男子中的吸烟人数;样本是这50名学生中每一个人调查所得到的吸烟人数;总体用二项分布描述比较合适.3. 设某厂大量生产某种产品,其不合格品率p 未知,每m 件产品包装为一盒.为了检查产品的质量,任意抽取n 盒,查其中的不合格品数,试说明什么是总体,什么是样本,并指出样本的分布. 解:总体是全体盒装产品中每一盒的不合格品数;样本是被抽取的n 盒产品中每一盒的不合格品数;总体的分布为X ~ b (m , p ),x m x qp x m x X P −⎟⎟⎠⎞⎜⎜⎝⎛==}{,x = 0, 1, …, n , 样本的分布为nn x m x n x m x x m x n n q p x m q p x m q p x m x X x X x X P −−−⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⋅⎟⎟⎠⎞⎜⎜⎝⎛====L L 2211212211},,,{ ∑∑⋅⎟⎟⎠⎞⎜⎜⎝⎛===−=∏ni tni tx mn x ni i q px m 111.4. 为估计鱼塘里有多少鱼,一位统计学家设计了一个方案如下:从鱼塘中打捞出一网鱼,计有n 条,涂上不会被水冲刷掉的红漆后放回,一天后再从鱼塘里打捞一网,发现共有m 条鱼,而涂有红漆的鱼则有k 条,你能估计出鱼塘里大概有多少鱼吗?该问题的总体和样本又分别是什么呢? 解:设鱼塘里有N 条鱼,有涂有红漆的鱼所占比例为Nn , 而一天后打捞出的一网鱼中涂有红漆的鱼所占比例为m k,估计mk N n ≈,故估计出鱼塘里大概有kmnN ≈条鱼;总体是鱼塘里的所有鱼;样本是一天后再从鱼塘里打捞出的一网鱼. 5. 某厂生产的电容器的使用寿命服从指数分布,为了了解其平均寿命,从中抽出n 件产品测其使用寿命,试说明什么是总体,什么是样本,并指出样本的分布. 解:总体是该厂生产的全体电容器的寿命;样本是被抽取的n 件电容器的寿命;总体的分布为X ~ e (λ ),p (x ) = λ e λ x ,x > 0,样本的分布为11212(,,,)e e e enin i x x x x n n p x x x λλλλλλλλ=∑=⋅=L L ,x i > 0.6. 美国某高校根据毕业生返校情况纪录,宣布该校毕业生的年平均工资为5万美元,你对此有何评论? 解:返校的毕业生只是毕业生中一部分特殊群体,样本的抽取不具有随机性,不能反应全体毕业生的情况.习题5.21. 以下是某工厂通过抽样调查得到的10名工人一周内生产的产品数149 156 160 138 149 153 153 169 156 156 试由这批数据构造经验分布函数并作图. 解:经验分布函数0,138,0.1,138149,0.3,149153,()0.5,153156,0.8,156160,0.9,160169,1,169.n x x x F x x x x x <⎧⎪≤<⎪⎪≤<⎪=≤<⎨⎪≤<⎪≤<⎪⎪≥⎩ 作图略.2. 下表是经过整理后得到的分组样本组序 1 2 3 4 5分组区间 (38,48] (48,58] (58,68] (68,78] (78,88] 频数 3 4 8 3 2试写出此分布样本的经验分布函数.解:经验分布函数0,37.5,0.15,37.547.5,0.35,47.557.5,()0.75,57.567.5,0.9,67.577.5,1,77.5.n x x x F x x x x <⎧⎪≤<⎪⎪≤<⎪=⎨≤<⎪⎪≤<⎪≥⎪⎩3. 假若某地区30名2000年某专业毕业生实习期满后的月薪数据如下:909 1086 1120 999 1320 1091 1071 1081 1130 1336 967 1572 825 914 992 1232 950 775 1203 1025 1096 808 1224 1044 871 1164 971 950 866 738(1)构造该批数据的频率分布表(分6组); (2)画出直方图. 解:(1)最大观测值为1572,最小观测值为738,则组距为15727381406d −=≈, 区间端点可取为735,875,1015,1155,1295,1435,1575, 频率分布表为 组序 分组区间 组中值 频数 频率 累计频率 1 (735, 875] 805 6 0.2 0.2 2 (875, 1015] 945 8 0.2667 0.4667 3 (1015, 1155] 1085 9 0.3 0.7667 4 (1155, 1295] 1225 4 0.1333 0.95 (1295,0.96672 0.066671435]13651 0.03333150516 (1435,1575]合计30 1(2)作图略.4.某公司对其250名职工上班所需时间(单位:分钟)进行了调查,下面是其不完整的频率分布表:所需时间频率0~10 0.1010~20 0.2420~3030~40 0.1840~50 0.14 (1)试将频率分布表补充完整.(2)该公司上班所需时间在半小时以内有多少人?解:(1)频率分布表为组序分组区间组中值频数频率累计频率10] 5 25 0.1 0.11 (0,20] 15 60 0.24 0.342 (10,30] 25 85 0.34 0.683 (20,40] 35 45 0.18 0.864 (30,50] 45 35 0.14 15 (40,合计250 1(2)上班所需时间在半小时以内有25 + 60 + 85 = 170人.5.40种刊物的月发行量(单位:百册)如下:5954 5022 14667 6582 6870 1840 2662 45081208 3852 618 3008 1268 1978 7963 20483077 993 353 14263 1714 11127 6926 2047714 5923 6006 14267 1697 13876 4001 22801223 12579 13588 7315 4538 13304 1615 8612 (1)建立该批数据的频数分布表,取组距为1700(百册);(2)画出直方图.解:(1)最大观测值为353,最小观测值为14667,则组距为d = 1700,区间端点可取为0,1700,3400,5100,6800,8500,10200,11900,13600,15300,频率分布表为组序分组区间组中值频数频率累计频率1700] 850 9 0.225 0.2251 (0,25509 0.225 0.453400]2 (1700,42505 0.125 0.5755100]3 (3400,59504 0.1 0.6756800]4 (5100,76504 0.1 0.7758500]5 (6800,1 0.025 0.893506 (8500,10200]1 0.025 0.825110507 (10200,11900]3 0.075 0.9127508 (11900,13600]4 0.1 11445015300]9 (13600,合计30 1(2)作图略.6.对下列数据构造茎叶图472 425 447 377 341 369 412 399400 382 366 425 399 398 423 384418 392 372 418 374 385 439 408429 428 430 413 405 381 403 479381 443 441 433 399 379 386 387 解:茎叶图为34 135369, 6377, 2, 4, 9382, 4, 5, 1, 1, 6, 7399, 8, 2400, 5, 3412, 9, 8, 8, 3, 9425, 5, 3, 8, 9, 8439, 0, 3447, 3, 14546472, 97.根据调查,某集团公司的中层管理人员的年薪(单位:千元)数据如下:40.6 39.6 37.8 36.2 38.838.6 39.6 40.0 34.7 41.738.9 37.9 37.0 35.1 36.737.1 37.7 39.2 36.9 38.3试画出茎叶图.解:茎叶图为34.735. 136.2, 7, 937.0, 1, 738. 639.6, 6, 240.6, 8, 041.742.43.844.9, 545. 4习题5.31.在一本书上我们随机的检查了10页,发现每页上的错误数为:4 5 6 0 3 1 4 2 1 4试计算其样本均值、样本方差和样本标准差.解:样本均值3)41654(101=+++++=L x ; 样本方差7778.3])34()31()36()35()34[(91222222≈−+−++−+−+−=L s ;样本标准差9437.17778.3≈=s .2. 证明:对任意常数c , d ,有11()()()()()()n niiiii i x c y d x x y y n x c y d ==−−=−−+−−∑∑.证:∑∑==−+−−+−=−−ni i i n i i i d y y y c x x x d y c x 11)]())][(()[())((∑=−−+−−+−−+−−=ni i i i i d y c x d y x x y y c x y y x x 1)])(())(())(())([())(()()()()())((111d y c x n x x d y y y c x y y x x ni i ni i ni i i −−+−−+−−+−−=∑∑∑===))(())(())((00))((11d y c x n y y x x d y c x n y y x x ni i i ni i i −−+−−=−−+++−−=∑∑==.3. 设x 1 , …, x n 和y 1 , …, y n 是两组样本观测值,且有如下关系:y i = 3 x i − 4,i = 1, …, n ,试求样本均值x和y 间的关系以及样本方差2x s 和2y s 间的关系.解:4343431)43(111111−=−=⎟⎟⎠⎞⎜⎜⎝⎛−=−==∑∑∑∑====x x n n x n x n y n y ni i n i i n i i n i i ; 212121229(19)]43()43[(11)(11x n i i n i i n i i ys x x n x x n y y n s =−−=−−−−=−−=∑∑∑===. 4. 记∑==n i i n x n x 11,∑=−−=n i i n x x n s 122)(11,n = 1, 2, …,证明 )(1111n n n n x x n x x −++=++,21221)(111n n nn x x n s n n s −++−=++. 证:)(111111111111111111n n n n n n n i i n i i n x x n x x n x n n x n x n n n x n x −++=+++=++⋅+=+=+++=+=+∑∑; ⎥⎦⎤⎢⎣⎡−+−−=−=++=+=++∑∑21112112121))(1()(1)(1n n n i n i n i n i n x x n x x n x x n s ⎥⎦⎤⎢⎣⎡−+⋅+−−+−=++=∑2122112)()1(1)1()()(1n n n n n i n i x x n n x x x x n 2122112)(111)(1)(11)1(1n n n n n n i n i x x n s n n x x n n x x n n n −++−=⎥⎦⎤⎢⎣⎡−++−−−=++=∑.5. 从同一总体中抽取两个容量分别为n , m 的样本,样本均值分别为1x , 2x ,样本方差分别为21s , 22s ,将两组样本合并,其均值、方差分别为x , s 2,证明:12nx mx x n m+=+,)1)(()(1)1()1(22122212−++−+−+−+−=m n m n x x nm m n s m s n s . 证:m n x m x n x x m n x x m n x m j j n i i m j j n i i ++=⎟⎟⎠⎞⎜⎜⎝⎛++=⎟⎟⎠⎞⎜⎜⎝⎛++=∑∑∑∑====211211121111; ⎥⎦⎤⎢⎣⎡−+−−+=∑∑==m j jn i i x x x x m n s 1221212()(11 ⎥⎦⎤⎢⎣⎡−+−+−+−−+=∑∑==221222211211)()()()(11x x m x x x x n x x m n m j j n i i ⎥⎥⎦⎤⎢⎢⎣⎡⎟⎠⎞⎜⎝⎛++−+−+⎟⎠⎞⎜⎝⎛++−+−−+=221222221121)1()1(11m n x m x n x m s m m n x m x n x n s n m n 2212222122221)()()(111)1()1(m n x x mn x x nm m n m n s m s n +−+−⋅−++−+−+−=)1)(()(1)1()1(2212221−++−+−+−+−=m n m n x x nm m n s m s n . 6. 设有容量为n 的样本A ,它的样本均值为A x ,样本标准差为s A ,样本极差为R A ,样本中位数为m A .现对样本中每一个观测值施行如下变换:y = ax + b ,如此得到样本B ,试写出样本B 的均值、标准差、极差和中位数.解:b x a b x n a nb x a n b ax n y n y A ni i n i i n i i n i i B +=+⋅=+=+==∑∑∑∑====11111)(1)(11;A n i A i n i A i n iB i B s a x x n a b x a b ax n y y n s ||)(11||)(11)(11121212=−−⋅=−−+−=−−=∑∑∑===; R B = y (n ) − y (1) = a x (n ) + b − a x (1) − b = a [x (n ) − x (1)] = a R A ; 当n 为奇数时,b am b ax y m A n n B +=+==⎟⎠⎞⎜⎝⎛+⎟⎠⎞⎜⎝⎛+5.021215.0,当n 为偶数时,b am b x x ab ax b ax y y m A n n n n n n B +=++=+++=+=⎟⎠⎞⎜⎝⎛+⎟⎠⎞⎜⎝⎛⎟⎠⎞⎜⎝⎛+⎟⎠⎞⎜⎝⎛⎟⎠⎞⎜⎝⎛+⎟⎠⎞⎜⎝⎛5.01221221225.0][2][21][21,故m B 0.5 = a m A 0.5 + b .7. 证明:容量为2的样本x 1 , x 2的方差为2212)(21x x s −=. 证:221212221221222112)(214)(4)(])2()2[(121x x x x x x x x x x x x s −=−+−=+−++−−=. 8. 设x 1 , …, x n 是来自U (−1, 1) 的样本,试求)(X E 和Var(X .解:因X i ~ U (−1, 1),有0211)(=+−=i X E ,3112)11()(Var 2=+=i X ,故0)(1)1()(11===∑∑==ni i n i i X E n X n E X E ,n n nXnX n X ni in i i 31311)(Var 11Var )(Var 2121=⋅⋅==⎟⎟⎠⎞⎜⎜⎝⎛=∑∑==. 9. 设总体二阶矩存在,X 1 , …, X n 是样本,证明X X i −与)(j i X X j ≠−的相关系数为 − (n − 1) − 1.证:因X 1 , X 2 , …, X n 相互独立,有Cov (X l , X k ) = 0,(l ≠ k ), 则),(Cov ),(Cov ),(Cov ),(Cov ),(Cov X X X X X X X X X X X X j i j i j i +−−=−−)(Var ),1(Cov )1,(Cov 0X X X nX n X j j i i +−−= 22221111)(Var )(Var 1)(Var 1σσσσnn n n X X n X n j i −=+−−=+−−=,且)1,(Cov 21),(Cov 2)(Var )(Var )(Var 22i i i i i X nX n X X X X X X −+=−+=−σσ)(Var 1212222X X nn n n j −=−=−+=σσσσ,故11111)(Var )(Var ),(Cov ),(Corr 222−−=−⋅−−=−⋅−−−=−−n nn n n n X X X X X X X X X X X X j i j i j i σσσ. 10.设x 1 , x 2 ,…, x n 为一个样本,∑=−−=ni i x x n s 122)(11是样本方差,试证: 22)()1(1s x x n n ji j i =−−∑<. 证:因⎟⎟⎠⎞⎜⎜⎝⎛−−=−−=∑∑==21212211)(11x n x n x x n s n i i n i i , 则⎟⎟⎠⎞⎜⎜⎝⎛−+=−+=−=−∑∑∑∑∑∑∑∑∑∑∑==========<n i n j j i n i n j j n i n j i n i n j j i j i n i n j j i j i j i x x x x x x x x x x x x 1111211211221122221)2(21)(21)( 221212111212)1(2221221s n n x n x n x n x n x n x x x n x n n i i n i i n i n j j i n j j n i i −=⎟⎟⎠⎞⎜⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛⋅−=⎟⎟⎠⎞⎜⎜⎝⎛−+=∑∑∑∑∑∑======, 故22)()1(1s x x n n ji j i =−−∑<. 11.设总体4阶中心矩ν4 = E [X − E (X )]4存在,试对样本方差∑=−−=ni i X X n S 122(11,有 2442442442)1(3)1()2(2)1()()Var(−−+−−−−−=n n n n n S σνσνσν,其中σ 2为总体X 的方差.证:因⎥⎦⎤⎢⎣⎡−−−−=−−−−=∑∑==212122)()(11)]()[(11µµµµX n X n X X n S n i i n i i ,其中µ = E (X ), 则⎥⎦⎤⎢⎣⎡−−−−=∑=21222)()(Var )1(1)Var(µµX n X n S n i i⎭⎬⎫⎩⎨⎧−+⎟⎟⎠⎞⎜⎜⎝⎛−−−⎥⎦⎤⎢⎣⎡−−=∑∑==])(Var[)(,)(Cov 2)(Var )1(12212122µµµµX n X n X X n n i i n i i ⎭⎬⎫⎩⎨⎧−+−−−−−=∑∑==22122122)Var())(,)Cov((2)Var()1(1µµµµX n X X n X n n i i n i i , 因E (X i − µ)2 = σ 2,E (X i − µ)4 = ν4,则)(})({}])([)({)Var(441224122412σνσνµµµ−=−=−−−=−∑∑∑===n X E X E X ni ni i i ni i ,因E (X i − µ) = 0,221)Var()(σµnX X E ==−,且当i ≠ j 时,X i − µ 与X j − µ 相互独立, 则∑∑==−−−−−=−−ni i i ni i X E X E X X E X X 12222122})()(])()[({))(,)Cov((µµµµµµ∑∑==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⋅−⎥⎥⎦⎤⎢⎢⎣⎡⎟⎟⎠⎞⎜⎜⎝⎛−⋅−=ni nk k i n X n X E 1222121)(1)(σσµµ∑∑=≠⎭⎬⎫⎩⎨⎧−⎥⎦⎤⎢⎣⎡−⋅−+−=n i i k k i i n X E X E X E n1422421)()()(1σµµµ)(11])1([144142242σνσσσν−=⎭⎬⎫⎩⎨⎧−−⋅+=∑=n n n nni ,且224122421)(1])([)()Var(⎥⎦⎤⎢⎣⎡−⎥⎦⎤⎢⎣⎡−=−−−=−∑=σµµµµn X n E X E X E X n i i42221441)()(24)(1σµµµn X X X E n j i j i n i i −⎥⎦⎤⎢⎣⎡−−⎟⎟⎠⎞⎜⎜⎝⎛+−=∑∑<= 42221441)()(6)(1σµµµn X E X E X E n j i j i ni i −⎥⎦⎤⎢⎣⎡−−+−=∑∑<= 42443424444222442)3(11])1(3[11261σσνσσνσσσνn n n n n n n n n n n +−=−−+=−⎥⎦⎤⎢⎣⎡⋅⎟⎟⎠⎞⎜⎜⎝⎛⋅+=, 故⎭⎬⎫⎩⎨⎧⎥⎦⎤⎢⎣⎡+−+−⋅−−−=4244324444222)3(1)(12)()1(1)Var(σσνσνσνn n n n n n n S⎭⎬⎫⎩⎨⎧+−+−−−−=444444422)3(1)(2)()1(1σσνσνσνn n n 2442442444444442)1(3)1()2(2)1()()3(1)2(2)()1(1−−+−−−−−=⎭⎬⎫⎩⎨⎧−+−−−−=n n n n n n n n σνσνσνσνσνσν. 12.设总体X 的3阶矩存在,设X 1 , X 2 ,…, X n 是取自该总体的简单随机样本,X 为样本均值,S 2为样本方差,试证:nS X 32),Cov(ν=,其中ν3 = E [X − E (X )]3.证:因⎥⎦⎤⎢⎣⎡−−−−=−−−−=∑∑==212122)()(11)]()[(11µµµµX n X n X X n S n i i n i i ,其中µ = E (X ), 则⎟⎟⎠⎞⎜⎜⎝⎛⎥⎦⎤⎢⎣⎡−−−−−=−=∑=21222)()(11,Cov ),Cov(),Cov(µµµµX n X n X S X S X n i i ⎥⎦⎤⎢⎣⎡−−−−−−=∑=))(,Cov())(,Cov(11212µµµµX X n X X n n i i , 因0)()(=−=−µµi X E X E ,E (X i − µ)2 = σ 2,E (X i − µ)3 = ν3,且当i ≠ j 时,X i − µ 与X j − µ 相互独立,则∑∑∑∑====−−=⎟⎟⎠⎞⎜⎜⎝⎛−−=−−n i i i ni i n k k ni i X X n X X n X X 1212112))(,Cov(1)(,)(1Cov ))(,Cov(µµµµµµ331231])()()([1ννµµµ=⋅=−−−−=∑=n nX E X E X E n n i i i i , 且31232)(1)()()())(,Cov(⎥⎦⎤⎢⎣⎡−=−−−−=−−∑=n i i X n E X E X E X E X X µµµµµµ323313313311)(1)(1ννµµn n n X E n X E n n i i n i i =⋅=−=⎥⎦⎤⎢⎣⎡−=∑∑==,故n nn n n n n S X 333232111111),Cov(νννν=−⋅−=⎟⎠⎞⎜⎝⎛⋅−−=. 13.设1X 与2X 是从同一正态总体N (µ, σ 2)独立抽取的容量相同的两个样本均值.试确定样本容量n ,使得两样本均值的距离超过σ 的概率不超过0.01. 解:因µ==)()(21X E X E ,nX X 221)Var()Var(σ==,1X 与2X 相互独立,且总体分布为N (µ, σ 2),则0)(21=−=−µµX X E ,n n n X X 222212)Var(σσσ=+=−,即⎟⎟⎠⎞⎜⎜⎝⎛−n N X X 2212,0~σ, 因01.0222212}|{|21≤⎟⎟⎠⎞⎜⎜⎝⎛Φ−=⎥⎥⎦⎤⎢⎢⎣⎡⎟⎟⎠⎞⎜⎜⎝⎛Φ−=>−n n X X P σσσ,有995.02≥⎟⎟⎠⎞⎜⎜⎝⎛Φn ,5758.22≥n ,故n ≥ 13.2698,即n 至少14个.14.利用切比雪夫不等式求抛均匀硬币多少次才能使正面朝上的频率落在 (0.4, 0.6) 间的概率至少为0.9.如何才能更精确的计算这个次数?是多少?解:设⎩⎨⎧=,,0,,1次反面朝上第次正面朝上第i i X i 有X i ~ B (1, 0.5),且正面朝上的频率为∑==ni i X n X 11,则E (X i ) = 0.5,Var (X i ) = 0.25,且5.0(=X E ,n X 25.0)(Var =, 由切比雪夫不等式得n nX P X P 2511.025.01}1.0|5.0{|}6.04.0{2−=−≥<−=<<,故当9.0251≥−n时,即n ≥ 250时,9.0}6.04.0{≥<<X P ;利用中心极限定理更精确地计算,当n 很大时∑==ni i X n X 11的渐近分布为正态分布25.0,5.0(n N , 则)2.0()2.0()25.05.04.0(25.05.06.0()4.0()6.0(}6.04.0{n n nnF F X P −Φ−Φ=−Φ−−Φ=−=<<9.01)2.0(2≥−Φ=n ,即95.0)2.0(≥Φn ,64.12.0≥n ,故当n ≥ 67.24时,即n ≥ 68时,9.0}6.04.0{≥<<X P .15.从指数总体Exp (1/θ ) 抽取了40个样品,试求X 的渐近分布.解:因θ==)((X E X E ,2401)(Var )(Var θ==n X X ,故X 的渐近分布为)401,(2θθN .16.设X 1 , …, X 25是从均匀分布U (0, 5) 抽取的样本,试求样本均值X 的渐近分布.解:因25)()(==X E X E ,1211225)05()(Var )(Var 2=×−==n X X ,故X 的渐近分布为)121,25(N . 17.设X 1 , …, X 20是从二点分布b (1, p ) 抽取的样本,试求样本均值X 的渐近分布.解:因p X E X E ==)((,20)1()(Var )(Var p p n X X −==,故X 的渐近分布为20)1(,(p p p N −.18.设X 1 , …, X 8是从正态分布N (10, 9) 中抽取的样本,试求样本均值X 的标准差.解:因89)(Var )(Var ==n X X ,故X 的标准差为423)(Var =X . 19.切尾均值也是一个常用的反映样本数据的特征量,其想法是将数据的两端的值舍去,而用剩下的当中的值为计算样本均值,其计算公式是][2])[()2]([)1]([αααααn n X X X X n n n n −+++=−++L ,其中0 < α < 1/2是切尾系数,X (1) ≤ X (2) ≤ … ≤ X (n ) 是有序样本.现我们在高校采访了16名大学生,了解他们平时的学习情况,以下数据是大学生每周用于看电视的时间:15 14 12 9 20 4 17 26 15 18 6 10 16 15 5 8 取α = 1/16,试计算其切尾均值.解:因n α = 1,且有序样本为4, 5, 6, 8, 9, 10, 12, 14, 15, 15, 15, 16, 17, 18, 20, 26,故切尾均值8571.12)20865(216116/1=++++−=L x . 20.有一个分组样本如下:区间 组中值 频数 (145,155) 150 4 (155,165) 160 8 (165,175) 170 6 (175,185) 180 2试求该分组样本的样本均值、样本标准差、样本偏度和样本峰度.解:163)2180617081604150(201=×+×+×+×=x ;2338.9]2)163180(6)163170(8)163160(4)163150[(1912222=×−+×−+×−+×−=s ; 因81]2)163180(6)163170(8)163160(4)163150[(20122222=×−+×−+×−+×−=b , 144]2)163180(6)163170(8)163160(4)163150[(20133333=×−+×−+×−+×−=b ,14817]2)163180(6)163170(8)163160(4)163150[(20144444=×−+×−+×−+×−=b ,故样本偏度1975.02/3231==b b γ,样本峰度7417.032242−=−=b b γ.21.检查四批产品,其批次与不合格品率如下:批号批量不合格品率1 100 0.052 300 0.063 250 0.04 4 150 0.03试求这四批产品的总不合格品率.解:046875.0)03.015004.025006.030005.0100(8001=×+×+×+×=p . 22.设总体以等概率取1, 2, 3, 4, 5,现从中抽取一个容量为4的样本,试分别求X (1) 和X (4) 的分布. 解:因总体分布函数为⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<=,5,1,54,54,43,53,32,52,21,51,1,0)(x x x x x x x F则F (1) (x ) = P {X (1) ≤ x } = 1 − P {X (1) > x } = 1 − P {X 1 > x , X 2 > x , X 3 > x , X 4 > x } = 1 − [1 − F (x )]4⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<=,5,1,54,625624,43,625609,32,625544,21,625369,1,0x x x x x x且F (4) (x ) = P {X (4) ≤ x } = P {X 1 ≤ x , X 2 ≤ x , X 3 ≤ x , X 4 ≤ x } = [F (x )]4⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<=,5,1,54,625256,43,62581,32,62516,21,6251,1,0x x x x x x故X (1) 和X (4) 的分布为6251625156256562517562536954321)1(P X ; 6253696251756256562515625154321)4(PX . 23.设总体X 服从几何分布,即P {X = k } = pq k − 1,k = 1, 2, …,其中0 < p < 1,q = 1 − p ,X 1, X 2, …, X n 为该总体的样本.求X (n ) , X (1)的概率分布.解:因k k kj j q qq p pqk X P −=−−==≤∑=−11)1(}{11,k = 1, 2, …,故n k n k ni i ni i n n n q q k X P k X P k X P k X P k X P )1()1(}1{}{}1{}{}{111)()()(−==−−−=−≤−≤=−≤−≤==∏∏;且nk k n ni i ni i q q k X P k X P k X P k X P k X P −=>−−>=>−−>==−==∏∏)1(11)1()1()1(}{}1{}{}1{}{.24.设X 1 , …, X 16是来自N (8, 4) 的样本,试求下列概率(1)P {X (16) > 10}; (2)P {X (1) > 5}.解:(1)1616161)16()16()]2810([1)]10([1}10{1}10{1}10{−Φ−=−=≤−=≤−=>∏=F X P X P X P i i = 1 − [Φ(1)]16 = 1 − 0.841316 = 0.9370;(2)3308.09332.0)]5.1([285(1[)]5(1[}5{}5{16161616161)1(==Φ=−Φ−=−=>=>∏=F X P X P i i . 25.设总体为韦布尔分布,其密度函数为⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎟⎟⎠⎞⎜⎜⎝⎛−=−mmm x mx m x p ηηηexp ),;(1,x > 0, m > 0, η > 0. 现从中得到样本X 1 , …, X n ,证明X (1) 仍服从韦布尔分布,并指出其参数. 解:总体分布函数mm mmx xt xmt xt mm xt t mtt t p x F ⎟⎟⎠⎞⎜⎜⎝⎛−⎟⎟⎠⎞⎜⎜⎝⎛−⎟⎟⎠⎞⎜⎜⎝⎛−⎟⎟⎠⎞⎜⎜⎝⎛−−−=−=⎟⎟⎠⎞⎜⎜⎝⎛===∫∫∫ηηηηηηe1e d ed ed )()(00010,x > 0,则X (1) 的密度函数为111(1)11()[1()]()eeemmmmx x x m m m n n n mmmxmnxp x n F x p x n ηηηηη⎛⎞⎛⎞⎛⎞⎛⎞−−−−−−−−⎜⎟⎜⎟⎜⎟−⎝⎠⎝⎠⎝⎠=−=⋅==,故X (1) 服从参数为⎟⎟⎠⎞⎜⎜⎝⎛m n m η,的韦布尔分布. 26.设总体密度函数为p (x ) = 6 x (1 − x ), 0 < x < 1,X 1 , …, X 9是来自该总体的样本,试求样本中位数的分布. 解:总体分布函数3203223)23(d )1(6d )()(x x t t t t t t t p x F xxx−=−=−==∫∫,0 < x < 1,因样本容量n = 9,有样本中位数)5(215.0x x m n ==⎟⎠⎞⎜⎝⎛+,其密度函数为)1(6)231()23(!4!4!9)()](1[)]([!4!4!9)(432432445x x x x x x x p x F x F x p −⋅+−−⋅=−⋅=. 27.证明公式∫∑−−=−−−−=−⎟⎟⎠⎞⎜⎜⎝⎛110)1()!1(!!)1(p r n r rk k n k dx x x r n r n p p k n ,其中0 ≤ p ≤ 1. 证:设总体X 服从区间(0, 1)上的均匀分布,X 1, X 2, …, X n 为样本,X (1), X (2), …, X (n )是顺序统计量,则样本观测值中不超过p 的样品个数服从二项分布b (n , p ),即最多有r 个样品不超过p 的概率为∑=−+−⎟⎟⎠⎞⎜⎜⎝⎛=>rk kn k r p p k n p X P 0)1()1(}{,因总体X 的密度函数与分布函数分别为⎩⎨⎧<<=.,0;10,1)(其他x x p ⎪⎩⎪⎨⎧≥<≤<=.1,1;10,;0,0)(x x x x x F则X (r + 1)的密度函数为⎪⎩⎪⎨⎧<<−−−=−−−=−−−−+.,0,10,)1()!1(!!)()](1[)]([)!1(!!)(111其他x x x r n r n x p x F x F r n r n x p r n r r n r r 故∫∑−−+=−−−−=>=−⎟⎟⎠⎞⎜⎜⎝⎛11)1(0)1()!1(!!}{)1(p r n r r rk kn k dx x x r n r n p X P p p k n . 28.设总体X 的分布函数F (x )是连续的,X (1), …, X (n )为取自此总体的次序统计量,设ηi = F (X (i )),试证: (1)η1 ≤ η2 ≤ … ≤ ηn ,且ηi 是来自均匀分布U (0, 1)总体的次序统计量;(2)1)(+=n iE i η,)2()1()1()Var(2++−+=n n i n i i η,1 ≤ i ≤ n ; (3)ηi 和ηj 的协方差矩阵为⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎝⎛+−+−+−+−2)1(2)1(2)1(2)1(22212111n a a n a a n a a n a a 其中11+=n i a ,12+=n j a . 注:第(3)问应要求i < j . 解:(1)首先证明Y = F (X )的分布是均匀分布U (0, 1),因分布函数F (x )连续,对于任意的y ∈ (0, 1),存在x ,使得F (x ) = y , 则F Y ( y ) = P {Y = F (X ) ≤ y } = P {F (X ) ≤ F (x )} = P {X ≤ x } = F (x ) = y , 即Y = F (X )的分布函数是⎪⎩⎪⎨⎧≥<≤<=.1,1;10,;0,0)(y y y y y F Y可得Y = F (X )的分布是均匀分布U (0, 1),即F (X 1), F (X 2), …, F (X n )是均匀分布总体U (0, 1)的样本, 因分布函数F (x )单调不减,ηi = F (X (i )),且X (1) ≤ X (2) ≤ … ≤ X (n )是总体X 的次序统计量, 故η1 ≤ η2 ≤ … ≤ ηn ,且ηi 是来自均匀分布U (0, 1)总体的次序统计量; (2)因均匀分布U (0, 1) 的密度函数与分布函数分别为⎩⎨⎧<<=.,0;10,1)(其他y y p Y ⎪⎩⎪⎨⎧≥<≤<=.1,1;10,;0,0)(y y y y y F Y则ηi = F (X (i ))的密度函数为⎪⎩⎪⎨⎧<<−−−=−−−=−−−−.,0,10,)1()!()!1(!)()](1[)]([)!()!1(!)(11其他y y y i n i n y p y F y F i n i n y p i n i Y in Y i Y i即ηi 服从贝塔分布Be (i , n − i + 1),即Be (a , b ),其中a = i ,b = n − i + 1,故1)(+=+=n i b a a E i η,)2()1()1()1()()Var(22++−+=+++=n n i n i b a b a ab i η,1 ≤ i ≤ n ; (3)当i < j 时,(ηi , ηj )的联合密度函数为z y Y Y j n Y i j Y Y i Y ij z p y p z F y F z F y F j n i j i n z y p <−−−−−−−−−−=I )()()](1[)]()([)]([)!()!1()!1(!),(111011I )1()()!()!1()!1(!<<<−−−−−−−−−−=z y j n i j i z y z y j n i j i n , 则∫∫∫∫−−−+∞∞−+∞∞−−⋅−−−−−=⋅=1001)1()()!()!1()!1(!),()(z j n i j i ij j i dy z z y z y dz j n i j i n dydz z y p yz E ηη, 令y = zu ,有dy = zdu ,且当y = 0时,u = 0;当y = z 时,u = 1,则∫∫⋅−−=−⋅−−−−−−−1101)()()1()1()(zdu zu z zu z z dy z z y z y i j i j n zj n i j ij n j j n j i j i j j n z z j i j i i j i B z z du u u z z z −+−+−−−−−−=−+⋅−=−⋅−=∫)1(!)!1(!),1()1()1()1(1111,即∫−+−−−−−−−=101)1(!)!1(!)!()!1()!1(!)(dz z z j i j i j n i j i n E jn j j i ηη )1,2(!)!1(!)!()!1()!1(!+−+−−⋅−−−−=j n j B j i j i j n i j i n)2)(1()1()!2()!()!1(!)!1(!)!()!1()!1(!+++=+−+⋅−−⋅−−−−=n n j i n j n j j i j i j n i j i n , 可得)2()1()1(11)2)(1()1()()()(),Cov(2++−+=+⋅+−+++=−=n n j n i n j n i n n j i E E E j i j i j i ηηηηηη, 因11+=n i a ,12+=n j a , 则2)1()2()1()1(),Cov(212+−=++−+=n a a n n j n i j i ηη, 且2)1()2()1()1()Var(112+−=++−+=n a a n n i n i i η,2)1()2()1()1()Var(222+−=++−+=n a a n n j n j jη, 故ηi 和ηj 的协方差矩阵为⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎝⎛+−+−+−+−=⎟⎟⎠⎞⎜⎜⎝⎛2)1(2)1(2)1(2)1()Var(),Cov(),Cov()Var(22212111n a a n a a n a a n a a j j i j i i ηηηηηη. 29.设总体X 服从N (0, 1),从此总体获得一组样本观测值x 1 = 0, x 2 = 0.2, x 3 = 0.25, x 4 = −0.3, x 5 = −0.1, x 6 = 2, x 7 = 0.15, x 8 = 1, x 9 = −0.7, x 10 = −1.(1)计算x = 0.15(即x (6))处的E [F (X (6))],Var[F (X (6))]; (2)计算F (X (6))在x = 0.15的分布函数值.解:(1)根据第28题的结论知1)]([)(+=n iX F E i ,)2()1()1()](Var[2)(++−+=n n i n i X F i ,且n = 10, 故116)]([)6(=X F E ,2425121156)](Var[2)6(=××=X F ; (2)因F (X (i ))服从贝塔分布Be (i , n − i + 1),即这里的F (X (6))服从贝塔分布Be (6, 5),则F (X (6))在x = 0.15的分布函数值为∫−⋅=15.00456)1(!4!5!10)15.0(dx x x F , 故根据第27题的结论知0014.085.015.0101)1(!4!5!10)15.0(501015.00456=××⎟⎟⎠⎞⎜⎜⎝⎛−=−⋅=∑∫=−k k k k dx x x F . 30.在下列密度函数下分别寻求容量为n 的样本中位数m 0.5的渐近分布.(1)p (x ) = 6x (1 − x ),0 < x < 1;(2)⎭⎬⎫⎩⎨⎧−−=222)(exp π21)(σµσx x p ; (3)⎩⎨⎧<<=.,0;10,2)(其他x x x p (4)||e 2)(x x p λλ−=.解:样本中位数m 0.5的渐近分布为⎟⎟⎠⎞⎜⎜⎝⎛⋅)(41,5.025.0x p n x N ,其中p (x )是总体密度函数,x 0.5是总体中位数, (1)因p (x ) = 6x (1 − x ),0 < x < 1,有35.025.003205.023)23()1(6)(5.05.05.0x x x x dx x x x F x x −=−=−==∫,则x 0.5 = 0.5,有nn p n 91)5.05.06(41)5.0(4122=×××=⋅, 故样本中位数m 0.5的渐近分布为⎟⎠⎞⎜⎝⎛n N 91,5.0;(2)因⎭⎫⎩⎨⎧−−=222)(exp π21)(σµσx x p ,有0.5 = F (x 0.5) = F (µ), 则x 0.5 = µ ,有n n p n 2ππ2141)(41222σσµ=⎟⎟⎠⎞⎜⎜⎝⎛×=⋅, 故样本中位数m 0.5的渐近分布为⎟⎟⎠⎞⎜⎜⎝⎛n N 2π,2σµ;(3)因⎩⎨⎧<<=.,0;10,2)(其他x x x p 有25.00205.05.05.02)(5.0x x xdx x F x x ====∫, 则215.0=x ,有n n p n 8121241214122=⎟⎠⎞⎜⎝⎛××=⎟⎠⎞⎜⎝⎛⋅, 故样本中位数m 0.5的渐近分布为⎟⎠⎞⎜⎝⎛n N 81,21; (4)因||e 2)(x x p λλ−=,有0.5 = F (x 0.5) = F (0),则x 0.5 = 0,有2221241)0(41λλn n p n =⎟⎠⎞⎜⎝⎛×=⋅, 故样本中位数m 0.5的渐近分布为⎟⎠⎞⎜⎝⎛21,0λn N .31.设总体X 服从双参数指数分布,其分布函数为⎪⎩⎪⎨⎧≤>⎭⎬⎫⎩⎨⎧−−−=.,0;,exp 1)(µµσµx x x x F其中,−∞ < µ < +∞,σ > 0,X (1) ≤ … ≤ X (n )为样本的次序统计量.试证明)(2)1()1()(−−−−i i X X i n σ服从自由度为2的χ 2分布(i = 2, …, n ). 注:此题有误,讨论的随机变量应为)(2)1()1()(−−+−i i X X i n σ.证:因(X (i − 1), X (i ))的联合密度函数为z y i n i i i z p y p z F y F i n i n z y p <−−−−−−=I )()()](1[)]([)!()!2(!),(2)1( z y in i z y z y i n i n <<−−⎭⎬⎫⎩⎨⎧−−⋅⎭⎬⎫⎩⎨⎧−−⋅⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−−−=µσµσσµσσµσµI exp 1exp 1exp exp 1)!()!2(!2z y i n i z y y i n i n <<+−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−⎭⎬⎫⎩⎨⎧−−−−=µσµσµσµσI exp exp 1exp )!()!2(!122,则T = X (i ) − X (i − 1)的密度函数为∫+∞∞−−⋅⋅+=dy t y y p t p i i T 1),()()1(∫∞++−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−+−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−⎭⎬⎫⎩⎨⎧−−−−=µσµσµσµσdy t y y y i n i n i n i 122exp exp 1exp )!()!2(!∫∞+−+−+−⎥⎦⎤⎢⎣⎡⎭⎫⎩⎨⎧−−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−=µσµσσµσµσσy d y y t i n i n i i n i n exp )(exp 1exp exp )!()!2(!2112∫−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−=−+−+−012112)()1(exp )!()!2(!du u ut i n i n i i n i n σσσ∫−+−−⎭⎬⎫⎩⎨⎧+−−−−=1021)1()1(exp )!()!2(!du u ut i n i n i n i i n σσ )1,2()1(exp )!()!2(!−+−⎭⎬⎫⎩⎨⎧+−−−−=i i n B t i n i n i n σσ⎭⎬⎫⎩⎨⎧+−−+−=−+−⋅⎭⎬⎫⎩⎨⎧+−−−−=σσσσt i n i n n i i n t i n i n i n )1(exp 1!)!2()!1()1(exp )!()!2(!,t > 0,可得T i n X X i n S i i σσ2)1()(2)1()1()(+−=−+−=−的密度函数为⎭⎬⎫⎩⎨⎧−=+−⋅⎭⎬⎫⎩⎨⎧−+−=+−⋅⎟⎟⎠⎞⎜⎜⎝⎛+−=2exp 21)1(22exp 1)1(2)1(2)(s i n s i n i n s i n p s p T S σσσσ,s > 0, 故)(2)1()1()(−−+−=i i X X i n S σ服从参数为21的指数分布,也就是服从自由度为2的χ 2分布. 32.设总体X 的密度函数为⎩⎨⎧<<=.,0;10,3)(2其他x x x p X (1) ≤ X (2) ≤ … ≤ X (5)为容量为5的取自此总体的次序统计量,试证)4()2(X X 与X (4)相互独立.z −证:因总体X 的密度函数和分布函数分别为⎩⎨⎧<<=.,0;10,3)(2其他x x x p ⎪⎩⎪⎨⎧≥<≤<=.1,1;10,;0,0)(3x x x x x F 则(X (2), X (4))的联合密度函数为)4()2(I )()()](1[)]()([)]([!1!1!1!5),()4()2(1)4(1)2()4(1)2()4()2(24x x x p x p x F x F x F x F x x p <−−⋅⋅=103)4(3)2(3)4(2)4(5)2(102)4(2)2(3)4(3)2(3)4(3)2()4()2()4()2(I )1)((1080I 33)1)((120<<<<<<−−=⋅⋅−−=x x x x x x x x x x x x x x x ,设)4()2(1X X Y =,Y 2 = X (4),有X (2) = Y 1Y 2,X (4) = Y 2,则(X (2), X (4))关于( Y 1 , Y 2 )的雅可比行列式为21221)4()2(1),(),(y y y y y x x J ==∂∂=,且0 < X (2) ≤ X (4) < 1对应于0 < Y 1 < 1, 0 < Y 2 < 1,可得(Y 1 , Y 2 )的联合密度函数为210,10323213222521221242121I )1]()([)(1080||),(),(y y y y y y y y J y y y p y y p y y ⋅−−=⋅=<<<<103211210315121I )1(I )1(1080<<<<−⋅−=y y y y y y ,由于(Y 1 , Y 2 , …, Y n )的联合密度函数p ( y 1 , y 2)可分离变量, 故)4()2(1X X Y =与Y 2 = X (4)相互独立.33.(1)设X (1)和X (n )分别为容量n 的最小和最大次序统计量,证明极差R n = X (n ) − X (1)的分布函数∫+∞∞−−−+=dy y p y F x y F n x F n R n )()]()([)(1其中F ( y )与p ( y )分别为总体的分布函数与密度函数;(2)利用(1)的结论,求总体为指数分布Exp (λ)时,样本极差R n 的分布. 注:第(1)问应添上x > 0的要求. 解:(1)方法一:增补变量法因(X (1), X (n ))的联合密度函数为z y n z y n n z p y p y F z F n n z p y p y F z F n n z y p <−<−−−=−−=I )()()]()()[1(I )()()]()([)!2(!),(221, 对于其函数R n = X (n ) − X (1),增补变量W = X (1),⎩⎨⎧−==.;y z r y w 反函数为⎩⎨⎧+==.;r w z w y 其雅可比行列式为11101==J ,则R n 的密度函数为∫+∞∞−>−+−+−=dw r w p w p w F r w F n n r p r n R n 02I )()()]()()[1()(,故R n = X (n ) − X (1)的分布函数为∫∫∫∞−+∞∞−>−∞−+−+−==x r n x R R dw r w p w p w F r w F n n dr dr r p x F n n 02I )()()]()()[1()()(∫∫+∞∞−∞−>−+−+−=xr n dr r w p w p w F r w F n n dw 02I )()()]()()[1(∫∫+∞∞−−+−+−=xn dr r w p w F r w F dw w p n n 02)()]()([)()1(∫∫+∞∞−−+−+−=xn r w dF w F r w F dw w p n n 02)()]()([)()1(∫+∞∞−−−+−⋅−=x n w F r w F n dw w p n n 01)]()([11)()1(∫+∞∞−−−+=dw w p w F x w F n n )()]()([1 ∫+∞∞−−−+=dy y p y F x y F n n )()]()([1,x > 0;方法二:分布函数法因(X (1), X (n ))的联合密度函数为z y n z y n n z p y p y F z F n n z p y p y F z F n n z y p <−<−−−=−−=I )()()]()()[1(I )()()]()([)!2(!),(221, 故R n = X (n ) − X (1)的分布函数为∫∫+∞∞−+∞−=≤−==xy n n n R dz z y p dy x X X R P x F n ),(}{)(1)1()(∫∫+∞∞−+−−−=xy yn dz z p y p y F z F dy n n )()()]()([)1(2∫∫+∞∞−+−−⋅−=xy yn z F d y F z F y p dy n n )]([)]()([)()1(2∫∫+∞∞−−+∞∞−+−−+=−−⋅⋅−=dy y p y F x y F n y F z F n y p dy n n n x y y n )()]()([)]()([11)()1(11,x > 0;(2)因指数分布Exp (λ)的密度函数与分布函数分别为⎩⎨⎧≤>=−.0,0;0,e )(x x x p x λλ ⎩⎨⎧≤>−=−.0,0;0,e 1)(x x x F x λ故R n = X (n ) − X (1)的分布函数为∫∫+∞−−−+−+∞∞−−⋅−−−=−+=01)(1e )]e 1()e 1[()()]()([)(dy n dy y p y F x y F n x F y n y x y n R n λλλλ101011)e 1()(e 1)e 1(e )1()e 1()(e −−+∞−−−+∞−−−−−−=⎟⎠⎞⎜⎝⎛−⋅−=−⋅−=∫n x n y n x y n x n y n n d n λλλλλλ,x > 0.34.设X 1 , …, X n 是来自U (0, θ ) 的样本,X (1) ≤ … ≤ X (n ) 为次序统计量,令)1()(+=i i i X X Y ,i = 1, …, n − 1,Y n = X (n ) ,证明Y 1 , …, Y n 相互独立.。

概率论与数理统计第五章课后习题及参考答案

概率论与数理统计第五章课后习题及参考答案

概率论与数理统计第五章课后习题及参考答案1.用切比雪夫不等式估计下列各题的概率.(1)废品率为03.0,1000个产品中废品多于20个且少于40个的概率;(2)200个新生儿中,男孩多于80个而少于120个的概率(假设男孩和女孩的概率均为5.0).解:(1)设X 为1000个产品中废品的个数,则X ~)1000,03.0(B ,有30)(=X E ,1.29)(=X D ,由切比雪夫不等式,得)3040303020()4020(-<-<-=<<X P X P )103010(<-<-=X P )1030(<-=X P 709.0101.2912=-≥.(2)设X 为200个新生儿中男孩的个数,则X ~)200,5.0(B ,有100)(=X E ,50)(=X D ,由切比雪夫不等式,得)10012010010080()12080(-<-<-=<<X P X P )2010020(<-<-=X P )20100(<-=X P 87205012=-≥.2.一颗骰子连续掷4次,点数总和记为X ,估计)1810(<<X P .解:设i X 为该骰子掷第i 次出现的点数,则61)(==k X P i ,6,,2,1 =i ,6,,2,1 =k .27)654321(61)(=+++++=i X E ,691)654321(61)(2222222=+++++=i X E ,35)]([)()(22=-=i i i X E X E X D ,4,3,2,1=i .因为4321X X X X X +++=,且1X ,2X ,3X ,4X 相互独立,故有14)(=X E ,335)(=X D .由切比雪夫不等式,得)1418141410()1810(-<-<-=<<X P X P )4144(<-<-=X P )414(<-=X P 271.0433512=-≥.3.袋装茶叶用及其装袋,每袋的净重为随机变量,其期望值为100g ,标准差为10g ,一大盒内装200袋,求一盒茶叶净重大于5.20kg 的概率.解:设i X 为一袋袋装茶叶的净重,X 为一盒茶叶的净重,由题可知∑==2001i i X X ,100)(=i X E ,100)(=i X D ,200,,2,1 =i .因为1X ,2X ,…,200X 相互独立,则20000)()(2001==∑=i i X E X E ,20000)()(2001==∑=i i X D X D .)()(20500)()(()20500(2001X D X E X D X E X P X P i i ->-=>∑=)1020020000205001020020000(⋅->⋅-=X P )2251020020000(>⋅-=X P 由独立同分布的中心极限定理,1020020000⋅-X 近似地服从)1,0(N ,于是0002.0)5.3(1)2251020020000(=Φ-≈>⋅-X P .4.有一批建筑用木桩,其80%的长度不小于3m .现从这批木桩中随机取出100根,试问其中至少有30根短于3m 的概率是多少?解:设X 为100根木桩中短于3m 的根数,则由题可知X ~)2.0,100(B ,有20)(=X E ,16)(=X D ,由棣莫弗—拉普拉斯定理,得)30(1)30(<-=≥X P X P )42030(1)()((1-Φ-=-Φ-=X D X E X 0062.0)5.2(1=Φ-=.5.某种电器元件的寿命服从均值为100h 的指数分布.现随机选取16只,设它们的寿命是相互独立的.求这16只元件寿命总和大于1920h 的概率.解:设i X 为第i 只电器元件的寿命,由题可知i X ~)01.0(E ,16,,2,1 =i ,且1X ,2X ,…,16X 相互独立,则100)(=i X E ,10000)(=i X D .记∑==161i i X X ,则1600)()(161==∑=i i X E X E ,160000)()(161==∑=i i X D X D .))()(1920)()(()1920(X D X E X D X E X P X P ->-=>)400160019204001600(->-=X P )8.04001600(>-=X P ,由独立同分布的中心极限定理,1600-X 近似地服从)1,0(N ,于是2119.0)8.0(1)8.04001600(=Φ-=>-X P .6.在数值计算中中,每个数值都取小数点后四位,第五位四舍五入(即可以认为计算误差在区间]105,105[55--⨯⨯-上服从均匀分布),现有1200个数相加,求产生的误差综合的绝对值小于03.0的概率.解:设i X 为每个数值的误差,则i X ~)105,105(55--⨯⨯-U ,有0)(=i X E ,1210)(8-=i X D ,1200,,2,1 =i .从而0)()(12001==∑=i i X E X E ,61200110)()(-===∑i i X D X D .由独立同分布的中心极限定理,X 近似地服从)10,0(6-N ,于是)03.0(<X P ))()(03.0)()((X D X E X D X E X P -≤-=12101200003.0121012000(44--⋅-≤⋅-=X P 9974.01)3(2=-Φ=.7.某药厂断言,该厂生产的某药品对医治一种疑难的血液病治愈率为8.0.医院检验员任取100个服用此药的病人,如果其中多于75个治愈,就接受这一断言,否则就拒绝这一断言.(1)若实际上此药对这种病的治愈率是8.0,问接受这一断言的概率是多少?(2)若实际上此药对这种病的治愈率是7.0,问接受这一断言的概率是多少?解:设X 为100个服用此药的病人中治愈的个数,(1)由题可知X ~)8.0,100(B ,则80)(=X E ,16)(=X D ,由棣莫弗—拉普拉斯定理,得)75(1)75(≤-=>X P X P 48075(1))()((1-Φ-=-Φ-=X D X E X 8944.0)25.1(=Φ=.(2)由题可知X ~)7.0,100(B ,则70)(=X E ,21)(=X D ,由棣莫弗—拉普拉斯定理,得)75(1)75(≤-=>X P X P 217075(1)()((1-Φ-=-Φ-=X D X E X 1379.0)09.1(1=Φ-=.8.一射手在一次射击中,所得环数的分布律如下表:X678910P 05.005.01.03.05.0求:(1)在100次射击中环数介于900环与930环之间的概率是多少?(2)超过950环的概率是多少?解:设X 为100次射击中所得的环数,i X 为第i 次射击的环数,则∑==1001i i X X ,15.9)(=i X E ,95.84)(2=i X E ,2275.1)]([)()(22=-=i i i X E X E X D ,100,,2,1 =i .由1X ,2X ,…,100X 相互独立,得915)()(1001==∑=i i X E X E ,75.122)()(1001==∑=i i X D X D .由独立同分布的中心极限定理,75.122915-X 近似地服从)1,0(N ,于是(1))930900(≤≤X P ))()(930)()()()(900(X D X E X D X E X X D X E P -≤-≤-=75.12291593075.12291575.122915900(-≤-≤-=X P )75.1221575.122915(≤-=X P 823.01)35.1(2=-Φ≈.(2))950(>X P ))()(950)()((X D X E X D X E X P ->-=75.122915950)()((->-=X D X E X P 001.0)1.3(1=Φ-≈.9.设有30个电子元件1A ,2A ,…,30A ,其寿命分别为1X ,2X ,…,30X ,且且都服从参数为1.0=λ的指数分布,它们的使用情况是当i A 损坏后,立即使用1+i A (29,,2,1 =i ).求元件使用总时间T 不小于350h 的概率.解:由题可知i X ~)1.0(E ,30,,2,1 =i ,则10)(=i X E ,100)(=i X D .记∑==301i i X T ,由1X ,2X ,…,30X 相互独立,得300)()(301==∑=i i X E T E ,3000)()(301==∑=i i X D T D .))()(350)()(()350(T D T E T D T E T P T P ->-=>30103003503010300(⋅->⋅-=T P )91.03010300(>⋅-≈T P ,由独立同分布的中心极限定理,3010300⋅-T 近似地服从)1,0(N ,于是1814.0)91.0(1)91.03010300(=Φ-=>⋅-T P .10.大学英语四级考试,设有85道选择题,每题4个选择答案,只有一个正确.若需要通过考试,必须答对51道以上.试问某学生靠运气能通过四级考试的概率有多大?解:设X 为该学生答对的题数,由题可知X ~41,85(B ,则25.21)(=X E ,9375.15)(=i X D ,85,,2,1 =i .由棣莫弗—拉普拉斯中心极限定理,近似地有9375.1525.21-X ~)1,0(N ,得)8551(≤≤X P ))()(85)()()()(51(X D X E X D X E X X D X E P -≤-≤-=)9375.1525.21859375.1525.219375.1525.2151(-≤-≤-=X P 0)45.7()97.15(=Φ-Φ=.即学生靠运气能通过四级考试的概率为0.。

概率论与数理统计----第五章大数定律及中心极限定理

概率论与数理统计----第五章大数定律及中心极限定理

= 1 − Φ(3.54)
=0.0002
一箱味精净重大于20500的概率为 的概率为0.0002. 一箱味精净重大于 的概率为
推论:
特别,若X~B(n,p),则当n充分大时, 特别, ~B(n 则当n充分大时,
X~N(np,npq) X~N(np,npq) np
若随机变量X~B( X~B(n, ),则对任意实数x有 ),则对任意实数 即 若随机变量X~B( ,p),则对任意实数 有
不等式证明 P{-1<X<2n+1}≥(2n+1)/(n+1)(n+1)
3. 设P{|X-E(X)|<ε}不小于 不小于0.9,D(X)=0.009.则用 不小于 则用
切比绍夫不等式估计ε的 最小值是( 切比绍夫不等式估计 的 最小值是
0.3 ).
4.(894) 设随机变量 的数学期望为 设随机变量X的数学期望为 的数学期望为µ, 标准差为σ,则由切比绍夫不等式 标准差为 则由切比绍夫不等式 P{|X-µ|≥3σ}≤( ). 1/9 5. 设随机变量X的分布律为 设随机变量 的分布律为 P{X=0.3}=0.2, P{X=0.6}=0.8, 用切比绍夫不等式估计 |X-E(X)|<0.2的概率 的概率. 的概率
1 n lim P ∑ Xi − µ < ε = 1 n→∞ n i =1
定理(贝努里利大数定律) 设每次实验中事件A发生的概率 定理(贝努里利大数定律) 设每次实验中事件A 为p,n次重复独立实验中事件A发生的次数为nA,则对任 次重复独立实验中事件A发生的次数为n 意的ε>0 意的ε>0 ,事件的频率 nA ,有 ε>

+∞
−∞

概率论与数理统计答案第五章(东华大学出版)

概率论与数理统计答案第五章(东华大学出版)

第五章复习题Page1941、 设i (i=1,2,,50)ξ 是相互独立的随机变量,且它们都服从参数为0.03λ=的泊松分布。

记1250ξξξξ=+++ ,试用中心极限定理计算P(3)ξ≥。

解:由中心极限定理可认为~ξ((),())(1.5,1.5)N E D N ξξ=,则(3)P ξ≥1.31.5)1)1(1.225)10.889751.51.5P ===-Φ=-=。

2、 一部件包括10部分。

每部分的长度是一个随机变量,它们相互独立且具有同一分布。

其数学期望为2mm ,均方差为0.05mm ,规定总长度为20±0.1mm 时产品合格,试求产品合格的概率。

解:由中心极限定理可认为总长度~ξ((),())(20,0.025)N E D N ξξ=,则(19.920.P ξ≤≤()2(0.6325)10.4735025P ξ=≤=Φ-=。

3、 一个加法器同时收到20个噪声电压(1,2,,20)k V k = 。

设它们是相互独立的随机变量,且都在区间[0,10]上服从均匀分布。

V 为加法器上受到的总噪声电压,求(105)P V >解:由中心极限定理可知)3500,100()121020,520())(),((~2N N V D V E N V =⨯⨯=,则(105))1(0.39)10.65170.3483P V P >=>=-Φ=-= 4、 计算机在进行加法时,对每个加数取整(取为最接近它的整数),设所有的取整误差是相互独立的,且它们都在(0.5,0.5]-上服从均匀分布。

(1) 若将1500个数相加,问误差总和的绝对值超过15的概率是多少?(2) 问几个数加在一起可使得误差总和的绝对值小于10的概率为0.90?解:(1)由中心极限定理:误差总和)125,0()1211500,01500(~N N =⨯⨯ξ,因此(||15)2(12(10.9099)0.1802P P ξ>=>=-Φ=⋅-=。

概率论与数理统计第5章

概率论与数理统计第5章

p( x1 , x2 ,
, xn ) = p(x1 )p(x2 )
p(xn ) = ∏ p( xi )
i =1
n
14 September 2009
1.
若连续型总体 X 的密度函数为 p(x ), , X n )是取自总体 X 的样本, iid
(X 1 , X 2 ,
X1, X2, … , Xn
n 则 (X 1 , X 2 , , X n )的密度函数为 p( x1 , x2 , , xn ) = p(x1 )p(x2 ) p(xn ) = ∏ p( xi ) i =1
数理统计
学习基础:1、高等数学 2、概率论
前面的学习已知:随机变量及其所伴随的概率分布全面描述了 随机现象的统计规律性,所以要研究一个随机现象首先要 知道它的概率分布. 概率论中:许多问题的概率分布通常是已知的或假设为已知的然后 在此基础上进行一切计算与推理. 实际中:一个随机现象的概率分布可能完全不知道 或知道分布类型却不知道其中的参数.例如正态分布
则 (X 1 , X 2 ,
, X n )的密度函数为
p( x1 , x2 ,
, xn ) = p(x1 )p(x2 )
n
p(xn )
⎧n −λ ∑ xi ⎪ Π λe −λxi = λ ne i=1 = ⎨ i =1 ⎪ 0 ⎩
xi > 0, i = 1, 2, 其它
,n
例如 设某批产品共有N 个,其中的次品 数为M, 其次品率为 p = M / N 若 p 是未知的,则可用抽样方法来估计它. 从这批产品中任取一个产品,用随机变量 X来描述它是否是次品: 所取的产品是次品 ⎧ 1, X =⎨ ⎩ 0, 所取的产品不是次品 X 服从参数为p 的0-1分布,可用如下表示 方法: P(x) = p (1− p) ,

东华大学《概率论与数理统计》课件 第五章 大数定律与中心极限定理

东华大学《概率论与数理统计》课件 第五章 大数定律与中心极限定理

7 8.75E-06 6.2863E-05 7.19381E-05 7.28862E-05 7.2992E-05
8 3.65E-07 7.3817E-06 8.93826E-06 9.1053E-06 9.124E-06
4 0.01116 0.01494171 0.015289955 0.015324478 0.01532831
5 0.001488 0.00289779 0.003048808 0.003063976 0.00306566
6 0.000138 0.00046345 0.0005061 0.000510458 0.00051094
ln n) + 1 ( 2
ln n) = 0
Dn
=
E
2 n
=
1 2
(ln n) +
1 2
(ln n)
=
ln n

但 1
n2
n
D( i ) =
i =1
1 n2
n i =1
Di
=
1 n2
n
ln i
i =1
1 n2
n
ln n =
i =1
ln n n
→0
满足马尔可夫条件,{
}服从大数定律
n
注意: 辛钦大数定律只要求一阶矩存在,但是 随机变量序列是独立同分布的. 若所讨论的 随机变量序列是不服从同分布的要求或不独 立可应用切比雪夫大数定律 或者马尔可夫大 数定律 .
(2)设 n 为 n 次独立重复试验中 A 出现的次数, p 是事件 A 在每次试验中出现的概率, 0 ,

lim
n→
P{
n
n

p

概率论数理统计基础知识第五章

概率论数理统计基础知识第五章

C
]
(A)Y ~ 2 (n). (B)Y ~ 2 (n 1). (C)Y ~ F (n,1). (D)Y ~ F (1, n).
【例】设 随机变量X和Y都服从标准正态分布,则[ C ]
(A)X+Y服从正态分布.
2 2 2
(B)X2 +Y2服从 2分布. Y
2
2 X (C)X 和Y 都服从 分布. (D)
(X ) ~ t ( n 1) S n
客、考点 10,正态总体的抽样分布
33/33
34/33
35/33
【例】设总体 X ~ N (0,1),X 1 , X 2 , X1 X 2
2 2 X3 X4
, X n 是简单随机
2 X i. i 4 n
样本 , 试问下列统计量服从什么分布? (1 ) ; (2 ) n 1X1
记:F分布是两个卡方分布的商
2. F 分布的上侧分位数
设 F ~ F (k1 , k2 ) ,对于给定的 a (0,1) ,称满足条件
P{F Fa (k1 , k2 )}

Fa ( k1 ,k2 )
f F ( x)dx a
的数 Fa (k1 , k2 ) 为F 分布的上侧a 分位数。
服从F分布.
§5.5 正态总体统计量的分布
一、单个正态总体情形 总体
X ~ N ( , 2 ) ,样本 X1 , X 2 , , Xn ,
1 n 样本均值 X X i n i 1
n 1 2 样本方差 S 2 ( X X ) i n 1 i 1
1. 定理1 若设总体X~N(μ,σ2), 则统计量
有一约束条件
(X
i 1

概率论与数理统计 第三版 第五章 大数定律和中心极限定理

概率论与数理统计 第三版 第五章 大数定律和中心极限定理
上页 下页 返回
依概率收敛的序列还有以下性质: 设 X n p a, Yn pb, 且函数 g(x,y) 在点 (a,b)连续,
具有数学期望 E(X ) 和方差 D(X ) , 0 ,有
P{
X
E
(
X
)

}≤
D(
X
2
)
,

P{ X E(X ) }≥1 D(X ) .
2
上页 下页 返回
证 以连续型随机变量X为例.
P{ X E( X ) ≥} f (x)dx x E ( X ) ≥
≤ x E ( X ) ≥
x E(X ) 2
E(
X
k
)
,D(
X
k
)
2
(k
1,2,
上页
,
n).
下页
返回
则对任意的ε>0, 有
1
lim P{ n n
n
Xk
k 1
}1
证 由于
lim P X 1.
n
E
1 n
n k 1
X
k
1 n
n k 1
E(X
k
)
1 n
n
,
D
1 n
n k 1
Xk
1 n2
n
D
k 1
XK
1 n2
n
2
2
n
,
上页 下页 返回
由切比雪夫不等式知
P
1 n
n
Xk
k 1
≥1
2
n
2
.
令n , 并注意到概率不能大于1, 即得
1
lim
n
P

陈国华等主编概率论与数理统计第五章习题解答

陈国华等主编概率论与数理统计第五章习题解答

x>0 x≤0
(α > 0, β > 0)
a a 1 1 1 dx = ∫ cos(tx) ⋅ dx + ∫ sin(tx) ⋅ dx −a −a −a 2a 2a 2a 1 1 1 = ⋅ sin(tx) |a sin(at ) x =− a = at 2a t t −1 (2)参数为 λ 的指数分布的特征函数为, φ X (t ) = (1 − i ) ,参数为 λ 的指数分布可看做
1
π (1 + x 2 )
(−∞ < x < +∞) ;
⎧A ⎪ (D) X i 的概率函数为 : g ( x) = ⎨ x 3 ⎪0 ⎩
x ≥1 x <1
(i = 1,2,3, ) .
答案:CABAD 三.解答题
1.一颗骰子连续掷 4 次,点数总和记为 X ,估计 p (10 < X < 18) .
3.已知随机变量 X 的数学期望为 10,方差 DX 存在且 P (−20 < X < 40) ≤ 0.1 ,则
DX ≥ . 4.设 X 1 , X 2 , , X n, 为独立同分布的随机变量序列,且 X i (i = 1,2, ) 服从参数为 2 的
指数分布,则 n → ∞ 当时, Yn =
1 n 2 ∑ X i 依概率收敛于 n i =1
1 1 ln n + ln n = 0 2 2
n
DX n = EX n = ln n
n 1 1 D ( Xi) = 2 ∑ 2 n n i =1
2
∑ ln i → 0(n → ∞)
i =1
根据马尔可夫大数定律, {X n } 服从大数定律。
3 、 已 知 随 机 变 量 X 和 Y 的 数 学 期 望 、 方 差 以 及 相 关 系 数 分 别 为 E ( X ) = E (Y ) = 2 ,

概率论与数理统计 第五章

概率论与数理统计 第五章

贝努里定理. 它的叙述如下:设是n次重复独立 对于任意给定的ε>0,有
lim P{| nA p | } 1
n
n
lim P{| nA p | } 1
n
n
其中nA/n是频率,p是概率,即次数多
时事件发生的频率收敛于概率.表示频率的稳定性.
定理3
lim P{|
n
1 n
n i 1
Xi
| } 1
数理统计的方法属于归纳法,由大量的资料作依据,而不
是从根据某种事实进行假设,按一定的逻辑推理得到的.例
如统计学家通过大量观察资料得出吸烟和肺癌有关,吸烟
者得肺癌的人比不吸烟的多好几倍.因此得到这个结论.
数理统计的应用范围很广泛.在政府部门要求有关的资
料给政府制定政策提供参考.由局部推断整体,学生的假期
第五章 大 数 定 律 与 中 心 极 限 定 律
§ 5.1大 数 定 律
定理1(切比雪夫定理) 设X1,X2,...,Xn,...是相互独立的随机变
量序列若存在常数C,使得D(Xi)≤C. (i=1,2,...n),则对任意给
定的ε>0,有
lim P{|
n
1 n
n i 1
[Xi
E( X i )] |
7200 6800 2
200 1
D 2
1
2100 2002
0.95
可见虽有10000盏灯,只要电力供应7200盏灯即有相当大的保 证率切贝谢夫不等式对这类问题的计算有较大价值,但它的精度 不高.为此我们研究下面的内容.
2021/9/5
10
§ 5.2 中 心 极 限 定 理
在随机变量的一切可能性的分布律中,正态分布占有特殊的

《概率论与数理统计》课件第五章大数定律及中心极限定理

《概率论与数理统计》课件第五章大数定律及中心极限定理
有极其重要的地位?
4.大样本统计推断的理论基础
是什么?
大数定律中心极限定理
随机现象中平均结果的稳定性
大数定律的客观背景
大量抛掷硬币正面出现频率
字母使用频率
生产过程中的废品率
§5.1 大数定律
背景:1. 频率稳定性2. 大量测量结果算术平均值的稳定性
回顾
随机现象的主要研究方法
概率分布
01
证:_x001A__x001B__x001B_,_x001A__x001B__x001B_,⋯, _x001A__x001B__x001B_, ⋯相互独立同分布,则_x001A__x001B__x001B__x001B_,_x001A__x001B__x001B__x001B_, ⋯,_x001A__x001B__x001B__x001B_, ⋯也相互独立同分布,由辛钦大数定律得证.
第五章 大数定律及中心极限定理
§5.1 大数定律§5.2 中心极限定理
要点:用切比雪夫不等式估算概率独立同分布,用中心极限定理计算对于二项分布,当n很大时,计算
本章要解决的问题
1.为何能以某事件发生的频率
作为该事件的概率的估计?
2.为何能以样本均值作为总体
期望的估计?
3.为何正态分布在概率论中占
解:(1)设X表示一年内死亡的人数,则~(, ),其中=,=.%. 设Y表示保险公司一年的利润,=×−.需要求的是_x001A_<_x001B_.
由中心极限定理
_x001A_<_x001B_=_x001A_×−<_x001B_ =_x001A_>_x001B_=−_x001A_≤_x001B_
且,
由中心极限定理
解:设为第i个螺丝钉的重量, 相互独立同分布. 于是,一盒螺丝钉的重量为

概率论与数理统计第五章知识点

概率论与数理统计第五章知识点

概率论与数理统计第五章知识点第五章的概率论与数理统计的知识点主要涉及到概率函数、统计推断、分布函数和多元正态分布等内容,这其中包括了多项式概率分布、超几何分布、二项分布、线性回归、假设检验、多重切线回归、卡方检验、小抽样检验、检验均值和协方差等内容。

首先,多项式概率分布是一种特殊的概率分布,它建立了在有限次试验中某个事件出现次数的概率,它由定义性的概率空间和一组完备的事件集合组成,并可以使用不同的统计技术来计算它们。

其次,超几何分布是一种分布,用于计算取样观测中某种特征发生次数的概率,它与多项式分布有着很大的不同,它建立了一个独立的取样模型,它是一种独立取样模型,它利用概率论中的概率空间来分析一个独立取样实验中观测到一个特征发生次数的概率。

再次,二项分布也是一种概率分布,它用来计算一系列试验中出现某种特征的次数的概率。

它是一种特殊的多项式分布,可以使用概率论的工具来应用二项式分布,以确定两个不同事件之间的概率。

此外,线性回归也是第五章概率论与数理统计中一个重要的概念,它是一种统计方法,用来预测一个变量的变化可能会导致另一个变量的变化。

线性回归的基本原理是拟合两个变量的关系,使回归线能够最佳地拟合所有数据,以找到其中的趋势。

另外,假设检验是一种重要的统计技术,在假设检验中,需要使用概率空间,以便计算假设检验中备择假设的概率,并判断假设是否成立。

另外,多重切线回归也是一种重要的统计方法,它是以多元关系作为因变量和因变量之间的关系来拟合数据,以确定多元回归线的最佳拟合方式,让其效果最好。

此外,卡方检验、小抽样检验和检验均值和协方差等也是第五章概率论与数理统计的重要内容。

其中,卡方检验是一种特殊的假设检验,用来判断一组数据的差异是否大于预期,以确定数据的分布情况。

而小抽样检验是一种统计方法,用于给出总体参数的精确估计,以帮助确定相关的总体统计量,用来估计总体参数。

最后,检验均值和协方差也是一种重要的统计方法,它可以帮助分析两个变量之间的关系,以确定两个变量之间的相关程度。

概率论与数理统计第5章

概率论与数理统计第5章

2、定理以数学形式证明了随机变量X
1
,
X
的算术平均
n
X

1 n
n i 1
X i接近数学期望E( X k ) (k
1,2, n),这种接近
说明其具有的稳定性
这种稳定性的含义说明算术平均值是依概率收敛的意义下 逼近某一常数.
1.(2010-1)设 n 为n次独立重复试验中事件A发生的次数,p是事件
10
3.(2009 1)
设X i

0, 1,
事件A不发生 事件A发生 (i 1, 2,
,100),且P(A) 0.8,
100
X1, X 2 , , X100相互独立,令Y Xi则由中心极限定理知Y 近似服从于 i 1
正态分布,其方差为________ .
4.(2008 -10)设总体X的分布律为P{X 1} p, P{X 0} 1- p, 其中0 p 1.
P{|
m n

p
|
}1

ln im
P{|
m n

p
|

}
0
注: 贝努里大数定律表明,当重复试验次数n充分 大时,事件A发生的频率m/n与事件A的概率p有较 大偏差的概率很小.
事件发生的频率可以代替事件的概率.
5.2.2 独立同分布随机变量的切比雪夫大数定律
定理5-3
设随机变量X
1
,
X

2
,X
n
,
是独立同分布随机变量序列,
E( Xi ) , D( Xi ) 2 (i 1, 2, )均存在,则对任意 0有
lim{|
n

概率论与数理统计-第五章

概率论与数理统计-第五章

【数理统计简史】
1. 近代统计学时期
18 世纪末到 19 世纪,是近代统计学时期.这一 时期的重大成就是大数定律和概率论被引入统计 学.之后最小二乘法、误差理论和正态分布理论 等相继成为统计学的重要内容.这一时期有两大 学派:数理统计学派和社会统计学派.
【数理统计简史】 数理统计学派始于19世纪中叶,代表人物是比 利时的凯特莱( A.Quetelet , 1796-1874 ),著有 《概率论书简》《社会物理学》等,他主张用研 究自然科学的方法研究社会现象,正式把概率论 引入统计学,并最先用大数定律证明了社会生活 中随机现象的规律性,提出了误差理论.凯特莱 的贡献,使统计学的发展进入个了一个新的阶 段.
i =1 36
1 2 2 3 2 2 2 2 D( X ) = E ( X ) − E ( X ) = ( 0 + 1 + 2 + 3 ) − 4 2 5 = 4
2
二、样本与抽样 由于X1,X2,...,X36均与总体X同分布,且相互独 立,所以,Y的均值和方差分别为
E (Y ) = E ( ∑ X i ) = 36 E ( X ) = 54,
【数理统计简史】 18世纪到 19世纪初期,高斯从描述天文观测的 误差而引进正态分布,并使用最小二乘法作为估 计方法,是近代数理统计学发展初期的重大事件, 对社会发展有很大的影响.
【数理统计简史】 用正态分布描述观测数据的应用是如此普遍,以 至 在 19 世 纪 相 当 长 的 时 期 内 , 包 括 高 尔 顿 ( Galton )在内的一些学者,认为这个分布可用 于描述几乎是一切常见的数据.直到现在,有关 正态分布的统计方法,仍占据着常用统计方法中 很重要的一部分.最小二乘法方面的工作,在 20 世纪初以来,经过一些学者的发展,如今成了数 理统计学中的主要方法.

概率论与数理统计 五大数定理

概率论与数理统计 五大数定理

,
i
1,2, , n, .
设Yn
Xi,
i 1
n
n
则: E Yn
i , D Yn
2 i
sn2 .
i 1
i 1
Zn
Yn
Yn
EYn DYn
1 sn
n i1
Xi
n i 1
i
1 n
sn i1
Xi i ,
则有:E(Zn ) 0, D( Zn ) 1.
11
林德伯格定理:
显然, 当n 时,P(Bn ) 1.
[注] 小概率事件尽管在个别试验中不可能发生,但在大量试验
中几乎必然发生。 10
第二节 中心极限定理
概率论中有关论证随机变量的和的极限分布是正态分布的定
理叫做中心极限定理。

X1
,
X
, , X , 是独立随机变量,并各有
2
n
n
EX i
i ,
DX i
2 i
的频率作为事件 A 的概率近似值时, 误差小于0.01的概率.

设事件A 在每次试验中发生的概率为 p,
在这10000次试验
中发生了X 次, 因此,所求事件的概率为
则 EX np 10000 p, DX 10000 p1 p,
P
X 10000
p
0.01 P
X 10000 p
100
P X EX 100 1 DX 1002
DX n
1 n2
nK
K n
由此,
当 n 充分大时,
随机变量
也就是说,
X 的值较紧密地聚集在它的数学期望 n
分散程度是很小的,
Xn

概率论与数理统计第五章

概率论与数理统计第五章

第 ×× 次课 2学时本次课教学重点:常用的统计量 本次课教学难点:总体,简单随机样本,统计量的概念。

本次课教学内容:第五章 数理统计的基础知识 第一节 数理统计的基本概念 教学组织: 一、引言在前五章中我们学习了概率论的基本内容,因为随机变量及其所伴随的概率分布全面描述了随机现象的统计规律性,所以在概率论的许多问题中,概率分布通常都是已知的,或者假设是已知的,而一切计算与推理都是在此基础上得出来的。

然而,实际情况往往并非如此。

一个随机现象所服从的分布概型可能完全不知道,或者只知道其概型而不知其分布函数中所含的参数。

例如,某工厂生产的灯泡的寿命服从什么分布是不知道的。

再如,某厂生产的一件产品是合格品还是不合格品,我们知道它服从两点分布,但其参数p 却不知道。

那么怎样才能知道一个随机现象的分布或其参数呢?这就是数理统计所要解决的一个首要问题。

为了获得灯泡的寿命分布,我们从所有的灯泡中抽出一部分进行观察与测试以取得相关信息,从而做出推断。

由于观察和测试是随机现象,依据有限个观察与测试对整体所做出的推断不可能绝对准确,这个不确定性我们用概率来表达。

数理统计学的基本问题就是依据观测或试验所取得的有限信息对整体做出推断,每个推断必须伴有一定的概率来表明其可靠程度。

这种伴有一定概率的推断称为统计推断。

二、总体与随机样本 1、总体在数理统计中,我们往往研究有关对象的某一数量指标(如灯泡的寿命这一数量指标)。

为此,考虑与这一数量指标相联系的随机试验,对这一数量指标进行试验或观察。

我们把研究对象的全体所构成的一个集合称为总体,总体中的每个对象称为个体。

总体中所包含的个体的个数称为总体的容量。

容量有限的总体称为有限总体,容量无限的总体称为无限总体。

例如,考察某批灯泡的质量,如这一批灯泡共有5000只,每个灯泡的寿命是一个可能的观察值,是一个个体。

所有5000只灯泡的寿命是一个有限总体。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x!
n
P( X1 x1, X 2 x2 , , X n xn ) P( X i xi ) i 1
n xi e i1 xi!
n
xi
i1
en
x1!x2! xn!
三、分组数据统计表与频率直方图
1、分组数据表 (1)组距:若样本值过多时,可将其分为若干组。
分组的区间长度一般取成相等,称区间的长度为组距。
xn )
P( X i xi ) p(xi )
i 1
i 1
3当总体X是连续型时, X~f(x)(连续总体密度),
则样本的联合密度(连续样本密度)为
n
f (x1, x2 , , xn ) f (xi )
i 1
总体、样本、样本观察值的关系
总体
理论分布
样本
样本观察值
统计是从手中已有的资料——样本观察值,去推断总 体的情况——总体分布。样本是联系两者的桥梁。总 体分布决定了样本取值的概率规律,也就是样本取到 样本观察值的规律,因而可以用样本观察值去推断总 体。
)2
2
1
e n
1
2 2
n
( xi )2
i1
2
例5.2 设某电子产品的寿命X服从指数分布,密度函数
ex x 0
f (x)
0
x0
(X1,X2,…,Xn)为X的一个样本,求其密度函数。
解 因为(X1,X2,…,Xn)为X的一个样本,X i ~ f (xi )
f (x1, x2, , xn )
例5.1 设 X ~ N (, 2 ) (X1,X2,…,Xn)为X的一个样本,
求(X1,X2,…,Xn)的密度。
解 (X1,X2,…,Xn)为X的一个样本,故
X i ~ N (, 2 ) i 1,2, , n
n
f (x1, x2 , , xn ) f (xi )
i 1
n
i 1
1
e
(
xi 2 2

X i ~ N(, 2 )
X i ~ N (0,1) i=1,2,3
X1 ~ N (0,1)
X2
2
X3
2
~
2 (2)
X1
X2
2
X3
2
2
~ t(2)
2(X1 )
~ t(2)
(X2 )2 (X3 )2
t(n) 的概率密度为
f (t)
( n 1) 2
X
2 3
X
2 4
X
2 5
解:X 1
X 2服从N (0,2) Y1
X1
X2 2
服从N (0,1)
X 3, X 4, X 5服从N (0,1) Y2
X
2 3
X
2 4
X 52服从 2 (3)
又因为Y1 , Y2 相互独立
X1 X2
2
服从t(3)
(X
2 3
X
2 4
X 52)/ 3
c 3/2
例5.8.设随机变量X服从N(2,1),随机变量Y1 Y, 2 ,Y3, Y4均
n
f
(xi )
n i 1
exi
i 1
0
xi 0(i 1,2, , n) 其他
n
n
xi e i1
0
xi 0(i 1,2, , n) 其他
例5.3 某商场每天客流量X服从参数为λ的泊松分布, 求其样本(X1,X2,…,Xn)的联合分布律。
解 P( X x) x e x 0,1,2,
(一) 2—分布
1、定义:
设X1,X2,…,Xn为取自总体N(0,1)的样本,则
n
2
X
2 i
~
2 (n)
称为自由度为n的2分布。
i 1
n个相互独立的服从标准正态分)曲线
f
( y)
1 2n/ 2 (n/ 2)
n 1 y
y2 e 2
∵P(a<2(n)b)= P(2(n)b) - P(2(n)a )
={1- P(2(n)>b) }-{1- P(2(n)>a )}
a
2 1
p
(n),
b
2 p
(n)
2
2
例5.6 总体X~N(μ,σ2),(X1,X2,…,X16)为一个样本,求
2
P
2
1 16
16
(Xi
i 1
)2
2
解 X i ~ N(, 2 )
X i ~ N (0,1)
i 1,2, ,16
16
Xi
2
~
2 (16)
i1
2
P
2
1 16
16 i 1
(Xi
)2
2
P
8
2 (16)
16
P 2 (16) 16 P 2 (16) 8
{1 P( 2 (16) 16)}{1 P( 2 (16) 8)}
函数Fn (x) k / n
0
x x(1) x(k) x x (k1)
1 x x(n)
与事件{X x}在n次独立重复的试验中的发生频率是相同的。
称F(n x)为经验分布函数。
五、统计量
样本是我们进行分析和推断的起点,但实际上我们 并不直接用样本进行推断,而需对样本进行“加工” 和“提炼”,将分散于样本中的信息集中起来,为此 引入统计量的概念。
一、总体(母体) 在数理统计中,把所研究的对象的全体称为总体。
通常指研究对象的某项数量指标,一般记为X。 把总体的每一个基本单位称为个体。
如全体在校生的身高X,某批灯泡的寿命Y。 对不同的个体,X的取值是不同的。X是一个随机变量或 随机向量。X或Y的分布也就完全描述了我们所关心的指 标,即总体的分布。为方便起见,我们将X的可能取值 的全体组成的集合称为总体,或直接称X为总体。X的分 布也就是总体的分布。
,
y
0
0,
y0
例5.4 X ~ N (, 2 ) (X1,X2,X3)为X的一个样本

X1
2
X 2
2
X 3
2
的分布。
解 因为(X1,X2,X3)为X的一个样本 则 X i ~ N (0,1) i=1,2,3
X1
2
X2
2
X3
2
~
2 (3)
例5.5 X ~ N(0,1) (X1,X2,…X6)为X的一个样本
n
F (x1)F (x2 ) F (xn ) F (xi ) i 1
2当总体X是离散型时,其分布律(离散总体密度)为
P( X xk ) pk k 1,2, 样本的联合分布律(离散样本密度)为
P( X 1
x1, X 2
x2 ,
Xn
xn )
P( n
X
1
x1 )P( X 2
n
x2 )
P(X n
X
1 n
n i 1
Xi
n
X
2 i
i 1
X
1
2
X
2 i
i
均为统计量
若μ已知,σ2未知, (X1,X2,…,X5)为X的一个样本
maxX1, X2, , X5, X 为统计量
1
2
X
2不是统计量
i
几个常用的统计量
样本均值
X
1 n
n i 1
Xi
样本方差
S 2
1 n 1
n i 1
(Xi
X )2
3
3
( X1 X2 X3 )2 ( X4 X5 X6 )2 ~ 2 (n)
3
3
所以,取常数C=1/3使得CY服从2分布
性质1. 若X~2(n),则E(X)=n,D(X)=2n
证明: X
n
X
2 i
,
Xi
~
N (0,1),
E( X i )
0, D( X i )
1
i1 n
n
E(X) E(
第五章 数理统计的基础知识
▪ 总体和样本 ▪ 几个常用的分布和抽样分布
概率论与数理统计的关系
▪ 概率论——是根据大量同类随机现象的统计规律,对 随机现象出现某一结果的可能性作出一种客观的科学 判断,对这种出现的可能性大小做出数量上的描述;比 较这些可能性的大小、研究它们之间的联系,从而形 成一整套数学理论和方法。
Y (X1 X2 X3 )2 (X4 X5 X6 )2
求常数C使得CY服从2分布。
解 因为(X1,X2…X6)为X的一个样本, Xi~N(0,1),i=1,2…6
则(X1 X2 X3) ~ N(0,3) (X4 X5 X6 ) ~ N(0,3)
X1 X2 X3 ~ N(0,1) X4 X5 X6 ~ N(0,1)
(1
t
2
n1
)2
,
n ( n) n
2
t
2、基本性质:
(1) f(t)关于t=0(纵轴)对称;
(2) f(t)的极限为N(0,1)的密度函数,即
lim f (t) (t)
1
t2
e 2 , x
n
2
3、t分布表及有关计算 T~t(n) P{T>λ}= α
t (n)
α
注: t1 (n) t (n)
(X1,X2,…,Xn)
g(X1,X2,…,Xn)
其中g(x1,x2,…,xn)是(x1,x2,…,xn)的连续函数。
如果g(X1,X2,…,Xn)中不含有未知参数,称g(X1,X2,…,Xn) 为统计量。
(不含未知参数的样本的函数)
如 X ~ N (, 2 ) , 2 已知,
相关文档
最新文档