第五章 概率及其分布

合集下载

(概率论与数理统计 茆诗松) 第5章 统计量及其分布

(概率论与数理统计 茆诗松) 第5章 统计量及其分布
例5.3.6 设总体X 的分布为仅取0,1,2的 离散
均匀分布,分布列为
x0 1 2
p 1/3 1/3 1/3
现从中抽取容量为3的样本,其一切可能取值有 33=27种, (表5.3.6)
x0 1 2
p 1/3 1/3 1/3
P(x(1)=0) = ?
ቤተ መጻሕፍቲ ባይዱ
可给出的 x(1) , x(2), x(3) 分布列如下 :
n
(x x ) 0. i i1
定理5.3.2 数据观测值与均值的偏差平方和 最小,即在形如 (xic)2 的函数中,
(xi x)2最小,其中c为任意给定常数。
样本均值的抽样分布:
定理5.3.3 设x1, x2, …, xn 是来自某个总体的样本,
x 为样本均值。
(1) 若总体分布为N(, 2),则
是将样本观测值由小到大排列后得到的第 i 个 观测值。
其中, x(1)=minx1, x2,…, xn称为该样本的最小次序统计量, 称 x(n)=maxx1,x2,…,xn为该样本的最大次序统计量。
在一个样本中,x1, x2,…,xn 是独立同分布的,而 次序统计量 x(1), x(2),…, x(n) 则既不独立,分布也 不相同,看下例。

p R ( r ) 0 1 r n ( n 1 ) [ ( y r ) y ] n 2 d y n ( n 1 ) r n 2 ( 1 r )
这正是参数为(n1, 2)的贝塔分布。
5.3.6 样本分位数与样本中位数
样本中位数也是一个很常见的统计量,它也是 次序统计量的函数,通常如下定义:
在n
不大时,常用
s2
1 n n1i1
(xi
x)2

概率及其分布与二项分布

概率及其分布与二项分布

概率的加法定理
? 若事件A发生,则事件B就一定不发生, 这样的两个事件为互不相容事件。
? 两互不相容事件 和的概率,等于这两个
事件概率之和,即
P ?P ?P
( A? B )
( A)
(B)
(6.3)
A
B
P( A1 ? A2 ?? An ) ? P?A1 ? ? P?A2 ? ? ? ? P?An ? (6.4)
例3:从男生占2/5的学校中随机抽取6 个学生,问正好抽到4个男生的概率是多 少?最多抽到2个男生的概率是多少?
解:将n=6,p=2/5 ,q=3/5,X=4代入 (6.7)式,则恰好抽到 4个男生的概率为
P( 4 )
?
C64
?p4 ?q2
?
6!
?
??
2
4
? ?
?
??
3
2
? ?
4!? 2! ? 5 ? ? 5 ?
计算
? 抽到第一题或第二题的概率应为抽到第一题 的概率和抽到第二题的概率之和,即
P?A? B? ?
P?A ? ?
P?B? ?
1? 5
1 5
?
2 5
? 四个学生都抽到第一题即四个学生同时抽到第
一题,其概率应为抽到第一题的概率的乘积,即
P?A1 ?A2 ?A3 ?A4 ??
1? 5
1? 5
1? 5
1 5
一、概率的定义
? 后验概率(或统计概率)
? 随机事件的频率
m W( A) ? n
? 当n无限增大时,随机事件 A的频率会稳定在
一个常数 P,这个常数就是随机事件 A的概率。
P?A? ?
Lim
n? ?

附录1和附录2

附录1和附录2

n
i1
Xi
m Yj
j1
§附录2 矩阵运算的基本知识
A2.1 有关的定义
(1)矩阵 一个有m行n列的矩阵:
a11
A
a21
a12
a22
a1n a2n
am1 am2 amn
就称作m×n阶矩阵。矩阵A常常也简记为A=(aij)m×n。 (2)向量和标量
一个m×1阶矩阵称作一个列向量,一个1×n阶矩阵称作一
样本中已知常量的数目决定。
③F-分布:即分布形式由两个随机变量的方差和自由度所决定的概率
分布。F-分布的概率度用F表示:
F
n1s12 n2s22
(n1 1) (n2 1)
(X X )2 (n1 1) (Y Y )2 (nE( X ) X i Pi i 1
E(K ) K (K为常数)
f (x) 的具体形式对于不同的分布是不同的。在经
济计量学中,最常用的概率分布有三个:
①正态分布:分布形式取决于随机变量的均
值和标准误差,其概 率2密度函数为:
f (x)
1
e 2
(
x
2
)
2
当 =0 =1 时,其概率分布称作标准正态分布,
这时概率密度函数为:
f (x)
1
x2
e2
2
正态分布的分布形式如图1-4所示,主要特点是
0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451

概率统计各章节总结

概率统计各章节总结

1
(
1
)
x 1 1e
x
0
x0 x0
a0
1
ba
b
1
x
第六章
常用统计量及抽样分布
2 ~ 2(n)
f
(x)
2n
1 2 (n
2)
n 1
x2 e
x 2
0
x0 x0
t ~ t(n)
t (x)
[(n 1)
2]
(1
x2
)
n1 2
(n 2) n n
F ~ F (n , n ) 1
2
(x)

布 F(x)
函 数
P(X x)
二维( X,Y )
边缘 X
关系
F(x, y)
FX (x) P(X x)
FX
(
x)
lim
y
F
(
x,
y
)
P(X x,Y y) P(X x,Y )


意 义
x
(x, y) ( X ,Y )
(X,Y) x
第三章


F(x)
pk F(x, y)
pij

pq npq
(b a)2 12
2 2
第五章
大数定律及中心极限定理
定理1
定理2
(贝努利)
定理3
(辛钦)
定理1
(林德)
定理2
(德莫弗)
X1, X 2 ,, X n ,相互独立
E( X k ) D( X k ) 2
1
n
n k 1
Xk
P
X1 , X 2 ,, X n ,相互独立

概率论与数理统计课件第5章-PPT精品文档

概率论与数理统计课件第5章-PPT精品文档

PX Q 0 . 5 2
1
第三四分位数Q3: PX Q 0 . 7 5 3
例1
为对某小麦杂交组合F2代的株高X进行研究,抽
取容量为100的样本,测试的原始数据记录如下(单位: 厘米),试根据以上数据,画出它的频率直方图,求随
机变量X的分布状况。
87 99 86 87 84 85 96 90 103 88 91 94 94 91 88 109 83 89 111 98 102 92 82 80 91 84 88 91 110 99 86 94 83 80 91 85 73 98 89 102 99 81 80 87 95 70 97 104 88 102 69 94 95 92 92 90 94 75 91 95 102 76 104 98 83 94 90 96 80 80 90 92 105 92 92 90 94 97 86 91 95 94 88 96 80 94 92 91 77 83
样本方差( X X i n 1i 1


几个常用的统计量
设 (X ,X , 1 2 是总体 X 的一个样本, ,X n) 样本均方差或标准差
2 1 n S X i X n 1i 1


它们的观测值用相应的小写字母表示.反映总 体X取值的平均,或反映总体X取值的离散程度。
几个常用的统计量
设 (X ,X , 1 2 是总体 X 的一个样本, ,X n)
子样的K阶(原点)矩
1 n k Ak X i n i 1
子样的K阶中心矩
1 B k X i X n i1
n


k
数据的简单处理
为了研究随机现象,首要的工作是收集原始数据. 一般通过抽样调查或试验得到的数据往往是杂乱无章

概率论与数理统计(茆诗松)课后第五章习题参考答案

概率论与数理统计(茆诗松)课后第五章习题参考答案

第五章 统计量及其分布习题5.11. 某地电视台想了解某电视栏目(如:每日九点至九点半的体育节目)在该地区的收视率情况,于是委托一家市场咨询公司进行一次电话访查. (1)该项研究的总体是什么? (2)该项研究的样本是什么? 解:(1)总体是该地区的全体用户;(2)样本是被访查的电话用户.2. 某市要调查成年男子的吸烟率,特聘请50名统计专业本科生作街头随机调查,要求每位学生调查100名成年男子,问该项调查的总体和样本分别是什么,总体用什么分布描述为宜?解:总体是任意100名成年男子中的吸烟人数;样本是这50名学生中每一个人调查所得到的吸烟人数;总体用二项分布描述比较合适.3. 设某厂大量生产某种产品,其不合格品率p 未知,每m 件产品包装为一盒.为了检查产品的质量,任意抽取n 盒,查其中的不合格品数,试说明什么是总体,什么是样本,并指出样本的分布. 解:总体是全体盒装产品中每一盒的不合格品数;样本是被抽取的n 盒产品中每一盒的不合格品数;总体的分布为X ~ b (m , p ),x m x qp x m x X P −⎟⎟⎠⎞⎜⎜⎝⎛==}{,x = 0, 1, …, n , 样本的分布为nn x m x n x m x x m x n n q p x m q p x m q p x m x X x X x X P −−−⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⋅⎟⎟⎠⎞⎜⎜⎝⎛====L L 2211212211},,,{ ∑∑⋅⎟⎟⎠⎞⎜⎜⎝⎛===−=∏ni tni tx mn x ni i q px m 111.4. 为估计鱼塘里有多少鱼,一位统计学家设计了一个方案如下:从鱼塘中打捞出一网鱼,计有n 条,涂上不会被水冲刷掉的红漆后放回,一天后再从鱼塘里打捞一网,发现共有m 条鱼,而涂有红漆的鱼则有k 条,你能估计出鱼塘里大概有多少鱼吗?该问题的总体和样本又分别是什么呢? 解:设鱼塘里有N 条鱼,有涂有红漆的鱼所占比例为Nn , 而一天后打捞出的一网鱼中涂有红漆的鱼所占比例为m k,估计mk N n ≈,故估计出鱼塘里大概有kmnN ≈条鱼;总体是鱼塘里的所有鱼;样本是一天后再从鱼塘里打捞出的一网鱼. 5. 某厂生产的电容器的使用寿命服从指数分布,为了了解其平均寿命,从中抽出n 件产品测其使用寿命,试说明什么是总体,什么是样本,并指出样本的分布. 解:总体是该厂生产的全体电容器的寿命;样本是被抽取的n 件电容器的寿命;总体的分布为X ~ e (λ ),p (x ) = λ e λ x ,x > 0,样本的分布为11212(,,,)e e e enin i x x x x n n p x x x λλλλλλλλ=∑=⋅=L L ,x i > 0.6. 美国某高校根据毕业生返校情况纪录,宣布该校毕业生的年平均工资为5万美元,你对此有何评论? 解:返校的毕业生只是毕业生中一部分特殊群体,样本的抽取不具有随机性,不能反应全体毕业生的情况.习题5.21. 以下是某工厂通过抽样调查得到的10名工人一周内生产的产品数149 156 160 138 149 153 153 169 156 156 试由这批数据构造经验分布函数并作图. 解:经验分布函数0,138,0.1,138149,0.3,149153,()0.5,153156,0.8,156160,0.9,160169,1,169.n x x x F x x x x x <⎧⎪≤<⎪⎪≤<⎪=≤<⎨⎪≤<⎪≤<⎪⎪≥⎩ 作图略.2. 下表是经过整理后得到的分组样本组序 1 2 3 4 5分组区间 (38,48] (48,58] (58,68] (68,78] (78,88] 频数 3 4 8 3 2试写出此分布样本的经验分布函数.解:经验分布函数0,37.5,0.15,37.547.5,0.35,47.557.5,()0.75,57.567.5,0.9,67.577.5,1,77.5.n x x x F x x x x <⎧⎪≤<⎪⎪≤<⎪=⎨≤<⎪⎪≤<⎪≥⎪⎩3. 假若某地区30名2000年某专业毕业生实习期满后的月薪数据如下:909 1086 1120 999 1320 1091 1071 1081 1130 1336 967 1572 825 914 992 1232 950 775 1203 1025 1096 808 1224 1044 871 1164 971 950 866 738(1)构造该批数据的频率分布表(分6组); (2)画出直方图. 解:(1)最大观测值为1572,最小观测值为738,则组距为15727381406d −=≈, 区间端点可取为735,875,1015,1155,1295,1435,1575, 频率分布表为 组序 分组区间 组中值 频数 频率 累计频率 1 (735, 875] 805 6 0.2 0.2 2 (875, 1015] 945 8 0.2667 0.4667 3 (1015, 1155] 1085 9 0.3 0.7667 4 (1155, 1295] 1225 4 0.1333 0.95 (1295,0.96672 0.066671435]13651 0.03333150516 (1435,1575]合计30 1(2)作图略.4.某公司对其250名职工上班所需时间(单位:分钟)进行了调查,下面是其不完整的频率分布表:所需时间频率0~10 0.1010~20 0.2420~3030~40 0.1840~50 0.14 (1)试将频率分布表补充完整.(2)该公司上班所需时间在半小时以内有多少人?解:(1)频率分布表为组序分组区间组中值频数频率累计频率10] 5 25 0.1 0.11 (0,20] 15 60 0.24 0.342 (10,30] 25 85 0.34 0.683 (20,40] 35 45 0.18 0.864 (30,50] 45 35 0.14 15 (40,合计250 1(2)上班所需时间在半小时以内有25 + 60 + 85 = 170人.5.40种刊物的月发行量(单位:百册)如下:5954 5022 14667 6582 6870 1840 2662 45081208 3852 618 3008 1268 1978 7963 20483077 993 353 14263 1714 11127 6926 2047714 5923 6006 14267 1697 13876 4001 22801223 12579 13588 7315 4538 13304 1615 8612 (1)建立该批数据的频数分布表,取组距为1700(百册);(2)画出直方图.解:(1)最大观测值为353,最小观测值为14667,则组距为d = 1700,区间端点可取为0,1700,3400,5100,6800,8500,10200,11900,13600,15300,频率分布表为组序分组区间组中值频数频率累计频率1700] 850 9 0.225 0.2251 (0,25509 0.225 0.453400]2 (1700,42505 0.125 0.5755100]3 (3400,59504 0.1 0.6756800]4 (5100,76504 0.1 0.7758500]5 (6800,1 0.025 0.893506 (8500,10200]1 0.025 0.825110507 (10200,11900]3 0.075 0.9127508 (11900,13600]4 0.1 11445015300]9 (13600,合计30 1(2)作图略.6.对下列数据构造茎叶图472 425 447 377 341 369 412 399400 382 366 425 399 398 423 384418 392 372 418 374 385 439 408429 428 430 413 405 381 403 479381 443 441 433 399 379 386 387 解:茎叶图为34 135369, 6377, 2, 4, 9382, 4, 5, 1, 1, 6, 7399, 8, 2400, 5, 3412, 9, 8, 8, 3, 9425, 5, 3, 8, 9, 8439, 0, 3447, 3, 14546472, 97.根据调查,某集团公司的中层管理人员的年薪(单位:千元)数据如下:40.6 39.6 37.8 36.2 38.838.6 39.6 40.0 34.7 41.738.9 37.9 37.0 35.1 36.737.1 37.7 39.2 36.9 38.3试画出茎叶图.解:茎叶图为34.735. 136.2, 7, 937.0, 1, 738. 639.6, 6, 240.6, 8, 041.742.43.844.9, 545. 4习题5.31.在一本书上我们随机的检查了10页,发现每页上的错误数为:4 5 6 0 3 1 4 2 1 4试计算其样本均值、样本方差和样本标准差.解:样本均值3)41654(101=+++++=L x ; 样本方差7778.3])34()31()36()35()34[(91222222≈−+−++−+−+−=L s ;样本标准差9437.17778.3≈=s .2. 证明:对任意常数c , d ,有11()()()()()()n niiiii i x c y d x x y y n x c y d ==−−=−−+−−∑∑.证:∑∑==−+−−+−=−−ni i i n i i i d y y y c x x x d y c x 11)]())][(()[())((∑=−−+−−+−−+−−=ni i i i i d y c x d y x x y y c x y y x x 1)])(())(())(())([())(()()()()())((111d y c x n x x d y y y c x y y x x ni i ni i ni i i −−+−−+−−+−−=∑∑∑===))(())(())((00))((11d y c x n y y x x d y c x n y y x x ni i i ni i i −−+−−=−−+++−−=∑∑==.3. 设x 1 , …, x n 和y 1 , …, y n 是两组样本观测值,且有如下关系:y i = 3 x i − 4,i = 1, …, n ,试求样本均值x和y 间的关系以及样本方差2x s 和2y s 间的关系.解:4343431)43(111111−=−=⎟⎟⎠⎞⎜⎜⎝⎛−=−==∑∑∑∑====x x n n x n x n y n y ni i n i i n i i n i i ; 212121229(19)]43()43[(11)(11x n i i n i i n i i ys x x n x x n y y n s =−−=−−−−=−−=∑∑∑===. 4. 记∑==n i i n x n x 11,∑=−−=n i i n x x n s 122)(11,n = 1, 2, …,证明 )(1111n n n n x x n x x −++=++,21221)(111n n nn x x n s n n s −++−=++. 证:)(111111111111111111n n n n n n n i i n i i n x x n x x n x n n x n x n n n x n x −++=+++=++⋅+=+=+++=+=+∑∑; ⎥⎦⎤⎢⎣⎡−+−−=−=++=+=++∑∑21112112121))(1()(1)(1n n n i n i n i n i n x x n x x n x x n s ⎥⎦⎤⎢⎣⎡−+⋅+−−+−=++=∑2122112)()1(1)1()()(1n n n n n i n i x x n n x x x x n 2122112)(111)(1)(11)1(1n n n n n n i n i x x n s n n x x n n x x n n n −++−=⎥⎦⎤⎢⎣⎡−++−−−=++=∑.5. 从同一总体中抽取两个容量分别为n , m 的样本,样本均值分别为1x , 2x ,样本方差分别为21s , 22s ,将两组样本合并,其均值、方差分别为x , s 2,证明:12nx mx x n m+=+,)1)(()(1)1()1(22122212−++−+−+−+−=m n m n x x nm m n s m s n s . 证:m n x m x n x x m n x x m n x m j j n i i m j j n i i ++=⎟⎟⎠⎞⎜⎜⎝⎛++=⎟⎟⎠⎞⎜⎜⎝⎛++=∑∑∑∑====211211121111; ⎥⎦⎤⎢⎣⎡−+−−+=∑∑==m j jn i i x x x x m n s 1221212()(11 ⎥⎦⎤⎢⎣⎡−+−+−+−−+=∑∑==221222211211)()()()(11x x m x x x x n x x m n m j j n i i ⎥⎥⎦⎤⎢⎢⎣⎡⎟⎠⎞⎜⎝⎛++−+−+⎟⎠⎞⎜⎝⎛++−+−−+=221222221121)1()1(11m n x m x n x m s m m n x m x n x n s n m n 2212222122221)()()(111)1()1(m n x x mn x x nm m n m n s m s n +−+−⋅−++−+−+−=)1)(()(1)1()1(2212221−++−+−+−+−=m n m n x x nm m n s m s n . 6. 设有容量为n 的样本A ,它的样本均值为A x ,样本标准差为s A ,样本极差为R A ,样本中位数为m A .现对样本中每一个观测值施行如下变换:y = ax + b ,如此得到样本B ,试写出样本B 的均值、标准差、极差和中位数.解:b x a b x n a nb x a n b ax n y n y A ni i n i i n i i n i i B +=+⋅=+=+==∑∑∑∑====11111)(1)(11;A n i A i n i A i n iB i B s a x x n a b x a b ax n y y n s ||)(11||)(11)(11121212=−−⋅=−−+−=−−=∑∑∑===; R B = y (n ) − y (1) = a x (n ) + b − a x (1) − b = a [x (n ) − x (1)] = a R A ; 当n 为奇数时,b am b ax y m A n n B +=+==⎟⎠⎞⎜⎝⎛+⎟⎠⎞⎜⎝⎛+5.021215.0,当n 为偶数时,b am b x x ab ax b ax y y m A n n n n n n B +=++=+++=+=⎟⎠⎞⎜⎝⎛+⎟⎠⎞⎜⎝⎛⎟⎠⎞⎜⎝⎛+⎟⎠⎞⎜⎝⎛⎟⎠⎞⎜⎝⎛+⎟⎠⎞⎜⎝⎛5.01221221225.0][2][21][21,故m B 0.5 = a m A 0.5 + b .7. 证明:容量为2的样本x 1 , x 2的方差为2212)(21x x s −=. 证:221212221221222112)(214)(4)(])2()2[(121x x x x x x x x x x x x s −=−+−=+−++−−=. 8. 设x 1 , …, x n 是来自U (−1, 1) 的样本,试求)(X E 和Var(X .解:因X i ~ U (−1, 1),有0211)(=+−=i X E ,3112)11()(Var 2=+=i X ,故0)(1)1()(11===∑∑==ni i n i i X E n X n E X E ,n n nXnX n X ni in i i 31311)(Var 11Var )(Var 2121=⋅⋅==⎟⎟⎠⎞⎜⎜⎝⎛=∑∑==. 9. 设总体二阶矩存在,X 1 , …, X n 是样本,证明X X i −与)(j i X X j ≠−的相关系数为 − (n − 1) − 1.证:因X 1 , X 2 , …, X n 相互独立,有Cov (X l , X k ) = 0,(l ≠ k ), 则),(Cov ),(Cov ),(Cov ),(Cov ),(Cov X X X X X X X X X X X X j i j i j i +−−=−−)(Var ),1(Cov )1,(Cov 0X X X nX n X j j i i +−−= 22221111)(Var )(Var 1)(Var 1σσσσnn n n X X n X n j i −=+−−=+−−=,且)1,(Cov 21),(Cov 2)(Var )(Var )(Var 22i i i i i X nX n X X X X X X −+=−+=−σσ)(Var 1212222X X nn n n j −=−=−+=σσσσ,故11111)(Var )(Var ),(Cov ),(Corr 222−−=−⋅−−=−⋅−−−=−−n nn n n n X X X X X X X X X X X X j i j i j i σσσ. 10.设x 1 , x 2 ,…, x n 为一个样本,∑=−−=ni i x x n s 122)(11是样本方差,试证: 22)()1(1s x x n n ji j i =−−∑<. 证:因⎟⎟⎠⎞⎜⎜⎝⎛−−=−−=∑∑==21212211)(11x n x n x x n s n i i n i i , 则⎟⎟⎠⎞⎜⎜⎝⎛−+=−+=−=−∑∑∑∑∑∑∑∑∑∑∑==========<n i n j j i n i n j j n i n j i n i n j j i j i n i n j j i j i j i x x x x x x x x x x x x 1111211211221122221)2(21)(21)( 221212111212)1(2221221s n n x n x n x n x n x n x x x n x n n i i n i i n i n j j i n j j n i i −=⎟⎟⎠⎞⎜⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛⋅−=⎟⎟⎠⎞⎜⎜⎝⎛−+=∑∑∑∑∑∑======, 故22)()1(1s x x n n ji j i =−−∑<. 11.设总体4阶中心矩ν4 = E [X − E (X )]4存在,试对样本方差∑=−−=ni i X X n S 122(11,有 2442442442)1(3)1()2(2)1()()Var(−−+−−−−−=n n n n n S σνσνσν,其中σ 2为总体X 的方差.证:因⎥⎦⎤⎢⎣⎡−−−−=−−−−=∑∑==212122)()(11)]()[(11µµµµX n X n X X n S n i i n i i ,其中µ = E (X ), 则⎥⎦⎤⎢⎣⎡−−−−=∑=21222)()(Var )1(1)Var(µµX n X n S n i i⎭⎬⎫⎩⎨⎧−+⎟⎟⎠⎞⎜⎜⎝⎛−−−⎥⎦⎤⎢⎣⎡−−=∑∑==])(Var[)(,)(Cov 2)(Var )1(12212122µµµµX n X n X X n n i i n i i ⎭⎬⎫⎩⎨⎧−+−−−−−=∑∑==22122122)Var())(,)Cov((2)Var()1(1µµµµX n X X n X n n i i n i i , 因E (X i − µ)2 = σ 2,E (X i − µ)4 = ν4,则)(})({}])([)({)Var(441224122412σνσνµµµ−=−=−−−=−∑∑∑===n X E X E X ni ni i i ni i ,因E (X i − µ) = 0,221)Var()(σµnX X E ==−,且当i ≠ j 时,X i − µ 与X j − µ 相互独立, 则∑∑==−−−−−=−−ni i i ni i X E X E X X E X X 12222122})()(])()[({))(,)Cov((µµµµµµ∑∑==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⋅−⎥⎥⎦⎤⎢⎢⎣⎡⎟⎟⎠⎞⎜⎜⎝⎛−⋅−=ni nk k i n X n X E 1222121)(1)(σσµµ∑∑=≠⎭⎬⎫⎩⎨⎧−⎥⎦⎤⎢⎣⎡−⋅−+−=n i i k k i i n X E X E X E n1422421)()()(1σµµµ)(11])1([144142242σνσσσν−=⎭⎬⎫⎩⎨⎧−−⋅+=∑=n n n nni ,且224122421)(1])([)()Var(⎥⎦⎤⎢⎣⎡−⎥⎦⎤⎢⎣⎡−=−−−=−∑=σµµµµn X n E X E X E X n i i42221441)()(24)(1σµµµn X X X E n j i j i n i i −⎥⎦⎤⎢⎣⎡−−⎟⎟⎠⎞⎜⎜⎝⎛+−=∑∑<= 42221441)()(6)(1σµµµn X E X E X E n j i j i ni i −⎥⎦⎤⎢⎣⎡−−+−=∑∑<= 42443424444222442)3(11])1(3[11261σσνσσνσσσνn n n n n n n n n n n +−=−−+=−⎥⎦⎤⎢⎣⎡⋅⎟⎟⎠⎞⎜⎜⎝⎛⋅+=, 故⎭⎬⎫⎩⎨⎧⎥⎦⎤⎢⎣⎡+−+−⋅−−−=4244324444222)3(1)(12)()1(1)Var(σσνσνσνn n n n n n n S⎭⎬⎫⎩⎨⎧+−+−−−−=444444422)3(1)(2)()1(1σσνσνσνn n n 2442442444444442)1(3)1()2(2)1()()3(1)2(2)()1(1−−+−−−−−=⎭⎬⎫⎩⎨⎧−+−−−−=n n n n n n n n σνσνσνσνσνσν. 12.设总体X 的3阶矩存在,设X 1 , X 2 ,…, X n 是取自该总体的简单随机样本,X 为样本均值,S 2为样本方差,试证:nS X 32),Cov(ν=,其中ν3 = E [X − E (X )]3.证:因⎥⎦⎤⎢⎣⎡−−−−=−−−−=∑∑==212122)()(11)]()[(11µµµµX n X n X X n S n i i n i i ,其中µ = E (X ), 则⎟⎟⎠⎞⎜⎜⎝⎛⎥⎦⎤⎢⎣⎡−−−−−=−=∑=21222)()(11,Cov ),Cov(),Cov(µµµµX n X n X S X S X n i i ⎥⎦⎤⎢⎣⎡−−−−−−=∑=))(,Cov())(,Cov(11212µµµµX X n X X n n i i , 因0)()(=−=−µµi X E X E ,E (X i − µ)2 = σ 2,E (X i − µ)3 = ν3,且当i ≠ j 时,X i − µ 与X j − µ 相互独立,则∑∑∑∑====−−=⎟⎟⎠⎞⎜⎜⎝⎛−−=−−n i i i ni i n k k ni i X X n X X n X X 1212112))(,Cov(1)(,)(1Cov ))(,Cov(µµµµµµ331231])()()([1ννµµµ=⋅=−−−−=∑=n nX E X E X E n n i i i i , 且31232)(1)()()())(,Cov(⎥⎦⎤⎢⎣⎡−=−−−−=−−∑=n i i X n E X E X E X E X X µµµµµµ323313313311)(1)(1ννµµn n n X E n X E n n i i n i i =⋅=−=⎥⎦⎤⎢⎣⎡−=∑∑==,故n nn n n n n S X 333232111111),Cov(νννν=−⋅−=⎟⎠⎞⎜⎝⎛⋅−−=. 13.设1X 与2X 是从同一正态总体N (µ, σ 2)独立抽取的容量相同的两个样本均值.试确定样本容量n ,使得两样本均值的距离超过σ 的概率不超过0.01. 解:因µ==)()(21X E X E ,nX X 221)Var()Var(σ==,1X 与2X 相互独立,且总体分布为N (µ, σ 2),则0)(21=−=−µµX X E ,n n n X X 222212)Var(σσσ=+=−,即⎟⎟⎠⎞⎜⎜⎝⎛−n N X X 2212,0~σ, 因01.0222212}|{|21≤⎟⎟⎠⎞⎜⎜⎝⎛Φ−=⎥⎥⎦⎤⎢⎢⎣⎡⎟⎟⎠⎞⎜⎜⎝⎛Φ−=>−n n X X P σσσ,有995.02≥⎟⎟⎠⎞⎜⎜⎝⎛Φn ,5758.22≥n ,故n ≥ 13.2698,即n 至少14个.14.利用切比雪夫不等式求抛均匀硬币多少次才能使正面朝上的频率落在 (0.4, 0.6) 间的概率至少为0.9.如何才能更精确的计算这个次数?是多少?解:设⎩⎨⎧=,,0,,1次反面朝上第次正面朝上第i i X i 有X i ~ B (1, 0.5),且正面朝上的频率为∑==ni i X n X 11,则E (X i ) = 0.5,Var (X i ) = 0.25,且5.0(=X E ,n X 25.0)(Var =, 由切比雪夫不等式得n nX P X P 2511.025.01}1.0|5.0{|}6.04.0{2−=−≥<−=<<,故当9.0251≥−n时,即n ≥ 250时,9.0}6.04.0{≥<<X P ;利用中心极限定理更精确地计算,当n 很大时∑==ni i X n X 11的渐近分布为正态分布25.0,5.0(n N , 则)2.0()2.0()25.05.04.0(25.05.06.0()4.0()6.0(}6.04.0{n n nnF F X P −Φ−Φ=−Φ−−Φ=−=<<9.01)2.0(2≥−Φ=n ,即95.0)2.0(≥Φn ,64.12.0≥n ,故当n ≥ 67.24时,即n ≥ 68时,9.0}6.04.0{≥<<X P .15.从指数总体Exp (1/θ ) 抽取了40个样品,试求X 的渐近分布.解:因θ==)((X E X E ,2401)(Var )(Var θ==n X X ,故X 的渐近分布为)401,(2θθN .16.设X 1 , …, X 25是从均匀分布U (0, 5) 抽取的样本,试求样本均值X 的渐近分布.解:因25)()(==X E X E ,1211225)05()(Var )(Var 2=×−==n X X ,故X 的渐近分布为)121,25(N . 17.设X 1 , …, X 20是从二点分布b (1, p ) 抽取的样本,试求样本均值X 的渐近分布.解:因p X E X E ==)((,20)1()(Var )(Var p p n X X −==,故X 的渐近分布为20)1(,(p p p N −.18.设X 1 , …, X 8是从正态分布N (10, 9) 中抽取的样本,试求样本均值X 的标准差.解:因89)(Var )(Var ==n X X ,故X 的标准差为423)(Var =X . 19.切尾均值也是一个常用的反映样本数据的特征量,其想法是将数据的两端的值舍去,而用剩下的当中的值为计算样本均值,其计算公式是][2])[()2]([)1]([αααααn n X X X X n n n n −+++=−++L ,其中0 < α < 1/2是切尾系数,X (1) ≤ X (2) ≤ … ≤ X (n ) 是有序样本.现我们在高校采访了16名大学生,了解他们平时的学习情况,以下数据是大学生每周用于看电视的时间:15 14 12 9 20 4 17 26 15 18 6 10 16 15 5 8 取α = 1/16,试计算其切尾均值.解:因n α = 1,且有序样本为4, 5, 6, 8, 9, 10, 12, 14, 15, 15, 15, 16, 17, 18, 20, 26,故切尾均值8571.12)20865(216116/1=++++−=L x . 20.有一个分组样本如下:区间 组中值 频数 (145,155) 150 4 (155,165) 160 8 (165,175) 170 6 (175,185) 180 2试求该分组样本的样本均值、样本标准差、样本偏度和样本峰度.解:163)2180617081604150(201=×+×+×+×=x ;2338.9]2)163180(6)163170(8)163160(4)163150[(1912222=×−+×−+×−+×−=s ; 因81]2)163180(6)163170(8)163160(4)163150[(20122222=×−+×−+×−+×−=b , 144]2)163180(6)163170(8)163160(4)163150[(20133333=×−+×−+×−+×−=b ,14817]2)163180(6)163170(8)163160(4)163150[(20144444=×−+×−+×−+×−=b ,故样本偏度1975.02/3231==b b γ,样本峰度7417.032242−=−=b b γ.21.检查四批产品,其批次与不合格品率如下:批号批量不合格品率1 100 0.052 300 0.063 250 0.04 4 150 0.03试求这四批产品的总不合格品率.解:046875.0)03.015004.025006.030005.0100(8001=×+×+×+×=p . 22.设总体以等概率取1, 2, 3, 4, 5,现从中抽取一个容量为4的样本,试分别求X (1) 和X (4) 的分布. 解:因总体分布函数为⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<=,5,1,54,54,43,53,32,52,21,51,1,0)(x x x x x x x F则F (1) (x ) = P {X (1) ≤ x } = 1 − P {X (1) > x } = 1 − P {X 1 > x , X 2 > x , X 3 > x , X 4 > x } = 1 − [1 − F (x )]4⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<=,5,1,54,625624,43,625609,32,625544,21,625369,1,0x x x x x x且F (4) (x ) = P {X (4) ≤ x } = P {X 1 ≤ x , X 2 ≤ x , X 3 ≤ x , X 4 ≤ x } = [F (x )]4⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<=,5,1,54,625256,43,62581,32,62516,21,6251,1,0x x x x x x故X (1) 和X (4) 的分布为6251625156256562517562536954321)1(P X ; 6253696251756256562515625154321)4(PX . 23.设总体X 服从几何分布,即P {X = k } = pq k − 1,k = 1, 2, …,其中0 < p < 1,q = 1 − p ,X 1, X 2, …, X n 为该总体的样本.求X (n ) , X (1)的概率分布.解:因k k kj j q qq p pqk X P −=−−==≤∑=−11)1(}{11,k = 1, 2, …,故n k n k ni i ni i n n n q q k X P k X P k X P k X P k X P )1()1(}1{}{}1{}{}{111)()()(−==−−−=−≤−≤=−≤−≤==∏∏;且nk k n ni i ni i q q k X P k X P k X P k X P k X P −=>−−>=>−−>==−==∏∏)1(11)1()1()1(}{}1{}{}1{}{.24.设X 1 , …, X 16是来自N (8, 4) 的样本,试求下列概率(1)P {X (16) > 10}; (2)P {X (1) > 5}.解:(1)1616161)16()16()]2810([1)]10([1}10{1}10{1}10{−Φ−=−=≤−=≤−=>∏=F X P X P X P i i = 1 − [Φ(1)]16 = 1 − 0.841316 = 0.9370;(2)3308.09332.0)]5.1([285(1[)]5(1[}5{}5{16161616161)1(==Φ=−Φ−=−=>=>∏=F X P X P i i . 25.设总体为韦布尔分布,其密度函数为⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎟⎟⎠⎞⎜⎜⎝⎛−=−mmm x mx m x p ηηηexp ),;(1,x > 0, m > 0, η > 0. 现从中得到样本X 1 , …, X n ,证明X (1) 仍服从韦布尔分布,并指出其参数. 解:总体分布函数mm mmx xt xmt xt mm xt t mtt t p x F ⎟⎟⎠⎞⎜⎜⎝⎛−⎟⎟⎠⎞⎜⎜⎝⎛−⎟⎟⎠⎞⎜⎜⎝⎛−⎟⎟⎠⎞⎜⎜⎝⎛−−−=−=⎟⎟⎠⎞⎜⎜⎝⎛===∫∫∫ηηηηηηe1e d ed ed )()(00010,x > 0,则X (1) 的密度函数为111(1)11()[1()]()eeemmmmx x x m m m n n n mmmxmnxp x n F x p x n ηηηηη⎛⎞⎛⎞⎛⎞⎛⎞−−−−−−−−⎜⎟⎜⎟⎜⎟−⎝⎠⎝⎠⎝⎠=−=⋅==,故X (1) 服从参数为⎟⎟⎠⎞⎜⎜⎝⎛m n m η,的韦布尔分布. 26.设总体密度函数为p (x ) = 6 x (1 − x ), 0 < x < 1,X 1 , …, X 9是来自该总体的样本,试求样本中位数的分布. 解:总体分布函数3203223)23(d )1(6d )()(x x t t t t t t t p x F xxx−=−=−==∫∫,0 < x < 1,因样本容量n = 9,有样本中位数)5(215.0x x m n ==⎟⎠⎞⎜⎝⎛+,其密度函数为)1(6)231()23(!4!4!9)()](1[)]([!4!4!9)(432432445x x x x x x x p x F x F x p −⋅+−−⋅=−⋅=. 27.证明公式∫∑−−=−−−−=−⎟⎟⎠⎞⎜⎜⎝⎛110)1()!1(!!)1(p r n r rk k n k dx x x r n r n p p k n ,其中0 ≤ p ≤ 1. 证:设总体X 服从区间(0, 1)上的均匀分布,X 1, X 2, …, X n 为样本,X (1), X (2), …, X (n )是顺序统计量,则样本观测值中不超过p 的样品个数服从二项分布b (n , p ),即最多有r 个样品不超过p 的概率为∑=−+−⎟⎟⎠⎞⎜⎜⎝⎛=>rk kn k r p p k n p X P 0)1()1(}{,因总体X 的密度函数与分布函数分别为⎩⎨⎧<<=.,0;10,1)(其他x x p ⎪⎩⎪⎨⎧≥<≤<=.1,1;10,;0,0)(x x x x x F则X (r + 1)的密度函数为⎪⎩⎪⎨⎧<<−−−=−−−=−−−−+.,0,10,)1()!1(!!)()](1[)]([)!1(!!)(111其他x x x r n r n x p x F x F r n r n x p r n r r n r r 故∫∑−−+=−−−−=>=−⎟⎟⎠⎞⎜⎜⎝⎛11)1(0)1()!1(!!}{)1(p r n r r rk kn k dx x x r n r n p X P p p k n . 28.设总体X 的分布函数F (x )是连续的,X (1), …, X (n )为取自此总体的次序统计量,设ηi = F (X (i )),试证: (1)η1 ≤ η2 ≤ … ≤ ηn ,且ηi 是来自均匀分布U (0, 1)总体的次序统计量;(2)1)(+=n iE i η,)2()1()1()Var(2++−+=n n i n i i η,1 ≤ i ≤ n ; (3)ηi 和ηj 的协方差矩阵为⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎝⎛+−+−+−+−2)1(2)1(2)1(2)1(22212111n a a n a a n a a n a a 其中11+=n i a ,12+=n j a . 注:第(3)问应要求i < j . 解:(1)首先证明Y = F (X )的分布是均匀分布U (0, 1),因分布函数F (x )连续,对于任意的y ∈ (0, 1),存在x ,使得F (x ) = y , 则F Y ( y ) = P {Y = F (X ) ≤ y } = P {F (X ) ≤ F (x )} = P {X ≤ x } = F (x ) = y , 即Y = F (X )的分布函数是⎪⎩⎪⎨⎧≥<≤<=.1,1;10,;0,0)(y y y y y F Y可得Y = F (X )的分布是均匀分布U (0, 1),即F (X 1), F (X 2), …, F (X n )是均匀分布总体U (0, 1)的样本, 因分布函数F (x )单调不减,ηi = F (X (i )),且X (1) ≤ X (2) ≤ … ≤ X (n )是总体X 的次序统计量, 故η1 ≤ η2 ≤ … ≤ ηn ,且ηi 是来自均匀分布U (0, 1)总体的次序统计量; (2)因均匀分布U (0, 1) 的密度函数与分布函数分别为⎩⎨⎧<<=.,0;10,1)(其他y y p Y ⎪⎩⎪⎨⎧≥<≤<=.1,1;10,;0,0)(y y y y y F Y则ηi = F (X (i ))的密度函数为⎪⎩⎪⎨⎧<<−−−=−−−=−−−−.,0,10,)1()!()!1(!)()](1[)]([)!()!1(!)(11其他y y y i n i n y p y F y F i n i n y p i n i Y in Y i Y i即ηi 服从贝塔分布Be (i , n − i + 1),即Be (a , b ),其中a = i ,b = n − i + 1,故1)(+=+=n i b a a E i η,)2()1()1()1()()Var(22++−+=+++=n n i n i b a b a ab i η,1 ≤ i ≤ n ; (3)当i < j 时,(ηi , ηj )的联合密度函数为z y Y Y j n Y i j Y Y i Y ij z p y p z F y F z F y F j n i j i n z y p <−−−−−−−−−−=I )()()](1[)]()([)]([)!()!1()!1(!),(111011I )1()()!()!1()!1(!<<<−−−−−−−−−−=z y j n i j i z y z y j n i j i n , 则∫∫∫∫−−−+∞∞−+∞∞−−⋅−−−−−=⋅=1001)1()()!()!1()!1(!),()(z j n i j i ij j i dy z z y z y dz j n i j i n dydz z y p yz E ηη, 令y = zu ,有dy = zdu ,且当y = 0时,u = 0;当y = z 时,u = 1,则∫∫⋅−−=−⋅−−−−−−−1101)()()1()1()(zdu zu z zu z z dy z z y z y i j i j n zj n i j ij n j j n j i j i j j n z z j i j i i j i B z z du u u z z z −+−+−−−−−−=−+⋅−=−⋅−=∫)1(!)!1(!),1()1()1()1(1111,即∫−+−−−−−−−=101)1(!)!1(!)!()!1()!1(!)(dz z z j i j i j n i j i n E jn j j i ηη )1,2(!)!1(!)!()!1()!1(!+−+−−⋅−−−−=j n j B j i j i j n i j i n)2)(1()1()!2()!()!1(!)!1(!)!()!1()!1(!+++=+−+⋅−−⋅−−−−=n n j i n j n j j i j i j n i j i n , 可得)2()1()1(11)2)(1()1()()()(),Cov(2++−+=+⋅+−+++=−=n n j n i n j n i n n j i E E E j i j i j i ηηηηηη, 因11+=n i a ,12+=n j a , 则2)1()2()1()1(),Cov(212+−=++−+=n a a n n j n i j i ηη, 且2)1()2()1()1()Var(112+−=++−+=n a a n n i n i i η,2)1()2()1()1()Var(222+−=++−+=n a a n n j n j jη, 故ηi 和ηj 的协方差矩阵为⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎝⎛+−+−+−+−=⎟⎟⎠⎞⎜⎜⎝⎛2)1(2)1(2)1(2)1()Var(),Cov(),Cov()Var(22212111n a a n a a n a a n a a j j i j i i ηηηηηη. 29.设总体X 服从N (0, 1),从此总体获得一组样本观测值x 1 = 0, x 2 = 0.2, x 3 = 0.25, x 4 = −0.3, x 5 = −0.1, x 6 = 2, x 7 = 0.15, x 8 = 1, x 9 = −0.7, x 10 = −1.(1)计算x = 0.15(即x (6))处的E [F (X (6))],Var[F (X (6))]; (2)计算F (X (6))在x = 0.15的分布函数值.解:(1)根据第28题的结论知1)]([)(+=n iX F E i ,)2()1()1()](Var[2)(++−+=n n i n i X F i ,且n = 10, 故116)]([)6(=X F E ,2425121156)](Var[2)6(=××=X F ; (2)因F (X (i ))服从贝塔分布Be (i , n − i + 1),即这里的F (X (6))服从贝塔分布Be (6, 5),则F (X (6))在x = 0.15的分布函数值为∫−⋅=15.00456)1(!4!5!10)15.0(dx x x F , 故根据第27题的结论知0014.085.015.0101)1(!4!5!10)15.0(501015.00456=××⎟⎟⎠⎞⎜⎜⎝⎛−=−⋅=∑∫=−k k k k dx x x F . 30.在下列密度函数下分别寻求容量为n 的样本中位数m 0.5的渐近分布.(1)p (x ) = 6x (1 − x ),0 < x < 1;(2)⎭⎬⎫⎩⎨⎧−−=222)(exp π21)(σµσx x p ; (3)⎩⎨⎧<<=.,0;10,2)(其他x x x p (4)||e 2)(x x p λλ−=.解:样本中位数m 0.5的渐近分布为⎟⎟⎠⎞⎜⎜⎝⎛⋅)(41,5.025.0x p n x N ,其中p (x )是总体密度函数,x 0.5是总体中位数, (1)因p (x ) = 6x (1 − x ),0 < x < 1,有35.025.003205.023)23()1(6)(5.05.05.0x x x x dx x x x F x x −=−=−==∫,则x 0.5 = 0.5,有nn p n 91)5.05.06(41)5.0(4122=×××=⋅, 故样本中位数m 0.5的渐近分布为⎟⎠⎞⎜⎝⎛n N 91,5.0;(2)因⎭⎫⎩⎨⎧−−=222)(exp π21)(σµσx x p ,有0.5 = F (x 0.5) = F (µ), 则x 0.5 = µ ,有n n p n 2ππ2141)(41222σσµ=⎟⎟⎠⎞⎜⎜⎝⎛×=⋅, 故样本中位数m 0.5的渐近分布为⎟⎟⎠⎞⎜⎜⎝⎛n N 2π,2σµ;(3)因⎩⎨⎧<<=.,0;10,2)(其他x x x p 有25.00205.05.05.02)(5.0x x xdx x F x x ====∫, 则215.0=x ,有n n p n 8121241214122=⎟⎠⎞⎜⎝⎛××=⎟⎠⎞⎜⎝⎛⋅, 故样本中位数m 0.5的渐近分布为⎟⎠⎞⎜⎝⎛n N 81,21; (4)因||e 2)(x x p λλ−=,有0.5 = F (x 0.5) = F (0),则x 0.5 = 0,有2221241)0(41λλn n p n =⎟⎠⎞⎜⎝⎛×=⋅, 故样本中位数m 0.5的渐近分布为⎟⎠⎞⎜⎝⎛21,0λn N .31.设总体X 服从双参数指数分布,其分布函数为⎪⎩⎪⎨⎧≤>⎭⎬⎫⎩⎨⎧−−−=.,0;,exp 1)(µµσµx x x x F其中,−∞ < µ < +∞,σ > 0,X (1) ≤ … ≤ X (n )为样本的次序统计量.试证明)(2)1()1()(−−−−i i X X i n σ服从自由度为2的χ 2分布(i = 2, …, n ). 注:此题有误,讨论的随机变量应为)(2)1()1()(−−+−i i X X i n σ.证:因(X (i − 1), X (i ))的联合密度函数为z y i n i i i z p y p z F y F i n i n z y p <−−−−−−=I )()()](1[)]([)!()!2(!),(2)1( z y in i z y z y i n i n <<−−⎭⎬⎫⎩⎨⎧−−⋅⎭⎬⎫⎩⎨⎧−−⋅⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−−−=µσµσσµσσµσµI exp 1exp 1exp exp 1)!()!2(!2z y i n i z y y i n i n <<+−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−⎭⎬⎫⎩⎨⎧−−−−=µσµσµσµσI exp exp 1exp )!()!2(!122,则T = X (i ) − X (i − 1)的密度函数为∫+∞∞−−⋅⋅+=dy t y y p t p i i T 1),()()1(∫∞++−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−+−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−⎭⎬⎫⎩⎨⎧−−−−=µσµσµσµσdy t y y y i n i n i n i 122exp exp 1exp )!()!2(!∫∞+−+−+−⎥⎦⎤⎢⎣⎡⎭⎫⎩⎨⎧−−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−=µσµσσµσµσσy d y y t i n i n i i n i n exp )(exp 1exp exp )!()!2(!2112∫−−⎥⎦⎤⎢⎣⎡⎭⎬⎫⎩⎨⎧−−−=−+−+−012112)()1(exp )!()!2(!du u ut i n i n i i n i n σσσ∫−+−−⎭⎬⎫⎩⎨⎧+−−−−=1021)1()1(exp )!()!2(!du u ut i n i n i n i i n σσ )1,2()1(exp )!()!2(!−+−⎭⎬⎫⎩⎨⎧+−−−−=i i n B t i n i n i n σσ⎭⎬⎫⎩⎨⎧+−−+−=−+−⋅⎭⎬⎫⎩⎨⎧+−−−−=σσσσt i n i n n i i n t i n i n i n )1(exp 1!)!2()!1()1(exp )!()!2(!,t > 0,可得T i n X X i n S i i σσ2)1()(2)1()1()(+−=−+−=−的密度函数为⎭⎬⎫⎩⎨⎧−=+−⋅⎭⎬⎫⎩⎨⎧−+−=+−⋅⎟⎟⎠⎞⎜⎜⎝⎛+−=2exp 21)1(22exp 1)1(2)1(2)(s i n s i n i n s i n p s p T S σσσσ,s > 0, 故)(2)1()1()(−−+−=i i X X i n S σ服从参数为21的指数分布,也就是服从自由度为2的χ 2分布. 32.设总体X 的密度函数为⎩⎨⎧<<=.,0;10,3)(2其他x x x p X (1) ≤ X (2) ≤ … ≤ X (5)为容量为5的取自此总体的次序统计量,试证)4()2(X X 与X (4)相互独立.z −证:因总体X 的密度函数和分布函数分别为⎩⎨⎧<<=.,0;10,3)(2其他x x x p ⎪⎩⎪⎨⎧≥<≤<=.1,1;10,;0,0)(3x x x x x F 则(X (2), X (4))的联合密度函数为)4()2(I )()()](1[)]()([)]([!1!1!1!5),()4()2(1)4(1)2()4(1)2()4()2(24x x x p x p x F x F x F x F x x p <−−⋅⋅=103)4(3)2(3)4(2)4(5)2(102)4(2)2(3)4(3)2(3)4(3)2()4()2()4()2(I )1)((1080I 33)1)((120<<<<<<−−=⋅⋅−−=x x x x x x x x x x x x x x x ,设)4()2(1X X Y =,Y 2 = X (4),有X (2) = Y 1Y 2,X (4) = Y 2,则(X (2), X (4))关于( Y 1 , Y 2 )的雅可比行列式为21221)4()2(1),(),(y y y y y x x J ==∂∂=,且0 < X (2) ≤ X (4) < 1对应于0 < Y 1 < 1, 0 < Y 2 < 1,可得(Y 1 , Y 2 )的联合密度函数为210,10323213222521221242121I )1]()([)(1080||),(),(y y y y y y y y J y y y p y y p y y ⋅−−=⋅=<<<<103211210315121I )1(I )1(1080<<<<−⋅−=y y y y y y ,由于(Y 1 , Y 2 , …, Y n )的联合密度函数p ( y 1 , y 2)可分离变量, 故)4()2(1X X Y =与Y 2 = X (4)相互独立.33.(1)设X (1)和X (n )分别为容量n 的最小和最大次序统计量,证明极差R n = X (n ) − X (1)的分布函数∫+∞∞−−−+=dy y p y F x y F n x F n R n )()]()([)(1其中F ( y )与p ( y )分别为总体的分布函数与密度函数;(2)利用(1)的结论,求总体为指数分布Exp (λ)时,样本极差R n 的分布. 注:第(1)问应添上x > 0的要求. 解:(1)方法一:增补变量法因(X (1), X (n ))的联合密度函数为z y n z y n n z p y p y F z F n n z p y p y F z F n n z y p <−<−−−=−−=I )()()]()()[1(I )()()]()([)!2(!),(221, 对于其函数R n = X (n ) − X (1),增补变量W = X (1),⎩⎨⎧−==.;y z r y w 反函数为⎩⎨⎧+==.;r w z w y 其雅可比行列式为11101==J ,则R n 的密度函数为∫+∞∞−>−+−+−=dw r w p w p w F r w F n n r p r n R n 02I )()()]()()[1()(,故R n = X (n ) − X (1)的分布函数为∫∫∫∞−+∞∞−>−∞−+−+−==x r n x R R dw r w p w p w F r w F n n dr dr r p x F n n 02I )()()]()()[1()()(∫∫+∞∞−∞−>−+−+−=xr n dr r w p w p w F r w F n n dw 02I )()()]()()[1(∫∫+∞∞−−+−+−=xn dr r w p w F r w F dw w p n n 02)()]()([)()1(∫∫+∞∞−−+−+−=xn r w dF w F r w F dw w p n n 02)()]()([)()1(∫+∞∞−−−+−⋅−=x n w F r w F n dw w p n n 01)]()([11)()1(∫+∞∞−−−+=dw w p w F x w F n n )()]()([1 ∫+∞∞−−−+=dy y p y F x y F n n )()]()([1,x > 0;方法二:分布函数法因(X (1), X (n ))的联合密度函数为z y n z y n n z p y p y F z F n n z p y p y F z F n n z y p <−<−−−=−−=I )()()]()()[1(I )()()]()([)!2(!),(221, 故R n = X (n ) − X (1)的分布函数为∫∫+∞∞−+∞−=≤−==xy n n n R dz z y p dy x X X R P x F n ),(}{)(1)1()(∫∫+∞∞−+−−−=xy yn dz z p y p y F z F dy n n )()()]()([)1(2∫∫+∞∞−+−−⋅−=xy yn z F d y F z F y p dy n n )]([)]()([)()1(2∫∫+∞∞−−+∞∞−+−−+=−−⋅⋅−=dy y p y F x y F n y F z F n y p dy n n n x y y n )()]()([)]()([11)()1(11,x > 0;(2)因指数分布Exp (λ)的密度函数与分布函数分别为⎩⎨⎧≤>=−.0,0;0,e )(x x x p x λλ ⎩⎨⎧≤>−=−.0,0;0,e 1)(x x x F x λ故R n = X (n ) − X (1)的分布函数为∫∫+∞−−−+−+∞∞−−⋅−−−=−+=01)(1e )]e 1()e 1[()()]()([)(dy n dy y p y F x y F n x F y n y x y n R n λλλλ101011)e 1()(e 1)e 1(e )1()e 1()(e −−+∞−−−+∞−−−−−−=⎟⎠⎞⎜⎝⎛−⋅−=−⋅−=∫n x n y n x y n x n y n n d n λλλλλλ,x > 0.34.设X 1 , …, X n 是来自U (0, θ ) 的样本,X (1) ≤ … ≤ X (n ) 为次序统计量,令)1()(+=i i i X X Y ,i = 1, …, n − 1,Y n = X (n ) ,证明Y 1 , …, Y n 相互独立.。

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

几种常见概率分布

几种常见概率分布

• P(x=0)=0.510/(0!×1.6653)=0.6005
• P(x=1)=0.511/(1!×1.6653)=0.3063
• P(x=2)=0.512/(2!×1.6653)=0.0781
P(x=3)=0.513/(3!×1.6653)=0.0133
P(x=4)=0.514/(4!×1.6653)=0.0017
k=0Βιβλιοθήκη 项分布的性质Today: 2019/10/13
m
P(X ≤m) = Pn (k ≤m) =
C
k n
p
k
q
n
k
k=0
n
P(X ≥m) = Pn (k ≥m) = Ckn pkqn-k
k=m
P(m1 ≤X ≤m2 ) Pn (m1 ≤k ≤m2 )
m2
Cnk pk qn-k (m1 ≤m2 ) k m1
χ服从正态分布,记为χ~(µ,σ2).相应的概率分布函
数为
F(x) = 1
e x
-(x-μ) 2 2σ2
σ 2 π -∞
(二)特征 正态分布密度曲线是以χ =µ
为对称轴的单峰、对称的悬 钟形; f(x)在χ =µ处达到极大值,极 大值为 f(μ)= 1
σ 2π
f(x)是非负数,以x轴为渐进 线;
由计算可知 , 注射 A 疫苗无效的概率为 0.0352,比B疫苗无效的概率0.1671小得多。因 此,可以认为A疫苗是有效的,但不能认为B 疫苗也是有效的。
Today: 2019/10/13
(二)应用条件(三个)
n个观察单位的观察结果互相独立; 各观察单位只具有互相对立的一种结果,如
阳性或阴性,生存或死亡等,属于二项分类 资料。 已知发生某一结果(如死亡) 的概率为p,其对 立结果的概率则为1-P=q,实际中要求p 是 从大量观察中获得的比较稳定的数值。

概率论随机函数及其概率分布

概率论随机函数及其概率分布

XY 1 2
10
1
3
21
1
3
3
P( X 2,Y 2) 2 1 1 , 32 3
16
2020年10月21日3时50分
山东建筑大学理学院信息与计算科学教研室
概率论与数理统计
随机变量及其概率分布
例2 一射手进行射击,每次射击击中目标的概率均为p (0<p<1 ),
且假设各次击中目标与否相互独立,射击进行到击中目标两次为止. 设以 X 表示到第一次击中目标所需要的射击次数,以 Y 表示总共
随机变量及其概率分布
若二维随机变量 (X, Y) 的全部可能取值为有限多对或可列无穷多对
则称(X, Y)为二维离散型随机变量
设二维随机变量(X, Y) 的全部可能值为 (xi , y j ) ,i, j 1,2,3, , 而 P(X x i ,Y y j ) pij , i, j 1, 2,3, ,
xn p( xn )
则随机变量函数Y=g(X)的概率分布是:
Y
P(Y yi )
y1 g( x1 )
p( x1 )
y2 g( x2 )
p( x2 )
yn g(xn )
p( xn )
2
2020年10月21日3时50分
山东建筑大学理学院信息与计算科学教研室
概率论与数理统计
例1 设随机变量X 的分布律为
随机变量及其概率分布
二维连续型随机变量,在平面内的某个区域内连续地取值 定义 设二维随机变量 (X, Y) 的联合分布函数为F(x, y) ,若存在
非负函数f (x, y) ,对任意实数 x, y ,有
F (x, y) x y f (u, v)dudv

《概率论与数理统计)考试重点

《概率论与数理统计)考试重点

《概率论与数理统计》考试重点说明:我们将知识点按考查几率及重要性分为三个等级,即一级重点、二级重点、三级重点,其中,一级重点为必考点,本次考试考查频率高;二级重点为次重点,考查频率较高;三级重点为预测考点,考查频率一般,但有可能考查的知识点。

第一章 随机事件与概率1.随机事件的关系与计算 (一级重点)填空、简答事件的包含与相等、和事件、积事件、互不相容、对立事件的概念2.古典概型中概率的计算 (二级重点)选择、填空、计算记住古典概型事件概率的计算公式3. 利用概率的性质计算概率 (一级重点)选择、填空)()()()(AB P B P A P B A P -+=⋃,)()()(AB P B P A B P -=-(考得多)等,要能灵活运用。

4. 条件概率的定义 (一级重点)选择、填空 记住条件概率的定义和公式:)()(B P AB P = 5. 全概率公式与贝叶斯公式 (二级重点)计算记住全概率公式和贝叶斯公式,并能够运用它们。

一般说来,如果若干因素(也就是事件)对某个事件的发生产生了影响,求这个事件发生的概率时要用到全概率公式;如果这个事件发生了,要去追究原因,即求另一个事件发生的概率时,要用到贝叶斯公式,这个公式也叫逆概公式。

6. 事件的独立性(概念与性质) (一级重点)选择、填空定义:若)()()(B P A P AB P =,则称A 与B 相互独立。

结论:若A 与B 相互独立,则A 与B ,A 与B ,A 与B 都相互独立。

7. n 重贝努利试验中事件A 恰好发生k 次的概率公式 (一级重点)选择、填空在n 重贝努利试验中,设每次试验中事件A 的概率为p (10 p ),则事件A 恰好发生k 次的概率n k p p C k P k n k k n n ,,2,1,0,)1()( =-=-。

第二章 随机变量的分布及其数字特征8.离散型随机变量的分布律及相关的概率计算 (一级重点)选择、填空、计算、综合。

体育统计学 2

体育统计学 2
统计推断是获取总体性质和特征过程,即根据样本的性质和特征,分析和推断总体的性 质和特征,包括参数估计和假设检验。 参数估计主要包括参数的点估计和区间估计等。 点估计
总体参数的点估计就是用样本统计量来直接地估计相对应的总体参数,即直接使用样本 均数直接估计总体均数等。优点:
1)点估计的优点是能给出一个明确的值,计算简单方便。 (2)点估计的缺点是没有考虑到抽样误差的影响,无法判断它的结果有多大的可信程 度。 区间估计:是根据抽样误差的规律,按一定概率(1-α)估计包含未知总体参数的可能范围。 这个区间(范围)称为总体参数的可信(置信)区间。含义 计算置信区间的方法可靠性。 置信区间 2 要素:1.置信度,可信度 2.精确性关系是相对的 计算置信区间的基本原则 求参数置信区间在保证可靠性的前提下,尽量提高数据精确性。 影响置信度的因素 影响可信区间大小的因素 可信度 可信度越大,区间越宽 个体变异 变异越大,区间越宽 样本含量 样本含量越大,区间越窄 计算题:总体方差已知,未知。对应例题。P86.7.2.1 7.2.2
标准差
定义:方差的平方根。
(x )2
N
其公式为:总体标准差
s (x x)2 n 1
样本标准差:
n-1:
自由度
含义:反映每个数据的平均离散程度,标准差越大,说明数据的离散程度越大。
标准差的优缺点及适用条件优缺点:
(1)灵敏性、严密确定、充分性。
(2)标准差能对平均数的代表性作出 补充说明。
1.
z 50 x x (10) s
2. 50 12.3 12.5 10 0.8
52.5(分)
抽样得 100 所中学 829 名初二男生 50 米跑成绩的样本统计量为:x 8.5秒 , s 0.686秒 。以均数为 50 分, x 2.5s为 0 分和 100 分,1、若某学生的成绩为 7.8 秒,他的标准

高中数学统计学 PPT课件 图文

高中数学统计学 PPT课件 图文
• 将一个一般的转换为标准正态分布 • 计算概率时 ,查标准正态概率分布表
• 对于负的 x ,可由 (-x)1 x得到
• 对于标准正态分布,即X~N(0,1),有
• P (a X b) b a • P (|X| a) 2 a 1
• 对于一般正态分布,即X~N( , ),有
• 方差为 D ( X ) = npq
【例】某农庄饲养100只家禽,其中有5只鹅,现 从中任取一只,有放回地抽样3次。求在所抽取 的3只家禽中恰好有2只鹅的概率
解:设 X 为所抽取的3只家禽中鹅的数目,则 X~B ( 3 , 0.05),根据二项分布公式有
P X 2 C 3 2 (0 .0)2 5 (0 .9)3 5 2 0 .0071
x!
— 给定的时间间隔、长度、面积、 体积内事件出现的平均数
e = 2.71828 x —给定的时间间隔、长度、面积、体
积内事件出现的次数
泊松概率分布的期望和方差
• 泊松分布的数学期望为 E(X)=
• 方差为 D(X)=
泊松分布
——实例3.2.6
【例】假定某人饲养了一群鸡,母鸡在周一产蛋的 个数X服从泊松分布,假设周一产蛋的平均数为2.5 个。试求
• f(x)不是概率
请多加注意啊!
概率密度函数
密度函数 f(x)表示X 的所有取值 x 及其频数f(x)
频数
f(x)
(值, 频数)
x
a
b

概率密度函数
在平面直角坐标系中画出f(x)的图形,则对于任何实数
x1 < x2,P(x1< X x2)是该曲线下从x1 到 x2的面积
概率是曲线下的面积, 哈哈!
方差为:D(X) 6 xi E(X)2pi i1

概率论初步

概率论初步

第五章概率论初步[复习考试要求]1. 了解随机现象、随机试验的基本特点;理解基本事件、样本空间、随机事件的概念。

2. 掌握事件之间的关系:包含关系、相等关系、互不相容关系及对立关系。

3. 理解事件之间并(和)、交(积)、差运算的意义,掌握其运算规律。

4. 理解概率的古典型意义,掌握事件概率的基本性质及事件概率的计算。

5. 会求事件的条件概率;掌握概率的乘法公式及事件的独立性。

6. 了解随机变量的概念及其分布函数。

7. 理解离散性随机变量的意义及其概率分布掌握概率分布的计算方法。

8. 会求离散性随机变量的数学期望、方差和标准差。

[主要知识内容] 第0节预备知识(一)两个原理1. 分类计数原理(加法原理)做一件事,完成它有 n 类方式,第一类方式有种方法,第二类方式有 门】种方法,,, 第n 类方式有…一:种方法,无论利用哪种方式的哪种方法都可以完成这件事,那么完成这件事的方法总数为-。

2. 分步计数原理(乘法原理)做一件事,完成它有n 个步骤,第一个步骤有 种方法,第二个步骤有「•种方法,,, 第n 个步骤有…一:种方法,必须经过所有步骤才能完成这件事,那么完成这件事的方法总数n□%为 …。

例如,某人由甲地经过乙地到丙地。

可供选择的交通工具及次数如下:由甲地到乙地,汽车6种、火车5种;由乙地到丙地,汽车 4种,火车3种。

则由甲地到乙地的方法数为 6+5=11 (种),由乙地到丙地的方法数为 4+3=7 (种),由甲地经过乙地到丙地的方法数为 (6+5)X ( 4+3) =77 (种)。

【答疑编号10050101】 (二)排列1. 定义:从n 个不同元素中,任取 m ( m < n )个元素,按照一定的顺序排成一列,叫 做从n 个不同元素中取出 m 个元素的一个排列。

当m<n 时,称排列为选排列;当 m=n 时,称排列为全排列。

2. 排列数:从n 个不同元素中取出 m ( me n )个元素的所有排列的个数,叫做从 n 个不 同元素中取出m 个元素的排列数,记作3. 排列数计算公式:= yi (n-l) (n-2) -2 ] =M !(规定0!=1 ) 4. 可重复元素的排列:从 n 个不同元素中,任取 m ( m e n )个元素(元素可以重复), 按照一定的顺序排成一列,叫做从 n 个不同元素中取出 m 个元素的一个可-«-(H 1)- Z) ■ (« -+1)-n! -W1)!重复元素的排列。

概率分布及概率分布图

概率分布及概率分布图

概率密度函数图
总结词
概率密度函数图是一种展示连续概率分布的图形,通过曲线的高低表示概率密度的大小。
详细描述
概率密度函数图是连续概率分布的图形表示,它通过曲线的高低表示概率密度的大小。在概率密度函数图中,曲 线下方的面积表示事件发生的概率。这种图形可以帮助我们了解连续随机变量的分布情况,并用于估计和预测未 来的事件。
02 离散概率分布
二项分布
01
02
03
定义
二项分布是描述在n次独 立重复的伯努利试验中成 功的次数的概率分布。
公式
$B(n, p) = C(n, k) p^k (1-p)^{n-k}$,其中C(n, k)是组合数,表示从n个 不同项中选取k个的方法 数。
应用场景
例如,抛硬币的结果(正 面或反面),或者给定数 量的独立事件中成功事件 的次数。
泊松分布
定义
泊松分布是描述在单位时间内(或单 位面积内)随机事件的次数,当这些 事件以小概率发生,并且这些事件之 间是独立的。
公式
应用场景
例如,放射性衰变或者网络中同时发 生的请求数。
$P(X=k) = frac{e^{lambda}lambda^k}{k!}$,其中 $lambda$是事件的平均发生率。
05 概率分布及概率分布图的 应用实例
在统计学中的应用
1 2 3
描述性统计
概率分布图可以用来描述数据的分布情况,如频 数分布图、直方图等,帮助我们了解数据的集中 趋势、离散程度等。
假设检验
在假设检验中,概率分布图可以用来表示样本数 据和理论分布之间的比较,帮助我们判断样本数 据是否符合预期的分布。
概率分布的种类
离散概率分布
描述离散随机变量的取值概率,如二项分布、泊 松分布等。

统计学第五章 概率与概率分布

统计学第五章 概率与概率分布

全概公式
(实例)
【例】某车间用甲、乙、丙三台机床进行生产,各种机床的 次品率分别为5%、4%、2%,它们各自的产品分别占总产量 的 25% 、 35% 、 40% ,将它们的产品组合在一起,求任取一 个是次品的概率。 解:设 A1表示“产品来自甲台机床”, A2表示“产品来自 乙台机床”, A3表示“产品来自丙台机床”, B表示“取到 次品”。根据全概公式有
全概公式

设事件A1,A2,…,An 两两互斥, A1+A2+…+ An=(满足这两个条件的事件组称为一个完备事 件组),且P(Ai)>0(i=1,2, …,n),则对任意事件B, 有 n
P( B) p( Ai ) P( B | Ai )
i 1
我们把事件A1,A2,…,An 看作是引起事件B发 生的所有可能原因,事件B 能且只能在原有A1, A2,…,An 之一发生的条件下发生,求事件B 的 概率就是上面的全概公式
概率的古典定义
(实例)

【例】某钢铁公司所属三个工厂的职工人数如下表。

从 该公司中随机抽取1人,问: (1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率 某钢铁公司所属企业职工人数
工厂 炼钢厂 炼铁厂 轧钢厂 合计 男职工 4000 3200 900 8500 女职工 1800 1600 600 4000 合计 6200 4800 1500 12500
概率的性质与运算法则
随机事件的几个基本概念

1. 2. 3.

在相同条件下,对事物或现象所进行的观察
例如:掷一枚骰子,观察其出现的点数 试验具有以下特点
可以在相同的条件下重复进行 每次试验的可能结果可能不止一个,但试验的所 有可能结果在试验之前是确切知道的 在试验结束之前,不能确定该次试验的确切结果

第五章 二维随机变量及其分布

第五章 二维随机变量及其分布
x −∞ −∞

y
p(u, v )dudv .
则称( 则称(X,Y)为二维连续型随机变量,p(x,y)称为 为二维连续型随机变量, (X,Y)的联合密度(函数)。 的联合密度(函数)。 偏导存在的点处有: 注:在F(x,y)偏导存在的点处有: ∂2 p( x, y) = F( x, y). ∂x∂y
1 1 2 + P ( X = 2,Y = 2) = 0 + + = . 3 3 3
2011-11-8 皖西学院 数理系 13
一口袋装有3个球 分别标有数字1,2,2, 个球, 例2 一口袋装有 个球,分别标有数字 从袋中任取一球;放回袋中,再从袋中任取一球。 从袋中任取一球;放回袋中,再从袋中任取一球。
变量分成离散型、连续型及混合型, 变量分成离散型、连续型及混合型,主要研究离 散型和连续型的随机变量。 散型和连续型的随机变量。
2011-11-8 皖西学院 数理系 3
二、二维随机变量的分布函数 定义:设有二维随机变量( X ,Y ), 对∀x, y ∈ R, 称概率 P( X ≤ x,Y ≤ y)为随机变量( X ,Y )的联合分布函数。记 概 率 作:F ( x, y), 即 F ( x, y) = P( X ≤ x,Y ≤ y).
概 率 论 与 数 理 统 计
x1 < x2 ⇒ F ( x1 , y) ≤ F( x2 , y);
y1 < y2 ⇒ F ( x, y1 ) ≤ F ( x, y2 ) .
有界性: 有界性:
0 ≤ F ( x, y) ≤ 1; F (−∞, y) = 0, F ( x, −∞) = 0, F (+∞, +∞) = 1.
xi
M

概率论与数理统计第五章

概率论与数理统计第五章

第 ×× 次课 2学时本次课教学重点:常用的统计量 本次课教学难点:总体,简单随机样本,统计量的概念。

本次课教学内容:第五章 数理统计的基础知识 第一节 数理统计的基本概念 教学组织: 一、引言在前五章中我们学习了概率论的基本内容,因为随机变量及其所伴随的概率分布全面描述了随机现象的统计规律性,所以在概率论的许多问题中,概率分布通常都是已知的,或者假设是已知的,而一切计算与推理都是在此基础上得出来的。

然而,实际情况往往并非如此。

一个随机现象所服从的分布概型可能完全不知道,或者只知道其概型而不知其分布函数中所含的参数。

例如,某工厂生产的灯泡的寿命服从什么分布是不知道的。

再如,某厂生产的一件产品是合格品还是不合格品,我们知道它服从两点分布,但其参数p 却不知道。

那么怎样才能知道一个随机现象的分布或其参数呢?这就是数理统计所要解决的一个首要问题。

为了获得灯泡的寿命分布,我们从所有的灯泡中抽出一部分进行观察与测试以取得相关信息,从而做出推断。

由于观察和测试是随机现象,依据有限个观察与测试对整体所做出的推断不可能绝对准确,这个不确定性我们用概率来表达。

数理统计学的基本问题就是依据观测或试验所取得的有限信息对整体做出推断,每个推断必须伴有一定的概率来表明其可靠程度。

这种伴有一定概率的推断称为统计推断。

二、总体与随机样本 1、总体在数理统计中,我们往往研究有关对象的某一数量指标(如灯泡的寿命这一数量指标)。

为此,考虑与这一数量指标相联系的随机试验,对这一数量指标进行试验或观察。

我们把研究对象的全体所构成的一个集合称为总体,总体中的每个对象称为个体。

总体中所包含的个体的个数称为总体的容量。

容量有限的总体称为有限总体,容量无限的总体称为无限总体。

例如,考察某批灯泡的质量,如这一批灯泡共有5000只,每个灯泡的寿命是一个可能的观察值,是一个个体。

所有5000只灯泡的寿命是一个有限总体。

概率与概率分布

概率与概率分布

故乘客候车小于5min的概率为
1 P(0 5) dx 0.5 0 10
5
2、正态分布 一、 概念和公式的引出 正态分布 如果随机变量 的密度函数为
1 f ( x) e 2
( x )2 2 2
( x (,))
其中 , ( 0) 为参数,则称随机变量 服从参数为
如果随机变量 取值为0,1,2,…,n,其概率 分布为
k P( k ) Cn p k (1 p) nk (k 1,2,, n)
则称 服从参数为n,p的二项分布,记作
~B(n, p)
三、进一步练习 练习[摸球]
练习 [使用寿命] 按规定,某种型号电子元件的使用 寿命超过1500小时的为一级品.已知某大批产品的一 级品率为0.2,现从中随机地抽查10只,设10只元件 中一级品的只数为 ,求 的概率分布.
“出现正面”这一随机事件.
3.2.1 离散型随机变量及其分布
一、案例 二、概念和公式的引出
三、进一步的练习
案例 [取球]
上面我们已经知道随机变量可以表示随机试验的
结果,有些随机试验的结果可用随机变量的取值按 一定顺序列出.如掷一枚骰子,可用 取值1,2,…,6来表示所有结果.
二、 概念和公式的引出 离散型随机变量
k 10 k
的概率分布为
10 k
P( k ) C (0.2) (0.8)
(k 1,2, ...)
3.泊松分布 二、 概念和公式的引出 泊松分布 如果随机变量 的概率分布为
P( k )
k
k!
e

( 0, k 0,1,2,, n)
则称 服从参数为 的泊松分布,记作

概率论5章

概率论5章

F ( x, y) A[ B arctanx][C arctany]
求常数A,B,C.
解: F ( , ) A[ B
F ( , y ) A[ B

2
][C

2
]1

2
][ C arctan y ] 0
F ( x, ) A[ B arctan x ][ C
x y
f ( x, y)dxdy
dx 8e
x 0 ( 2 x 4 y ) x dy 2e 2 x (e 4 y ) |0 dx 0
= 0 =



0
2e
2 x
(1 e
4 y
)dx 2e
0

2 x
dx 2e6 x dx
0

F ( , y ) lim F ( x, y ) 0
x
§5.1 二维随机变量及分布函数
二、联合分布函数 性质 ⑤ 随机点(X,Y)落在矩形区域
{( x, y) | x1 X x2 , y1 Y y2}
的概率
y y2
y1 0 x1 x2 x
P( x1 X x2 , y1 Y y2 ) F ( x2 , y2 ) F (x2 , y1 ) F (x1, y2 ) F (x1, y1 )
y0 0 y0 0
x
§5.4 边缘分布
一、边缘分布函数 1.边缘分布 设F(x,y)为二维随机变量(X,Y)的联合分布函数,称
P(X≤x)=P(X≤x,Y<+≦)
x , y
其中 -≦<μ1<+≦, -≦<μ2<+≦,σ1>0,σ2>0 ,|ρ|<1,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三.概率的加法定理和乘法定理
概率的加法定理
♦ ♦
若事件A发生,则事件B就一定不发生, 若事件A发生,则事件B就一定不发生,
这样的两个事件为互不相容事件。 这样的两个事件为互不相容事件。 互不相容事件和的概率, 两互不相容事件和的概率,等于这两个 和的概率
事件概率之和,即 事件概率之和,
P( A+ B ) = P( A ) + P( B )
P( A1 + A2 +L An ) = P( A1 ) + P( A2 ) + L + P( An )
(5.4) (5.5)
概率的乘法定理

若事件A发生不影响事件B是否发生, 若事件A发生不影响事件B是否发生,这
样的两个事件为互相独立事件。 样的两个事件为互相独立事件。

两个互相独立事件积的概率, 互相独立事件积的概率 两个互相独立事件积的概率,等于这两个
二项分布的性质

从概率直方图可以看到, 从概率直方图可以看到,二项分布有
如下性质: 如下性质:

①.当p=q时(不管n多大),图形是 p=q时 不管n多大),图形是 ),
对称的。 对称的。

②.当p≠q时,直方图呈偏态。p>q p≠q时 直方图呈偏态。
与p<q时的偏斜方向相反。 时的偏斜方向相反。
第五章
概率及概率分布
教育研究中所收集到的数据, 教育研究中所收集到的数据,除了描 述样本分析结果外(描述统计),更重要 述样本分析结果外(描述统计),更重要 ), 的是利用这些数据的信息对总体的某种特 征作出具有一定可靠程度的估计与推断 (推断统计)。概率分布理论是处理这些 推断统计)。概率分布理论是处理这些 )。概率分布理论 数据变量的数学计基础, 数据变量的数学计基础,也是推论统计的 基础。 基础。
6 5 2 4
4
3 2 3 2 3 = + 6 ⋅ + 15 ⋅ = 0.5443 5 5 5 5 5
3.二项分布图
♦ 以成功事件出现的次数为横坐标, 以成功事件出现的次数为横坐标,
以成功事件出现不同次数的概率为纵 坐标,绘制直方图或多边图, 坐标,绘制直方图或多边图,即为二 项分布图。 项分布图。
表5-1 一个学生做10个正误题做对不同题数的概率分布 做对题目数 0 1 2 3 4 5 6 7 8 9 10 总和 出现方式数 1 10 45 120 210 252 210 120 45 10 1 1024 概率P(X) 概率P(X) 0.001 0.010 0.044 0.117 0.205 0.246 0.205 0.117 0.044 0.010 0.001 1.000 累积概率 0.001 0.011 0.055 0.172 0.377 0.623 0.828 0.945 0.989 0.999 1.000
♦ ♦ ♦
一次试验只有两种可能的结果 两种可能的结果, 一次试验只有两种可能的结果,即成功
和失败; 和失败; 各次试验相互独立 独立, 各次试验相互独立,即各次试验之间互
不影响; 不影响; 各次试验中成功的概率相等,失败的概 成功的概率相等 各次试验中成功的概率相等,失败的概
相等。 率也相等 率也相等。
平均可以猜对5 平均可以猜对5题。什么情况下可以说他是 真会而不是猜测呢? 真会而不是猜测呢?

这种问题需要用累积概率来算。 这种问题需要用累积概率来算。当做对
8题或8题以上时,累积概率为0.989,也 题或8题以上时,累积概率为0.989, 0.989 就是说,猜对9题或10题的概率不足0.05。 就是说,猜对9题或10题的概率不足0.05。 10题的概率不足0.05
事件概率的乘积, 事件概率的乘积,即
P( A⋅B ) = P( A ) ⋅ P( B )
(5.6)
P( A1 ⋅ A2 ⋅L An ) = P( A1 ) ⋅ P( A2 ) ⋅L ⋅ P( An )
(5.7)

某一学生从5 例1:某一学生从5个试题中任意抽取
一题,进行口试。 一题,进行口试。如果抽到每一题的概率 为1/5,则抽到试题1或试题2的概率是 则抽到试题1或试题2 多少? 多少? 如果前一个学生把抽过的试题还回 后一个学生再抽, 后,后一个学生再抽,则4个学生都抽到 试题1的概率是多少? 试题1的概率是多少?
一、概率的定义
1.后验概率 或统计概率 1.后验概率(或统计概率 或统计概率)
♦ ♦
随机事件的频率
W( A)
m = n
(5.1)
当n无限增大时,随机事件A的频率会稳定在 无限增大时,随机事件A
一个常数P 这个常数就是随机事件A的概率。 一个常数P,这个常数就是随机事件A的概率。
m P( A ) = Lim n →∞ n
解:将n=6,p=2/5,q=3/5,X=4代入 n=6,p=2/5,q=3/5,X=4代入 (5.8)式,则恰好抽到4个男生的概率为 则恰好抽到4
6! 2 3 P( 4 ) = C ⋅ p ⋅ q = × × = 0.1382 4!×2! 5 5
4 6 4 2

例题:一个教师对8 例题:一个教师对8个学生的作业成绩
进行猜测,如果教师猜对的可能性为1 进行猜测,如果教师猜对的可能性为1/3, 问:
♦ ♦
平均能猜对几个学生的成绩? ⑴.平均能猜对几个学生的成绩? 假如规定猜对95%,才算这个教师 95%, ⑵.假如规定猜对95%,才算这个教师
有一定的评判能力, 有一定的评判能力,那么这个教师至少要猜 对几个学生? 对几个学生?
4
2
最多抽到2个男生的概率,等于1 最多抽到2个男生的概率,等于1个也 没有抽到、抽到1 没有抽到、抽到1个和抽到两个男生的概 率之和, 率之和,即
P( 0 ) + P(1) + P(2 ) = C ⋅ p ⋅ q + C ⋅ p ⋅ q + C ⋅ p ⋅ q
0 6 0 6 1 6 5 2 6 2

解:⑴.
1 µ = np = 8 × = 2.67 3

⑵.
P( X ) = C ⋅ p ⋅ q
X n X
n− X
2 0 0 8 8 P( 0 ) = C 8 ⋅ p ⋅ q = q = = 0 .0406 3 7 8! 1 2 1 P(1) = C 8 ⋅ p 1 ⋅ q 7 = × × = 0 .1616 7! 3 3
8! 1 2 4 4 4 = C8 ⋅ p ⋅ q = × × = 0 . 1550 4!× 4! 3 3
4 4
3
5
P( 5 )
8! 1 2 5 5 3 = C8 ⋅ p ⋅ q = × × = 0 . 0617 5!× 3! 3 3
2.二项分布函数

二项分布是一种离散型随机变量的概率
分布。 分布。

用 n 次方的二项展开式来表达在 n 次
二项试验中成功事件出现的不同次数( 二项试验中成功事件出现的不同次数(X=0, 成功事件出现的不同次数 1…)的概率分布,叫做二项分布。 1…)的概率分布,叫做二项分布。
二项展开式的通式(即二项分布函数):
(5.2)
2.先验概率 古典概率 2.先验概率(古典概率 古典概率)
古典概率模型要求满足两个条件: 古典概率模型要求满足两个条件: 试验的所有可能结果是有限的; ⑴ 试验的所有可能结果是有限的; ⑵ 每一种可能结果出现的可能性相等。 每一种可能结果出现的可能性相等。
P( A)
m = n
(5.3)
例:将一枚硬币抛3次,观察正(H)反 面(T)出现的情况。 那么所有可能的结果有8个,HHH,HHT, HTH,THH,HTT,THT,TTH,TTT,即n=8。 如果一次正面朝上为事件A,那么事件A就包 括三种可能的结果:HTT,THT,TTH,m=3, 那么抛3次硬币恰好有1次正面朝上的概率就 是P(A)=m/n=3/8。
4.二项分布的平均数和标准差

如果二项分布满足p nq≥5(或者p 如果二项分布满足p>q且 nq≥5(或者p<q
np≥5时 二项分布接近于正态分布。 且 np≥5时,二项分布接近于正态分布。可用下 面的方法计算二项分布的平均数和标准差。 面的方法计算二项分布的平均数和标准差。

二项分布的平均数为
次从0→n为降幂。每项p 次从0→n为降幂。每项p与q方次之和等于n。 0→n为降幂 方次之和等于n
♦ 系数:各项系数是成功事件次数的组合数。 系数:各项系数是成功事件次数的组合数。
例3:从男生占2/5的学校中随机抽取6 从男生占2 的学校中随机抽取6 个学生,问正好抽到4 个学生,问正好抽到4个男生的概率是多 最多抽到2个男生的概率是多少? 少?最多抽到2个男生的概率是多少?

抽出一个白球的概率为3 5,抽出一个黑 抽出一个白球的概率为3/5,抽出一个黑
球的概率为2 球的概率为2/5。

抽出一个黑球和一个白球的情况应包括先
抽出一个黑球、后抽出一个白球和先抽出一 抽出一个黑球、 个白球、后抽出一个黑球两种情况。因此: 个白球、后抽出一个黑球两种情况。因此:
3 2 2 3 P = × + × = 0.48 5 5 5 5
8! 1 2 2 2 6 P( 2 ) = C8 ⋅ p ⋅ q = × × = 0.2816 2!×6! 3 3
P( 3 )
P( 4 )
2 6
8
8! 1 2 = C 83 ⋅ p 3 ⋅ q 5 = × × = 0 .2800 3!× 5! 3 3
54张扑克,每张出现的可能性相等, 因此每张出现的概率为1/54,如果我 们将随机事件A规定为红桃,那么事件 A就由13个基本事件组成,也就是m=13, n=54,这时红桃出现的概率为P(A) =13/54=0.241。
相关文档
最新文档