概率论与数理统计 5.1 数学期望
概率论与数理统计 第五章

Xn ⎯ ⎯→ X 2. 依概率收敛与依分布收敛的关系
依概率收敛 ⇒ 依分布收敛
L
3. 定义:中心极限定理 设随机变量 X ~ N(0,1),{Xi },i = 1, 2, … 相互独 立,且数学期望和方差都存在, 若标准化随机变量序列
∑
n
i =1
Xi −
∑ E(X
i =1
n
i
)
∑
n
i =1
D(X i)
所以结论成立。 由此有,若X ~ B( n, p ),对于足够大的n,有 ⎧ m1 − np X − np m2 − np ⎫ ⎪ ⎪ < ≤ P{m1 < X ≤ m2 }= P ⎨ ⎬ np(1 − p) np(1 − p) ⎪ ⎪ np(1 − p) ⎩ ⎭
⎧ Yn − np ⎫ ⎪ ⎪ ≤ x ⎬ = Φ( x ) lim P ⎨ n →∞ ⎪ np(1 − p ) ⎪ ⎩ ⎭
证明:对于任意正整数n,随机变量Yn 可表示为 证明:对于任意正整数n Yn = X1+ X2+…+ Xn X1, X2,…, Xn 相互独立,Xi ~ B( 1, p ),且有 E( Xi ) = p , D( Xi ) = p(1-p) 所以随机变量序列{ Xi }, i =1,2,…满足独立同分布 中心极限定理条件。即有
切比雪夫不等式的应用 1)估计随机变量落在某个区间内的概率 (P125例5.5.2) 2)估计ε的值, 使 P(│X - E(X)│<ε) ≥ a (0<a<1) 3)证明大数定律。
二. 大数定律 定义: 依概率收敛 设{Xn}是一个随机变量序列,X 是一个随机变量 或常数,若对于任意的ε> 0,有 lim P{| X n − X |≥ ε } = 0
《概率论与数理统计》数学期望

§4.3 随机变量函数的数学期望 例题
§4.3 随机变量函数的数学期望 例题
§4.3 随机变量函数的数学期望 例题
概率论与数理统计
§4.4 协方差和相关系数
协方差 相关系数 授课内容 例题
§4.4 协方差和相关系数 协方差
1. 定义
§4.4 协方差和相关系数 协方差
2. 协方差的计算公式
概率论与数理统计
§4.1 数学期望
离散型随机变量的数学期望
连续型随机变量的数学期望
授课内容
数学期望的性质
§4.1 数学期望 离散型随机变量的数学期望
1. 定义
§4.1 数学期望 离散型随机变量的数学期望
关于定义的几点说明
(2) 级数的绝对收敛性保证了级数的和不随级数各项次序的改变 而改变 , 之所以这样要求是因为数学期望是反映随机变量X 取可能值 的平均值,它不应随可能值的排列次序而改变.
§4.4 协方差和相关系数 相关系数
3. 不相关的定义
§4.4 协方差和相关系数 相关系数
4. 不相关性的判定
以下四个条件等价 (1) ρ 0; (2)Cov( X ,Y ) 0; (3) D( X Y ) DX DY;
(4)3 随机变量函数的数学期望 二维随机变量函数的数学期望
§4.3 随机变量函数的数学期望 二维随机变量函数的数学期望
一维随机变量函数的数学期望 二维随机变量函数的数学期望 授课内容 例题
§4.3 随机变量函数的数学期望 例题
§4.3 随机变量函数的数学期望 例题
§4.3 随机变量函数的数学期望 例题
5 .不相关与相互独立的关系
协方差 相关系数 授课内容 例题
§4.4 协方差和相关系数 例题
14级--GZ《概率与统计》_第12讲_5.1大数定律_5.2中心极限定理

§2 中心极限定理
5.2 中心极限定理
简介
中心极限定理是研究在什么条件下,独立随机变 量序列部分和的极限分布为正态分布的一系列定理 的总称。 在自然界与生产中,一些现象受到许多相互独立 的随机因素的影响,如果每个因素所产生的影响都 很微小时,总的影响可以看作是服从正态分布的。 中心极限定理就是从数学上证明了这一现象 。 它是近两个世纪概率论研究的中心问题,因此这 些定理称为中心极限定理。
P(120000 aX 60000 ) 0.9,即 P( X
由棣莫弗 - 拉普拉斯定理知,
60000 ) 0.9. a
60000 X 60 60000 a 60 P( X ) P( ) 0 . 9. a 60 9.4% 60 9.4%
5.2 中心极限定理
定理1:独立同分布中心极限定理 (变形)
P( k 1
n
X
n
k
n
当n 时 x) ( x)
n
k
X
式中
k 1
n
n
X n n 1 X X
分子分母同时除以n n k 1
k
X 近似 ~ N (0,1) 故: n
或
X ~ N (,
为什么会有这种规律性?这是由于大量试验过程中,随
机因素相互抵消、相互补偿的结果。
用极限方法来研究大量独立(包括微弱相关)随机试验
的规律性的一系列定律称为大数定律。
5.1 大数定律
弱大数定理(辛钦大数定理)
设随机变量序列 X1, X2, … 独立同分布,具有有限的 数学期望 E(Xk)=μ, k=1, 2, …,则对任给 ε >0 ,有
棣莫弗 – 拉普拉斯定理 (针对二项分布)
概率论与数理统计(英文) 第五章

5. Random vectors and Joint Probability Distribution s随机向量与联合概率分布5.1 Concept of Joint Probability Distributions(1) Discrete Variables Case 离散型Often, trials are conducted where two random variables are observed simultaneously in order to determine not only their individual behavior but also the degree of relationship between them.( X, Y)For two discrete random variables X and Y, we write the probability that X will take the value x and Y will take the value y as P(X=x, Y=y). Consequently, P(X=x, Y=y) is the probability of the intersection of the events X=x and Y=y.(X=x, Y=y) ------ (X=x)∩(Y=y)The distribution of probability is specified by listing the probabilities associated with all possible pairs of values x and y, either by formula or in a table. We refer to the function p(x, y)=P(X=x, Y=y) and the corresponding possible values (X, Y) as the j oint probability distribution (联合分布)of X and Y.They satisfy(,)0, (,)1xyp x y p x y ≥=∑∑,where the sum is over all possible values of the variable.Example 5.1.1 Calculating probabilities from a discrete joint probability distributionLet X and Y have the joint probability distribution.(a) Find (1)P X Y +>;(b) Find the probability distribution ()()X p x P X x == of the individualrandom variable X . Solution(a) The event 1X Y +>is composed of the pairs of values (l,1), (2,0), and (2,l). Adding their corresponding probabilities(1)(1,1)(2,0)(2,1)0.20.100.3.P X Y p p p +>=++=++=(b) Since the event X =0 is composed of the two pairs of values (0,0) and (0,1), we add their corresponding probabilities to obtain(0)(0,0)(0,1)0.10.20.3P X p p ==+=+=.Continuing, we obtain (1)(1,0)(1,1)0.40.20.6P X p p ==+=+= and(2)(2,0)(2,1)0.100.1P X p p ==+=+=.In summary, (0)0.3X p =, (1)0.6X p = and (2)0.1X p =is the probabilitydistribution of X . Note that the probability distribution ()X p x of appears in the lower margin of this enlarged table. The probability distribution ()Y p y of Y appears in the right-hand margin of the table. Consequently, the individual distributions are called marginal probability distributions .(边缘分布)From the example, we see that for each fixed value of x , the marginalprobability distribution is obtained as()()(,)X yP X x p x p x y ===∑,where the sum is over all possible values of the second variable. Continuing, we obtain()()(,)Y xP Y y p y p x y ===∑.Example 3.5.3Suppose the number X of patent applications (专利申请)submitted by a company during a 1-year period is a random variable having thePoisson distribution with mean λ, (()!n e P X n n λλ-==)and the variousapplications independently have probability (0,1)p ∈ of eventually being approved.Determine the distribution of the number of patent applications during the 1-year period that are eventually approved.先求联合分布密度,再求边缘分布Solution Let Y be the number of patent application being eventually approved during 1-year period. Then the event {}Y k = is the union of mutually exclusive events {,}X n Y k == ()n k ≥.If X n =, then the random variable S has the binomial distribution with parameter n and p :(|)(1)k k n k n P Y k X n C p p -===-. (0)n k ≥≥ Thus(,)()(|)P X n Y k P X n P Y k X n ====== (1)!nk kn k n e C p p n λλ--=⋅⋅-when k>n, P(X=n, Y=k)=0,Hence the distribution of Y is()(,)(,)n n kP Y k P X n Y k P X n Y k ∞∞=========∑∑(1)!nk kn k n n ke C p p n λλ∞--==⋅⋅-∑!(1)!!()!nk n k n k n e p p n k n k λλ∞--==⋅⋅--∑(1)!()!kn kkn k n ke p p k n k λλλ-∞--==⋅⋅--∑()(1)(1)()()!!!mk k p m p p p e e ek m k λλλλλλ∞---=-==∑ ()!k pp e k λλ-= Thus, Y has the Poisson distribution of mean p λ. exercise从1,2,3,4,5五个数中不放回随机的接连地取3个,然后按大小排成123X X X <<,试求13(,)X X 的联合分布,x1,x3 独立吗?Homework Chap 5 1,(2) Continuous Variables Case 连续型随机向量There are many situations in which we describe an outcome by giving the values of several continuous random variables. For instance, we may measure the weight and the hardness of a rock, the pressure and the temperature of a gas. Suppose that X and Y are two continuous random variables. A function (,)f x y is called the joint probability density of these random variables, if the probability that , a X b c Y d ≤≤≤≤ is given by the multiple integral(, )(,)b da cP a X b c Y d f x y dxdy ≤≤≤≤=⎰⎰Thus, a function (,)f x y can serve as a joint probability density if all of the following hold:for all values of x and y , f is integrable on R 2 andTo extend the concept of a cumulative distribution function to the two variables case, we can define F (x , y )(, )(, )F x y P X x Y y =≤≤,and we refer to the corresponding function F as the joint cumulative distribution function of the two random variables.Example 5.1.2If the joint probability density of two random variables is given by236 for 0,0(,)0 elsewherex y e x y f x y --⎧>>=⎨⎩ Find the joint distribution function, and use it to find the probability(2,4)P X Y ≤≤.Solution By definition,23006 for 0, 0(,)(,)0 elsewhere y x yu vxe du e dv x y F x yf u v dudv ---∞-∞⎧>>⎪==⎨⎪⎩⎰⎰⎰⎰Thus,23(1)(1) for >0, >0(,)0 elsewhere x y e e x y F x y --⎧--=⎨⎩.Hence,412(2, 4)(2, 4)(1)(1)0.9817P X Y F e e --≤≤==--=.ExampleIf the joint probability density of two random variables is given by2,1,01(,)0,kxy x y x f x y ⎧≤≤≤≤=⎨⎩其他(a)find the k; (b)find the probability2((,)),{(,)|,01}P X Y D D x y x y x x ∈=≤≤≤≤solutionsince(,)1f x y dxdy ∞∞-∞-∞=⎰⎰24111001(,)()226x x kf x y dxdy dx kxydy k x dx ∞∞-∞-∞==-=⎰⎰⎰⎰⎰ hence k=6.21124001((,))663()4xx DP X Y D xydxdy dx xydy x x x dx ∈===-=⎰⎰⎰⎰⎰joint marginal densities 边缘密度Given the joint probability density of two random variables, the probability density of the X or Y can be obtained by integrating out another variable,The functions f X and f Y respectively are called the marginal density (边缘密度)of X and Y .,ExampleThe joint probability density of two random variables is given by26,1,01(,)0,xy x y x f x y ⎧≤≤≤≤=⎨⎩其他find the marginal density from the joint density when [0,1]x ∈,215()(,)633X xf x f x v dv xydy x x +∞-∞====-⎰⎰[0,1]x ∉,()0X f x =,hence 533,01()0,X x x x f x elsewhere ⎧-≤≤=⎨⎩23,01()0,Y y y f x elsewhere ⎧≤≤=⎨⎩exercises求服从B 上均匀分布的随机向量(X,Y )的分布密度及分布函数。
概率论与数理统计 第五章 大数定律与中心极限定理

的概率很小” ,用数学语言表达,就是要证明: 0 ,有
nA nA lim P p 0 lim P p 1 n ,或 n n . n
另一种提法是:研究随机变量 n A 的分布的极限行为,即讨 论分布函数
nA lim P p 0 lim P n n 或 n
nA p 1 . n
证 引入
1 , 第i次试验中事件A发生 Xi ,i 1 , 2 , , n , 0 , 第i次试验中事件A不发生
下面我们进一步来讨论贝努利试验.若记 n A 为 n 次贝努利试
nA 验中事件 A 发生的次数, 则事件 A 发生的频率为 n . 所谓 “频 率的稳定性” ,无非是指当试验次数 n 无限增大(即 n )时,
nA 频率 n 无限接近于某个固定常数.这个固定的常数就是“事 件 A 在一次试验中发生的的概率 p” . nA 由此可见,讨论频率 n 的极限行为,是理解概率论中最基本
2019年1月14日星期一
11 / 102
§5.1
大数定律
作为预备知识,我们先明确随机变量序列收敛的
相关概念,同时给出一个重要的不等式,它是以下理 论证明所用的主要工具之一.
定 义 1.1 设 a 是常数,对于随机变量序列 ,如果 0 ,有
X1 , X 2 ,
, Xn ,
lim P
n
个常数,即在这个常数的附近摆动,这就是所谓的“频
率稳定性”.但对这一点,至今为止我们尚未给予理论 上的说明.另外,在第二章我们给出了二项分布的泊松 逼近,那么更一般的近似计算方案又是怎样呢?
概率论与数理统计魏宗舒第二章(4)

若
i , j =1
∑ g( x , y ) p
i j
∞
ij
绝对收敛,则有
i , j =1
E (Z ) =
∑ g(x , y ) p .
i j ij
∞
数学期望的性质 则有 (1)设 C 为常数,
E(C) = C
(2)设 C 为常数,X 是一个随机变量,则有
E(CX ) = CE( X )
则有 (3)设 a , b 为常数,X ,Y 是随机变量,
E( XY ) = E( X )E(Y )
推广 设 X i ( i = 1 , 2 ,L , n) 是相互独立的 随机变量, 则有
E( X1 X2 LXn ) = E( X1 )E( X2 )LE( Xn )
§2.5 方差的定义和性质
方差( 方差(Variance) ) 前面我们介绍了随机变量的数学期望,它 体现了随机变量取值的平均水平,是随机变量 的一个重要的数字特征。 但对有些实际问题,仅仅知道平均值是不 够的。
k
k
这就是通常所说的加权平均(概率为权数)。 加权平均(概率为权数) 加权平均
他们的射击水平 例2 甲、乙两人射击, 由下表给出 X :甲击中的环数 Y :乙击中的环数
X P
8 9 10 0.1 0.3 0.6
Y P
8 9 10 0.2 0.5 0.3
试问哪个人的射击水平较高?
解:甲、乙二人的平均射击环数为
我们讨论了随机变量 在前面的课程中, 如果知道了随机变量 X 的概率分 及其分布, 布,那么 X 的全部概率特征也就知道了。 在实际问题中,概率分布一般是 然而, 而在一些实际应用中,人们并 较难确定的。 只要 不需要知道随机变量的一切概率性质, 知道它的某些数字特征就够了。 在对随机变量的研究中,确定某 因此, 些数字特征 数字特征是非常重要的。 数字特征
第五章 中心极限及大数定理《概率论与数理统计》西南交大峨眉校区剖析

A 在每次试验中发生的概率为 p ,则对任意正数 ,有
lim
n
P(
fn (A)
p
)
1,
即 fn ( A) P p P(A) ( n )。
(5.3)
伯努利大数定理说明,在 n 时,随机事件 A 发 生 的 频 率 fn ( A) 依 概 率 收 敛 于 事 件 A 发 生 的 概 率
P(8 Y
2) P( Y EY
5) P( Y EY
5)
1
DY 52
1 8 17 25 25
例 3:进行 100 次重复独立试验,事件 A 在每次试验中发生的概率为 0.5 ,试利用切比雪夫 不等式估计 100 次试验中事件 A 发生的次数在 40 至 60 次之间的概率。
解:设随机变量 X 表示 100 次重复独立试验中事件 A 发生的次数,则 X ~ B(100, 0.5) ,
2.依概率收敛
定义 1:设 X1, , Xn, 是一个随机变量序列,如果对于任意的正数 ,
事件 Xn a 的概率当 n 时趋于 1,即
lim P
n
Xn a
1
则称随机变量序列Xn 当 n 时依概率收敛于数 a ,
记为 X n P a ( n )。
二、大数定理
大数定理是由“频率稳定于概率”这个概率的统计定义引申而来, 它叙述在什么条件下随机变量序列的算术平均值收敛于其均值的 算术平均值。 所谓“大数”,就是指涉及大量数目的观测,它表明定理中所指 的现象,只有在大量次数的试验和观测之下才能成立
,试验证随机变量序列 X1,
, Xn,
满足
(精品) 概率论与数理统计课件:随机变量的数字特征

D( ) E E 2 E E 2
D D
性质4可以推广到如下情形。
当1,
2
,,
两两独立时,有
n
n
D(1 2 n ) Di i 1
一般地,对n个随机变量1、
随机变量的数字特征
▪数学期望 ▪方差 ▪协方差与相关系数 ▪矩 ▪条件数学期望
§5.1 数学期望
离散型随机变量的数学期望
设随机变量的分布律为 P( xk ) pk
则当
k
xk
pk
时,称
xk pk 为随机变
k
量的数学期望或均值,记作E ,即有
E xk pk xk P( xk )
k
k
例1 甲、乙两射手的稳定成绩分别为
并且有 Ei 0 1 p 1 p p
设 1 2 n
则 E E1 2 n
E1 E2 En
np
此外,我们可以推导出 η~B(n,p)
超几何分布
在一箱N件装的产品中混进了M件次品,今从中抽 取n 件 (n≤M) ,求从中查出次品的件数的概率分布.
解
P(
k)
C C k nk M NM CNn
p p2 p1 p
p 1 p 2 1 24
例5 设随机变量ξ服从[a,b]上的均匀分布,
求Dξ。
解:(x)
1 ba
0
a xb 其他
E 2 b x2 dx 1 (a2 ab b2 )
a ba 3
而E a b
2
D E 2 (E )2 1 (b a)2
12
例6
设随机变量ξ服从正态分布N(a,σ2),求Dξ。
指数分布 (参数为a)
np
λ
1 p
概率论与数理统计学1至7章课后答案

第五章作业题解5.1 已知正常男性成人每毫升的血液中含白细胞平均数是7300, 标准差是700. 使用切比雪夫不等式估计正常男性成人每毫升血液中含白细胞数在5200到9400之间的概率.解:设每毫升血液中含白细胞数为,依题意得,7300)(==X E μ,700)(==X Var σ 由切比雪夫不等式,得)2100|7300(|)94005200(<-=<<X P X P982100700112222=-=-≥εσ.5.2 设随机变量X 服从参数为λ的泊松分布, 使用切比雪夫不等式证明 1{02}P X λλλ-<<≥. 解:因为)(~λP X ,所以λμ==)(X E 。
λσ==)(2X Var 故由切比雪夫不等式,得)|(|)20(λλλ<-=<<X P X P λλλλεσ111222-=-=-≥不等式得证.5.3 设由机器包装的每包大米的重量是一个随机变量, 期望是10千克, 方差是0.1千克2. 求100袋这种大米的总重量在990至1010千克之间的概率.解:设第i 袋大米的重量为X i ,(i =1,2,…,100),则100袋大米的总重量为∑==1001i i X X 。
因为 10)(=i X E ,1.0)(=i X Var ,所以 100010100)(=⨯=X E ,101.0100)(=⨯=X Var 由中心极限定理知,101000-X 近似服从)1,0(N故 )10|1000(|)1010990(<-=<<X P X P1)10(2)10|101000(|-Φ≈<-=X P998.01999.021)16.3(2=-⨯=-Φ=5.4 一加法器同时收到20个噪声电压,(1,2,,20)i V i = ,设它们是相互独立的随机变量,并且都服从区间[0,10]上的均匀分布。
记201k k V V ==∑,求(105)P V >的近似值。
概率论与数理统计5.1大数定律

即
1 n lim P X i ò 1. n n i 1
证明超本课程范围,略,详见魏宗舒的教材。 定律的含义:观测量X在相同的条件下重复观测n 次,当n充分大时,“观测值的算术平均值接近 于期望”是一大概率事件。 以任意大的把握用观测值 1 n 的算术平均值近似期望。 xi 依概率收敛于 n i 1 1 n 即n充分大时, x xi n i 1 9
2
n
1.
6
说明大量随机试验的平均具有稳定性.
2). 一般情形 定理 设随机变量列 { X n }相互独立,且均具有 数学期望, 且方差有界,即 D( X n ) C, n 1, 2,..., 则 ò 0, 有 1 n 1 n lim P X i E ( X i ) ò 1. n n i 1 n i 1
成立,则称 X n 服从大数定律。
随机变量列前若干项的算术平均依概率收敛于某 数列。
4
切比雪夫(Chebyshev)不等式
设随机变量X具有有限数学期望EX和方差DX,则 对于任意正数
,如下不等式成立。
DX
P X EX
2
——切比雪夫不等式
5
2. 切比雪夫定理
1). 特殊情形 定理5.1 设随机变量列 { X n }相互独立,且具有相 同的数学期望和方差, E( X n ) , D( X n ) 2 , n 1, 2,...,
A发生的频率代替概率的理论依据.
前面介绍的大数定律要求各随机变量方差存在。
8
于 ò 0, 有
4. 辛钦大数定律(样本平均数稳定性) 定理 设随机变量X1,X2,…,Xn,„相互独
概率论与数理统计 第三版 第五章 大数定律和中心极限定理

依概率收敛的序列还有以下性质: 设 X n p a, Yn pb, 且函数 g(x,y) 在点 (a,b)连续,
具有数学期望 E(X ) 和方差 D(X ) , 0 ,有
P{
X
E
(
X
)
≥
}≤
D(
X
2
)
,
或
P{ X E(X ) }≥1 D(X ) .
2
上页 下页 返回
证 以连续型随机变量X为例.
P{ X E( X ) ≥} f (x)dx x E ( X ) ≥
≤ x E ( X ) ≥
x E(X ) 2
E(
X
k
)
,D(
X
k
)
2
(k
1,2,
上页
,
n).
下页
返回
则对任意的ε>0, 有
1
lim P{ n n
n
Xk
k 1
}1
证 由于
lim P X 1.
n
E
1 n
n k 1
X
k
1 n
n k 1
E(X
k
)
1 n
n
,
D
1 n
n k 1
Xk
1 n2
n
D
k 1
XK
1 n2
n
2
2
n
,
上页 下页 返回
由切比雪夫不等式知
P
1 n
n
Xk
k 1
≥1
2
n
2
.
令n , 并注意到概率不能大于1, 即得
1
lim
n
P
陈国华等主编概率论与数理统计第五章习题解答

x>0 x≤0
(α > 0, β > 0)
a a 1 1 1 dx = ∫ cos(tx) ⋅ dx + ∫ sin(tx) ⋅ dx −a −a −a 2a 2a 2a 1 1 1 = ⋅ sin(tx) |a sin(at ) x =− a = at 2a t t −1 (2)参数为 λ 的指数分布的特征函数为, φ X (t ) = (1 − i ) ,参数为 λ 的指数分布可看做
1
π (1 + x 2 )
(−∞ < x < +∞) ;
⎧A ⎪ (D) X i 的概率函数为 : g ( x) = ⎨ x 3 ⎪0 ⎩
x ≥1 x <1
(i = 1,2,3, ) .
答案:CABAD 三.解答题
1.一颗骰子连续掷 4 次,点数总和记为 X ,估计 p (10 < X < 18) .
3.已知随机变量 X 的数学期望为 10,方差 DX 存在且 P (−20 < X < 40) ≤ 0.1 ,则
DX ≥ . 4.设 X 1 , X 2 , , X n, 为独立同分布的随机变量序列,且 X i (i = 1,2, ) 服从参数为 2 的
指数分布,则 n → ∞ 当时, Yn =
1 n 2 ∑ X i 依概率收敛于 n i =1
1 1 ln n + ln n = 0 2 2
n
DX n = EX n = ln n
n 1 1 D ( Xi) = 2 ∑ 2 n n i =1
2
∑ ln i → 0(n → ∞)
i =1
根据马尔可夫大数定律, {X n } 服从大数定律。
3 、 已 知 随 机 变 量 X 和 Y 的 数 学 期 望 、 方 差 以 及 相 关 系 数 分 别 为 E ( X ) = E (Y ) = 2 ,
概率论与数理统计第5章作业题解

第五章作业题解5.1 已知正常男性成人每毫升的血液中含白细胞平均数是7300, 标准差是700. 使用切比雪 夫不等式估计正常男性成人每毫升血液中含白细胞数在5200到9400之间的概率.解:设每毫升血液中含白细胞数为,依题意得,7300)(==X E μ,700)(==X Var σ由切比雪夫不等式,得)2100|7300(|)94005200(<-=<<X P X P982100700112222=-=-≥εσ.5.2 设随机变量X 服从参数为λ的泊松分布, 使用切比雪夫不等式证明1{02}P X λλλ-<<≥.解:因为)(~λP X ,所以λμ==)(X E 。
λσ==)(2X Var故由切比雪夫不等式,得)|(|)20(λλλ<-=<<X P X P λλλλεσ111222-=-=-≥不等式得证.5.3 设由机器包装的每包大米的重量是一个随机变量, 期望是10千克, 方差是0.1千克2. 求100袋这种大米的总重量在990至1010千克之间的概率.解:设第i 袋大米的重量为X i ,(i =1,2,…,100),则100袋大米的总重量为∑==1001i i X X 。
因为 10)(=i X E ,1.0)(=i X Var ,所以 100010100)(=⨯=X E ,101.0100)(=⨯=X Var由中心极限定理知,101000-X 近似服从)1,0(N故 )10|1000(|)1010990(<-=<<X P X P1)10(2)10|101000(|-Φ≈<-=X P998.01999.021)16.3(2=-⨯=-Φ=5.4 一加法器同时收到20个噪声电压,(1,2,,20)i V i = ,设它们是相互独立的随机变量,并且都服从区间[0,10]上的均匀分布。
记201kk V V==∑,求(105)P V >的近似值。
浙江大学概率论与数理统计盛骤第四版数理统计部分

为什么?
答:只有(4)不是统计量。
17
随机变量独立性的两个定理
定理6.1:设X1, X 2 , , X n是相互独立的n个随机变量,
又设y gi x1, , xni , x1, , xni Rni , i 1, 2, k是k个连续函数,
且有n1 n2 nk n, 则k个随机变量:
[说明]:后面提到的样本均指简单随机样本,由概率论知,若总体X 具有概率密度f(x),
则样本(X1,X2,…,Xn)具有联合密度函数:
n
fn x1, x2, xn f xi
i 1
16
统计量:样本的不含任何未知参数的函数。
常用统计量:设(X1,X2,…,Xn)为取自总体X的样本
1.
样本均值
n
Yn x
lim P i1 n
n
x
x
证明略。
1
t2
e 2 dt
2
此定理表明,当n充分大时,Yn近似服从N 0,1.
n
即: X(i 近似)~N (n, n 2 ), i=1
从而,P(a
n i 1
Xi
b)
(b n ) ( a n ).
n
n
答案:N (, 2 )
n
9
定理5.5 德莫佛--拉普拉斯定理
解:设机器出故障的台数为X,则X b400,0.02,分别用三种方法计算:
1. 用二项分布计算
P X 2 1 P X 0 P X 1 1 0.98400 4000.020.98399 0.9972
2. 用泊松分布近似计算
np 400 0.02 8 查表得
P X 2 1 P X 0 P X 1 1 0.000335 0.002684 0.9969
概率论与数理统计 切比雪夫不等式和大数定律

3、定理5.3(辛钦定理): 设随机变量 X1 ,X2 , … , Xn , … 相互独立 , 服从 同一分布, 具有数学期望
E( Xk ) = (k = 1, 2,L ) ,
则对于任意正数 ε , 有
lim P n
1 n
n k =1
Xk
=1
.
伯努利大数定律是辛钦定理的特殊情况 . 在实际
问题的处理中辛钦定理十分有用也很重要 .
事实上, 由辛钦定理可知, 如果随机变量
X1 ,X2 , … , Xn … 相互独立, 服从同一分布且具有数
学期望 μ , 则前 n 个随机变量的算术平均值
依概率收敛于它们的数学期望 μ .
1 n
n
= lim P n
1n n k=1 X k
=
1
.
证 由于
E( 1 n
n k =1
Xk )
=
1 n
n k =1
E(Xk )
=
1 gn
n
=
D( 1 n
n k =1
Xk )
=
1 n2
n k =1
D( Xk )
=
1 gn 2
n2
=
12
n
由切比雪夫不等式, 得
= P X 7300 2100
1 7002 = 1 1 = 8
21002
99
注 切比雪夫不等式虽然不能准确地求出某事件 的概率, 只是给出一个估计值, 但这在实际 问题的处理中仍然十分有用 .
概率论与数理统计教程(魏宗舒第二版)5-6章答案_split_1

说明:本习题答案是针对魏宗舒编写的《概率论与数理统计教程》(第二版).5.1设(x l ,x 2,···,x n )及(u 1,u 2,···,u n )为两组子样的观测值,它们有如下关系:u i =x i −ab,(b =0,a 为常数)求子样均值¯u 与¯x ,子样方差S 2u 与S 2x 的关系.解:¯u =1n n ∑︁i =1u i =1n n ∑︁i =1x i −a b =1b (︃1n n ∑︁i =1x i −a )︃=1b(¯x −a )S 2u=1n n ∑︁i =1(u i −¯u )2=1n n ∑︁i =1(︂x i −a b −¯x −a b )︂2=1b 2[︃1n n ∑︁i =1(x i −¯x )2]︃=1b2S 2x.5.2若子样观测值x 1,x 2,···,x m 的频数分别为n 1,n 2,···,n m ,试写出计算子样平均数¯x 和子样方差S 2n 的公式(这里n =n 1+n 2+···+n m )解:¯x =1n m∑︁i =1m i x iS 2n=1n m∑︁i =1m i (x i −¯x )2.5.3利用切比雪夫不等式求钱币需抛掷多少次才能使子样均值¯ξ落在0.4到0.6之间的概率至少为0.9?如何才能更精确地计算是概率接近0.9所需要的次数是多少?解:设需要掷n 次,E ¯ξ=0.5,D (¯ξ)=14n.由切比雪夫不等式可得:P (0.4≤¯ξ≤0.6)=P (|¯ξ−0.5|≤0.1)≥1−14n ×(0.1)2=1−25n≥0.9⇒n ≥250.所以由切比雪夫不等式估计,至少需要掷250次才能使样本均值落在0.4到0.6之间的概率至少为0.9.¯ξ−0.5√︀1/(4n )=2√n (¯ξ−0.5)近似服从标准正态分布,所以P (0.4≤¯ξ≤0.6)=P (︀2√n (0.4−0.5)≤2√n (¯ξ−0.5)≤2√n (0.6−0.5))︀=2Φ(2√n ×0.1)−1≥0.9⇒Φ(0.2√n )≥0.95.其中Φ(x )是标准正态分布N (0,1)的分布函数,查表可得Φ(1.645)=0.95.因此0.2√n =1.647⇒n =67.65,因此至少要掷68次硬币.5.4若一母体ξ的方差σ2=4,而¯ξ是容量为100的子样的均值.分别利用切比雪夫不等式和极限定理求出一个下界,使得¯ξ−μ(μ为母体ξ的数学期望Eξ)夹在这界限之间的概率为0.9.解:设P (|¯ξ−μ|≤a )≥0.9.注意到母体的数学期望为μ,方差为σ2.所以E ¯ξ=μ,D ¯ξ=σ2/n =125.由切比雪夫不等式可知:P (|¯ξ−μ|≤a )≥1−D ¯ξa 2=1−125a2≥0.90⇒1/(25a 2)≤0.1⇒a ≥0.4.故由切比雪夫不等式得到的界限是0.4.根据大数定律可知¯ξ−μ√︀1/25=5(¯ξ−μ)近似服从标准正态分布,所以P (|¯ξ−μ|≤a )=P (5(¯ξ−μ)≤5a )=2Φ(5a )−1≥0.9⇒Φ(5a )≥0.95⇒5a ≥1.645⇒a ≥0.329.由大数定律得到的界限是0.329.5.5假定¯ξ1和¯ξ2分别是取自正态总体N(μ,σ2)的容量为n的两个独立子样(ξ11,ξ12,···,ξ1n)和(ξ21,ξ22,···,ξ2n)的均值,确定n使得两个子样均值之差超过σ的概率大约为0.01.解:由题意可知¯ξi∼N(μ,σ2/n),i=1,2,并且¯ξ1,¯ξ2相互独立.因此¯ξ1−¯ξ1∼N(0,2σ2/n),即√n¯ξ1−¯ξ2√2σ∼N(0,1).由P(|¯ξ1−¯ξ2|>σ)=0.01可得:P(√n⃒⃒⃒⃒¯ξ1−¯ξ2√2σ⃒⃒⃒⃒>√nσ√2σ)=0.01⇒P(√n⃒⃒⃒⃒¯ξ1−¯ξ2√2σ⃒⃒⃒⃒>√︂n2)=0.01⇒2(1−Φ(√︀n/2))=0.01⇒√︀n/2=2.576⇒n=13.27.所以当n=13时,可使得两个子样均值之差超过σ个概率大约为0.01.5.6设母体ξ∼N(μ,4),(ξ1,ξ2,···,ξn)是取自此母体的一个子样,¯ξ为子样均值.试问:子样容量n应取多大,才能使(1)E(|¯ξ−μ|2)≤0.1;(2)E(|¯ξ−μ|)≤0.1;(3)P(|¯ξ−μ|≤0.1)≥0.95.解:由题意可知√n2(¯ξ−μ)∼N(0,1).设η∼N(0,1),那么E(|η|2)=∫︁∞−∞1√2π|x|2e−12x2dx=2∫︁∞−∞1√2πx2e−12x2dx=Eη2=Dη+(Eη)2=1;E(|η|)=∫︁∞−∞1√2π|x|e−12x2dx=2∫︁∞1√2πxe−12x2dx=−2√2πe−12x2⃒⃒⃒∞=√︂2π.(1).E(|¯ξ−μ|2)=4nE⃒⃒⃒⃒√n2(¯ξ−μ)⃒⃒⃒⃒2=4n≤0.1⇒n≥40.所以当n取40时,可以使得E(|¯ξ−μ|2)≤0.1.(2).E(|¯ξ−μ|)=2√nE⃒⃒⃒⃒√n2(¯ξ−μ)⃒⃒⃒⃒=2√n√︂2π≤0.1⇒n≥800π.(3).P(|¯ξ−μ|≤0.1)=P(|√n2(¯ξ−μ)|≤0.1√n2)≥0.95⇒2Φ(0.1√n2)−1≥0.95⇒Φ(0.1√n2)≥0.975⇒0.1√n2≥1.96⇒n≥39.22=1536.6.即当n≥1537时,才能使P(|¯ξ−μ|≤0.1)≥0.95.5.7设母体ξ∼b(1,p)(二点分布),(ξ1,ξ2,···,ξn)为取自此母体的一个子样,¯ξ为子样均值.(1).若p=0.2,子样容量n应取多大,才能使①P(|¯ξ−p|≤0.1)≥0.75;②E(|¯ξ−p|2)≤0.01.(2).若p ∈(0,1)为未知数,则对每个p ,子样容量n 为多大时才能使E (|¯ξ−p |2)≤0.01.解:记q =1−p ,则√n (¯ξ−p )近似服从正态分布N (0,pq ).(1).P (|¯ξ−p |≤0.1)=P (⃒⃒√n (¯ξ−p )/√pq ⃒⃒≤0.1√n √pq )≈2Φ(︂0.1√n √pq)︂−1所以由P (|¯ξ−p |≤0.1)≥0.75可得Φ(︂0.1√n √pq)︂≥0.875.查表得Φ(1.15)=0.875,因此0.1√n/√pq ≥1.15⇒n ≥11.52×pq =21.16,即当n ≥22时,才能保证P (|¯ξ−p |≤0.1)≥0.75.②.E (|¯ξ−p |2)=E (¯ξ−p )2=E (¯ξ−E ¯ξ)2=D ¯ξ=Dξ/n =pq/n =0.16/p .所以要使E (|¯ξ−p |2)≤0.01,只需0.16n≤0.01⇒n ≥0.160.01=16,故只有当n ≥16,才能使E (|¯ξ−p |2)≤0.01.(2).类似于(1)中的②,E (|¯ξ−p |2)=D ¯ξ=p (1−p )n.因此要使E (|¯ξ−p |2)≤0.01,子样容量n 必须≥p (1−p )0.01=100p (1−p ).5.8设母体ξ的k 阶原点矩和中心矩分别为v k =Eξk ,μk =E (ξ−v 1)k ,k =1,2,3,4.ξk ,m k 分别为容量为n 的子样k 阶原点矩和中心矩,求证:∙E (¯ξ−v 1)3=μ3n 2;∙E (¯ξ−v 1)4=3μ2n 2+μ4−3μ22n3.解:令η=ξ−v 1=ξ−Eξ,ηi =ξi −v 1,那么η1,η2,···,ηn 就是来自总体η的子样,并且Eηki =Eηk =E (ξ−v 1)k =μk .令¯η=1n ∑︀n i =1ηi ,那么¯η=¯ξ−v 1.所以(1)E (¯ξ−v 1)3=E ¯η3=1n3∑︁i,j,kEηi ηj ηk =1n 3⎛⎜⎝n ∑︁i =1Eη3i +∑︁i,j,k 不全相等Eηi ηj ηk ⎞⎟⎠=1n 3⎛⎝nμ3+3∑︁i =j,i =kEηi (ηj ηk )⎞⎠=1n 2μ3+3n 3∑︁i =j,i =kEηi E (ηj ηk )=μ3n 2(2)E (¯ξ−v 1)4=E ¯η4=1n4∑︁i,j,k,lEηi ηj ηk ηl=1n 4⎛⎝n ∑︁i =1Eη4i +∑︁i =j =k =lEη2i η2k +∑︁i =k =j =lEη2i η2j +∑︁i =l =k =jEη2i η2j +E∑︁elseηi ηj ηk ηl ⎞⎠=1n 4(︀nμ4+3n (n −1)μ22)︀=3(n −1)μ22n 3+μ4n 3=μ4−3μ22n 3+3μ22n2其中对i,j,k,l 求和时,把这四个下标分成三类,一类是i =j =k =l ,第二类是这四个下标分成两组,在同组中的下标都相等,其余的分在第三类.注意在第三类中,我们肯定可以找到一个下边,它和其余三个下标都不同,此时Eηi ηj ηk ηl =0,这因为,比如i 不等于其余三个下标,那么Eηi ηj ηk ηl =Eηi Eηj ηk ηl ,而Eξi =0.5.9.设母体ξ∼N (μ,σ2),子样方差S 2n =1n ∑︀n i =1(ξi −¯ξ)2.求ES 2n ,DS 2n ,并证明当n 增大时,他们分别为σ2+o (1n )和2σ4n +o (︀1n )︀.解:ES 2n =(n −1)σ2n=σ2−1nσ2=σ2+o (1).(注:习题中有错误,不是o (1n ),1n 的高阶无穷小,而是o (1),即无穷小.)对于后一问,只需利用P 233的定理5.1,我们在这里这需计算μ2,μ4.μ2=Dξ=σ2,μ4=E (ξ−μ)4=∫︁∞−∞(x −μ)4p ξ(x )dx =∫︁∞−∞x 41√2πσexp {︂−12x 2σ2}︂dx =∫︁∞−∞x 31√2πσexp {︂−12x 2σ2}︂dx 22=−x 3σ√2πexp {︂−12x 2σ2}︂⃒⃒⃒∞−∞+3σ2∫︁∞−∞x 21√2πσexp {︂−12x 2σ2}︂dx=3σ4.把μ2,μ4的结果带入定理5.1,可知:DS 2n=σ4[︀2n−2n 2]︀=2σ4n+o (︀1n )︀.实际上,我们也可以这样计算:令随机变量η∼χ2(n ),那么Eη=∫︁∞0x 12n 2Γ(n 2)x n 2−1e −12x dx =2n +22Γ(n +22)2n 2Γ(n 2)=n Eη2=∫︁∞x 212n 2Γ(n 2)x n 2−1e −12x dx =n (n +2).因此Eη=n,Dη=2n .从以上可知:D (S 2n )=σ4n2D (︂nS 2n σ2)︂=2(n −1)σ4n 2=2σ2n+o(︂1n)︂.5.10设(ξ1,ξ2)为取自正态母体ξ∼N (0,σ2)的一个子样,试证:(1).ξ1+ξ2与ξ1−ξ2是相互独立的;(2).(ξ1+ξ2)2(ξ1−ξ2)2服从F (1,1)分布.解:(ξ1,ξ2)是ξ∼N (μ,σ2)的子样,从而ξ*=[︃ξ1ξ2]︃∼N(︃[︃μμ]︃,σ2I 2)︃,其中I 2表示二阶单位矩阵.那么η=[︃η1η2]︃=[︃111−1]︃ξ* Bξ*∼N (︃B [︃μμ]︃,σ2BI 2B ′)︃,即η∼N (︃[2μ,0]′,[︃2002]︃)︃.因此可知η1,η2即ξ1+ξ2,ξ1−ξ2相互独立,且分别有分布N (2μ,2),N (0,2).5.11设母体的分布函数为F (x ),(ξ1,ξ2,···,ξn )是取自该母体的一个字样.若F (x )的二阶矩存在,¯ξ为字样均值,试证(ξi −¯ξ)与(ξj −¯ξ)的相关系数为ρ=−1n −1,i =j =1,2,···,n .解:方法一:由相关系数的定义,我们先计算Cov(ξi −¯ξ,ξj −¯ξ)和D (ξi −¯ξ)=D (ξj −¯ξ).记总体ξ的期望为μ,方差为σ2.令ηi =ξi −μ,i =1,2,···,n ,那么Eηi =0,Eηi ηj =0,i =j,Eη2i=σ2.从而可知:Cov(ξi −¯ξ,ξj −¯ξ)=Cov(ηi −¯η,ηj −¯η)=Cov(ηi ,ηj )−2Cov(ηi ,¯η)+Cov(¯η,¯η)=0−2Cov(ηi ,1n ηi )+σ2/n =−1n σ2.D (ξi −¯ξ)=D (ηi −¯η)=Cov(ηi −¯η,ηi −¯η)=D (ηi )−2Cov(ηi ,¯η)+D ¯η=σ2−2Cov(ηi ,1n ηi )+σ2/n =n −1nσ2.所以ξi −¯ξ,ξj −¯ξ的相关系数为−σ2/n√︂n −1n σ2n −1nσ2=−1n −1,i =j.方法二:首先由ξ1,ξ2,···,ξn 的独立性可知:D (ξ−¯ξ)=D (n −1n ξi −1n∑︁j =iξj )=(︂n −1n )︂2Dξi +1n2∑︁j =iDξj=σ2(︃(︂n −1n )︂2+n −1n 2)︃=n −1nσ2.由对称性可知对任意的i =j ,Cov(ξi ,ξj )=Cov(ξ1,ξ2) c .同时注意到∑︀n i =1(ξi −¯ξ)=0,所以=D (n ∑︁i =1(ξi −¯ξ))=n ∑︁i =1D (ξi −¯ξ)+∑︁i =jCov(ξi −¯ξ,ξj −¯ξ)=(n −1)σ2+n (n −1)c⇒c =−n −1n (n −1)σ2=−1nσ2.因此Cov(ξi −¯ξ,ξj −¯ξ)=−1n σ2n −1nσ2=−1n −1.5.12设¯ξn ,S 2n 分别是子样(ξ1,ξ2,···,ξn )的子样均值和子样方差,现又获得第n +1个观测值,试证:(1).¯ξ=¯ξn +1n +1(ξn +1−¯ξn );(2).S 2n +1=n n +1[︁S 2n +1n +1(ξn +1−¯ξn )2]︁.解:(1).¯ξn +1=1n +1n +1∑︁i =1ξi =1n +1ξn +1+n n +11n n∑︁i =1ξi=1n +1ξn +1+n n +1¯ξn =1n +1(ξn +1−¯ξn )+¯ξn .S2n+1=1n+1n+1∑︁i=1ξ2i−¯ξ2n+1=nn+1(1nn∑︁i=1ξ2−¯ξ2n)+nn+1¯ξ2n+1n+1ξ2n+1−(︃¯ξ2n+2n+1¯ξn(ξn+1−¯ξn)+(︂1n+1)︂2(ξn+1−¯ξn)2)︃=nn+1S2n+1n+1[︀ξ2n+1−2ξn+1¯ξn+¯ξn]︀−1(n+1)2(ξn+1−¯ξn)2=nn+1[︂S2n+1n+1(ξn+1−¯ξn)2]︂.5.13从装有一个白球、两个黑球的罐子里有放回地取球.令ξ=0表示取到白球,ξ=1表示取到黑球.求容量为5的子样均值和子样方差的期望值.解:实际上,我们知道E¯ξ=Eξ,ES2n =n−1nDξ,所以我们只需计算出总体的期望和方差.由题意可知总体ξ有分布列ξ01P132 3那么Eξ=23,Dξ=1323=29,因此E¯ξ=23,ES2n=2(n−1)9n.习题5.14设母体ξ服从参数为λ的泊松分布,(ξ1,ξ2,···,ξn)是取自此母体的一个子样.求(1).子样的联合概率分布列;(2).子样均值¯ξ的分布列、E¯ξ、D(¯ξ)和ES2n.解:因为ξ1,ξ2,···,ξn是总体ξ∼P(λ)的子样,所以ξ1,ξ2,···,ξn独立同分布,且均服从参数为λ的泊松分布.故(1)子样的联合分布列为P(ξ1=x1,ξ2=x2,···,ξn=x n)=n∏︁i=1P(ξi=x i)=n∏︁i=1λx ix i!e−λ=λ∑︀ni=1x i e−nλ(︃n∏︁i=1x i!)︃−1.x i=0,1,2,···,i=1,2,···,n.(2).回顾78页例2.12,该例题说明两个相互独立的泊松分布P(λ1),P(λ2)的和服从泊松分布P(λ1+λ2),因此在本题中n∑︁i=1ξi∼P(nλ)所以¯ξ的分布列为:P(¯ξ=kn)=P(n∑︁i=1ξi=k)(nλ)kk!e−nλ.因为总体的期望和方差都是λ,因此E¯ξ=Eξ=λ,D¯ξ=Dξn=λn,ES2n=n−1nDξ=(n−1)λn.5.15设ξ1,ξ2,···,ξn是取自正态母体N(μ,σ2)的子样,求u=k∑︀i=1ξi和v=∑︀ni=rξi,0<k<r<n的联合分布列.解:由于k<r,所以u,v相互独立.又因为ξ1,ξ2,···,ξn独立同分布,均服从N(μ,σ2)分布,而u,v都是ξ1,ξ2,···,ξn的线性组合,故u,v也都服从正态分布.又Eu=k∑︁i=1Eξi=kμ,Du=k∑︁i=1Dξi=kσ2,Ev=n∑︁i=rEξi=(n−r+1)μ,Dv=n∑︁i=rDξi=(n−r+1)σ2,所以u,v 的联合分布为二维正态分布N (kμ,(n −r +1)μ,kσ2,(n −r +1)σ2,0).5.16设母体η=(ξ1,ξ2)∼N (μ1,μ2,σ21,σ22,ρ),(η1,η2,···,ηn )是取自此母体的一个子样,求子样均值¯η=(¯ξ1,¯ξ2)=(︂1nn ∑︀i =1ξ1i ,1n n∑︀i =1ξ2i )︂的分布密度函数.解:首先可知¯η服从二维正态分布.又ηi ∼N (μ1,μ2,σ21,σ22,ρ),所以Eξ1i =μ1,Eξ2=μ2,Dξ1i =σ21,Dξ2i =σ22,Cov(ξ1i ,ξ2i )=ρσ1σ2.又因为当i =j 时,ηi ,ηj 相互独立,故Cov(ξ1i ,ξ2j )=0.这样我们就有如下结果:E ¯ξ1=1n n∑︁i =1Eξ1i =μ1;E ¯ξ2=1n n∑︁i =1Eξ2i =μ2;D ¯ξ1=1n 2n ∑︁i =1Dξ1i=1n σ21;D ¯ξ2=1n 2n ∑︁i =1Dξ2i=1n σ22;Cov(¯ξ1,¯ξ2)=1n 2Cov(n ∑︁i =1ξ1i ,n ∑︁i =1ξ2i )=1n 2∑︁i,jCov(ξ1i ,ξ2j )=1n 2∑︁i Cov(ξ1i ,ξ2i)=ρσ1σ2n.并且¯ξ1,¯ξ2的相关系数为Cov(¯ξ1,¯ξ2√︀[D ¯ξ1][D ¯ξ2]=ρσ1σ2/n √︀(σ21/n )(σ22/n )=ρ.由以上结论可知¯η∼N (μ1,μ2,σ21/n,σ22/n,ρ),其密度函数为:n2πσ1σ2√︀1−ρ2exp {︂−n 2(1−ρ2)[︂(x −μ1)2σ21−2ρ(x −μ1)(y −μ2)σ1σ2+(y −mu 2)2σ22]︂}︂.5.17设母体的分布列为P (ξ=k )=1N ,k =1,2,···,N .现进行不放回抽样,¯ξ¯ξ为子样(ξ1,ξ2,···,ξn )的均值,试求E ¯ξ和D (¯ξ).解:由题意可知,母体中共有N 个个体,且取到每个个体的概率是一样的.从母体中不放回的抽样,第i 次抽到第k 个个体的概率为1/N .故ξi 也有分布列P (ξi =k )=1N ,k =1,2,···,N ,即和母体有相同的分布列.所以Eξi =1N ∑︀N k =1k =N +12,Eξ2i =1N ∑︀N k =1k 2=(N +1)(2N +1)6,Dξi =N 2−112.由于抽样是不放回抽样,所以ξi ,ξj 不是相互独立的.它们有联合分布列P (ξi =k,ξj =l )={︃1N (N −1),k =l,0,k =l 由此可知:Eξi ξj=1N (N −1)∑︁k =lkl =(N +1)(3N +2)12;Cov(ξi ,ξj )=Eξi Eξj −Eξi Eξj =−N +112.所以D(ξ1+ξ2+···+ξn)=n∑︁k=1Dξk+2∑︁1≤k<l≤nCov(ξk,ξl)=n N2−112−n(n−1)N+112=n(N+1)(N−n)12;D(¯ξ)=1n2D(n∑︁i=1ξi)=(N+1)(N−n)12n;E¯ξ=1nn∑︁i=1Eξi=N+12.5.18设母体ξ∼N(0,1),ξ1,ξ2,ξ3为取自该母体的一个子样,在子样空间中求子样到原点的距离小于1个概率.解:由于ξi,i=1,2,3独立同分布,和母体有相同的分布,故ξ1,ξ2,ξ3的联合密度函数为:p(x,y,z)=1(2π)3/2exp{︂−12(x2+y2+z2)}︂.因此子样到原点的距离小于1的概率为p=P(ξ21+ξ22+ξ23<1)=∫︁∫︁∫︁x2+y2+z2<11(2π)3/2exp{︂−12(x2+y2+z2)}︂dxdydz.做变换⎧⎪⎨⎪⎩x=r cosθ1,y=r sinθ1cosθ2, z=r sinθ1sinθ2.变化的雅克比行列式为ð(x,y,z)ð(r,θ1,θ2)=r sinθ1.所以P=(2π)−3/2∫︁π0sinθ1dθ1∫︁2πdθ2∫︁1r2exp{︂−12r2}︂=√︂2π∫︁1r2exp{−r22}dr=√︂2π[︂−r exp{−r22}⃒⃒1+∫︁1exp{−r22}dr]︂=√︂2π[︂∫︁1exp{−r22}dr−e−12]︂=√︂2π[︂√2π∫︁11√2πexp{−r22}dr−e−12]︂=√︂2π[︁√2π(Φ(1)−Φ(0))−e−12]︁=2Φ(1)−1−√︂2πe−12.其中Φ(x)是标准正态分布的分布函数.或者如下计算P.P=(2π)−3/2∫︁1−1[︂e−x22∫︁y2+z2<1−x2e−12(y2+z2)dydz]︂dx=(2π)−3/2∫︁1−1[︃e−x22∫︁2πdθ∫︁√1−x2re−12r2dr]︃dx=(2π)−1/2∫︁1−1[︂e−x22(︂−e−12r2⃒⃒⃒√1−x2)︂]︂dx=(2π)−1/2∫︁1−1e−12x2[1−e−12(1−x2)]dx=∫︁1−11√2πe−12x2dx−1√2π∫︁1−1e−12dx=2Φ(1)−1−√︂2πe−12≈0.1987.又或者利用χ2分布.注意到ξ21+ξ22+ξ23∼χ2(3),所以P =P (ξ21+ξ22+ξ23<1)=∫︁10123/2Γ(32)x 32−1e −x 2dx =1√2π∫︁10x 12e −x 2dx.在上述积分中做变换x =t 2,可以得到和前面相同的结果.5.19设(ξ1,ξ2,···,ξn )为取自正态母体N (μ,σ2)的子样,S 2n 为子样方差,分别求满足下列各式的最小n 值.(1).P (︂S 2nσ2≤1.5)︂≥0.95.(2).P (︂|S 2n −σ2|≤12Σ)︂≥0.8.解:注意到nS2n σ2∼χ2(n −1).(1).P (︂S 2n σ2≤1.5)︂=P (︂nS 2n σ2≤1.5n )︂≥0.95,故1.5n ≥χ20.95(n −1).1.5×20<χ20.95(19),而1.5×21>χ20.95(20),所以最小的n 是21.(2).P (︂|S 2n −σ2|≤12σ2)︂=P (︁⃒⃒⃒nS 2n σ2−n ⃒⃒⃒≤n 2)︁=P (︁n 2≤ns 2nσ2≤3n 2)︁.所以我们要找的n 为使得P (︂n 2≤ns 2n σ2≤3n 2)︂≥0.8的最小的n .用软件计算可知此最小的n 为13.5.20子样(ξ1,ξ2,ξ3)来自正态母体N (0,1),又η1=0.8ξ1+0.6ξ2,η2=√2(0.3ξ1−0.4ξ2−0.5ξ3),η3=√2(0.3ξ1−0.4ξ2+0.5ξ3),求(η1,η2,η3)的联合分布密度及η1,η2,η3的边际密度.解:ξ1,ξ2,ξ3相互独立,且都服从分布N (0,1),所以(ξ1,ξ2,ξ3)的联合分布是三维正态分布.其期望为(0,0,0),协方差矩阵为三阶单位矩阵I 3.记A =⎛⎜⎝0.80.600.3√2−0.4√2−0.5√20.3√2−0.4√20.5√2⎞⎟⎠,那么可知(η1,η2,η3)′=A (ξ1,ξ2,ξ3)′,即(η1,η2,η3)′是(ξ1,ξ2,ξ3)的线性变换,所以(η1,η2,η3)′也服从正态分布,其期望,协方差矩阵分别为:E ⎛⎜⎝η1η2η3⎞⎟⎠=A ⎛⎜⎝000⎞⎟⎠=0,Cov ⎛⎜⎝η1η2η3⎞⎟⎠AI 3A ′=I 3.由于η1,η2,η3的协方差矩阵是单位矩阵,故可知ηi ,ηj 的相关系数为0,所以η1,η2,η3相互独立.又Eηi =0,Dηi =1,所以ηi sin N (0,1).5.21若ξ1,ξ2,···,ξn 相互独立且服从正态分布,它们的数学期望相等,方差各为σ21,σ22,···,σ2n ,证明:u =∑︀n i =1ξiσ2i∑︀ni =11σ2i与v =n ∑︁i =1(︂ξi −u σi)︂2是相互独立的,且u 服从正态分布,v 服从自由度为n 的χ2分布.解:因为ξi ,i =1,2,···,n 有相同的数学期望,不妨用μ表示其共同的数学期望.令ηi =ξiσi,i =1,2,···,n ,那么η1,η2,···,ηn 相互独立,都服从正态分布,且Dηi =1,Eηi =a/σi ,i =1,···,n ,这样可知η=(η1,η2,···,ηn )′的协方差矩阵为n 阶单位矩阵I n .记C=√︃n∑︀i=11σ2i,令矩阵A是正交矩阵,且其第一行为(1σ1,1σ2,···,1σn)/C.设ζ=⎛⎜⎜⎜⎜⎝ζ1ζ2...ζn⎞⎟⎟⎟⎟⎠=Aη=A⎛⎜⎜⎜⎜⎝η1η2...ηn⎞⎟⎟⎟⎟⎠那么(ζ1,ζ2,···,ζn)′服从多元正态分布,且其协方差矩阵为Cov(ζ)=A Cov(η)A′=AI n A′=AA′=I n.ζ的数学期望为Eζ=AEη=A ⎛⎜⎜⎜⎜⎝aσ1aσ2...aσn⎞⎟⎟⎟⎟⎠=a⎛⎜⎜⎜⎜⎜⎜⎝n∑︀i=11σ2i...⎞⎟⎟⎟⎟⎟⎟⎠=⎛⎜⎜⎜⎜⎝aC2...⎞⎟⎟⎟⎟⎠.这意味着ζ1,ζ2,···,ζn相互独立,且ζ1∼N(aC2,1),ζ2∼N(0,1),i=2,3,···,n.由于矩阵A的第一行为(1σ1,1σ2,···,1σn)/C,所以ζ1=1C(η1/σ1+η2/σ2+···+ηn/σn)=1C(ξ1/σ21+ξ2/σ22+···+ξn/σ2n)=Cu.由此可知u=1C ζ1∼N(a,1C2),即N(a,(︀∑︀ni=1σ2i)︀.又v=n∑︁i=1(︂ξi−uσi)︂2=n∑︁i=1(ηi−uσi)2=n∑︁i=1η2i−2un∑︁i=1ηi/σi+u2n∑︁i=11σ2i=η′η−2u(C2u)+C2u2=η′η−C2u2 =η′η−ζ21.其中利用了∑︀ni=1ηi/σi=∑︀ni=1ξiσ2i=C2u,ζ1=Cu.因为A是正交矩阵,且ζ=Aη,所以ζ′ζ=η′A′Aη=η′η.这样可知v=ζ′ζ−ζ21=ζ22+ζ23+···+ζ2n.综合以上所述,我们已经知道ζ1,ζ2,···,ζn,相互独立,且ζi∼N(0,1),i=2,3,···,n,u∼N(a,1/C2).所以u=Cζ1与v=ζ22+ζ23+···+ζ2n相互独立,且v∼χ2(n−1).注:v的自由度是n−1,不是n.5.22设母体ξ服从正态分布N(μ,σ2),¯ξ,S2n分别为容量为n的子样均值和子样方差,又设ξn+1∼N(μ,σ2)且与ξ1,ξ2,···,ξn相互独立.试求统计量ξn+1−¯ξS n √︂n−1n+1的抽样分布.解:由定理5.4知¯ξ与S2n相互独立,¯ξ∼N(μ,σ2/n),nS2nσ2∼χ2(n−1).ξn+1与ξ1,ξ2,···,ξn相互独立,故¯ξ与¯ξ,S2n独立.且ξn+1−¯ξ∼N(0,σ2+σ2n),即ξn+1−¯ξ∼N(0,n+1nσ2).ξn+1,¯ξ都与S2n相互独立,那么ξn+1−¯ξ与S2n独立,因此ξn+1−¯ξ√n+1n σ2√︂nS2nσ2⧸︁(n−1)∼t(n−1),即ξn+1−¯ξS n√︂n−1n+1∼t(n−1).5.23(ξi,ηi),i=1,2,···,n是取自二元正态分布N(μ1,μ2,σ21,σ22,ρ)的子样.设¯ξ=1nn∑︀i=1ξi,¯η=1nn∑︀i=1ηi,S2ξ=1n∑︀ni=1(ξi−¯ξ)2,S2η=1n∑︀ni=1(ηi−¯η)2和r=∑︀ni=1(ξi−¯ξ)(ηi−¯η)√︁∑︀ni=1(ξi−¯ξ)2∑︀ni=1(ηi−¯η)2.试求统计量¯ξ−¯η−(μ1−μ2)√︁S2ξ+S2η−2rSξSη√n−1.的分布.解:一般的我们称1nn∑︁i=1(ξi−¯ξ)(ηi−¯η)为样本协方差.而把r=∑︀ni=1(ξi−¯ξ)(ηi−¯η)√︁∑︀ni=1(ξi−¯ξ)2∑︀ni=1(ηi−¯η)2=样本协方差√︁S2ξS2η为样本相关系数.设[ξ1,η1]′,[ξ2,η2]′,···,[ξn,ηn]′是从总体[ξ,η]′∼N(μ1,μ2,σ21,σ22,ρ)取到的子样.S2ξ+S2η−2rSξSη=1n(︃n∑︁i=1(ξi−¯ξ)2+n∑︁i=1(ηi−¯η)2−2n∑︁i=1(ξi−¯ξ)(ηi−¯η))︃=1nn∑︁i=1[︀(ξi−ηi)−(¯ξ−¯η)]︀2.令ζi=ξi−ηi,i=1,2,···,n.那么ζ1,ζ2,···,ζn就可以看做是从总体ξ−η∼N(μ1−μ2,σ21+σ22−2ρσ1σ2)的子样.并且这个新子样的子样均值和子样方差分别为:¯ζ=1nn∑︁i=1(ξi−ηi)=¯ξ−¯ηS2=1nn∑︁i=1(ζi−¯ζ)2=1nn∑︁i=1[︀(ξi−ηi)−(¯ξ−¯η)]︀2=S2ξ+S2η−2rSξSη.因此√n−1(¯ξ−¯η)−(μ1−μ2)√︁S2ξ+S2η−2rSξSη∼t(n−1).5.23-2解:(1)因为函数y=√x的反函数为x=y2,且dxdy=2y,所以η=√ξ的密度函数为pξ(y)=2pη(y2)|y|=⎧⎨⎩22n/2Γ(n/2)y×(y2)n2−1e−12y2=12n2−1Γ(n2)y n−1e−y22,y>0 0,y≤0(2).因为z=y√n的反函数为y=√nz,且dydz√n,所以ζ=ξ√n的密度为: pζ(z)=√npξ(√nz)=⎧⎨⎩n n22n/2−1Γ(n/2)z n−1e−nz22,z>00,z≤0(3)Eξ=E √η=∫︁∞√x12n/2Γ(n/2)x n2−1e−12x dx=2n+12Γ(n+12)2n2Γ(n2)=√2Γ(n+12)Γ(n2).Eξ2=Eη=nDξ=Eξ2−(Eξ)2=n−2(︂Γ(n+12Γ(n2))︂25.24设母体ξ以等概率取四个值0,1,2,3,现从中获得一个容量为3的子样,试分别求ξ(1)与ξ(3)的分布.解:(i).先求ξ(1)的分布(分布列).P(ξ(1)≥k)=P(min{ξ1,ξ2,ξ3}≥k)=P(ξi≥k,i=1,2,3)=3∏︁i=1P(ξi≥k)=3∏︁i=14−k4=(︂4−k4)︂3,k=0,1,2,3.P(ξ(1)=k)=P(ξ(1)≥k)−P(ξ(1)≥k+1)=(︂4−k4)︂3−(︂3−k4)︂3,k=0,1,2P(ξ(1)=3)=P(ξ(1)≥3)=(︂14)︂3=164.因此ξ(1)有如下分布列:ξ(1)0123P37641964764164(ii).再考虑ξ(3)的分布列.P(ξ(3)≤k)=P(max{ξ1,ξ2,ξ3}≤k)=P(ξi≤k,i=1,2,3)=3∏︁i=1P(ξi≤k)=3∏︁i=1k+14=(︂k+14)︂3,k=0,1,2,3P(ξ(3)=k)=P(ξ(3)≤k)−P(ξ(3)≤k−1)=(︂k+14)︂3−(︂k4)︂3,k=1,2,3P(ξ(3)=0)=P(ξ(3)≤0)=(︂14)︂3=164.因此ξ(3)有如下分布列:ξ(3)0123P164764196437645.25设母体ξ的密度函数为f(x)=3x2,0≤x≤1从中获得一个容量为5的子样ξ1,ξ2,···,ξ5,其次序统计量为ξ(1),ξ(2),···,ξ(5).(1).试分别求ξ(1)与ξ(5)的概率密度函数;(2).试证ξ(2)ξ(4)与ξ(4)相互独立.解:(1).母体有分布函数F(x)=⎧⎪⎨⎪⎩0,x≤0x3,0<x≤1,1,x>1.所以ξ(1)的概率密度函数f(1)(x),ξ(5)的概率密度函数f5(x)分别为:f(1)(x)={︃5[1−x3]4(3x2),0≤x≤1,0,else={︃15x2(1−x3)4,0≤x≤1,0,else.f(5)(x)={︃5(x3)4(3x2),0≤x≤10,else={︃15x14,0≤x≤1,0,else.(2).母体有分布函数F(x)=⎧⎪⎨⎪⎩0,x≤0x3,0<x≤1,1,x>1.因此ξ(2),ξ(4)的联合密度函数为g2,4(y,z)={︃5!9(2−1)!(4−2−1)!(5−4)!(y3)[z3−y3]4−2−1[1−z3]y2z2,0<y<z≤1.0,else={︃1080y5(z3−y3)(1−z3)z2,0<y<z≤1 0,else.令{︃U=ξ(2)/ξ(4)V=ξ(4)其对应的函数为:{︃u=y/z,v=z.其反函数为y=uv,z=v,其雅克比行列式为J=⃒⃒⃒⃒⃒v u01⃒⃒⃒⃒⃒=v.所以U,V的联合密度为pU,V (u,v)={︃1080(uv)5(v3−(uv)3)(1−v3)v2v,0<u<1,0<v<1,0,else.={︃1080v11(1−v3)u5(1−u3),0<u<1,0<v<1,0,else.U,V的联合密度函数是变量可分离的,故U,V相互独立.且U=ξ(2)/ξ(4)的密度函数为PU (u)={︃ku5(1−u3),0<u<10,else计算可知k=18.5.26设母体ξ服从韦布尔分布,其分布函数为F(x)=1−e−(xη)m,x>0,其中m>0为形状参数,η>0为尺度参数.从中获得子样ξ1,ξ2,···,ξn,证明μ=min(ξ1,ξ2,···,ξn)任服从韦布尔分布,并指出其形状参数和尺度参数.解:母体ξ的密度函数p(x)=F′(x)={︃mηmx m−1e−(xη)m,x>0 0,else.所以最小次序统计量μ=ξ(1)=min(ξ1,ξ2,···,ξn)的密度函数为:f(x)=n(1−F(x)]n−1p(x)=nmηmx m−1(︁e−(xη)m)︁n−1e−(xη)m=nmηmx m−1(︁e−n(xη)m)︁=m(cη)mx m−1(︁e−(x cη)m)︁其中c=n−1m.比较f(x)和母体的密度函数p(x)可知μ也服从韦布尔分布,其形状参数仍为m,尺度参数为ηm√n.5.27设某电子元件寿命服从参数为λ=0.0015的指数分布,其分布函数为:F(x)=1−e−λx,x>0.今从中随机抽取6个元件,测得其寿命分别为ξ1,ξ2,···,ξ6,试求下列事件的概率.(1).到800小时没有一个元件失效;(2).到300小时所有元件都失效.解:ξ1,ξ2,···,ξ6是子样,所以ξ1,ξ2,···,ξ6相互独立,且每个ξi都服从参数为λ的指数分布,所以(1).到800小时没有一个元件失效的概率为p1=P(ξ1>800,ξ2>800,···,ξ6>800)=6∏︁i=1P(ξi>800)=6∏︁i=1P(ξ<800)=6∏︁i=1[1−(1−e−800λ)]=[e−800λ]6=e−4800λ=e−7.2≈0.00075.(2).到300小时所有元件都失效的概率p2=P(ξ1<3000,ξ2<3000,···,ξ6<3000)=6∏︁i=1P(ξi<3000)=6∏︁i=1P(ξ<3000)=6∏︁i=1[1−e−3000λ)]=[1−e−3000λ]6=[1−e−4.5]6≈0.93517.5.28设母体ξ的密度函数为f(x)={︃6x(1−x),0<x<10,else由此母体中抽取一个子样(ξ1,ξ2,ξ3,ξ4,ξ5),又ξ(1)<ξ(2)<ξ(3)<ξ(4)<ξ(5)是子样的顺序统计量,求ξ(3)的密度函数.解:ξ的分布函数为F(x)=∫︁x6t(1−t)dt=x2(3−2x),(0<x<1),所以ξ(3)的密度函数为:g3(x)=5!2!2![F(x)]2[1−F(x)]2f(x)=5!2!2![x2(3−2x)]2[1−x2(3−2x)]2[6x(1−x)]=180x5(1−x)(3−2x)2(1−3x2+2x3)2,0<x<1.5.29母体ξ服从[0,1]上的均匀分布,(ξ1,ξ2,···,ξn)为取自该母体的子样,ηi=ξ(i)为次序统计量,求P(ηi> 12),i=1,2,3,4,5.解:ξ服从[,1]上的均匀分布R[0,1],所以ξ的分布函数为:F(x)=⎧⎪⎨⎪⎩x,0<x≤10,x≤01,x>1.因此第i个次序统计量ηi的概率密度函数为:g i(y)=⎧⎨⎩5!(i−1)!(5−i)!x i−1(1−x)5−i,0<y≤1 0,y≤0或者y>1故P(η1>1/2)=∫︁11/25(1−y)4dy=∫︁1/25t4dt=132P(η2>1/2)=∫︁11/220y(1−y)3dy=316P(η3>1/2)=∫︁11/230y2(1−y)2dy=12P(η4>1/2)=∫︁11/220y3(1−y)dy=1316=1−P(η2>1/2)P(η5>1/2)=∫︁11/25y4dy=3132=1−P(η1>1/2).5.30设(ξ1,ξ2)是取自具有指数分布母体的子样,其密度函数为:f(x)={︃e−x,x>00,else(ξ(1)<ξ(2)是次序统计量,求ξ(1)与η=ξ(1)+ξ(2)的联合密度函数.解:母体ξ服从参数为1的指数分布,其分布函数为F(x)=(1−e−x),x>0.因此ξ(1),ξ(2)的联合密度函数为:g1,2(x,y)=2e−x e−y,0<x<y.令U=ξ(1),V=ξ(1)+ξ(2).它对应的函数为u=x,v=x+y,其反函数为x=u,y=v−u,且雅克比行列式J=⃒⃒⃒⃒⃒ðxðuðxðvðyðuðyðv⃒⃒⃒⃒⃒=⃒⃒⃒⃒⃒10−11⃒⃒⃒⃒⃒=1.所以U,V的联合密度函数为pU,V(u,v)=2e−u e−(v−u),0<u<(v−u)=e−v,0<2u<v.5.31设母体ξ的分布函数F(x)是连续的,ξ(1),ξ(2),···,ξ(n)为取自此母体的子样的次序统计量,设ηi= F(ξ(i)),试证(1).η1≤η2≤···≤ηn,且ηi是来自均匀分布U(0,1)母体的次序统计量;(2).Eηi=in+1,D(ηi)=i(n+1−i)(n+1)2(n+2),1≤i≤n.(3).ηi和ηj的协方差矩阵为⎛⎜⎝a1(1−a1)n+2a1(1−a2)n+2a1(1−a2)n+2a2(1−a2)n+2⎞⎟⎠其中a i=in+1,a j=jn+1.证明:因为ξ(1),ξ(2),···,ξ(n)是取自母体ξ的子样的次序统计量,所以ξ(1)≤ξ(2)≤···≤ξ(n).又因为分布函数F(x)是单调不降的,所以F(ξ(1))≤F(ξ(2))≤···≤F(ξ(n))并且可看做是取自母体F(ξ)的子样的次序统计量.令C x=sup{t|F(t)≤t},0<x<1.由于F(x)是连续函数,其闭集的原像仍为闭集.而且F(x)单调不降,故可知F(C x)=x.这样可知:P(F(ξ)≤x)=P(ξ≤C x)=F(C x)=x,0<x<1.所以η=F(ξ)服从(0,1)上的均匀分布,所以η1,···,ηn可看做从(0,1)分布的母体上子样的次序统计量.(2).由(1)可知ηi有密度函数p(i)=⎧⎨⎩n!(i−1)!(n−i)![F(x)]i−1[1−F(x)]n−i,0<x<1, 0,else=⎧⎨⎩n!(i−1)!(n−i)!x i−1(1−x)n−i,0<x<1, 0,else即ηi服从beta分布Beta(i,n−i+1).注意到ηi的密度函数的形式,Eηi=∫︁1n!(i−1)!(n−i)!x i(1−x)n−i dx=n!(i−1)!(n−i)!i!(n−i)!(n+1)!∫︁1(n+1)![(i+1)−1]![(n+1)−(i+1)]!x(i+1)−1(1−x)(n+1)−(i+1)dx=n!(i−1)!(n−i)!i!(n−i)!(n+1)!=in+1.其中我们利用了(n+1)![(i+1)−1]![(n+1)−(i+1)]!x(i+1)−1(1−x)(n+1)−(i+1),0<x<1是子样容量为n+1时ηi+1的密度函数.用同样的方法可得:Eη2i=∫︁1n!(i−1)!(n−i)!x i+1(1−x)n−i dx=n!(i−1)!(n−i)!(i+1)!(n−i)!(n+2)!∫︁1(n+2)![(i+2)−1]![(n+2)−(i+2)]!x(i+2)−1(1−x)(n+2)−(i+2)dx=n!(i−1)!(n−i)!(i+1)!(n−i)!(n+2)!=i(i+1)(n+2)(n+1).其中我们利用了(n+2)![(i+2)−1]![(n+2)−(i+2)]!x(i+1)−1(1−x)(n+1)−(i+1),0<x<1是子样容量为n+2时ηi+2的密度函数.那么Dηi=Eη2i−(Eηi)2=i(n+1−i) (n+1)2(n+2).(3).不妨假定i<j.因为η1,···,ηn可看做(0,1)上均匀分布母体的子样的次序统计量.故ηi,ηj的联合密度函数为:g i,j(x,y)=n!(i−1)!(j−i−1)!(n−j)!x i−1(y−x)j−i−1(1−y)n−j,0<x<y<1.注意到E(ηiηj)=Eηi(ηj−ηi)+Eη2i.Eηi(ηj−ηi)=∫︁10∫︁1xn!(i−1)!(j−i−1)!(n−j)!x i(y−x)j−i(1−y)n−j dxdy=i(j−i)(n+2)(n+1)∫︁1∫︁1x(n+2)![(i+1)−1]![(j+2)−(i+1)−1]![(n+2)−(j+2)]!·x(i+1)−1(y−x)(j+2)−(i+1)−1(1−y)(n+2)−(j+2)dxdy=i(j−i)(n+2)(n+1),其中利用了(n+2)![(i+1)−1]![(j+2)−(i+1)−1]![(n+2)−(j+2)]!x(i+1)−1(y−x)(j+2)−(i+1)−1(1−y)(n+2)−(j+2),0<x<y<1是子样容量为n+2时,ηi+1和ηj+2的联合密度函数.所以进一步的可得Cov(ηi,ηj)=Eηiηj−(Eηi)(Eηj)=Eηi(ηj−ηi)+Eη2i−(Eηi)(Eηj)=i(j−i)(n+2)(n+1)+i(i+1)(n+2)(n+1)−ij(n+1)2=i(n+1−j)(n+2)(n+1)2=a1(1−a2n+2.从而可得ηi,ηj的协方差矩阵为Cov(ηi,ηj)=(︃Dηi Cov(ηi,ηj)Cov(ηj,ηi)Dηj)︃=⎛⎜⎝a1(1−a1)n+2a1(1−a2)n+2a1(1−a2)n+2a2(1−a2)n+2⎞⎟⎠.5.32设母体ξ∼N(0,1),从此母体获得一组子样观测值x1=0,x2=0.2,x3=0.25,x4=−0.3, x5=−0.1,x6=2,x7=0.15,x8=1,x9=−0.7,x10=−1.(1).求子样的经验分布函数F n(x).(2).计算x=0.15(即ξ(6))处E(F(ξ(6))),D(F(ξ(6)))解:(1).子样的经验分布函数为:F n(x)=⎧⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎩0,x≤−10.1,−1<x≤−0.70.2,−0.7<x≤−0.30.3,−0.3<x≤−0.10.4,−0.1<x≤00.5,0<x≤0.150.6,0.15<x≤0.20.7,0.2<x≤0.250.8,0.25<x≤10.9,1<x≤21,x>2(2).记F(x)为标准正态分布的分布函数,p(x)为标准正态分布的密度函数,那么ξ(6)的密度函数为:g6(x)=10!5!4!F5(x)[1−F(x)]4p(x),。
概率论与数理统计:5_1大数定律

P(X ) E(X )
证 仅证连续型 r.v.的情形
P( X
)
f
(x)dx
x
f
(x)dx
1
0
xf
(x)dx
E(X
)
推论 1 ——马尔可夫 ( Markov ) 不等式
设随机变量 X 的k阶绝对原点矩 E( |X |k)
存在,则对于任意实数 > 0,
P(|
X
|
由 Chebyshev 不等式, = 0.01n ,故
P|
令
X
0.75n
|
0.01n
1
0.1875n (0.01n)2
1
0.1875n (0.01n)2
0.90
解得 n 18750
大数定律
贝努里(Bernoulli) 大数定律
设 nA 是 n 次独立重复试验中事件 A 发生 的次数, p 是每次试验中 A 发生的概率, 则 0 有
lim P
n
1 n
n k 1
Xk
0
或
lim P
n
1 n
n k 1
Xk
1
定理的意义
具有相同数学期望和方差的独立 r.v.序列的 算术平均值依概率收敛于数学期望.
当 n 足够大时, 算术平均值几乎是一常数.
数学 期望
可被
算术 均值
近似代替
注1 X1, X 2,, X n , 不一定有相同的数学 期望与方差,可设
P940
X
1060
1059
Ck 6000
k 941
1 6
k
5 6
6000k
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(k 0,常数),求W的数学期望.
解:由上面的公式
E(W )
g(v) f
(v)dv
a
g(v)
1
dv
a
kv 2
1
dv
1
ka 2
0
a
0
a
3
概率论
上述定理还可以推广到两个或两个以上随机变量的函数 的情况。
定理: 设Z=g(X,Y) 是随机向量(X,Y)的二元函数,EZ存在,
(1) 若(X,Y)为d.r.v., P( X xi ,Y y j ) pij ,
(X,Y ) ~
1
f
(
x,
y)
a
2
,
0 x a,0 y a
0,
else
aa
E X Y
x y f ( x, y)dxdy
x y 1 dxdy a
00
x y a
O
a
1
x y
a2
[(
x y
y
x)dxdy
y x
(x
y)dxdy]
1 a2
a
[
0
a
dx
x
(
y
x)dy
a 0
EZ E[g( X ,Y )] g( xi , y j ) pij
ij
(2) 若(X,Y)为c.r.v., ( X ,Y ) ~ f ( x, y),
EZ E[g(X ,Y )]
g( x, y) f ( x, y)dydx
若令g(X,Y)=X, 同样地,
EX
xf ( x, y)dydx
1
dx a b
ba
2
a
即数学期望位于区间(a , b)的中点.
概率论
例4 有2个相互独立工作的电子装置,它们的寿命Xk
(k 1,2)服从同一指数分布,其概率密度为
f
(
x)
e
x
x 0,
0
0 x 0,
若将这两个电子装置串联连接组成整机,求整机
寿命(以小时计) N 的数学期望. 解:先计算 Xk 的期望
(2) 当X为连续型时,它的密度函数为f(x).若
g( x) f ( x)dx绝对收敛,则有
E(Y ) E[g( X )] g( x) f ( x)dx
概率论
E
(Y
)
E[
g(
X
)]
g( xk ) pk ,
k 1
X离散型
g(x)
f
( x)dx,
X连续型
该公式的重要性在于: 当我们求E[g(X)]时, 不必 知道g(X)的分布,而只需知道X的分布就可以了. 这给求随机变量函数的期望带来很大方便.
xf X ( x)dx yfY ( y)dy
EXEY
概率论
例9: 求二项分布的数学期望
概率论
若 X~B(n,p), 则X表示n重贝努里试验中的“成功” 次数.
现在我们来求X的数学期望 .
概率论
X~B(n,p), 则X表示n重贝努里试验中的“成功” 次数.
若设
1 X i 0
如第i次试验成功 如第i次试验失败
1. 问题的提出:
设已知随机变量X的分布,我们需要计算X的某个 函数的期望,比如说g(X)的期望. 应该如何计算呢?
一种方法是,因为g(X)也是随机变量,故应有概 率分布,它的分布可以由已知的X的分布求出来. 一旦 我们知道了g(X)的分布,就可以按照期望的定义把 E[g(X)]计算出来.
概率论
使用这种方法必须先求出随机变量函数g(X)的 分布,一般是比较复杂的 .
概率论
5.1 数学期望
d.r.v.的数学期望 c.r.v.的数学期望 r.v.函数的数学期望 数学期望的性质 小结
分赌本问题: 17司机中叶,一位赌徒向法国数学家
Pascal提出一个使他苦恼许久的问题:甲,乙两赌徒赌技 相同,各出50法朗,每局中无平局.他们约定, 谁先赢三局,则
得全部赌本。 当甲赢两局, 乙赢一局时, 赌博被迫中断 。 现问100法朗 如何分配才算公平 ?
若级数 xk pk 绝对收敛,则称级数的和为
k 1
d.r.v.X的数学期望,记为 E( X ) ,
即
E( X ) xk pk
k 1
请注意 : d.r.v.X数学期望是一个绝对收敛的级 数的和. 数学期望简称期望,又称为均值。
概率论
例1 甲、乙二人进行打靶,所得分数分别记为X1, X2, 它们的分布率分别为
xf X ( x)dx
EY
yf ( x, y)dxdy
yfY ( y)dy
可以由联合密度直接求出X, Y的期望
例7: 设X ,Y的联合分布为
Y X
1
1
1 0.25 0 0.25
1
0.5 0.25 0.75
0.75 0.25
求EX , EY , E( XY ), E[min( X ,Y )]. 解 EX (1) 0.25 1 0.75 0.5,
这不仅考虑了已赌的局 数, 还包含了对再赌下去的 一种
“期望” (Expectation),它比(1)的分法更为合理。 这就是数学期望这个名 称的由来, 也称为均值。 就上例
而言, 再赌下去的话 , 甲“平均”可以赢75法朗。
一、d.r.v.的数学期望
概率论
定义5.1 设d.r.v.X的分布率是
P{X=xk}=pk , k=1,2,…
i 1
i 1
不一定能推出X,Y 独立
4. 设X、Y 相互独立,则 E(XY)=E(X)E(Y);
n
n
推广 : E[ Xi ] E( Xi ) (诸Xi相互独立时)
i1
i 1
概率论
性质1,2请同学自己证明,我们来证性质3和4。
证 设二维随机变量(X ,Y)的概率密度f ( x, y).其边缘
概率密度为fX ( x), fY ( y),于是有
记住:指数分 布的期望
EXk
xf ( x)dx
x e xdx 1
0
N min( X1, X2 ) 的分布函数为
Fmin (
x)
1
[1
F(
x)]2
1
e2
x
x0
0
x0
于是N的概率密度为
fmin
(
x)
2e
2
x
x0
0 x 0
E(N) 1
2
概率论
概率论
三、r.v.函数的数学期望
dx
x 0
(x
y)dy]
a 3
四、数学期望的性质
概率论
1. 设C是常数,则E(C)=C;
2. 若k是常数,则E(kX)=kE(X); 请注意:
3. E(X+Y) = E(X)+E(Y);
由E(XY)=E(X)E(Y)
特别地, E(X+c) = E(X)+c
n
n
推广 : E[ Xi ] E( Xi )
概率论
例5 设随机变量 X 的概率分布为
X -2 -1 0 1 2 P 0.2 0.1 0.1 0.3 0.3 求 E(X-1), E(X2+1).
概率论
例6 设风速V在(0,a)上服从均匀分布,即具有概率
密度
f (v) a1 0 v a 0 其它
又设飞机机翼受到的正压力W是V的函数 :W kV 2
i=1,2,…,n
则 X= X1+X2+…+Xn
因为 P(Xi =1)= p,
P(Xi =0)= 1-p
记住:两点 分布的期望
E(Xi)= 1 p 0 (1 p)= p
n
所以 E(X)= E( Xi ) = np
i 1
可见,服从参数为n和p的二项分布的随机变量X
的数学期望是 n p.
数轴上取很密的分点x0 <x1<x2< …,则X落在小区 间[xi, xi+1)的概率是
xi1 f ( x)dx xi
阴影面积近似为
f ( xi )xi
f ( xi )( xi1 xi )
f ( xi )xi
小区间[xi, xi+1)
概率论
由于xi与xi+1很接近, 所以区间[xi, xi+1)中的值 可以用xi来近似代替.
例2 设 X ~ P(),求E( X ).
概率论
解 : X的分布率为
P{ X k} k e , k 0,1,2, , 0
k!
EX
k
k0
P(X
k)
k 1
k e
(k 1)!
e
k1
k10 (k 1)!
记住:泊松 分布的期望
概率论
二、c.r.v.的数学期望
设X是连续型随机变量,其密度函数为f (x),在
EY 0.5,
E( XY ) (1) (1) 0.25 (1) 1 0 1 (1) 0.5 11 0.25 0
E[min( X ,Y )] (1) 0.25 (1) 0
(1) 0.5 1 0.25 0.5
例8:在长为a的线段上任取两点,求此两点间的平均长度.
X
Y
O
a
解: X ~ U[0,a] Y ~ U[0,a] X ,Y相互独立
那么是否可以不先求g(X)的分布而只根据X的 分布求得E[g(X)]呢?
下面的定理指出,答案是肯定的.
概率论
定理 设Y是r.v.X的函数,Y=g (X) (g是连续函数)
(1) 当X为离散型时,它的分布率为P(X= xk)=pk ;
(k 1,2, ),若 g( xk ) pk绝对收敛,则有