数理统计第4章

合集下载

概率论与数理统计 --- 第四章{随机变量的数字特征} 第一节:数学期望

概率论与数理统计 --- 第四章{随机变量的数字特征} 第一节:数学期望
32 30 17 21 0 1 2 3 1.27 100 100 100 100
这个数能否作为 X的平均值呢?
若统计100天,
可以想象, 若另外统计100天, 车工小张不出废品, 这另外100天每天的平均废品数也不一定是1.27. 一般来说, 若统计n天 ,
(假定小张每天至多出三件废品)
又设飞机机翼受到的正压力W 是V 的函数 : W kV 2 ( k 0, 常数), 求W 的数学期望.
解: 由上面的公式
1 1 2 E (W ) kv f (v )dv kv dv ka a 3 0
2 2

a
例7 设二维连续型随机变量(X , Y)的概率密度为
A sin( x y ) 0 x , 0 y f ( x, y) 2 2 0 其它 (1)求系数A , ( 2)求E ( X ), E ( XY ).
x f ( x )x
i i i
i
阴影面积近似为
这正是:


f ( xi )xi

x f ( x )dx
的渐近和式.
小区间[xi, xi+1)
定义: 设X是连续型随机变量, 其密度函数为 f (x), 如果积分: xf ( x )dx
概率论


绝对收敛, 则称此积分值为X的数学期望, 即:
2. 设二维连续型随机变量 (X, Y) 的联合概率密度为 f (x, y), 则: E ( X )
E (Y )


xf X ( x )dx

yfY
( y )dy




xf ( x , y )dxdy,

《概率论与数理统计》第四章考点手册

《概率论与数理统计》第四章考点手册

《概率论与数理统计》第四章 随机变量的数字特征考点33 离散型随机变量的数学期望(★★二级考点,选择、填空、计算、综合)1.设X 是离散型随机变量,概率分布为P {X =x i }=p i ,i =1,2,…。

则∑∞==1)(i i ip x X E 为X 的数学期望(或均值)。

2.常用离散型随机变量的数学期望(1)两点分布:X ∼B(1,p),0<p<1,则E(X)=p 。

(2)二项分布:X ∼B(n,p),其中0<p<1,则E(X)=np 。

(3)泊松分布:X ∼P(λ),其中λ>0,则E(X)=λ。

考点34 连续型随机变量的数学期望(★★二级考点,选择、填空、计算、综合)1.设X 是连续型随机变量,则称⎰∞∞-=dx x f x X E )()(为X 的数学期望。

2. 常用连续型随机变量的数学期望(1)均匀分布若X~U[a,b],即X 服从[a,b]上的均匀分布,则; 21)()(b a dx a b x dx x xf X E b a +=-==⎰⎰+∞∞- (2)指数分布若X 服从参数为λ的指数分布,则 ; /1)(0λλλ⎰+∞-==dx e x X E x 正态分布若X 服从),(2s µN ,则.)(μ=X E考点35 二维随机变量的数学期望(★★二级考点,选择、填空、计算、综合)1.二维离散型随机变量的数学期望:设二维离散型随机向量(X,Y)的概率分布为p ij ,i=1,2,⋯,j=1,2,⋯.则:.),()],([11åå¥=¥==i j ij j i p y x g Y X g E2. 二维连续型随机变量的数学期望:设二维连续型随机向量(X,Y)的密度函数为f(x,y),则:. ),(),()],([dxdy y x f y x g Y X g E òò¥¥-¥¥-=考点36 数学期望的性质(★★★一级考点,选择、填空)(1).设C 是常数,则E(C)=C;E(C)=C ×1=C(2).若k 是常数,则E(kX)=kE(X);(3).E(X+Y)=E(X)+E(Y);(4).设X,Y 相互独立,则E(XY)=E(X)E(Y);考点37 方差的概念(★★二级考点,选择、填空)1.方差的概念:设X 是一随机变量,若E [X -E (X )]2 存在,则称其为X 的方差,记成Var(X ),即Var(X )=E {[X -E (X )]2} 并称)(X Var 为X 的标准差。

概率论与数理统计第四章

概率论与数理统计第四章

E (b) b E (aX ) aE ( X )
2. E(X+Y) = E(X)+E(Y);
推广 : E [ X i ] E ( X i )
i 1 i 1 n n
E ( ai X i ) ai E ( X i )
i 1 i 1
n
n
3. 设X、Y独立,则 E(XY)=E(X)E(Y);
例2.(X,Y)服从二维正态分布,其概率密度为 1 f ( x, y ) 2 21 2 1
1 y 1 2 x 1 y 2 y 2 2 exp{ [( ) 2 ( )( )( ) ]} 2 1 1 2 2 (1 )
证明: XY
Cov(kX, kY)=k2Cov(X,Y)
■相关系数
定义 设D(X)>0, D(Y)>0, 称
XY
Cov( X , Y ) X EX Y EY E[ ] D( X ) D(Y ) DX DY
为随机变量X和Y的相关系数(标准协方差)
X Y E( X Y ) XY
练习
1.设离散型随机变量(X,Y)的分布列为 Y 0 1 2 X 则E(XY)=( ) 0 1/3 1/6 1/9 1 0 1/6 1/9 2 0 0 1/9
2.设随机变量X的概率密度为
e x f ( x) 0 x0 其它
Y=e-2X,则EY=( )
■数学期望的性质
1. 设a,b是常数,则E(aX+b)=aE(X)+b;
对正态分布而言,X、Y相互独立 与互不相关是等价的。
例4.设随机变量(X,Y)~N(1, 1, 9, 16, -0.5) 令
第四章 随机变量的数字特征

概率论与数理统计教程(茆诗松)第4章

概率论与数理统计教程(茆诗松)第4章

解:用 Xi=1表示第i个部件正常工作, 反之记为Xi=0. 又记Y=X1+X2+…+X100,则 E(Y)=90,Var(Y)=9.
由此得:
P{Y
85}
ห้องสมุดไป่ตู้
1
85
0.5 9
90
0.966.
13 July 2020
华东师范大学
第四章 大数定律与中心极限定理
第10页
二、给定 n 和概率,求 y
例4.4.4 有200台独立工作(工作的概率为0.7)的机床,
第6页
4.4.3 二项分布的正态近似
定理4.4.2 棣莫弗—拉普拉斯中心极限定理
设n 为服从二项分布 b(n, p) 的随机变量,则当 n
充分大时,有
lim
n
P
n
np npq
y
( y)
是林德贝格—勒维中心极限定理的特例.
13 July 2020
华东师范大学
第四章 大数定律与中心极限定理
第7页
13 July 2020
华东师范大学
第四章 大数定律与中心极限定理
第5页
例4.4.2 设 X 为一次射击中命中的环数,其分布列为
X 10 9 8 7
6
P 0.8 0.1 0.05 0.02 0.03
求100次射击中命中环数在900环到930环之间的概率.
解: 设 Xi 为第 i 次射击命中的环数,则Xi 独立同分布,
且 E(Xi) =9.62,Var(Xi) =0.82,故
P
900
100 i 1
Xi
930
930 100 9.62 100 0.82
900 100 9.62 100 0.82

概率论与数理统计第四章

概率论与数理统计第四章

)
(
)
(
)
,
(
Y
D
X
Dபைடு நூலகம்
Y
X
Cov
xy
=
r
=4[E(WV)]2-4E(W2)×E(V2)≤0
01
得到[E(WV)]2≤E(W2)×E(V2). →(8)式得到证明.
02
设W=X-E(X),V=Y-E(Y),那么
03
其判别式
由(9)式知, |ρ xy|=1 等价于 [E(WV)]2=E(W2)E(V2). 即 g(t)= E[tW-V)2] =t2E(W2)-2tE(WV)+E(V2) =0 (10) 由于 E[X-E(X)]=E(x)-E(X) =0, E[Y-E(Y)]=E(Y)-E(Y) =0.故 E(tW-V)=tE(W)-E(V)=tE[X-E(X)]-E[Y-E(Y)]=0 所以 D(tW-V)=E{[tW-V-E(tW-V)]2}=E[(tW-V)2]=0 (11) 由于数学期望为0,方差也为0,即(11)式成立的充分必要条件是 P{tW-V=0}=1
随机变量X的数学期望是随机变量的平均数.它是将随机变量 x及它所取的数和相应频率的乘积和.
=
(1)
)
2
3
(
)
(
-
=
ò
µ
µ
-
dx
x
x
E
j
x
可见均匀分布的数学期望为区间的中值.
例2 计算在区间[a,b]上服从均匀分布的随机变量 的数学期望
泊松分布的数学期望和方差都等于参数λ.
其他
02
f(x)=
01
(4-6)
03
(4)指数分布

概率论与数理统计-第4章-第2讲-随机变量函数的数学期望

概率论与数理统计-第4章-第2讲-随机变量函数的数学期望

02 典型例题
应用 设市场上对某种产品每年需求量为X 吨 ,其中X ~ U [200,400],
每出售一吨可赚300元 , 售不出去,则每吨需保管费100元,问应
该组织多少货源, 才能使平均利润最大?
f
X
(
x)
1 200
,
0,
200 x 400, 其它
解 设组织n吨货源, 利润为 Y,
Y
因此只要掌握了期望的计算,所有的数字特征计算都解决了!
概率论与数理统计
学海无涯,祝你成功!
主讲教师 |
01 随机变量函数的数学期望
(1) Y = g(X) 的数学期望
设离散 r.v. X 的概率分布为 P( X xi ) pi , i 1, 2,
若无穷级数 g(xi ) pi 绝对收敛,则 i 1 E(Y ) g(xi ) pi i 1
设连续 r.v. X 的密度为 f (x)
若广义积分 g(x) f (x)dx 绝对收敛, 则
例 设风速V是一个随机变量,它服从(0,a)上的均匀分布,而飞 机某部位受到的压力F是风速V 的函数:
F kV 2
(常数k > 0),求F 的数学期望.
01 随机变量函数的数学期望
如何计算随机变量函数的数学期望?
一种方法是: 因为g(X)也是随机变量,故应有概率分布,它 的分布可以由X的分布求出来. 一旦我们知道了g(X)的分布,就 可以按照期望的定义把E[g(X)]计算出来.
xf (x, y)dxdy
0
0
dx
2xdy 1
1 x1
3
E(3X 2Y )
(3x 2 y) f (x, y)dxdy
0
0

数理统计第四章

数理统计第四章

第4章数据汇总这一章,我们介绍数据的描述和汇总方法•这些方法大部分以图形的方式展示数据,也可以用其揭示数据结构•在不使用随机模型的情况下,这些方法可以达到描述性分析的目的•如果考虑随机模型,那获得的数据%,X2,…,X n,在一些情形下将它们视为独立同分布的n个随机变量X i,X2, ,X n的实现.我们首先讨论经验累积分布函数等,这些方法可以用于展示数据值的分布。

接着,我们讨论直方图和相关的图形,它们扮演着随机变量的概率密度的角色,从另一角度展示数据值的分布•我们还将介绍数据的简单汇总,比如用以代表数据中心的样本均值、中位数等,用以量化数据分散程度的样本标准差等,这些统计量比直方图等图形提供了更加浓缩的汇总信息•接着将介绍箱线图,它通过一种简单的图形方式将中心值、散度和分布形状等信息汇总起来•最后介绍散点图,用以揭示变量相关性的信息.§ 4.1基于累积分布函数的方法经验累积分布函数设x1,x2/,x!是一组数据,经验累积分布函数(empirical cumulative distributen function,ecdf)定义为1F n(X)= —#{X 兰X}n显然F n(x)是阶梯形的右连续的函数例 4.1 (见P261)如果要进一步讨论经验累积分布函数的统计性质,那必须置于随机模型下去讨论.数据x1,x2/ ,x n视为简单随机样本X1,X2/ ,X n的实现, 它们公共的分布函数为F(x)( —般假定F(x)是连续型分布).样本X i,X2,…,X n的经验累积分布函数定义为1F n(x) #{X i 沁}n对于任意给定的实数x , F n(x)是一个随机变量,并且n F n(x) ~B(n,F(x)),从而1E(F n(x)) E(V n(x)) =F(x),nVar(F n(x))二Var(V n(x)) = F(x)(1-F(x)).n n可见,F n(x)是F(x)的无偏估计,且n「:时Var(F n(x)) > 0,从而知F n(x) 是F(x)的相合估计.关于F n(x)还有更强的结论:定理(格里汶科)对于任意的自然数n,设X i,X2,…,X n是来自总体分布函数F(x)的一个样本,F n(x)为其经验分布函数,记D n = sup |F n(X)-F(x)|,则有x ■■■:::P(lim D n=0) =1n )::该定理表明,经验分布函数F n(x)会一致地强收敛于总体分布函数F(x). 这也说明用经验分布函数F n(x)推断总体分布函数F(x),用样本各阶矩(即F n(x)的矩)去推断总体的矩等是合理的,是有理论依据的 .生存函数随机变量T的生存函数定义为S(t)=P(T t)设随机变量T的分布函数为F(t),那么生存函数S(t)=1-F(t),两者给出的信息是等价的•在应用中,对于寿命数据(一般是非负的),通常分析生存函数而不是分布函数•若样本的经验分布函数为&(t),那么经验生存 函数为S n (t)=1-F n (t)例 4.2(见 P262)生存函数与危险函数有联系.危险函数定义为其中f(t),F(t)分别为T 的密度函数和分布函数也即为了看清危险函数的统计意义,我们考查元件在使用了 t 时间还未失效 的条件下,在接下来的时间段(t,r .]内失效的条件概率P(t :::T I :|t t)假设密度f(t)在t 处连续,那么有F(t :)- F(t)丄 f(t) 1-F(t)S(t) 因此h(tp P(t ::T -^ A l T t)或P(t T <t -qT t)MtTm 。

概率论与数理统计第4章 随机变量的数字特征与极限定理

概率论与数理统计第4章  随机变量的数字特征与极限定理
4.2.1 随机变量方差的概念 数学期望是随机变量重要的数字特征.但是,在 刻画随机变量的性质时,仅有数学期望是不够的.例如, 有两批钢筋,每批各10根,它们的抗拉强度指数如下:
25
定义4.3 设X是随机变量,若E[X-E(X)]2存 在,则称它为X的方差,记为D(X),即
由定义4.2,随机变量X的方差反映了X的可能取值 与其数学期望的平均偏离程度.若D(X)较小,则X的 取值比较集中,否则,X的取值比较分散.因此,方差 D(X)是刻画X取值离散程度的一个量.
3
定义4.1 设离散型随机变量X的分布律为
4
5
6
7
8
9
4.1.2 几个常用分布的数学期望 1.0—1分布 设随机变量X服从以p为参数的(0—1)分布,则X 的数学期望为
2.二项分布 设随机变量X~B(n,p),则X的数学期望为
10
3.泊松分布 设随机变量X~P(λ)分布,则X的数学期望为
41
Hale Waihona Puke 424.3 协方差、相关系数及矩
4.3.1 协方差 对于二维随机变量(X,Y),除了分量X,Y的数 字特征外,还需要找出能体现各分量之间的联系的数字 特征.
43
44
4.3.2 相关系数 定义4.5 设(X,Y)为二维随机变量,cov (X,Y),D(X),D(X)均存在,且D(X)>0,D(X) >0,称
15
16
17
定理4.2 设(X,Y)是二维随机变量,z=g(x,y) 是一个连续函数. (1)如果(X,Y)为离散型随机变量,其联合分布 律为
18
19
20
4.1.4 数学期望的性质 数学期望有如下常用性质(以下的讨论中,假设所 遇到的数学期望均存在):

概率论与数理统计 第4章 随机变量的数字特征

概率论与数理统计 第4章  随机变量的数字特征

解:
1 (5 0.5x)( 3 x2 x)dx
0
2
4.65(元)
2021/7/22
21
4.1.2 随机变量函数的数学期望
将定理4.1推广到二维随机变量的情形.
定理4.2 设Z是随机变量X,Y的函数Z = g(X,Y), g是连续函数.
(1) 若(X,Y)是二维离散型随机变量,其分布律
为P{X xi ,Y yj } pij, i, j 1,2,, 则有
解:由于 P{ X k} k e ,k = 0,1,2,…,
k!
因而
E( X ) kP{ X k} k k e
k0
k0 k!
k e
k1 (k 1)!
e
k 1
k1 (k 1)!
e k ee k0 k!
2021/7/22
12
4.1.1 数学期望的概念
2. 连续型随机变量的数学期望
2021/7/22
18
4.1.2 随机变量函数的数学期望
定理4.1 设Y为随机变量X的函数:Y = g(X) (g是连续
函数).
(1) 设X是离散型随机变量,其分布律为
P{X xk } pk , k 1,2,
若级数 g( xk ) pk绝对收敛,则 E(Y ) E[g( X )] g( xk ) pk
f ( x) 25( x 4.2), 4 x 4.2,
0,
其 它.
求pH值X的数学期望E(X).
解:
E( X ) xf ( x)dx
4
4.2
x 25( x 3.8)dx x (25)(x 4.2)dx
3.8
4
4
2021/7/22
15

概率论与数理统计第四章_几种重要的分布

概率论与数理统计第四章_几种重要的分布
用贝努公式计算ξ的分布律下
ξ
0
1
2
3
4
p 0.0016 0.0256 0.1536 0.4096 0.4096
4.2超几何分布(了解)
主要内容: (一)了解超几何分布的概念 (二)了解超几何分布的期望和方差
4.2超几何分布
例1 某班有学生20名,其中有5名女同学,今从 班上任选4名学生去参观展览,被选到的女同学数ξ
k1 (k 1)!(n k)!
n
(k 11)n! pk (1 p)nk
k1 (k 1)!(n k)!
n
(k 1)n!
n
pk (1 p)nk
n!
pk (1 p)nk
k1 (k 1)!(n k)!
k1 (k 1)!(n k)!
n
n!
n
pk (1 p)nk
n!
pk (1 p)nk
k2 (k 2)!(n k)!
解 可以取0,1,2,3这4个值。
P(
=k)=
C3k
C4k 17
C420
(k=0,1,2,3,)
列成概率分布如下
ξ
0
1
2
3
p 0.4912 0.4211 0.0842 0.0035
定义42 设N个元素分为两类,有N1个属于第一类, N2个属于第二类(N1+N2=N)。从中按不重复抽 样取n个,令ξ表示这n个中第一(或二)类元素的个数,
k1 (k 1)!(n k)!
n2
n1
n(n 1)Cnl 2 pl2 (1 p)n2l nCnj1 p j1(1 p)n1 j
l0
j0
n2
n(n 1)Cnl 2 pl2 (1 p)n2l l0

概率论与数理统计 第4章

概率论与数理统计 第4章

dx 令t
t2 2
x

,得
E( X )
1 2



( t )e
dt
1-91
31
1 E( X ) x e 2
( x )2 2 2
dx 令t
t2 2
x

,得
E( X )
1 2



( t )e
t2 2

从而
的概率密度为:
1-91
21
故所求数学期望分别为
1-91
22
三.数学期望的性质
性质1: 设 C 为常数,则 性质2: 设 C 为常数,X 为随机变量, 则有 性质3: 设 X , Y 为任意两个随机变量, 则有 为 n 个随机变量,
推论1 设
为常数,则
1-91
23
性质4 设X 和Y 是相互独立的随机变量,则有
证: 因为 X 和 Y 相互独立,所以 于是
推广:
1-91 24
例7. 将 n只球随机放入M 只盒子中去,设每只球 落入各个盒子是等可能的,求有球的盒子数 X 的 均值 解 引入随机变量
显然有
1-91
25
例7. 将 n只球随机放入M 只盒子中去,设每只球 落入各个盒子是等可能的,求有球的盒子数 X 的 均值
1-91
18
例5. 设某公共汽车站于每小时的10分, 50分发车, 乘客在每小时内任一时刻到达车站是随机的。求 乘客到达车站等车时间的数学期望。
解: 设T 为乘客到达车站的时刻, 则
其概率密度为
设Y 为乘客等车时间,则
1-91
19
已知
1-91

概率论与数理统计第4章

概率论与数理统计第4章

随机变量的数学期望是概率论中最重要的 概念之一.它的定义来自习惯上的平均值概念.
5
一、离散型随机变量的数学期望
引例 某企业对自动流水线加工的产品实行质量 监测,每天抽检一次,每次抽取5件,检验产品是 否合格,在抽检的30天的记录中,无次品的有18天, 一件次品的有9天,两件次品的有3天,求日平均次 品数.
k

这启发我们引出如下连续型随机变量的数 学期望定义:
30
二、连续型随机变量的数学期望
设连续型随机变量 X 的概率密度为 f ( x ), 若积分
x f ( x ) d x
绝对收敛, 则称积分 x f ( x ) d x 的值为随机


变量 X 的数学期望, 记为 E ( X ) . 即 E ( X ) x f ( x )d x.
n
n 1
n( n 1)( n i ) i 1 n i 1 p q i! i 0
n 1
令i k 1
( n 1)( n i ) i ( n1) i np pq i! i 0
n 1
np C
i 0
n 1
i n 1
pq
i
( n 1 ) i
试问哪个射手技术较好?
12
解 设甲、乙射手击中的环 数分别为 X 1 , X 2 .
E ( X 1 ) 8 0.3 9 0.1 10 0.6 9.3(环), E ( X 2 ) 8 0.2 9 0.5 10 0.3 9.1(环),
故甲射手的技术比较好. 乙射手 甲射手
Y
1500
0.0952
2000
2500
3000
0.7408

概率论与数理统计(经管类)复习要点 第4章 随机变量的数字特征

概率论与数理统计(经管类)复习要点 第4章 随机变量的数字特征

第四章 随机变量的数字特征1. 把刻画随机变量某些方面特征的数值称为随机变量的数字特征,如期望、方差、协方差、相关系数等。

2. 随机变量的期望反映了随机变量取值的集中位置。

离散型随机变量的期望设离散型随机变量X 的分布律为P {X =x k }=p k ,k=1,2,…若级数∑ix i p i 绝对收敛(即级数∑i丨x i 丨p i 收敛),则定义X 的数学期望(简称均值或期望)为E (X )=∑ix i p i注:当X 的可能取值为有限多个x 1,x 2,…,x n 时,E (X )=∑=ni 1x i p i 当X 的可能取值为可列多个x 1,x 2,…,x n ,…时,E (X )=∑∞=1i x i p i三种重要离散型随机变量的数学期望:3. 离散型随机变量函数的数学期望 设离散型随机变量X 的分布律为P {X =x k }=p k ,k=1,2,…令Y =g (X ),若级数∑∞=1k g (x k )p k 绝对收敛,则随机变量Y 的数学期望为E (Y )= E[g (X )] =∑∞=1k g (x k )p k4. 连续型随机变量的期望三种重要连续型随机变量的数学期望:5. 连续型随机变量函数的数学期望2017.4单解:6. 二维随机变量的期望二维随机变量函数的期望7. 期望的性质(1)常数的期望等于这个常数,即E (C )=C ,其中C 为常数证明 常数C 作为随机变量,它只可能取一个值C ,即P {X =C }=1,所以E (C )=C ⋅1=C(2)常数与随机变量X 乘积的期望等于该常数与随机变量X 的期望的乘积,即E (C X )=C ⋅E (X ) (3)随机变量和的期望等于随机变量期望之和,即E (X +Y )= E (X )+ E (Y ) 推广:E (C 1X +C 2Y )= C 1E (X )+ C 2E (Y ),其中C 1,C 2为常数 一般地,设X 1,X 2,…,X n ,为n 个随机变量,则有E (∑=ni iX 1)=∑=ni iX E 1)(E (∑=ni ii X C 1)=∑=ni iiX E C 1)( 其中C i(i=1,2,…)为常数(4)两个相互独立的随机变量乘积的期望等于期望的乘积,即若X ,Y 是相互独立的随机变量,则E (XY )= E (X )E (Y )由数学归纳法可证得:当X1,X2,…,X n相互独立时有E(X1,X2,…,X n)= E(X1)E(X2)…E(X n)2018.4单解:指数分布的期望值为 1,故E(X)= E(Y)=21,所以E(X Y)= E(X)E(Y)=412018.4计解:(1)平均收益率E(X)=1%×0.1+2%×0.2+3%×0.1+4%×0.3+5%×0.2+6%×0.1=3.6%(2)预期利润10×3.6%=0.36万元2017.10单解:E(-3X +2)=-3 E(X)+2=-3×51+2=572017.4填解:E(X+Y)= E(X)+ E(Y)=20×0.1+2=48. 方差反映了随机变量偏离中心——期望的平均偏离程度。

概率论与数理统计(叶慈南 刘锡平 科学出版社)第4章 多维随机变量(r.v.)及其分布

概率论与数理统计(叶慈南 刘锡平 科学出版社)第4章 多维随机变量(r.v.)及其分布

fY
(
y
)
=
π2
1− y2, 0,
− 1 ≤ y ≤ 1. 其它
28
2. 二维正态分布 p97
(X,Y)的概率密度为
f (x, y) =
1
e 2(
−1 1− ρ
2
)

(
x
− µ1 σ2
1
)2
−2
ρ
(
x

µ1 )( σ 1σ
y
2

µ2
)
+
(
y
− µ2 σ2
2
)2

2πσ σ 1 − ρ 2 12
f ( x, y)dy
−∞
称为(X,Y)关于X的边缘概率密度。
∫ fY ( y) =
+∞
f ( x, y)dx
−∞
称为(X,Y)关于Y的边缘概率密度。
20
例p102 设 ( X ,Y )的概率密度是
f
(
x,
y)
=
cy(2 −

0,
x
),
0 ≤ x ≤ 1, 0 ≤ y ≤ x ,
其它
求 (1) c 的值; (2) 两个边缘密度; (3) P{X<1/2}.

pi j

p.j
… … … … ….. … …

p1 . p2 .

pi . …
1
18
3
例 将一枚硬币掷 3 次, 以X表示前 2 次中出现 H的次数, 以Y表示 3 次中出现H的次数. 求X,Y 的联合分布律以及(X,Y)的边缘分布律.
19
三、连续型(X,Y)的边缘概率密度

概率论与数理统计 第四章

概率论与数理统计   第四章

50 1 1 1 ( ) 49 2 100 2
数理统计
28

骣n 1 2 2 E (S ) = E 琪 X i - nX 琪 å 琪 n - 1 桫= 1 i
= 1 n- 1 n n 1
2
1 n 2 2 EX i nEX n 1 i 1
2
(n E X
若总体X是连续型随机变量,其概率密度为
f ( x ),
则样本的联合概率密度为
f ( x1 , x 2 , , x n ) f ( x1 ) f ( x 2 ) f ( x n )
对于离散型总体,有相似的结论。
数理统计 17
例 设 ( X 1 , X 2 , , X n ) 是取自正态总体 N ( , 2 ) 的 样本,求样本的概率分布。 解 总体X的密度函数为
数理统计
30
X EX 1 P DX
X 1 P 1 10
0 .0 2 E X DX
E(X ) 0 D(X ) 1 100
显然
X ( 1 ) m in X i ,
1 i n
X (n) m ax X i ,
1 i n
两者也分别称为最小次序统计量和最大次序统计量. 称
R X ( n ) X ( 1 ) 为样本极差
X n1 ( 2 ) Md 1 (X n X n ( ) (1 ) 2 2 2 n 为奇数 (4 - 15) n 为偶数
总体 样本
随机变量 X 随机向量
( X 1 , X 2 , , X n )
数理统计
15
在一次试验中,样本的具体观测值 称为样本值。记为 ( x 1 , x 2 , , x n ) . 有时候样本与样本值使用同一符号, 但含义不同。 简单随机样本 若 X 1 , X 2 , X n 是相互独立的并与总体

概率论与数理统计第四章数学期望

概率论与数理统计第四章数学期望
定义1 设X是离散型随机变量,它的分布律是:
如果 | xk | pk 有限,定义X的数学期望
k 1

P(X=xk)=pk , k=1,2,…

E ( X ) xk pk
k 1
也就是说,离散型随机变量的数学期望是一个 绝对收敛的级数的和.
分赌本问题 A 期望所得的赌金即为 X 的数学期望
因此彩票发行单位发行 10 万张彩票的创收利 润为
击中环数 概率 击中环数 概率 8 9 10
0 . 3 0 .1 0 . 6
8 9 10
乙射手
0 .2 0 .5 0 .3
试问哪个射手技术较好?
解 设甲、乙射手射中的环数分别为 X 1 , X 2 . 甲射手
击中环数 概率 8 9 10
0 . 3 0 .1 0 . 6
E ( X 1 ) 8 0.3 9 0.1 10 0.6 9.3(环),
200
即为 X 的可能值与其概率之积的累加.
引例2 射击问题 设某射击手在同样的条件下, 瞄准靶子相继射击90次,(命中的 环数是一个随机变量).射中次数 记录如下 命中环数 k 0 1 2 3
命中次数 nk
2 13 15
4 20
5
10
30
2 13 15 nk 10 20 30 频率 90 90 90 n 90 90 90 试问:该射手每次射击平均命中靶多少环?
1 3 200 0 4 4
50(元).
若设随机变量 X 为:在 A 胜2局 B 胜1局 的前提下, 继续赌下去 A 最终所得的赌金.
0 3 1 其概率分别为: 4 4 因而A期望所得的赌金即为X的 “期望”值, 3 1 200 0 150(元). 等于 4 4

概率论与数理统计第四章期末复习

概率论与数理统计第四章期末复习

概率论与数理统计第四章期末复习(一)随机变量的数学期望1.数学期望的定义定义1设离散随机变量X 的分布律为)()(i i i x X P x p p ===, ,2,1=i .若+∞<∑+∞=1i i i p x ,则称∑+∞==1)(i i i p x X E 为随机变量X 的数学期望,或称为该分布的数学期望,简称期望或均值.定义2设连续随机变量X 的密度函数为)(x f .若+∞<⎰∞+∞-x x f x d )(,则称xx xf X E d )()(⎰∞+∞-=为随机变量X 的数学期望,或称为该分布的数学期望,简称期望或均值.2.随机变量函数的数学期望定理1设随机变量Y 是随机变量X 的连续函数:)(X g Y =.设X 是离散型随机变量,其分布律为)(i i x X P p ==, ,2,1=i ,若∑+∞=1)(i i i p x g 绝对收敛,则有∑+∞===1)()]([)(i i i p x g X g E Y E .设X 是连续型随机变量,其概率密度为)(x f ,若⎰∞+∞-x x f x g d )()(绝对收敛,则有x x f x g X g E Y E d )()()]([)(⎰∞+∞-==.【例1】设随机变量X 的分布律为X 2-1-0123P1.02.025.02.015.01.0求随机变量X 的函数2X Y =的数学期望.【解】1.0315.022.0125.002.0)1(1.0)2()(222222⨯+⨯+⨯+⨯+⨯-+⨯-=Y E 3.2=.【例2】设随机变量X 具有概率密度⎪⎩⎪⎨⎧≤≤=,其他.;,001)(ππx x f X ,求X Y sin =的数学期望.【解】x x f x g X g E Y E d )()()]([)(⎰∞+∞-==πππ2d 1sin 0=⋅=⎰x x .【例3】某公司经销某种原料,根据历史资料表明:这种原料的市场需求量X (单位:吨)服从)500,300(上的均匀分布.每售出1吨该原料,公司可获利1.5(千元);若积压1吨,则公司损失0.5(千元).问公司应该组织多少货源,可使平均收益最大?【解】设该公司应该组织a 吨货源,则显然应该有500300≤≤a .又记Y 为在a 吨货源条件下的收益额(单位:千元),则收益额Y 为需求量X 的函数,即)(X g Y =.由题设条件知:当a X ≥时,此a 吨货源全部售出,共获利a 5.1.当a X <时,则售出X 吨(获利X 5.1),且还有X a -吨积压(获利)(5.0X a --),所以共获利a X X a X 5.02)(5.05.1-=--.由此知⎩⎨⎧<-≥=.,;,a X a X a X a X g 5.025.1)(则x x g x x f x g Y E X 2001)(d )()()(500300⎰⎰==∞+∞-]d 5.1d )5.02([2001500300x a x a x a a ⎰⎰+-=)300900(200122-+-=a a .易知,当450=a 时,能使)(Y E 达到最大,即公司应该组织450吨货源.定理2设随机变量Z 是随机变量X ,Y 的连续函数:),(Y X g Z =.设),(Y X 是二维离散型随机变量,其联合分布律为),(j i ij y Y x X P p ===,,2,1,=j i ,若∑∑+∞=+∞=11),(i j ij j i p y x g 收敛,则有∑∑+∞=+∞===11),()],([)(i j ij j i p y x g Y X g E Z E .设),(Y X 是二维连续型随机变量,其联合概率密度函数为),(y x f ,若y x y x f y x g d d ),(),(⎰⎰∞+∞-∞+∞-收敛,则有y x y x f y x g Y X g E Z E d d ),(),()],([)(⎰⎰∞+∞-∞+∞-==.【例4】设随机变量),(Y X 的联合概率密度为⎩⎨⎧<<<<--=其他.,,,,010102),(y x y x y x f 求)(X E ,)(XY E .【解】⎰⎰∞+∞-∞+∞-=y x y x f x X E d d ),()(125d d )2(1010=--=⎰⎰y x y x x ,⎰⎰∞+∞-∞+∞-=y x y x f xy XY E d d ),()(61d d )2(1010=--=⎰⎰y x y x xy .3.数学期望的性质性质1若a 是常数,则a a E =)(.性质2对任意常数a ,有)()(X aE aX E =.性质3对任意的两个函数)(1x g 和)(2x g ,有)]([)]([)]()([2121X g E X g E X g X g E +=+.性质4设),(Y X 是二维随机变量,则有)()()(Y E X E Y X E +=+.推广到n 维随机变量场合,即)()()()(2121n n X E X E X E X X X E +++=+++ .性质5若随机变量X 与Y 相互独立,则有)()()(Y E X E XY E =.推广到n 维随机变量场合,即若1X ,2X ,…,n X 相互独立,则有)()()()(2121n n X E X E X E X X X E =.【例5】设随机变量X 与Y 相互独立,X ~)4,1(-N ,Y ~)2,1(N ,则=-)2(Y X E .【解析】因为X ~)4,1(-N ,Y ~)2,1(N ,所以1)(-=X E ,1)(=Y E ,故3)(2)()2(-=-=-Y E X E Y X E .(二)随机变量的方差1.方差的定义定义1设X 是一个随机变量,若})]({[2X E X E -存在,则称})]({[2X E X E -为X 的方差,记为)(X D ,即})]({[)(2X E X E X D -=.称方差的平方根)(X D 为随机变量X 的标准差,记为)(X σ或X σ.定理1(方差的计算公式)【例1】设随机变量X 的概率密度为⎪⎩⎪⎨⎧<≤-<<-+=其他.,;,;,0101011)(x x x x x f ,求)(X D .【解】0d )1(d )1()(101=-++=⎰⎰-x x x x x x X E ,61d )1(d )1()(120122=-++=⎰⎰-x x x x x x X E ,所以61)]([)()(22=-=X E X E X D .2.方差的性质性质1常数的方差为0,即0)(=c D ,其中c 是常数.性质2若a ,b 是常数,则)()(2X D a b aX D =+.性质3若随机变量X 与Y 相互独立,则有)()()(Y D X D Y X D +=±.推广到n 维随机变量场合,即若1X ,2X ,…,n X 相互独立,则有)()()()(2121n n X D X D X D X X X D +++=±±± .【例2】已知2)(-=X E ,5)(2=X E ,求)31(X D -.【解】9})]([)({9)()3()31(222=-=-=-X E X E X D X D .(三)常见随机变量的数学期望、方差1.两点分布X ~),1(p b p X E =)(,)1()(p p X D -=.2.二项分布X ~),(p n b np X E =)(,)1()(p np X D -=.3.泊松分布X ~)(λP λ=)(X E ,λ=)(X D .4.均匀分布X ~),(b a U )(21)(b a X E +=,12)()(2a b X D -=.5.指数分布X ~)(λE λ1)(=X E ,21)(λ=X D .6.正态分布X ~),(2σμN μ=)(X E ,2)(σ=X D .【例1】设X ~),(p n b 且6)(=X E ,6.3)(=X D ,则下列结论正确的是()A .15=n ,4.0=pB .20=n ,3.0=pC .10=n ,6.0=p D .12=n ,5.0=p 【解析】6)(==np X E ,6.3)1()(=-=p np X D ,解之得15=n ,4.0=p .正确选项为A .【例2】若X ~)5,2(N ,Y ~)1,3(N ,且X 与Y 相互独立,则=)(XY E ()A .6B .2C .5D .15【解析】因为X ~)5,2(N ,所以2)(=X E ,因为Y ~)1,3(N ,3)(=Y E ,故6)()()(==Y E X E XY E ,正确选项为A .【例3】X 与Y 相互独立,X ~)2(P ,Y ~)1(E ,则=-)2(Y X D .【解析】因为X ~)2(P ,所以2)(=X D ,因为Y ~)1(E ,所以1)(=Y D ,又因为随机变量X 与Y 相互独立,所以9)()1()(2)2(22=-+=-Y D X D Y X D .(四)协方差、相关系数与矩1.协方差定义1设),(Y X 是一个二维随机变量,若)]}()][({[Y E Y X E X E --存在,则称其为X 与Y 的协方差,记为),(Cov Y X .即)]}()][({[),(Cov Y E Y X E X E Y X --=.定理1)()()(),(Cov Y E X E XY E Y X -=.【例1】设二维随机变量),(Y X 的联合分布律为:求协方差),(Cov Y X .【解】由题易得32)(=X E ,0)(=Y E ,0311131003111)(=⨯⨯+⨯⨯+⨯⨯-=XY E .于是0)()()(),(Cov =-=Y E X E XY E Y X .定理2若X 与Y 相互独立,则0),(Cov =Y X ,反之不然.定理3对任意二维随机变量),(Y X ,有),(Cov 2)()()(Y X Y D X D Y X D ±+=±.关于协方差的计算,还有下面四条有用的性质.性质1协方差),(Cov Y X 的计算与X ,Y 的次序无关,即),(Cov ),(Cov X Y Y X =.性质2任意随机变量X 与常数a 的协方差为零,即0),(Cov =a X .性质3对任意常数a ,b ,有),(Cov ),(Cov Y X ab bY X a =.性质4设X ,Y ,Z 是任意三个随机变量,则),(Cov ),(Cov ),(Cov Z Y Z X Z Y X +=+.2.相关系数定义2设),(Y X 是一个二维随机变量,且()0D X >,()0D Y >,则称Y X XY Y X Y D X D Y X σσρ),(Cov )()(),(Cov ==为X 与Y 的相关系数.性质11≤XY ρ.性质21=XY ρ的充要条件是X 与Y 间几乎处处有线性关系,即存在)0(≠a 与b ,使得1)(=+=b aX Y P .其中当1=XY ρ时,有0>a ;当1-=XY ρ时,有0<a .性质3设随机变量X 与Y 独立,则它们的相关系数等于零,即0=XY ρ.【例2】设1)()(==Y D X D ,21=XY ρ,则=+)(Y X D 3.【解析】因为21)()(),(Cov ==Y D X D Y X XY ρ,所以)()(21Y D X D XY =ρ21=,故),(Cov 2)()()(Y X Y D X D Y X D ++=+3=.【例3】已知1)(-=X E ,3)(=X D ,则=-)]2(3[2X E 6.【解析】)]2([3)]2(3[22-=-X E X E }2)]([)({32-+=X E X D 6=.【例5】设随机变量),(Y X 的概率密度函数为⎪⎩⎪⎨⎧≤≤≤≤+=其他.,,,,02020)(81),(y x y x y x f 求),(Cov Y X ,)(Y X D +和XY ρ.【解】⎰⎰+∞∞-+∞∞-=y x y x f x X E d d ),()(67d d )(822=+=⎰⎰y x y x x ,⎰⎰+∞∞-+∞∞-=y x y x f x X E d d ),()(2235d d )(820202=+=⎰⎰y x y x x ,⎰⎰+∞∞-+∞∞-=y x y x f xy XY E d d ),()(34d d )(82020=+=⎰⎰y x y x xy ,由轮换对称性,有67)(=Y E ,35)(=Y E ,361)()()(),(Cov -=-=Y E X E XY E Y X ,3611)]([)()()(22=-==X E X E X D Y D ,95),(Cov 2)()()(=++=+Y X Y D X D Y X D ,111)()(),Cov(-==Y D X D Y X XY ρ.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 四 章 方差分析、正交试验设计
§4.1 一元方差分析 §4.2 二元方差分析 §4.3 正交试验设计
§4.1 一元方差分析
一、方差分析及其有关术语
(一)指标、因素、水平 1、指标 试验结果值称为指标,一般表示为 数值,用 X 表示。 2、因素 影响指标的因子,一般表示为分类 变量。用 A,B,C 表示 3、水平 因素所处的状态,一般用A1、A2、 A3、… Ar 。 单因素方差分析:众多因素中仅有一个因素的 的水平有多个,其余因素只有一个水平。 多因素方差分析:多个因素有多个水平。

r ni

2

2
~ (n 1)
2、各平方和的作用及分布 (3) QA 反映水平之间的差异
ˆ i xi 由于X i ~ N ( mi , 2 ),故m
故当H0真时m1 m2 … mr m,有
x1 , x2 ,, xr , x 应相差不大
而 QA ni xi x
917 506 810 792
669 358 705 883
?不同品种肥料对小麦亩产量的作用是否有差异
X1 为肥料A1下的小麦亩产量, m1为平均亩产量;
981 964 917 669视为来自X1的子样值 X2 为肥料A2下的小麦亩产量, m2为平均亩产量; 607 693 506 358视为来自X2的子样值 X3 为肥料A3下的小麦亩产量, m3为平均亩产量;
差异源 平方和 组间 QA 组内 QE 总计 QT 方差分析表 自由度 均方离差 r- 1 QA/(r -1) n-r Qe/(n-r ) n- 1 F值 P-value F crit
水平(母体) 观察值
A1 (X1) A2 (X2)
x11, x12 ,x1n1 x21 , x22 , x2n2

X i ~ N ( mi , 2 )
QT xij x xr1, xr 2 ,xrnr i 1 j 1 Ar (Xr) H0: m1 m2 … mr 如果H0真 (m1 m2 … mr m) xij可以视为 来自N (m ,2 ) 的容量为n的子样。故H0真的 条件下有 QT H 0 2
2、一般模型 设因素有r个水平(r个母体Xi i =1,2, r ) 每个水平的均值分别用m1、m2、、 mr 表示
xi1 , xi 2 ,, xini 来自第i个母体X i , 形成数据
水平(母体) 观察值
A1 (X1) A2 (X2)
x11, x12 ,x1n1 x21 , x22 , x2n2

附:两类误差
1、随机误差
*因素的同一水平(母体)下,子样各观察值之 间的差异,对数据形成组内差。 *比如,同一行业下不同企业被投诉次数是不 同的 *这种差异可以看成是随机因素的影响,称为
随机误差
附:两类误差
2、系统误差
*因素的不同水平(不同母体)下,各观察值之 间的差异,对数据形成组间差。 *比如,不同行业之间的被投诉次数之间的差 异 *这种差异 可能 是由于抽样的随机性所造成的, 也可能是由于行业本身所造成的,后者所形 成的误差是由系统性因素造成的,称为系统

设 X i ~ N ( mi , 2 ) 且各母体独立
Ar (Xr)
xr1, xr 2 ,xrnr
H0: m1 m2 … mr H1: m1 ,m2 ,,mr不全相等( !H1可以不写)
(二) H0检验的统计量 1、平方和 (1)总平方和(总离差) QT 全部子样的 平均数 其中 第i行 (水平) 的平均数
2 r 2 r ni i 1 i 1 j 1
2
x
i 1 j 1
ni
QT QA QE
2 r ni i 1 j 1
ni r
ij
x xij xi xi x
2 2 r ni
2
x
r i 1 j 1 r ni
ij
x xi x xij xi
1 2 Si ni
x
ni j 1
ij
xi
2nS源自QE2n S
i 1 i
r

2
2 i i 2
~ (ni 1)
2
2 i

2
~ (n r )
2
注:QE xij xi
r ni i 1 j 1
2、各平方和的作用及分布 (2) QT 反映全部数据总的误差程度
零售业 1
旅游业 2
航空公司 3
家电制造 4 5
Ð Ò µ
» Í ² ¬ Ð Ò µ ± » Í ¶ Ë ß ´ Î Ê ý µ Ä É ¢ µ ã Í ¼
1、从散点图上可以看出
*不同行业被投诉的次数是有明显差异的
*即使是在同一个行业,不同企业被投诉的次 数也明显不同 *家电制造被投诉的次数较高,航空公司被 投诉的次数较低 2、行业与被投诉次数之间有一定的关系 *如果行业与被投诉次数之间没有关系,那么 它们被投诉的次数应该差不多相同,在散点图 上所呈现的模式也就应该很接近
791 642 810 705视为来自X3的子样值 X4 为肥料A4下的小麦亩产量, m4为平均亩产量; 901 703 792 883视为来自X4的子样值 不同品种肥料对小麦亩产量的作用是否有差异? 转化为是否拒绝 H0 H0: m1 = m2 = m3 = m4 H1: m1 m2 m3 m4不全等
J a F k 满足 a PF k | H 0 Ja F Fa (r 1, n r )
不拒绝H0 0
H0 成立时 F 应小。故 H0 的拒绝域为
拒绝 H0
a
F
Fa(r-1,n-r)
QA /( r 1) F QE /( n r )
(四)单因素方差分析表
i 1 r 2
故 QA 是由于水平之间的差异引起的
2、各平方和的作用及分布
(4) QA 分布 当H0真时
由于 QT =QA +QE
2

故当H0真时
QT
2

QT
2
H0
~ (n 1) 而


QA
2

QA
2

H0

2
QE
2

QE
2
~ (n r )
2
~ (r 1) 且QA与QE 独立
QT =QA +QE 的意义:总离差由两部份构成,
其一是由各水平(母体)的子样值内部的差异引 起,其二是由于水平之间的差异引起的,
3、 H0的检验统计量 如果原假设H0成立,即有 :m1 = m2 =…= mr 由于 mi 的估计是
xi ,故H0 成立应有 x1 , x2 ,, xr , x 相差不大,而
(二)方差分析的思想
1、仅从散点图上观察还不能提供充分的证据证明不 同行业被投诉的次数之间有显著差异
*这种差异也可能是由于抽样的随机性所造成的
2、需要有更准确的方法来检验这种差异是否显著, 也就是进行方差分析 *所以叫方差分析,因为虽然我们感兴趣的是均值, 但在判断均值之间是否有差异时则需要借助于方差
r ni
2
1 ni
x
ni j 1
i 1 j 1
ij
xi
2
为第 i 行的子样方差
(3)组间差(水平项离差平方和) (系统误差)
QA ni xi x
i 1
r
2
(4)三个平方和的关系
x
r ni i 1 j 1 r ni
ij
x ni xi x xij xi
H0: m1 = m2 = m3 = m4 H1: m1 m2 m3 m4不全等
2、什么是方差分析 检验多个母体平均数是否相等
*手段:分析数据的误差判断各母体均值是否相等
(三)方差分析的有关术语
1. 2.
试验 母体
这里只涉及一个因素,因此称为单因素四水 平的试验 因素的每一个水平可以看作是一个母体
*这个名字也表示:它是通过对数据误差来源的分析
判断不同母体的均值是否相等。因此,进行方差分析
时,需要考察数据误差的来源。
(三)方差分析的基本原理
1. 比较两类误差,以检验均值是否相等 2. 比较的基础是方差比

3. 如果系统(处理)误差显著地不同于随机 误差,则均值就是不相等的;反之,均值就 是相等的 4. 误差是由各部分的误差占总误差的比例 来测度的
x
n x
i 1
k
i i
故H0 成立时QA 不应太大,取检验统计量为
n
QA ni xi x
i 1
r
2
QA /( r 1) H 0 F ~ F (r 1, n r ) QE /( n r )
(三)H0 的拒绝域
由于QA及 QT =QA +QE ,故QA与F 等价,
行业 观测值 零售业 旅游业 航空公司 家电制造业
1 2 3 4 5 6 7
57 66 49 40 34 53 44
68 39 29 45 56 51
31 49 21 34 40
44 51 65 77 58
(一)图形分析
80 60
子样平均值的折线
ý Î Ê ß ´ ¶ Ë ±Í »
40 20 0 0
故 xij x ni xi x xij xi
r ni 2 r 2 r ni i 1 j 1 i 1 i 1 j 1
2
2、各平方和的作用及分布 (1) QE 反映随机抽样误差的大小,该误差是 由于各母体子样值内部的差异,可认为是由2 2 引起的误差。由于 X i ~ N ( mi , )
相关文档
最新文档