随机变量分布及数字特征
第五节随机变量分布的数字特征E(X)
例5
解
1 x 10 P { X 1} e d x 1 e 0.1 0.0952, 0 10
1
1 x 10 P{1 X 2} e dx 1 10
2
e 0.1 e 0.2 0.0861,
1 x 10 P{2 X 3} e dx 2 10
3
e 0.2 e 0.3 0.0779,
解
设1年中死亡人数为X , 则 X ~ b(10000 ,0.002 )
10000
1000 E ( X ) k 0 k (0.002)k (1 0.002)10000 k k 20(人).
被保险人所得赔偿金的期望值应为
20 2000 40000(元 ).
n
n
( n 1)! np p k 1 (1 p)( n1)( k 1) k 1 ( k 1)![( n 1) ( k 1)]!
n
np[ p (1 p )]n1
=np
则两点分布b(1,p)的数学期望为 p.
例4 泊松分布
设 X ~ P( ), 且分布律为
解
引入随机变量 X i ,
0, 在第 i 站没有人下车, Xi i 1,2,,10. 1, 在第 i 站有人下车 ,
则 X X 1 X 2 X 10 .
9 9 则有 P{ X i 0} , P{ X i 1} 1 , 10 10
E ( X 1 ) 8 0.3 9 0.1 10 0.6 9.3(环), E ( X 2 ) 8 0.2 9 0.5 10 0.3 9.1(环),
概率论-随机变量的几种重要分布及数字特征
2. 若X 是随机变量,若C是常数,则 E(CX ) CE( X );
3. 若 ( X ,Y )是二维随机向量,则
E( X Y ) E( X ) E(Y );
注: 推广到 n 维随机向量,有
n
n
E( Xi ) E(Xi )
i 1
ห้องสมุดไป่ตู้
i 1
数学期望的性质
4. 若 ( X ,Y ) 是二维随机向量,且 X ,Y相互独立,
E( X )E(Y ) E( XY ) E( X )E(Y ).
特别地,当X与Y 独立时,有 cov( X ,Y ) 0.
协方差的性质 1. 协方差的基本性质
(1) cov( X , X ) D( X ); (2) cov( X ,Y ) cov(Y , X ); (3) cov(aX ,bY ) abcov( X ,Y ), 其中 a,b 是
定理1 设 X 是一个随机变量,Y g( X ), 且E(X ) 存
在, 于是
(1) 若X 为离散型随机变量,其概率分布为
P{ X xi } pi , i 1,2,
若 g(xi ) pi 绝对收敛,则Y的数学期望为
i 1
E(Y ) E[g( X )] g(xi ) pi;
cov( X ,Y )
[x E( X )][ y E(Y )] f ( x, y)dxdy.
协方差的定义
利用数学期望的性质,易将协方差的计算化简.
cov( X ,Y ) E{[ X E( X )][Y E(Y )]} E( XY ) E( X )E(Y ) E(Y )E( X )
x0
连续型随机变量的分布及其数字特征
连续型随机变量的分布及其数字特征一、基本概念设随机变量X 的分布函数为F (x ),若存在非负函数f (x ),使对任意实数x ,有X x F {P )(=≤⎰∞-=xx x f x d )(}则称X 为连续型随机变量,并称 f (x )为X 的概率密度,它满足以下性质:① f (x )≥0,-∞<x <+∞; ② ⎰+∞∞-=1d )(x x f ; ③ P{a <x ≤b }=F (b )-F (a )=⎰ba x x f d )(; ④ P{x =a }=0.二、常见的三种连续型随机变量的概率分布常用的三种连续型随机变量的概率分布是均匀分布、指数分布和正态分布. (1) 均匀分布若连续型随机变量X 的概率密度为 ⎪⎩⎪⎨⎧<<-=其它,0;,1)(b x a ab x f MATLAB 提供的有关均匀分布的函数如下:unifpdf(X ,A ,B ) 均匀分布的密度函数 unifcdf(X ,A ,B ) 均匀分布的累积分布函数unifinv(P ,A ,B ) 均匀分布的逆累积分布函数 unirnd(A ,B ,m ,n ) 均匀分布的随机数发生器 unifstat(A ,B ) 均匀分布的数学期望与方差其中X 为随机变量,P 为概率值,A ,B 为均匀分布参数,m 和n 为生成随机数矩阵的行数和列数.(2) 指数分布如果随机变量X 的概率密度为⎩⎨⎧<≥-=0,0;0),exp()(x x x x f λλ其中λ为常数,则称X 服从参数为λ的指数分布,记作X ~e (λ). MATLAB 提供的有关指数分布的函数如下:exppdf(X ,L ) 指数分布的密度函数 expcdf(X ,L ) 指数分布的累积分布函数 expinv(P ,L ) 指数分布的逆累积分布函数 exprnd(X ,L ,m ,n ) 产生服从指数分布的随机数 expstat(L ) 求指数分布的数学期望与方差其中X 为随机变量,L 为参数λ,P 为显著概率,m 和n 为随机数矩阵的行数和列数. 绘制指数分布密度函数和累积分布函数图形的程序如下x=-0.1:0.001:0.4;subplot(1,2,1);plot(x,y,'k'); axis([-0.1,0.4,-0.1,21]);subplot(1,2,2);plot(x,z,'k'); axis([-0.1,0.4,-0.1,1.1]);指数分布的密度函数及累积分布函数图(3) 标准正态分布如果随机变量X 的概率密度为:,,2)(exp 21)(22+∞<<∞-⎪⎪⎭⎫⎝⎛--=x x x f σμσπ 其中μ和σ均为常数,且σ>0,则称X 服从参数为μ和σ2的正态分布,记作X ~N(μ,σ2).当μ=0,σ=1时,称X 服从标准正态分布,记作X ~N(0,1). MATLAB 提供的有关正态分布的函数如下:normpdf(X ,M ,C ) 正态分布的密度函数 normcdf(X ,M ,C ) 正态分布的累积分布函数 norminv(P ,M ,C ) 正态分布的逆累积分布函数 normrnd(M ,C ,m ,n ) 产生服从正态分布的随机数 normstat(M ,C ) 求正态分布的数学期望和方差其中X 为随机变量,M 为正态分布参数μ,C 为参数σ,P 为显著概率,m 和n 为随机矩阵的行数和列数.绘制标准正态分布的密度函数及累积分布函数图和一般正态分布的密度函数及累积分布函数图的程序如下:x=-4:0.01:4;subplot(2,2,1);plot(x,y,'k');axis([-4,4,-0.1,0.5]);subplot(2,2,2);plot(x,z,'k');axis([-4,4,-0.1,1.1]);x=-4:0.01:16;y1=normpdf(x,6,1);z1=normcdf(x,6,1);y2=normpdf(x,6,4);z2=normcdf(x,6,4);y3=normpdf(x,6,0.6);z3=normcdf(x,6,0.6);subplot(2,2,3);plot(x,y1,'k',x,y2,'k',x,y3,'k');axis([-4,16,-0.1,0.8]);subplot(2,2,4);plot(x,z1,'k',x,z2,'k',x,z3,'k');axis([-4,16,-0.1,1.1]);三、求解方法(1)通用函数介绍.Pdf 计算已选函数的概率密度函数,调用格式为:Y=Pdf(name, X,A)Y=Pdf(name, X,A,B)Y=Pdf(name, X, A,B,C)Name为上表中取stat后的字符,如beta、 bino 、chiz、exp等。
1032随机变量的数字特征
k p(x)( X )k E[( X )k ] 一阶中心矩=0
x
二阶中心矩=方差
The End
2023/12/27
11
2.方差 & 标准差
▪ 反映随机变量取值偏离均值的分散程度 ▪ 方差 Variance D(X)/ Var(X)
2
D(X ) E[(X E(X )) ]
▪ 标准差 standard deviation
(X ) D(X )
方差的运算与性质
D(X ) E[(X )2 ] E(X 2) [E(X )]2
E[(X E( X )]• E[(Y E(Y )]
Covariance
E( XY) E( X )E(Y )
▪ 相关系数
XY
Cov( X ,Y ) D( X ) D(Y )
若随机变量X与Y相互独立
▪ X与Y一定不相关
Cov(X ,Y ) Cov((Y ) D(X Y) D(X ) D(Y)
E( X ) xk pk k 1
E( X ) xf (x)dx
数学期望的性质
X/Y为相互独立的随机变量,a/b/c为常数
▪ E(c) = c ▪ E(cX) = cE(X) ▪ E(aX+b) = aE(X)+b
▪ E(X+Y) = E(X)+ E(Y) ▪ E(XY) = E(X)*E(Y)
D(X ) p(x)(x )2 (x )2 f (x)dx x
离散型变量
连续型变量
D(X+c) = D(X) D(cX) = c2D(X)
D(cX+Y) = c2D(X) + D(Y)
3.协方差 & 相关系数
随机变量的数字特征
例 若随机变量X的概率密度为
f(x)(1 1x2), x
则称X服从柯西(Cauchy)分布。
但
|x|
f(x)d x (1| x|x2)dx 发散
所以柯西分布的数学期望不存在。
《医药数理统计方法》
§3.1
三、数学期望的性质
1、E(C)=C 2、E(CX)=C×E(X) 3、E(X±Y)=E(X)±E(Y)
n
n
3)设X1,X2,…,Xn相互独立,则 V(Xi)V(Xi)
i1
i1
V (1 n i n 1X i) n 1 2i n 1 V (X i) 1 n [1 n i n 1 V (X i)]
解:红细胞的变异系数为 C V(X1)4 0..1 27 98 16.965%
血红蛋白的变异系数为
10.2 C V(X2)117.68.673%
所以,血红蛋白的变异较大。
《医药数理统计方法》
§3.2
二、方差的性质
1、V(C)=0 证明:V(C)=E{[CE(C)]2} =E[(CC)2]=0
2、V(CX)=C2V(X) 证明:V(CX)=E{[CXE(CX)]2}
而 E (X 2 ) E (X X ) E (X )E (X ) 1 1 1
339
计算是错误的!!
《医药数理统计方法》
§3.2
§3.2 方差、协方差和相关系数
一、方差 二、方差的性质 三、其他数字特征
《医药数理统计方法》
§3.2
一、方差
例3.15 为了比较甲、乙两个专业射击运动 员的技术水平,令每人各射击5次,分别以 X1,X2表示他们射击的环数,结果如下:
即
E(X) xf(x)dx
离散型随机变量及其分布列、数字特征-高考数学复习
0.8 .
解析:由结论2易得 E ( X )=0.8.
目录
课堂演练
考点 分类突破
精选考点 典例研析 技法重悟通
PART
2
目录
分布列的性质
【例1】 (1)(2024·云南一中检测)设离散型随机变量ξ的分布列
如下表所示,则下列各式正确的是(
ξ
-1
0
)
1
2
3
P
D. P (ξ<0.5)=0
目录
1
1
1
3
3
3
3
3
2
1
1
+ d ≤ ,所以- ≤ d ≤ .
3
3
3
目录
解题技法
离散型随机变量分布列性质的应用
(1)利用“总概率之和为1”可以求相关参数的取值范围或值;
(2)利用“离散型随机变量在某一范围内的概率等于它取这个范围
内各个值的概率之和”求某些特定事件的概率;
(3)可以根据性质判断所得分布列结果是否正确.
【例2】 (多选)设离散型随机变量 X 的分布列为
X
P
0
q
1
0.4
2
0.1
3
0.2
4
0.2
若离散型随机变量 Y 满足 Y =2 X +1,则下列结果正确的有(
)
A. q =0.1
B. E ( X )=2, D ( X )=1.4
C. E ( X )=2, D ( X )=1.8
D. E ( Y )=5, D ( Y )=7.2
(2) E ( aX + b )= aE ( X )+ b , D ( aX + b )= a 2 D
( X );
专题06 离散型随机变量及其分布列、数字特征(解析版)
06离散型随机变量及其分布列、数字特征知识点1随机变量(1)定义:一般地,对于随机试验样本空间Ω中的每个样本点ω,都有唯一的实数X(ω)与之对应,我们称X为随机变量.随机变量的取值X(ω)随着随机试验结果ω的变化而变化.(2)离散型随机变量:可能取值为有限个或可以一一列举的随机变量称之为离散型随机变量.(2)表示:随机变量通常用大写英文字母表示,例如X,Y,Z;随机变量的取值用小写英文字母表示,例如x,y,z.知识点2离散型随机变量的分布列的定义(1)定义:一般地,设离散型随机变量X的可能取值为x1,x2,…,x i,…,x n,我们称X取每一个值x i 的概率P(X=x i)=p i,i=1,2,…,n为X的概率分布列,简称分布列.(2)表示方法:①表格;②概率分布图.知识点3离散型随机变量的分布列的性质(1)p i ≥0,i =1,2,…,n ;(2)p 1+p 2+…+p n =1.知识点4离散型随机变量的均值与方差一般地,若离散型随机变量X 的分布列如下表所示,X x 1x 2…x n Pp 1p 2…p n(1)均值:称E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n =i ii 1nx P =∑为随机变量X 的均值或数学期望,数学期望简称期望.(2)方差:称D (X )=(x 1-E (X ))2p 1+(x 2-E (X ))2p 2+…+(x n -E (X ))2p n =i 1n=∑(x i -E (X ))2p i 为随机变量X的方差,有时也记为Var (X ),并称D (X )为随机变量X 的标准差,记为σ(X ).(3)均值的意义:均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.(4)方差和标准差的意义:随机变量的方差和标准差都可以度量随机变量取值与其均值E (X )的偏离程度,反映了随机变量取值的离散程度.方差或标准差越小,随机变量的取值越集中;方差或标准差越大,随机变量的取值越分散.知识点5均值与方差的性质若Y =aX +b ,其中X 是随机变量,a ,b 是常数,随机变量X 的均值是E (X ),方差是D (X ).则E (Y )=E (aX +b )=aE (X )+b ;D (Y )=D (aX +b )=a 2D (X ).(a ,b 为常数).知识点6分布列性质的两个作用(1)利用分布列中各事件概率之和为1可求参数的值.(2)随机变量ξ所取的值分别对应的事件是两两互斥的,利用这一点可以求相关事件的概率.知识点7均值与方差的四个常用性质(1)E (k )=k ,D (k )=0,其中k 为常数.(2)E (X 1+X 2)=E (X 1)+E (X 2).(3)D (X )=E (X 2)-(E (X ))2.(4)若X1,X 2相互独立,则E (X 1X 2)=E (X 1)·E (X 2).考点1离散型随机变量分布列的性质(1)求a的值;(2)求;(3)求X.【答案】(1)由分布列的性质,得++++P(X=1)=a+2a+3a+4a+5a=1,所以a=115.(2)=++P(X=1)=3×115+4×115+5×115=45.(3)X=++=115+215+315=25.【总结】离散型随机变量分布列性质的应用(1)利用“总概率之和为1”可以求相关参数的取值范围或值;(2)利用“离散型随机变量在一范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率;(3)可以根据性质判断所得分布列结果是否正确.【变式1-1】设随机变量X的分布列为P(X=k)=Ck(k+1),k=1,2,3,C为常数,则P(X<3)=__________.【答案】89【解析】随机变量X的分布列为P(X=k)=Ck(k+1),k=1,2,3,∴C2+C6+C12=1,即6C+2C+C12=1,解得C=43,∴P(X<3)=P(X=1)+P(X=2)=43=89.【变式1-2】设离散型随机变量X的分布列为X01234P0.20.10.10.3m(1)求随机变量Y=2X+1的分布列;(2)求随机变量η=|X-1|的分布列;(3)求随机变量ξ=X2的分布列.【解析】(1)由分布列的性质知,0.2+0.1+0.1+0.3+m=1,得m=0.3.首先列表为:X012342X+113579从而Y=2X+1的分布列为:Y13579P0.20.10.10.30.3(2)列表为:X01234|X-1|10123∴P(η=0)=P(X=1)=0.1,P(η=1)=P(X=0)+P(X=2)=0.2+0.1=0.3,P(η=2)=P(X=3)=0.3,P(η=3)=P(X=4)=0.3.故η=|X-1|的分布列为:η0123P0.10.30.30.3(3)首先列表为:X01234X2014916从而ξ=X2的分布列为:ξ014916P0.20.10.10.30.3【变式1-3】设随机变量X的分布列如下:X12345P 112161316p则p为()A.1 6B.13C.14D.112【答案】C【解析】由分布列的性质知,112+16+13+16+p=1,∴p=1-34=14.【变式1-4】设X是一个离散型随机变量,其分布列为X-101P 121-q q-q2则q等于()A.1 B.22或-22C.1+22D.2 2【答案】D【解析】1-q+q-q2=1,1-q≤12,q-q2≤12,解得q=22.【变式1-5】(多选)设随机变量ξ的分布列为ak(k=1,2,3,4,5),则()A.a=115B.ξ=15C.ξ=215D.P(ξ=1)=310【答案】AB【解析】对于选项A,∵随机变量ξ的分布列为ak(k=1,2,3,4,5),∴P(ξ=1)=a+2a+3a+4a+5a=15a=1,解得a=115,故A正确;对于B,易知ξ3×115=15,故B正确;对于C,易知ξ=115+2×115=15,故C错误;对于D,易知P(ξ=1)=5×115=13,故D错误.【变式1-6】设X是一个离散型随机变量,其分布列为X01P9a2-a3-8a则常数a的值为()A.13B.23C.13或23D.-13或-23【答案】A【解析】≤9a 2-a ≤1,≤3-8a ≤1,a 2-a +3-8a =1,解得a =13.【变式1-7】离散型随机变量X 的概率分布列为P (X =n )=an (n +1)(n =1,2,3,4),其中a 是常数,则P X 的值为()A.23B.34C.45D.56【答案】D【解析】因为P (X =n )=a n (n +1)(n =1,2,3,4),所以a 2+a 6+a 12+a 20=1,所以a =54,所以X P (X =1)+P (X =2)=54×12+54×16=56.【变式1-8】若随机变量X 的分布列如下表,则mn 的最大值是()X 024Pm0.5n A.116B.18C.14D.12【答案】A【解析】由分布列的性质,得m +n =12,m ≥0,n ≥0,所以mn =116,当且仅当m =n =14时,等号成立.【变式1-9】随机变量X 的分布列如下:X -101Pabc其中a ,b ,c 成等差数列,则P (|X |=1)=______,公差d 的取值范围是______.【答案】23-13,13【解析】因为a ,b ,c 成等差数列,所以2b =a +c .又a +b +c =1,所以b =13,所以P (|X |=1)=a +c =23.又a =13-d ,c =13+d ,根据分布列的性质,得0≤13-d ≤23,0≤13+d ≤23,所以-13≤d ≤13.考点2求离散型随机变量的分布列【例2】双败淘汰制是一种竞赛形式,与普通的单败淘汰制输掉一场即被淘汰不同,参赛者只有在输掉两场比赛后才丧失争夺冠军的可能.在双败淘汰制的比赛中,参赛者的数量一般是2的次方数,以保证每一轮都有偶数名参赛者.第一轮通过抽签,两人一组进行对阵,胜者进入胜者组,败者进入负者组.之后的每一轮直到最后一轮之前,胜者组的选手两人一组相互对阵,胜者进入下一轮,败者则降到负者组参加本轮负者组的第二阶段对阵;负者组的第一阶段,由之前负者组的选手(不包括本轮胜者组落败的选手)两人一组相互对阵,败者被淘汰(已经败两场),胜者进入第二阶段,分别对阵在本轮由胜者组中降组下来的选手,胜者进入下一轮,败者被淘汰.最后一轮,由胜者组最终获胜的选手(此前从未败过,记为A)对阵负者组最终获胜的选手(败过一场,记为B),若A胜则A获得冠军,若B胜则双方再次对阵,胜者获得冠军.某围棋赛事采用双败淘汰制,共有甲、乙、丙等8名选手参赛.第一轮对阵双方由随机抽签产生,之后每一场对阵根据赛事规程自动产生对阵双方,每场对阵没有平局.(1)设“在第一轮对阵中,甲、乙、丙都不互为对手”为事件M,求M的概率;(2)已知甲对阵其余7名选手获胜的概率均为23,解决以下问题:①求甲恰在对阵三场后被淘汰的概率;②若甲在第一轮获胜,设甲在该项赛事的总对阵场次为随机变量ξ,求ξ的分布列.【分析】(1)先求出8人平均分成四组的方法数,再求出甲,乙,丙都不分在同一组的方法数,从而可求得答案;(2)①甲恰在对阵三场后淘汰,有两种情况:“胜,败,败”和“败,胜,败”,然后利用互斥事件的概率公式求解即可;②由题意可得ξ∈{3,4,5,6,7},然后求出各自对应的概率,从而可得ξ的分布列.【解析】(1)8人平均分成四组,共有C28C26C24C22A44种方法,其中甲,乙,丙都不分在同一组的方法数为A35,所以P(A)=A35C28C26C24C22A44=4 7.(2)①甲恰在对阵三场后淘汰,这三场的结果依次是“胜,败,败”或“败,胜,败”,故所求的概率为23×13×13+13×23×13=427.②若甲在第一轮获胜,ξ∈{3,4,5,6,7}.当ξ=3时,表示甲在接下来的两场对阵都败,即P(ξ=3)=13×13=19.当ξ=4时,有两种情况:(ⅰ)甲在接下来的3场比赛都胜,其概率为23×23×23=827;(ⅱ)甲4场对阵后被淘汰,表示甲在接下来的3场对阵1胜1败,且第4场败,概率为C12·23×13×13=427,所以P (ξ=4)=827+427=49.当ξ=5时,有两种情况:(ⅰ)甲在接下来的2场对阵都胜,第4场败,概率为23×23×13=427;(ⅱ)甲在接下来的2场对阵1胜1败,第4场胜,第5场败,概率为C12·23×13×23×13=881;所以P (ξ=5)=427+881=2081.当ξ=6时,有两种情况:(ⅰ)甲第2场胜,在接下来的3场对阵为“败,胜,胜”,其概率为23×132=881;(ⅱ)甲第2场败,在接下来的4场对阵为“胜,胜,胜,败”,其概率为133×13=8243;所以P (ξ=6)=881+8243=32243.当ξ=7时,甲在接下来的5场对阵为“败,胜,胜,胜,胜”,即P (ξ=7)=134=16243.所以ξ的分布列为:ξ34567P194920813224316243【总结】离散型随机变量分布列的求解步骤【变式2-1】为创建国家级文明城市,某城市号召出租车司机在高考期间至少进行一次“爱心送考”,该城市某出租车公司共200名司机,他们进行“爱心送考”的次数统计如图所示.(1)求该出租车公司的司机进行“爱心送考”的人均次数;(2)从这200名司机中任选两人,设这两人进行送考次数之差的绝对值为随机变量X ,求X 的分布列.【解析】(1)由统计图得200名司机中送考1次的有20人,送考2次的有100人,送考3次的有80人,∴该出租车公司的司机进行“爱心送考”的人均次数为20×1+100×2+80×3200=2.3.(2)从该公司任选两名司机,记“这两人中一人送考1次,另一人送考2次”为事件A ,“这两人中一人送考2次,另一人送考3次”为事件B ,“这两人中一人送考1次,另一人送考3次”为事件C ,“这两人送考次数相同”为事件D .由题意知X 的所有可能取值为0,1,2,则P (X =0)=P (D )=C 220+C 2100+C 280C 2200=83199,P (X =1)=P (A )+P (B )=C 120C 1100C 2200+C 1100C 180C 2200=100199.P (X =2)=P (C )=C 120C 180C 2200=16199.∴X 的分布列为:X 012P8319910019916199【变式2-2】(多选)设离散型随机变量X 的分布列为X 01234Pq0.40.10.20.2若离散型随机变量Y 满足Y =2X +1,则下列结果正确的有()A .q =0.1B .E (X )=2,D (X )=1.4C .E (X )=2,D (X )=1.8D .E (Y )=5,D (Y )=7.2【答案】ACD【解析】因为q +0.4+0.1+0.2+0.2=1,所以q =0.1,故A 正确;由已知可得E (X )=0×0.1+1×0.4+2×0.1+3×0.2+4×0.2=2,D (X )=(0-2)2×0.1+(1-2)2×0.4+(2-2)2×0.1+(3-2)2×0.2+(4-2)2×0.2=1.8,故C 正确;因为Y =2X +1,所以E (Y )=2E (X )+1=5,D (Y )=4D (X )=7.2,故D 正确.考点3求离散型随机变量的均值与方差【例3】为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为14,16;1小时以上且不超过2小时离开的概率分别为12,23;两人滑雪时间都不会超过3小时.(1)求甲、乙两人所付滑雪费用相同的概率;(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:元),求ξ的分布列与数学期望E (ξ),方差D (ξ).【解析】(1)两人所付费用相同,相同的费用可能为0,40,80元,两人都付0元的概率为P 1=14×16=124,两人都付40元的概率为P 2=12×23=13,两人都付80元的概率为P 3-14--16-=124.则两人所付费用相同的概率为P =P 1+P 2+P 3=124+13+124=512.(2)ξ可能取值为0,40,80,120,160,则P (ξ=0)=14×16=124,P (ξ=40)=14×23+12×16=14,P (ξ=80)=14×16+12×23+14×16=512,P (ξ=120)=12×16+14×23=14,P (ξ=160)=14×16=124.所以,随机变量ξ的分布列为ξ04080120160P1241451214124∴E (ξ)=0×124+40×14+80×512+120×14+160×124=80,D (ξ)=(0-80)2×124+(40-80)2×14+(80-80)2×512+(120-80)2×14+(160-80)2×124=40003.【总结】求离散型随机变量ξ的均值与方差的步骤(1)理解ξ的意义,写出ξ全部的可能取值;(2)求ξ取每个值的概率;(3)写出ξ的分布列;(4)由均值的定义求E (ξ),由方差的定义求D (ξ).【变式3-1】据有关权威发布某种传染病的传播途径是通过呼吸传播,若病人(患了某种传染病的人)和正常人(没患某种传染病的人)都不戴口罩而且交流时距离小于一米90%的机率被传染,若病人不戴口罩正常人戴口罩且交流时距离小于一米时60%的机率被传染,若病人戴口罩而正常人不戴口罩且交流距离小于一米时30%的机率被传染上,若病人和正常人都带口罩且交流距离大于一米时不会被传染.为此对某地经常出入某场所的人员通过抽样调查的方式对戴口罩情况做了记录如下表:男士女士戴口罩不戴口罩戴口罩不戴口罩甲地40203010乙地10304515假设某人是否戴口罩互相独立(1)求去甲地的男士带口罩的概率,用上表估计所有去甲地的人戴口罩的概率.(2)若从所有男士中选1人,从所有女士中选2人,用上表的频率估计概率,求戴口罩人数X 的分布列和期望.(3)上表中男士不戴口罩记为“ξ=0”,戴口罩记为“ξ=1”,确定男士戴口罩的方差为Dξ,和女士不戴口罩记为“η=0”,戴口罩记为“η=1”确定女士戴口罩的方差为Dη.比较Dξ和Dη的大小,并说明理由.【解析】(1)设“去甲地的男士带口罩”为事件M ,则P (M )=4040+20=23,设“去甲地的人戴口罩”为事件N ,则P (N )=40+3040+20+30+10=710,(2)设“男士带口罩”为事件A ,则P (A )=40+1040+20+10+30=12,设“女士带口罩”为事件B ,则P (B )=30+4530+10+45+15=34,所有男士中选1人,从所有女士中选2人,戴口罩人数X =0,1,2,3,P (X =0)=12×14×14=132,P (X =1)=12×14×14+12×34×14+12×14×34=732,P (X =2)=12×34×14+12×14×34+12×34×34=1532,P (X =3)=12×34×34=932分布列为:X123P1327321532932E (X )=0×132+1×732+2×1532+3×932=2(3)E (ξ)=0×12+1×12=12,D (ξ)=(0-12)2×12+(1-12)2×12=14,E (η)=0×14+1×34=34,D (η)=(0-34)2×14+(1-34)2×34=316.100名男士中有50人戴口罩,50人不戴口罩,100名女士中有75人戴口罩,25人不戴口罩,从数据分布可看出来女士戴口罩的集中程度要好于男士,所以其方差偏小.【变式3-2】已知X 的分布列为X -101P121316设Y =2X +3,则E (Y )的值为()A .73B .4C .-1D .1【答案】A【解析】∵E (X )=-12+16=-13,∴E (Y )=E (2X +3)=2E (X )+3=-23+3=73.【变式3-3】已知离散型随机变量X 的分布列为X 012P0.51-2qq 2则常数q =________.【答案】1-22【解析】由分布列的性质得0.5+1-2q +q 2=1,解得q =1-22或q =1+22(舍去).【变式3-4】设随机变量X 的分布列为P (X =k )=a k,k =1,2,3,则a 的值为__________.【答案】2713【解析】因为随机变量X 的分布列为P (X =k )=a k,k =1,2,3,所以根据分布列的性质有a ·13+a 2+a 3=1,所以a +19+=a ×1327=1,所以a =2713.【变式3-5】已知随机变量X 的分布列如下:X -101P121316若Y =2X +3,则E (Y )的值为________.【答案】73【解析】E (X )=-12+16=-13,则E (Y )=E (2X +3)=2E (X )+3=-23+3=73.【变式3-6】若随机变量X 满足P (X =c )=1,其中c 为常数,则D (X )的值为________.【答案】0【解析】因为P (X =c )=1,所以E (X )=c ×1=c ,所以D (X )=(c -c )2×1=0.【变式3-7】(2022·昆明模拟)从1,2,3,4,5这组数据中,随机取出三个不同的数,用X 表示取出的数字的最小数,则随机变量X 的均值E (X )等于()A.32B.53C.74D.95【答案】A【解析】由题意知,X 的可能取值为1,2,3,而随机取3个数的取法有C 35种,当X =1时,取法有C 24种,即P (X =1)=C 24C 35=35;当X =2时,取法有C 23种,即P (X =2)=C 23C 35=310;当X =3时,取法有C22种,即P (X =3)=C 22C 35=110;∴E (X )=1×35+2×310+3×110=32.【变式3-8】已知随机变量X ,Y 满足Y =2X +1,且随机变量X 的分布列如下:X 012P1613a则随机变量Y 的方差D (Y )等于()A.59B.209C.43D.299【答案】B【解析】由分布列的性质,得a =1-16-13=12,所以E (X )=0×16+1×13+2×12=43,所以D (X )×16+×13+×12=59,又Y =2X +1,所以D (Y )=4D (X )=209.【变式3-9】已知m ,n 为正常数,离散型随机变量X 的分布列如表:X -101Pm14n若随机变量X 的均值E (X )=712,则mn =________,P (X ≤0)=________.【答案】11813【解析】+n +14=1,-m =712,=112,=23,所以mn =118,P (X ≤0)=m +14=13.【变式3-10】(2022·邯郸模拟)小张经常在某网上购物平台消费,该平台实行会员积分制度,每个月根据会员当月购买实物商品和虚拟商品(充话费等)的金额分别进行积分,详细积分规则以及小张每个月在该平台消费不同金额的概率如下面的表1和表2所示,并假设购买实物商品和购买虚拟商品相互独立.表1购买实物商品(元)(0,100)[100,500)[500,1000)积分246概率141214表2购买虚拟商品(元)(0,20)[20,50)[50,100)[100,200)积分1234概率13141416(1)求小张一个月购买实物商品和虚拟商品均不低于100元的概率;(2)求小张一个月积分不低于8分的概率;(3)若某个月小张购买了实物商品和虚拟商品,消费均低于100元,求他这个月的积分X 的分布列与均值.【解析】(1)小张一个月购买实物商品不低于100元的概率为12+14=34,购买虚拟商品不低于100元的概率为16,因此所求概率为34×16=18.(2)根据条件,积分不低于8分有两种情况:①购买实物商品积分为6分,购买虚拟商品的积分为2,3,4分;②购买实物商品积分为4分,购买虚拟商品的积分为4分,故小张一个月积分不低于8分的概率为14×+12×16=14.(3)由条件可知X 的可能取值为3,4,5.P (X =3)=1313+14+14=25,P (X =4)=P (X =5)=1413+14+14=310,即X 的分布列如下:X 345P25310310E (X )=3×25+4×310+5×310=3910.考点4均值与方差在决策中的作用【例4】2021年3月5日李克强总理在政府作报告中特别指出:扎实做好碳达峰,碳中和各项工作,制定2030年前碳排放达峰行动方案,优化产业结构和能源结构.某环保机器制造商为响应号召,对一次购买2台机器的客户推出了两种超过机器保修期后5年内的延保维修方案:方案一:交纳延保金5000元,在延保的5年内可免费维修2次,超过2次每次收取维修费1000元;方案二:交纳延保金6230元,在延保的5年内可免费维修4次,超过4次每次收取维修费t 元;制造商为制定收取标准,为此搜集并整理了200台这种机器超过保修期后5年内维修的次数,统计得到下表:维修次数0123机器台数20408060以这200台机器维修次数的频率代替1台机器维修次数发生的概率,记X 表示2台机器超过保修期后5年内共需维修的次数.(1)求X 的分布列;(2)以所需延保金与维修费用之和的均值为决策依据,为使选择方案二对客户更合算,应把t 定在什么范围?【分析】(1)由题设描述确定2台机器超过保修期后5年内共需维修的次数的可能值,并确定对应的基本事件,进而求各可能值的概率,写出分布列.(2)根据(1)所得分布列,由各方案的费用与维修次数的关系写出费用的分布列,并求期望,通过期望值的大小关系求参数的范围.【解析】(1)由题意得,X =0,1,2,3,4,5,6,P (X =0)=110×110=1100,P (X =1)=110×15×2=125,P (X =2)=110×25×2+15×15=325,P (X =3)=110×310×2+15×25×2=1150,P (X =4)=310×15×2+25×25=725,P (X =5)=310×25×2=625,P (X =6)=310×310=9100,∴X 的分布列为X 0123456P110012532511507256259100(2)选择方案一:所需费用为Y 1元,则X ≤2时,Y 1=5000,X =3时,Y 1=6000;X =4时,Y 1=7000;X =5时,Y 5=8000,X =6时,Y 1=9000,∴Y 1的分布列为Y 150006000700080009000P1710011507256259100E (Y 1)=5000×17100+6000×1150+7000×725+8000×625+9000×9100=6860,选择方案二:所需费用为Y 2元,则X ≤4时,Y 2=6230;X =5时,Y 2=6230+t ;X =6时,Y 2=6230+2t ,则Y 2的分布列为Y 262306230+t 6230+2t P671006259100E (Y 2)=6230×67100+(6230+t )×625+(6230+2t )×9100=6230+21t50,要使选择方案二对客户更合算,则E (Y 2)<E (Y 1),∴6230+21t50<6860,解得t <1500,即t 的取值范围为[0,1500).【总结】利用均值、方差进行决策的2个方略(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.(2)若两随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.【变式4-1】直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有56是“年轻人”.(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,并根据列联表判断是否有85%的把握认为经常使用网络直播销售与年龄有关?使用直播销售情况与年龄列联表年轻人非年轻人合计经常使用直播销售用户不常使用直播销售用户合计(2)某投资公司在2021年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为710,15,110;方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为35,310,110.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.参考数据:独立性检验临界值表α0.150.100.0500.0250.010x α2.0722.7063.8415.0246.635其中,χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .【解析】(1)由图1知,“年轻人”占比为45.5%+34.5%=80%,即有200×80%=160(人),“非年轻人”有200-160=40(人),由图2知,“经常使用直播销售用户”占比为30.1%+19.2%+10.7%=60%,即有200×60%=120(人),“不常使用直播销售用户”有200-120=80(人).“经常使用直播销售用户的年轻人”有120×56=100(人),“经常使用直播销售用户的非年轻人”有120-100=20(人).∴补全的列联表如下:年轻人非年轻人合计经常使用直播销售用户10020120不常使用直播销售用户602080合计16040200于是a =100,b =20,c =60,d =20.∴χ2=200×(100×20-60×20)2120×80×160×40=2512≈2.083>2.072,即有85%的把握认为经常使用网络直播销售与年龄有关.(2)若按方案一,设获利X 1万元,则X 1可取的值为300,-150,0,X 1的分布列为:X 1300-1500p71015110E (X 1)=300×710+(-150)×15+0×110=180(万元),D(X1)=(300-180)2×710+(-150-180)2×15+(0-180)2×110=1202×710+3302×15+1802×110=35100若按方案二,设获利X2万元,则X2可取的值为500,-300,0,X2的分布列为:X2500-3000p 35310110E(X2)=500×35+(-300)×310+0×110=210(万元),D(X2)=(500-210)2×35+(-300-210)2×310+(0-210)2×110=2902×35+5102×310+2102×110=132900∵E(X1)<E(X2),D(X1)<D(X2),由方案二的均值要比方案一的均值大,从获利角度来看方案二更大,故选方案二.由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故选方案一.【变式4-2】某班体育课组织篮球投篮考核,考核分为定点投篮与三步上篮两个项目.每个学生在每个项目投篮5次,以规范动作投中3次为考核合格,定点投篮考核合格得4分,否则得0分;三步上篮考核合格得6分,否则得0分.现将该班学生分为两组,一组先进行定点投篮考核,一组先进行三步上篮考核,若先考核的项目不合格,则无需进行下一个项目,直接判定为考核不合格;若先考核的项目合格,则进入下一个项目进行考核,无论第二个项目考核是否合格都结束考核.已知小明定点投篮考核合格的概率为0.8,三步上篮考核合格的概率为0.7,且每个项目考核合格的概率与考核次序无关.(1)若小明先进行定点投篮考核,记X为小明的累计得分,求X的分布列;(2)为使累计得分的均值最大,小明应选择先进行哪个项目的考核?并说明理由.【解析】(1)由已知可得,X的所有可能取值为0,4,10,则P(X=0)=1-0.8=0.2,P(X=4)=0.8×(1-0.7)=0.24,P(X=10)=0.8×0.7=0.56,所以X的分布列为X0410P0.20.240.56(2)小明应选择先进行定点投篮考核,理由如下:由(1)可知小明先进行定点投篮考核,累计得分的均值为E(X)=0×0.2+4×0.24+10×0.56=6.56,若小明先进行三步上篮考核,记Y为小明的累计得分,则Y的所有可能取值为0,6,10,P(Y=0)=1-0.7=0.3,P (Y =6)=0.7×(1-0.8)=0.14,P (Y =10)=0.7×0.8=0.56,则Y 的均值为E (Y )=0×0.3+6×0.14+10×0.56=6.44,因为E (X )>E (Y ),所以为使累计得分的均值最大,小明应选择先进行定点投篮考核.【变式4-3】为加快某种病毒的检测效率,某检测机构采取“k 合1检测法”,即将k 个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;②已知10人分成一组,分10组,两名感染患者在同一组的概率为111,定义随机变量X 为总检测次数,求检测次数X 的分布列和均值E (X );(2)若采用“5合1检测法”,检测次数Y 的均值为E (Y ),试比较E (X )和E (Y )的大小(直接写出结果).【解析】(1)①对每组进行检测,需要10次;再对结果为阳性的一组每个人进行检测,需要10次,所以总检测次数为20.②由题意,X 可以取20,30,P (X =20)=111,P (X =30)=1-111=1011,则X 的分布列为X 2030P1111011所以E (X )=20×111+30×1011=32011.(2)由题意,Y 可以取25,30,两名感染者在同一组的概率为P 1=C 120C 22C 398C 5100=499,不在同一组的概率为P 1=9599,则E (Y )=25×499+30×9599=295099>E (X ).【变式4-4】(2022·莆田质检)某工厂生产一种精密仪器,由第一、第二和第三工序加工而成,三道工序的加工结果相互独立,每道工序的加工结果只有A ,B 两个等级.三道工序的加工结果直接决定该仪器的产品等级:三道工序的加工结果均为A 级时,产品为一等品;第三工序的加工结果为A 级,且第一、第二工序至少有一道工序加工结果为B 级时,产品为二等品;其余均为三等品.每一道工序加工结果为A 级的概率如表一所示,一件产品的利润(单位:万元)如表二所示:表一工序第一工序第二工序第三工序概率0.50.750.8表二等级一等品二等品三等品利润2385(1)用η表示一件产品的利润,求η的分布列和均值;(2)因第一工序加工结果为A 级的概率较低,工厂计划通过增加检测成本对第一工序进行改良,假如改良过程中,每件产品检测成本增加x (0≤x ≤4)万元(即每件产品利润相应减少x 万元)时,第一工序加工结果为A 级的概率增加19x .问该改良方案对一件产品利润的均值是否会产生影响?并说明理由.【解析】(1)由题意可知,η的所有可能取值为23,8,5,产品为一等品的概率为0.5×0.75×0.8=0.3,产品为二等品的概率为(1-0.5×0.75)×0.8=0.5,产品为三等品的概率为1-0.3-0.5=0.2,所以η的分布列为η2385P0.30.50.2E (η)=23×0.3+8×0.5+5×0.2=11.9.(2)改良方案对一件产品的利润的均值不会产生影响,理由如下:在改良过程中,每件产品检测成本增加x (0≤x ≤4)万元,第一工序加工结果为A 级的概率增加19x ,设改良后一件产品的利润为ξ,则ξ的所有可能取值为23-x,8-x,5-x ,+19x 0.75×0.8=0.3+x15,二等品的概率为10.75×0.8=0.5-x15,三等品的概率为10.2,所以E (ξ)-x )-x )+0.2×(5-x )=6.9-0.3x +2315x -115x 2+4-0.5x -815x +1152+1-0.2x =11.9,因为E (ξ)=E (η),所以改良方案对一件产品的利润的均值不会产生影响.1.(多选)设离散型随机变量X 的分布列如下表:X 12345Pm0.10.2n0.3若离散型随机变量Y =-3X +1,且E (X )=3,则()A .m =0.1B .n =0.1C .E (Y )=-8D .D (Y )=-7.8【答案】BC【解析】由E (X )=1×m +2×0.1+3×0.2+4×n +5×0.3=3得m +4n =0.7,又由m +0.1+0.2+n +0.3=1得m +n =0.4,从而得m =0.3,n =0.1,故A 选项错误,B 选项正确;E (Y )=-3E (X )+1=-8,故C 选项正确;因为D (X )=0.3×(1-3)2+0.1×(2-3)2+0.1×(4-3)2+0.3×(5-3)2=2.6,所以D (Y )=(-3)2D (X )=23.4,故D 选项错误.2.已知随机变量ξ的分布列如下表,D (ξ)表示ξ的方差,则D (2ξ+1)=___________.ξ012pa1-2a14【答案】2【解析】由题意可得:a +1-2a +14=1,解得a =14,ξ012p141214所以E (ξ)=0×14+1×12+2×14=1,D (ξ)=14(0-1)2+12×(1-1)2+14×(2-1)2=12,D (2ξ+1)=22D (ξ)=2.3.京西某地到北京西站有阜石和莲石两条路,且到达西站所用时间互不影响.下表是该地区经这两条路抵达西站所用时长的频率分布表:时间(分钟)10~2020~3030~4040~5050~60莲石路(L 1)的频率0.10.20.30.20.2阜石路(L 2)0.10.40.40.1的频率若甲、乙两人分别有40分钟和50分钟的时间赶往西站(将频率视为概率)(1)甲、乙两人应如何选择各自的路径?(2)按照(1)的方案,用X表示甲、乙两人按时抵达西站的人数,求X的分布列和数学期望.【解析】(1)A i表示事件“甲选择路径L i时,40分钟内赶到火车站”,B1表示事件“乙选择路径L i时,50分钟内赶到火车站”,i=1,2,用频率估计相应的概率,则有P(A1)=0.1+0.2+0.3=0.6,P(A2)=0.1+0.4=0.5,P(A1)>P(A2),所以甲应选择路径L1;P(B1)=0.1+0.2+0.3+0.2=0.8,P(B2)=0.1+0.4+0.4=0.9,P(B1)<P(B2),所以乙应选择路径L2;(2)用A,B分别表示针对(1)的选择方案,甲,乙在各自的时间内到达火车站,由(1)知P(A)=0.6,P(B)=0.9,且A,B相互独立,X的取值是0,1,2,P(X=0)=P(A-B-)=0.1×0.4=0.04,P(X=1)=P(A-B+A B-)=0.4×0.9+0.6×0.1=0.42,P(X=2)=P(AB)=0.9×0.6=0.54,所以X的分布列为:X012P0.040.420.54E(X)=0×0.04+1×0.42+2×0.54=1.5.4.品酒师需定期接受酒味鉴别功能测试,通常采用的测试方法如下:拿出n(n∈N*且n≥4)瓶外观相同但品质不同的酒让品酒师品尝,要求其按品质优劣为它们排序;经过一段时间,等其记忆淡忘之后,再让其品尝这n瓶酒,并重新按品质优劣为它们排序.这称为一轮测试,根据一轮测试中的两次排序的偏离程度的高低为其评分.现分别以a1,a2,a3,…,a n表示第一次排序时被排在1,2,3,…,n的n种酒在第二次排序时的序号,并令X=|1-a1|+|2-a2|+|3-a3|+...+|n-a n|,则X是对两次排序的偏离程度的一种描述.下面取n=4研究,假设在品酒师仅凭随机猜测来排序的条件下,a1,a2,a3,a4等可能地为1,2,3,4的各种排列,且各轮测试相互独立.(1)直接写出X的可能取值,并求X的分布列和数学期望;(2)若某品酒师在相继进行的三轮测试中,都有X≤2,则认为该品酒师有较好的酒味鉴别功能.求出现这种现象的概率,并据此解释该测试方法的合理性.【解析】(1)X的可能取值为0,2,4,6,8P(X=0)=1A44=124,。
离散型随机变量及其分布列、数字特征
-0.6)2×0.006=0.46.
方法总结
1.求离散型随机变量的均值与方差关键是确定随机变量的所有可能
值,写出随机变量的分布列,正确运用均值、方差公式进行计算.
2.注意E ( aX + b )= aE ( X )+ b , D ( aX + b )= a 2 D ( X )的应用.
p
知识点三 离散型随机变量的数字特征
1. 均值
(1)一般地,若离散型随机变量 X 的分布列为
X
x1
x2
···
xi
···
xn
P
p1
p2
···
pi
···
pn
则称 E ( X )=
x 1 p 1+ x 2 p 2+···+ xipi +···+ xnpn
= ∑ xipi 为随机变量
=1
X 的均值或数学期望,它反映了随机变量取值的 平均水平
3
0.3
方法总结
离散型随机变量分布列的性质的应用
1.利用“所有概率之和为1可以求相关参数的取值范围或值.”
2.利用“离散型随机变量在一范围内的概率等于它取这个范围内各个
值的概率之和”求某些特定事件的概率.
3.可以根据性质判断所得分布列结果是否正确.
跟踪训练
1. 设离散型随机变量 X 的分布列为
X
数 X ( w ) 与之对应,我们称
X 为随机变量.
2. 离散型随机变量
可能取值为
有限个 或可以一一列举的随机变量,我们称之为离散型
随机变量,通常用大写英文字母表示随机变量,例如 X , Y , Z ;用小
随机变量分布与数字特征
5. 1 随机变量
(1)离散型随机变量:取有限个或无限可列个值。如例(1)、例(2 ) 。 (2)非离散型随机变量:可在整个数轴上取值或取实数某部分区间的全部
值。非离散型随机变量范围较广,本书只研究其中常遇见的一种—连续 型随机变量,如例(3)、例(4)。 例5.1.1设有2个一级品,3个二级品的产品,从中随机取出3个产品,如 果用X表示取出产品中一级品的个数,求X取不同值时相应的概率。 解:X可取值为{0,1,2}。
分布,分别求(1)每分钟恰好接到3次呼叫的概率;(2)每分钟内接到呼叫次 数不布
在二项分布中,当n很大(n>>10)且P很小(P≤1)时,也可近似用泊松分布 公式计算,其中λ=np。
例5. 2. 7若一年中参加某种寿险的人死亡率为0. 002,现有2 000人参加, 每人交保险费24元,一旦死亡保险公司赔偿5 000元,求(1)保险公司亏 本的概率;(2)保险公司盈利不少于10 000元的概率。
也有不少试验结果初看与数字无直接关系,但可通过如下示性函数使之
数值化。比如,产品合格与不合格可令 否
,事件A发生与
用
,这些事件数值化后,数量是会变化的,称为变量。
但变量取值机会有大有小,所以叫随机变量。
下一页 返回
5. 1 随机变量
定义5.1.1在某一随机试验中,对于试验的每一个样本点ω都唯一对应一 个数,这样依不同样本点ω而取不同值的点叫随机变量。通常用希腊字 母或大写英文字母X, Y, Z等表示随机变量,用小写英文字母xi、yi表示 随机变量相应于某个试验结果所取的值。
例5. 2. 1某汽车公司销售汽车数据表示在过去100天营业时间中,有24 天每天销售汽车是0辆,有38天每天销售为1辆,有20天每天销售为2辆, 有12天每天销售为3辆,有6天每天销售为5辆。定义随机变量X为一天 中售出汽车数取值为{0,1,2,3,5},概率用P(X)表示,可求出P(X=0)
概率论数字特征
在概率论中,数字特征是用来描述随机变量分布特征的数字指标。
以下是概率论中常见的数字特征:
1. 期望:
-期望是随机变量概率分布的均值,反映随机变量的平均取值水平,通常用E(X) 表示。
-期望可以通过对随机变量的每种可能取值乘以其对应的概率,再求和得到。
2. 方差:
-方差是随机变量与其期望的离差平方的平均值,反映随机变量取值的分散程度,通常用Var(X) 或σ^2 表示。
-方差可以通过将随机变量每种可能取值减去其期望,然后平方,再乘以对应的概率,再求和得到。
3. 标准差:
-标准差是方差的算术平方根,通常用σ表示,具有与原始数据相同的单位。
-标准差可以用来衡量随机变量取值的波动程度。
4. 偏态:
-偏态是随机变量分布的不对称程度,若右侧尾部更长,则为正
偏态;若左侧尾部更长,则为负偏态。
-偏态可以通过随机变量的三阶中心矩计算得到。
5. 峰态:
-峰态是随机变量分布的峰度,反映随机变量分布曲线的陡峭程度,通常用K 表示。
-峰态可以通过随机变量的四阶中心矩计算得到。
6. 分位数:
-分位数是将随机变量分为若干部分的数字点,例如中位数就是将随机变量分为两部分的点,25%分位数就是将随机变量分为四部分的点等等。
-分位数可以用来表示随机变量分布的位置和离散程度。
在实际应用中,以上数字特征经常被用来描述随机变量分布的性质和特征,例如对于正态分布,期望和方差可以完全描述其分布特征。
对于非正态分布,还需要考虑偏态和峰态等特征。
2.2随机变量的数字特征
数学期望也称为均值。
返回主目录
二、 随机变量的函数的分布
随机变量的函数
设 X 是一随机变量,Y 是 X 的函数, g X , 则 Y Y
也是一个随机变量.当 X 取值 x时,Y 取值 y g x
本节的任务就是:
已知随机变量 X 的分布,并且已知Y g X , 要求随机变量Y 的分布.
返回主目录
此时称Y 服从自由度为1的 2分布。
二、 随机变量的函数的分布
例 6
设 随机变量 X 的密度函数为 f X x , X ,试 Y 求随机变量Y 的密度函数 f Y y .
设随机变量X 的分布函数为FX y ,随机变量 Y 的分布函数为FY y
解:
FY y P y P X y Y
解:(1) 先求 Y = X 2 的分布函数 FY(y):
10 由于 Y X 2 0, 故当 y 0 时 FY ( y) 0.
20 当 y 0 时, FY ( y ) P{Y y} P{ X 2 y} P{ y X y }
y y
f X ( x)dx.
Y = (X-1)2
的分布律.
1 2 X -1 0 pk 0.2 0.3 0.1 0.4
解: Y 有可能取的值为 0,1,4. 且 Y=0 对应于 ( X-1)2=0, 解得 X=1, 所以, P{Y=0}=P{X=1}=0.1,
返回主目录
二、 随机变量的函数的分布
例 2(续) Y=(X-1)2 同理,
(1) 旅客 8:00 到站,求他侯车时间的数学期望。 (2) 旅客 8:20 到站,求他侯车时间的数学期望。
解:设旅客的候车时间为 X(以分记)
随机变量的5个数字特征
随机变量的5个数字特征。
随机变量的5个数字特征
随机变量是一种可以在多种不同情况下表现出不同数值的变量,它的数字特征可以帮助我们更加深入的了解一个随机变量的性质。
下面就介绍随机变量的5个数字特征:
首先是均值,它是一个随机变量的平均数,用来反映其数值的平均水平,可以帮助我们预测其可能表现出的数值范围;
其次是方差,它反映了一个随机变量的数值水平差异程度,当方差较低时,意味着随机变量的数值波动不大;
接着是标准差,它是方差的平方根,可以反映一个随机变量的数值分散程度,标准差越小,意味着数值的分布越集中;
最后还有三个数字特征,分别是偏度、峰度和相关系数,它们分别反映一个随机变量数值分布的偏斜程度、峭度以及与其他变量之间的关联程度。
总之,随机变量的5个数字特征,即均值、方差、标准差、偏度、峰度和相关系数,可以帮助我们更加深入地了解一个随机变量的性质,从而更好地分析和预测数据作出正确的决策。
概率论与数理统计2.1随机变量的分布与数字特征
对于任意的实数 x1, x2 (x1< x2) ,有:
P{x1 X x2} P{X x2} P{ X x1}
X
F ( x2 ) F ( x1 ).
o
x1
x2
x
随机变量的分布函数定义了事件域σ(X)上的一个概
率测度。分布函数也为随机变量的统计规律性提供了
直观的描述。
例8
等可能地在数轴上的有界区间[a,b]上投点,记X为 落点的位置(数轴上的坐标),求随机变量X的分布 函数
例2
掷一颗骰子,用 X 表示出现的点数。则 X 就是一 个随机变量.它的取值为1,2,3,4,5,6。则
X 4表示掷出的点数不超过 4 这一随机事件;
X 取偶数表示掷出的点数为偶数这一随机事件.
在同一个样本空间上可以定义不同的随机变
例量如.我们可以定义:
Y
1 0
出现偶数点 出现奇数点
Z
1 0
点数为 6 点数不为 6
例4
观察某生物的寿命(单位:小时),用Z表示该生
物的寿命。则 Z 就是一个随机变量。它的取值为 所有非负实数。
Z 1500
表示该生物的寿命不超过1500小时这一随机事
件.
Z 3000
表示该生物的寿命大于 3000小时这一随机事件.
注意 Z 的取值是无界的区间 个!
二、离散型随机变量的概率分布
离散型随机变量的定义 如果随机变量 X 的全部不同取值是有限个或可列无 穷多个,则称 X 为离散型随机变量。 离散型随机变量的概率分布
第 2 章 随机变量的分布与数字特征
§2.1 随机变量及其分布 §2.2 随机变量的数字特征 §2.3 常用的离散型分布 §2.4 常用的连续型分布 §2.5 随机变量函数的分布
随机变量的数字特征
随机变量的数字特征
随机变量的数字特征包括均值、方差、标准差、偏度和峰度等。
其中,均值是衡量随机变量中心位置的指标,是所有取值的平均数;方差是随机变量离均值的距离平方的平均数;标准差是方差的算术平方根,也是随机变量离均值距离的度量,具有与随机变量相同的量纲;偏度是随机变量概率分布的偏斜程度,为其分布的非对称程度的度量;峰度则是随机变量概率分布的尖锐程度,衡量随机变量的概率分布在平均值附近的峰值高低。
可以通过计算公式来求解以上数字特征,例如均值的计算公式为所有取值的总和除以取值的数量;方差的计算公式为将每个取值与均值的差值平方后的总和除
以取值的数量;标准差的计算公式则是方差的算术平方根;偏度的计算公式为三阶中心矩与标准差的比值;峰度的计算公式为四阶中心矩与标准差的四次幂的比值。
了解随机变量的数字特征有助于描绘随机变量的特征与规律,进而分析和预测其行为。
同时,对于特定应用领域,也需要针对性地选择数字特征进行分析,以
更好地满足应用的需求。
第十章 第五节 离散型随机变量的分布列及数字特征
(1)C 解析:D(3X-1)=9D(X),只需求 D(X)的最大值即可,根据题意 a+b
又 0≤p1≤1,∴0≤13 -d≤1,∴-23 ≤d≤13 .同理,由 0≤p3≤1,p3=d+13 , ∴-13 ≤d≤23 ,∴-13 ≤d≤13 ,即公差 d 的取值范围是-13,13 .
3.随机变量 X 的概率分布列如下:
X0
1
2
3
4
5
6
P
1 a
1 a
C16
1 a
C26
1 a
C36
1 a
为
X x1 x2 …
xi
…
xn
P p1 p2 …
pi
…
pn
则称 E(X)=x1p1+x2p2+…+xnpn 为 X 的数学期望或均值.
意义:离散型随机变量的数学期望刻画了这个离散型随机变量的平均水平.
(2)离散型随机变量的方差定义:
设离散型随机变量 X 的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
X
-1
0
1
P
1 4
1 2
1 4
A.0 B.1 C.14
D.12
D 解析:E(X)=-1×14 +0×12 +1×14 =0,
则 D(X)=14 ×(-1-0)2+12 ×(0-0)2+14 ×(1-0)2=12 .
第二章随机变量的分布和数字特征习题课
第二章 随机向量的分布和数字特征的习题课一:选择题:1. 若随机变量 21,X X 的分布函数为)(1x F 与)(2x F 则a ,b 取值为( )时,可使F(x)=a )(1x F -b )(2x F 为某随机变量的分布函数。
A.3/5,-2/5 B.2/3,2/3 C.-1/2,3/2 D.1/2,-3/2分析:由分布函数在±∞的极限性质,不难知a,b 应满足a-b=1,只有选项A 正确。
[答案 选:A] 2. 设 X ~ϕ(x ),且ϕ (-x )= ϕ(x ),其分布函数为F (x ),则对任意实数a , F (-a )=( )。
A.1-⎰ax 0)(ϕd x B . 21-⎰ax 0)(ϕ d x C .F(a) D .2F(a)-1 分析:①是偶函数,可结合标准正态分布来考虑;②⎰ax 0)(ϕ d x =F(a)-F(0);③F(0)=0.5;④F(a)+F(-a)=1 [答案 选:B] 3.设X ~N (μ,2σ),则随着σ的增大,P (|X -μ|<σ)( )。
A.单调增大 B.单调减少 C.保持不变 D.增减不定 [答案 选:C]4.设随机变量X 与Y 均服从正态分布,X ~N(μ,16),Y ~N(μ,25),记P{X ≤μ+4}=1p ,P{Y ≤μ+5}=2p ,则( )正确。
A.对任意实数μ,均有1p =2pB. 对任意实数μ,均有1p <2pC.只对个别的μ值才有 1p =2pD. 对任意实数μ,均有1p >2p [答案 选: A]5. 设X 是随机变量且)0,()(,)(2>==σμσμX D X E ,则对任意常数c ,()成立。
222)(.c EX c X E A -=-22)()(.μ-=-X E c X E B 22)()(.μ-<-X E c X E C22)()(.μ-≥-X E c X E D分析:[答案 选:D ]由2)(,)(σμ==X D X E ,得2222)()(μσ+=+=EX X D EX)2()(222c cX X E c X E +-=-∴2222222)(22c c c c cEX EX -+=+-+=+-=μσμμσ)2()(222μμμ+-=-X X E X E222222222σμμμσμμ=+-+=+-=EX EX显然22)()(μ-≥-X E c X E二:题空题1. 设在每次伯努里试验中,事件A 发生的概率均为p,则在n 次伯努里试验中,事件A 至少发生一次的概率为( ),至多发生一次的概率为( )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章 随机变量分布及数字特征10.1 随机变量 10.2 离散型随机变量分布1、学时:2学时2、过程与方法:结合实例介绍随机变量概念,离散型随机变量的概率分布、分布列、分布函数、概率及性质. 3、教学要求:(1)掌握随机变量及离散型随机变量的概率分布、分布列、分布函数、概率及性质 (2)几种常见概率分布教学重点:离散型随机变量的概率分布、分布列、分布函数、概率及性质 教学难点:离散型随机变量的分布函数 教学形式:多媒体讲授 教学过程:一、新课教学内容10.1 随机变量概率论与数理统计是从数量上来研究随机现象的统计规律,因此我们必须把随机事件数量化. 在随机试验中,结果有多种可能性,试验结果样本点很多可以与数值直接发生关系,如产品检验,我们关心的是抽样中出现的废品件数.商店销售我们重视每天销售额,利润值.在投骰子中是每次出现的点数等.但是也有不少试验结果初看与数字无直接关系,但我们可通过如下示性函数使之数值化,比如,产品合格与不合格令⎩⎨⎧=01ξ不合格合格 事件10A A X ⎧=⎨⎩发生与否用 不发生发生这些事件数值化后,数量是会变化的称为变量.变量取值机会有大有小所以叫随机变量 .定义1:在某一随机试验中,对于试验的每一个样本点ω都唯一对应一个数,这样依不同样本点ω而取不同值的点叫随机变量.通常用希腊字母或大写英文字母X 、Y 、Z 等表示.用小写英文字母i i y x 、表示随机变量相应于某个试验结果所取的值.举例:1°投骰子出现的点数用随机变量X 表示,X 可取值为{},,,,,,654321 2°电信局话务台每小时收到呼叫次数用Y 表示,Y 可取值为{} 210,,3°总站每五分钟发某一路车,乘客在车站候车时间{}50≤≤=t t ξ 4°某一电子零件的寿命用{}30000≤≤=t t T 按其取值情况可以把随机变量分成两类:(1)离散型随机变量:取有限个或无限可列个值.如例1°、2°.(2)非离散型随机变量:可在整个数轴上取值或取实数某部分区间的全部值.非离散型随机变量范围较广,本书只研究其中常遇见的一种称为连续型随机变量如例3°、4°.例1 设有2个一级品,3个二级品的产品,从中随机取出3个产品,如果用X 表示取出产品中一级品的个数,求X 取不同值时相应概率.解 X 可取值为{}210,,101)0(3533===C C X P 53)1(352312===C C C X P 103)2(351322==C C C X P 例2 抛一枚匀称的硬币,引进一变量Y 令⎩⎨⎧=01Y 出现反面出现正面求出现正面与反面概率:解 21)0(==Y P 21)1(==Y P 10.2 离散型随机变量分布10.2.1 离散型随机变量的概率分布例1 某汽车公司销售汽车数据表示在过去100天营业时间是有24天每天销售汽车是为0辆,38天每天销售为1辆,20天每天销售是为2辆,12天每天销售是为3辆,6天每天销售是为5辆.我们定义随机变量X 为一天中售出汽车数取值为{}53210,,,,,概率用P (X )表示,可求出24.010024)0(===X P 以此类推计算出汽车销售概率分布表为:从上表可知P (X=1)=0.38,一天最有可能卖出汽车为1辆.1天中汽车销售是大于等于3辆概率是18.0)5()3(==+=X P X P 这些概率有助于决策者了解某汽车公司销售情况以帮助制定更优策划案.而以上分布表就是离散型随机变量X 的分布表.定义1 设(1,2)k x k =为离散型随机变量X 的所有可能取的值,k p 是随机变量X 取k x 值时相应概率即得式子 ()(1,2,)k k P X x p k ===或写成如下表格形式:上式或上表称为离散型随机变量X 的概率分布或分布律由定义知概率分布具有下面性质. (1)0kp ≥ (k=1,2…) (2)1k kp =∑只有k p (k=1,2…)满足上述两条性质时上式或上表才能成为随机变量X 的概率分布.定义2 对于离散型随机变量X ,若对任何实数x 令()()k kx xF x P X x p≤=≤=∑称)(x F 为随机变量X的分布函数.分布函数)(x F 具有如下性质:(1)1)(0≤≤x F (2))(x F 是不减函数(3)()lim ()0x F F x →-∞-∞== ()lim ()1x F F x →+∞+∞==(4))(x F 若有间断点,在其间断点处右连续 (5))()()(1221x F x F x X x P -=≤<例2 设有一批产品10件,其中3件次品,从中任抽2件,如果用X 表示抽取次品数,求X 的概率分布与分布函数.解 设{}抽的次品数=X , 则X 可取值为{}2,1,0.157)0(21027===C C x P 157)1(2101317===C C C x P 151)2(21023===C C x Px ∴的概率分布为210273)(C C C k x P kk -== )210(、、=k 或用表格表示即其分布函数⎪⎪⎪⎩⎪⎪⎪⎨⎧≤<≤<≤<=x x x x x F 212115141015700)(例3 某水果店,根据零售葡萄的经验,预计做一笔生意,希望从这批货中得到毛利如下表:求每吨葡萄所得毛利分布列和分布函数,并画出分布函数图.解 设每吨葡萄所得毛利为X 千元则x 可能取值为{}2,1,2-∴其概率分布为其分布函数⎪⎪⎩⎪⎪⎨⎧=16.01.00)(x F 221122≥<≤<≤--<x x x x分布函数图10.2.2 常见的几种离散型的概率分布1、二点分布定义3 设随机变量X 的分布列为 (其中p+q=1,p>0,q>0)则称X 服从两点分布记为 X~(0,1)注:它适用于一次试验仅有两个结果的随机试验.2、二项分布二项分布适用于贝努里概型也称为独立实验序列.定义4:设一随机试验在同样条件下进行n 次独立重复试验,每一次试验事件A 只有两种结果:发生与不发生,发生的概率为p ,不发生的概率为1-p=q .在n 次独立试验中事件A 发生k 次概率为()k k n kn n P k C p q -=(k=0, 1, 2…n ), 此概型称为贝努里概型,其概率分布称为二项分布, 记为X~B (n ,p )。
显然当n=1时二项分布即成二点分布.贝努里概型在实际问题中有非常广泛的应用.例4 某服装店经理根据经验估计每个顾客进该店购买服装概率是0.3,现有3名顾客进店.问其中有2名顾客会购买的概率为多大?解 X 表示购买服装的顾客人数189.07.03.0)2(223=⨯==C x P例5 一条自动生产线上产品一级品率为0.6,现检查10件,求至少有两件一级品的概率. 解 设X 为一级品件数101019101010102(2)()1(0)(1)10.40.40.60.998k P x p k p p C =≥==--=--⨯≈∑3、泊松分布定义5 若随机变量X 的分布列为()!k e P x k k λλ-==)2,1,0,0( =>k λ则称X 服从参数为λ的泊松分布, 记为)(~λπX .泊松分布应用很广,如确定时间段通过交通路口的小轿车数,容器内细菌数,铸件疵点数,电话交换台电话被呼叫次数等都服从泊松分布.例6 已知某电话交换台每分钟接到呼唤次数X 服从参数4=λ的泊松分布,分别求(1)每分钟恰好接到3次呼唤概率(2)每分钟内接到呼唤次数不超过4次概率.解 (1)43!34)3(-==e X P 查泊松分布表得 1954.05665.07619.0)4()3()3(=-=≥-≥==X P X P X P(2)6288.03712.01)5(1)4(=-=≥-=≤X P X P在二项分布中当n 很大(n>>10)p 很小(p ≤0.1)时也可近似用泊松分布公式计算, 其中np =λ.例7 若一年中参加某种寿险的人死亡率为0.002,现有2000人参加.每人交保险费24元,一旦死亡保险公司赔偿5000元,求(1) 保险公司亏本概率(2)保险公司盈利不少于10000元的概率.解 设X 表死亡人数 则X~B (2000,0.002)002.02000==p n 较大 较小可近似用泊松分布计算4==np λ(1)若亏本即05000242000<-⨯x 得9>x0081.0!4)9(104==>∑∞=-x x x e x p (查泊松表)(2)盈利不少于10000即100005000242000≥-⨯x 得7≤x9489.0!41)7(1)7(84=-=>-=≤∑∞=-x x x e x p x p所以保险公司盈利概率是很大的.二、课堂小结本节介绍了随机变量的概念,离散型随机变量的概率分布,几种常见离散型概率分布,包括二项分布、两点分布、泊松分布.三、练习1、定点投篮一次,投中的概率为0.4,试用随机变量描述这一试验.2、一批产品分一、二、三级其中一级品是二级品的二倍,三级品是二级品的一半,从这批产品中随机抽取一个检验质量,用随机变量描述检验的可能结果.3、随机变量X的概率分布如下:问(1)这是一个概率分布吗?为什么(2)X=30的概率是多少?(3)X小于或等于25的概率是多少?(4)X大于30的概率是多少?4、下表为某公司营业第一年计划利润(X=利润)(以万元计)的概率分布,负值代表亏损.问(1)P(100)是多少?如何解释这个值.(2)该公司盈利的概率是多少?(3)该公司至少盈利100万的概率是多少?5、某商店销售某种水果,进货后第一天售出概率为60%,每500g的毛利为6元,第二天售出概率30%,每500g毛利为2元,第三天售出概率为10%,每500g的毛利为-1元, 求销售此种水果每500g所得毛利X 的概率分布,并求其分布函数.6、一批产品20件,其中有5件次品,从这批产品中任取4件求这4件产品中次品数X的分布(精确到0.01)7、从一个装有4个红球,2个白球的口袋中,一个一个地取球,共取5次,每次取出的球(1)取后放回;(2)取后不放回.求取得红球的个数X的概率分布.8、一批产品的废品率为0.001用泊松分布求800件产品中废品2件的概率以及废品数不超过2件的概率.9、若每次射击中靶的概率为0.7,若发射炮弹10次,分别求命中3次的概率,至少命中3次的概率及最多可命中几次,其概率为多少?10、设离散型随机变量XX试求(1)常数C ;(2)求P (X<1),P (X>0);(3)求其分布函数F (X )11、在人寿保险公司里,有3000个同一年龄段人参加人寿保险,假设在一年中,每人的死亡率为0.1%,参加保险的人在一年的第一天交纳保险费10元,死者家属可以从保险公司领取2000元赔偿金,求保险公司亏本的概率.10.3 连续型随机变量的分布1、学时:2学时2、过程与方法:对比离散型随机变量分布介绍连续型随机变量分布的情况. 3、教学要求:(1)掌握连续型随机变量分布、概率密度与分布函数、概念、性质 (2)几种常见连续型随机变量概率分布,正态分布查表教学重点:连续型随机变量分布、概率密度与分布函数、概念、性质,几种常见连续型随机变量概率分布,正态分布查表 教学难点:连续型随机变量分布、概率密度与分布函数 教学形式:多媒体讲授 教学过程:一、复习内容1. 随机变量的概念2. 离散型随机变量的概率分布:二项分布、两点分布、泊松分布 二、新课教学内容10.3.1 连续型随机变量的概率密度函数与分布函数定义1 对于随机变量X ,若存在非负可积函数))((+∞<<-∞x x f 使对任意实数a 、b (a<b )都有⎰=≤<badx x f b x a P )()(则称X 为连续型随机变量,)(x f 称为X 的概率密度函数, 简称概率密度或密度函数.性质:(1)0)(≥x f (2)⎰+∞∞-=+∞<<-∞=1)()(x P dx x f定义2 设X 为如上定义的随机变量, 函数{}⎰∞-=≤=xdt t f x X P x F )()( )(+∞<<-∞x称为连续型随机变量X 的分布函数.性质:(1)1)(0≤≤x F (2))(x F 是不减函数(3)()lim ()0x F F x →-∞-∞== ()lim ()1x F F x →+∞+∞==(4))(x F 若有间断点,在其间断点处右连续 (5))()()(1221x F x F x X x P -=≤<注:由微积分知识知道,在)(x f 连续点处连续型随机变量密度函数)(x f 等于分布函数F (x )的导数即)()(x f x F ='.值得注意是,对连续型随机变量X 来说它取任一指定实数值a 的概率为0即0)(==a x p例1 设⎩⎨⎧-=0)24()(2x x k x f 其他20<<x是某连续型随机变量X 的概率密度,求(1)常数k ;(2))31(<<x P ;(3))1(<x P解 (1)⎰⎰∞+∞-=-=-=1)322()24()(220322x x k dx x x k dx x f 83=∴k (2)⎰⎰=-=-==<<3121213225.0)322(83)24(83)()31(x x dx x x dx x f x P (3)⎰⎰∞-=-=-==<110103225.0)322(83)24(83)()1(x x dx x x dx x f x P 10.3.2 几种常见连续型随机变量的概率密度1、均匀分布定义3 若随机变量X 的概率密度为⎪⎩⎪⎨⎧-=01)(a b x f其他b x a << 则称X 在区间[a,b]上服从均匀分布, 记为X~U (a,b )可以计算其分布函数.0()1x a x a F x a x b b a x b<⎧⎪-⎪=≤<⎨-⎪≥⎪⎩例2 大多数计算机语言都有一个能够生成随机数的函数,在Excel 中RAND 函数多用于产生0到1之间随机数,生成的随机数机会是均等的,令X 表示生成的随机数.求(1)随机变量X 的概率密度;(2)产生一个在0.25到0.75之间的随机数概率是多少?(3)产生一个小于0.3随机数概率是多少?解 (1)⎩⎨⎧=01)(x f 其他10≤≤x (2)⎰==<<75.025.05.0)75.025.0(dx x P(3)⎰⎰∞-===<3.03.003.0)()3.0(dx dx x f x P2、指数分布定义4 如果随机变量X 的概率密度为⎩⎨⎧=-0)(x e x f λλ 00<≥x x )(为常数λ则称X 服从参数为λ的指数分布,记为X~E (λ),指数分布有着重要应用.有些元件寿命,动植物寿命,随机服务系统中服务时间等都可用指数分布来描述.例3 已知某种电子管的寿命X (小时)服从指数分布,X~E (0.001).一台仪器中有5个这种电子管,其中任一电子管损坏就停止工作,求仪器工作正常1000小时以上概率.解 x 的概率密度为⎪⎩⎪⎨⎧=-010001)(10001x e x f 00<≥x x⎰---=+=-=≤-=>100011000010001100011100011)1000(1)1000(e e dx e x p x p x x有5个电子管均在1000小时以上概率为51)(-e因此仪器正常工作1000小时以上概率为5-e .3、正态分布正态分布是最常见的也是最重要的一种分布,在自然现象和社会现象中,大量的随机变量都服从或近似服从正态分布.在某些条件下,即使原来不服从正态分布的一些独立随机变量,它们和的分布,当随机变量个数无限增加时也是趋于正态分布的.例如:测量误差、零件长度、直径、细纱的强力,螺丝口径,人的身高、体重等随机变量都服从正态分布.(1)正态分布的定义及其性质定义5 如果连续型随机变量的概率密度为222)(21)(σμσπϕ--=x ex )为常数、(0>σμσ)(+∞<<∞-x 则称x 服从正态分布, 记为),(~2σμN Xσμ、为其两个参数下图10-1为正态曲线图性质:1°关于直线μ=x 对称2°),()(μϕ-∞在x 严格上升,在()μ∞,+严格下降,在μ=x 处取得最大值σπ21.3°)(x ϕ有两拐点)21(21-±e σπσμ,4°以x 轴为渐近线.5°若固定σ,改变μ的值,则曲线)(x y ϕ=沿x 轴平行移动,曲线几何形状不变(见图10-2).若固定μ,改变σ值,σ越大)(x y ϕ=图形越平坦,σ越小图形越陡峭(见图10-3).特别地当1=μ,0=σ时称x 服从标准正态分布, 记)1,0(~N X其概率密度为20221)(x ex -=πϕ,其图形见右下图10-4:正态分布),(~2σμN X的分布函数为:dt e x X p x t x222)(21)()(σμσπ-∞-⎰=≤=Φ同理 标准正态分布)10(~,N X 的分布函数为dt e x X p x t x20221)()(-∞-⎰=≤=Φπ(2)正态分布的查表 正态分布函数若做变换σμ-=t y 则222()220()()()t y x xx x p X x dt dy μμσσμσ-----∞-Φ=≤===Φ⎰⎰由此可得如下定理:定理1 若),(~2σμN X 而()/Y X μσ=-则)1.0(~N Y图10-4所以一般正态分布均可以化为标准正态分布函数计算.下面就阐述服从标准正态分布随机变量x 落入区间的概率如何查标准正态分布表.查表方法为(1)当3.301.0<≤x ,可从表中直接查到)(0x Φ的值 (2)当3.3≥x ,可取1)(0≈Φx(3)当0<x 时,按公式)(1)(00x x Φ-=-Φ后查表进行计算这是因22220()t y xxx dt t y dy ----∞+∞Φ-==-⎰⎰令)(12112102222x dy e dy e y xy xΦ-=-==-∞--∞+⎰⎰ππ例4 设)1,0(~N x 求(1))96.1(≤x p (2))96.1(-<x p (3))96.1(>x p(4))21(<<-x p (5))5.5(<x p 解 (1)975.0)96.1()96.1(0=Φ=≤x p (2)025.0)96.1(1)96.1(0=Φ-=-<x p (3))96.1()96.1()96.1(-<+>=>x p x p x p05.0975.022)96.1(1)96.1(100=⨯-=Φ-+Φ-= (4)8186.01)1()2()1()2()21(0000=-Φ+Φ=-Φ-Φ=<<-x p (5)1)5.5()5.5(0≈Φ=<x p例5 设2~(8,0.5)X N 求(1))9(<x P (2))5.87(<<x p解 (1)9773.0)2()5.089()9()9(00=Φ=-Φ=Φ=<x p (2))5.087()5.085.8()7()5.8()5.87(00-Φ--Φ=Φ-Φ=<<x p8186.0197725.08413.01)2()1()2()1(0000=-+=-Φ+Φ=-Φ-Φ=例6 已知一批材料的强度2~(20018)X N ,.如果使用材料要求以99%概率保证强度不低于150.问这批材料是否合乎要求?解 )18200150(1)150(1)150(--=<-=≥p x p x p 01(2,78)(2.78)0.99730.99=-Φ-=Φ=>∴ 这批材料合乎要求例7 设随机变量),(~2σμN X 求x 落在区间)3,3(σμσμ+-内的概率 解 )3()3()33(00σμσμσμσμσμσμ--Φ--+Φ=+<<-x p9973.01)3(2)3()3(000=-Φ=-Φ-Φ=由例7可知正态随机变量x 落入区间)3,3(σμσμ+-的概率为0.9973.它说明在一次试验中,正态变量落入点μ的σ3领域内几乎是必然的.在企业管理中经常应用这一原理进行产品质量检查和工艺过程控制.这就是正态分布的“σ3法则”.三、课堂小结本节介绍了连续型随机变量的概率密度函数与分布函数,以及咱几种常见的连续型随机变量的概率密度函数与分布函数,包括均匀分布、指数分布、正态分布. 四、练习1、设连续型随机变量X 服从区间[])0(,>-a a a 的均匀分布,且已知概率31)1(=>x p 求(1)常数a 的值;(2))31(<x p2、在某公共电话亭,顾客打一次电话所用时间x 分钟是一个连续型随机变量,它服从参数为)0(>λλ的指数分布,且51=λ(1)任打一次电话所用时间在5分钟~10分钟的概率;(2)任打3次电话中至少有一次所用时间在5~10分钟的概率.3、某城镇每天用电量x 万度是连续型随机变量,其概率密度为⎩⎨⎧-=0)1()(2x kx x ϕ 其他10<<x试求(1)常数k (2)当每天供电量为0.8万度时,供电量不够的概率.4、设连续型随机变量x 的概率密度为⎩⎨⎧=0)(cxx f其他42≤≤x 试求(1)常数C (2))3(>x p (3)求其分布函数)(x F5、已知)1,0(~N X 求(1))20(<<x p (2))2(-<x p (3))2(<x p6、已知)1,0(~N X 若025.0)(=>λx p ,求λ.7、已知)9,4(~N X ,求(1))88.94(<<x p (2))88.9(>x p8、某商店供应一地区1000人的商品,若某种商品在一段时间内每人需要一件概率是0.6,问商店需要准备多少件这种商品,才能以99.7%概率保证不会脱销(假设各个人是否购买该商品是彼此独立的)?9、某牌号牙膏的销售量X 近似服从正态分布10000μ=(支/周),1500σ=(支/周)求(1)在任一给定周内,销售量超过12000支的概率是多少?(2)为使公司有充足的库存以满足每周需求概率达到0.95,应生产多少支?10.4 数学期望1、学时:2学时2、过程与方法:结合实例介绍离散型随机变量及连续性随机变量数学期望及性质. 3、教学要求:(1)理解并掌握数学期望概念、性质 (2)掌握随机变量函数的数学期望教学重点:数学期望概念、性质,随机变量的数学期望 教学难点:随机变量的数学期望 教学形式:多媒体讲授 教学过程:一、复习内容1. 连续型随机变量的概率分布与密度函数2. 几种常见连续性随机变量的概率分布与密度函数:均匀分布、指数分布、正态分布. 二、新课教学内容10.4.1 离散型随机变量数学期望例1 一批钢筋共有10根,抗拉强度指标为120和130各2根, 125有3根, 110、90、140各有1根,则它们平均抗 拉强度指标为:5.121101)31252130212014090110(=⨯⨯+⨯+⨯+++ 当然也可以这样计算:11122311090140120130125121.5101010101010⨯+⨯+⨯+⨯+⨯+⨯=可以看出平均抗拉强度不是取这个钢筋6个值的平均数而是取值与值的权重的乘积,故称为加权平均,其权重=试验总次数该值次数 若把权重看为取该值概率则就得∑kk kp x定义1 离散型随机变量X 有概率函数()(1,2)k k p X x p k ===, 若级数∑∞=1k k k p x 绝对收敛 ,称该级数和为X 的数学期望, 简称期望或均值, 记为 1()kk k E X xp ∞==∑例2 若随机变量X 服从0-1分布求)(x E 解 X 的分布列为:()01E x q p p ∴=⨯+⨯=例3 某电脑公司欲开发一种软件,其开发费用为200万元,但有开发成功与不成功可能,据以往经验,开发成功概率0.6,不成功概率0.4,若成功就面临把软件推向市场,市场畅销可获利600万元而销畅概率为0.7,不畅销将损失100万元而不畅销概率为0.3.根据以上情况是否决定要开发软件.解 设获利数为X ,推向市场获利数为1X1()6000.70.3(100)390E X =⨯+⨯-=()3902000.6(200)0.41148034E X =-⨯+-⨯=-=()所以可以开发.例4 某投资者有10万元,有两种投资方案,一是购股票,二是存入银行取利息,买股票收益取决于经济形势,假设分三种状态:形势好,形势中等,形势不好(即经济衰退).形势好可获利20000元,若形势中等可获利8000元,若形势不好要损失15000元.如果存入银行,假设年利率2.5%可得利息2500元.又设形势好、中、差概率分别为30%、50%和20%,试问采用哪一种方案? 解 设方案1x 为买股票 方案2x 为存银行 1U 为形势好 2U 为形势中等 3U 为经济衷退1()200000.380000.5(15000)0.27000E X =⨯+⨯+-⨯=2()2500E X =12()()E X E X >∴方案1X 的期望收益较高, 采用方案1X .10.4.2 连续型随机变量数学期望定义 2 设连续型随机变量X 有概率密度)(x ϕ,若积分⎰+∞∞-dx x x )(ϕ绝对收敛, 则()()E X x x dx ϕ+∞-∞=⎰为X 的数学期望例5 ),(~b a U X 求E(X)解 ⎪⎩⎪⎨⎧-=01)(a b x ϕ 其他b x a ≤<1()()2baa bE X x x dx xdx b a ϕ+∞-∞+===-⎰⎰例6 设2~(,)X N μσ 求E(X)解222)(21)(σμσπϕ--=x e x )(+∞<<-∞x222()22()()x t E X dx tt edt μσμσ---+∞+∞-∞-∞==+⎰(注:利用变量替换 x=μ+σt )=dt tedt et t ⎰⎰∞+∞--∞+∞--+222222πσπμ π2(22=⎰∞+∞--dt et220)t te dt +∞--∞=⎰=μμ=-0所以正态分布的数学期望μ就是其第一个参数10.4.3 数学期望的性质1°若c 为常数 则E (c )=C2°若k 为常数 则E (kX )=kE (X ) 3°若a ,b 为常数 则E (aX+b )=aE(X) +b4°x ,y 为两随机变量 则E (X+Y )=E (X )+E (Y )这性质可以推广到任意有限个随机变量,即1212()()()()n n E X X X E X E X E X +++=+++特别n 个随机变量的算术平均数仍是一个随机变量,其期望值等于这n 个随机变量期望的算术平均数即1111()n ni i i i E X EX n n ===∑∑ 5°设X 、Y 为两个相互独立的随机变量 则E (XY )=E (X )E (Y ) 例7 设~(3,4)X N 求(3)E X 及 (34)E X + 解~(3,4)()3X N E X ∴=(3)3()9E X E X == (34)3()413E X E X +=+=10.4.4 随机变量函数的数学期望定义3 设X 为随机变量,(),()Y f X f X =(为连续函数) (1)若X 为离散型随机变量,其分布列()(1,2)k k P X x p k ===, 如果级数k k k p x f ∑∞=1)(绝收收敛, 则1()[()]()kkk E Y E f X f x p∞===∑.(2)若X 为连续型随机变量, 其分布密度函数为)(x ϕ, 如果⎰+∞∞-dx x x f )()(ϕ绝对收敛, 则有()[()]()()E Y E f X f x x dx ϕ+∞-∞==⎰因此,求随机变量函数Y=f (X )的数学期望E (Y ),不必先求出Y 的概率分布,只需知道X 的概率分布就行了.例8 设随机变量X 的分布列为且22,()Y X X E Y =+求解 221()(2)(2)ii i i E Y E X X xx p ϕ==+=+∑2222(1)2(1)0.10200.2(121)0.3(222)0.44x ⎡⎤⎡⎤=-+-++⨯⨯++⨯⨯++⨯⨯⎣⎦⎣⎦=例9 一仪器由两个主要部件组成,其总长度为此二部件长度之和,这两部件长度ηξ与为两个相互独立的随机变量,其分布律如下表:求 (1) 总长度的数学期望 (2) 求 ()E ξη解 (1)设仪器总长度为n +=ξζ 9.92.0115.0103.09)(=⨯+⨯+⨯=ξE6.66.074.06)(=⨯+⨯=ηE5.166.69.9)()()(=+=+=ηξζE E E(2)34.656.69.9)()()(=⨯==∴ηξξηηξE E E 相互独立与 注意下面计算是错误的 56.436.6)()()(22===ηηηE E E∵)()()(Y E X E XY E =要求X 与Y 相互独立,而η与其本身绝不能说是相互独立.所以要用随机变量函数的数学期望公式计算.三、课堂小结本节学习了离散型随机变量以及连续型随机变量数学期望,数学期望的性质、随机变量函数的数学期望. 四、练习1.已知离散型随机变量x试求数学期望E(X)2.设随机变量X 的概率分布为试求(1))(X E (2)(1)E X -+ (3)2()E X 3.设随机变量x 的概率分布如下表X0 1 2试求 (1)常数c 值(2))20(<<x p (3)数学期望E(X)4.一万张奖券中,有1张一等奖,奖金1000元,10张二等奖,每张奖金100元,有100张三等奖,每张奖金10元.从一万张奖券中抽出一张,求一张奖券的数学期望.5.已知连续型随机变量x 的概率密度为⎪⎩⎪⎨⎧=0ln 2)(x x x f 1x e ≤≤其它 )(x E 试求6.设连续型随机变量X 的概率密度为⎩⎨⎧=0)(αkx x f 其他)0,0(10>><<αk x 已知数学期望54)(=X E 求常数k 与α的值 7.对球的直径X 作近似测量 若X 在区间[]b a ,上服从均匀分布,求球体积的数学期望.8.各月份对某公司产品需求有很大差异,根据过去两年的数据得到公司产品月需求量概率分布如下(1)若公司根据月需求量的数学期望来确定月订单数,则公司认为这种产品的月订单数是多少? (2)假设每单位产品销售收入为700元,每单位产品购入成本为500元,如果订购量基于(1)中答案,并且实际需求量为400单位,那么这月公司盈利或亏损多少?10.5方差1、学时:2学时2、过程与方法:结合实例介绍方差的定义、性质及计算方法.3、教学要求:(1)掌握方差的概念、性质 教学重点:方差的概念、性质 教学形式:多媒体讲授 教学过程:一、复习内容1. 离散型随即变量数学期望2. 连续性随机变量3. 数学期望的性质4. 随机变量函数的数学期望 二、新课教学内容10.5.1方差的定义例1 有甲、乙两种牌号的手表,它们日走的误差分别为21x x 与,各具有如下分布列:易验证12()()0E X E X ==,如果从期望看分不出它们的优势,但仔细观察,显然甲牌号比乙牌号优,因其误差较小,如何计算就是这节讨论的内容.如果X 是随机变量,()X E X -是衡量随机变量X 与它期望E(X)的偏差,但绝对值运算有许多不方便之处,人们就用2(())X E X -去衡量.但[]2()X E X -仍是一个随机变量,所以就用它的数学期望,即[]2()E X E X -来衡量X 与E (X )的偏离程度.定义 1 设X 为随机变量,如果[]2()E X E X -存在,则称它为X 的方差.记为()D X , 即[]2()()D X E X E X =-称为X的均方差或标准差记为()()X X σσ=即方差也可使用如下公式 2()[()]DE X E X =-(X )证明:2[()]D E X E X =-(X )=2222{2()[()]}()[()]E X XE X E X E X E X -+=- 例2 计算例1中的方差12()()D X D X 和以确定哪个牌号手表质量较优解 22221()(1)0.100.810.10.2E X =-⨯+⨯+⨯=22111()()[()]0.200.2D X E X E X =-=-=222222()(2)0.1(1)0.200.410.220.1 1.2E X =-⨯+-⨯+⨯+⨯+⨯= 22222()()[()] 1.20 1.2D X E X E X =-=-=21()()D X D X ∴>所以牌号甲手表较乙优例3 2~(,)()X N D X μσ求解22()2222()[()]()()x D X E X E X E X x dx μσμμ--+∞-∞=-=-=-⎰令t x =-σμ则2222222()t t D X t e dt tdeσ--+∞+∞-∞-∞===222222|t t e dt --+∞+∞-∞-∞⎰=22222σπσ=-∞+∞-⎰dt et所以正态分布中参数2σ恰为随机变量X 的方差. 例4.试对A 、B 方案进行投资风险价值分析.解 投资风险价值是反映投资者冒着风险进行某次投资所得到的报酬.投资风险越大,为补偿额外风险,通常其所要求获得的报酬也就越高.在实际工作中,测量风险通常用“标准差”,一般地,标准差越大说明投资风险就越大,投资风险价值通常也就越大.设A X 表示A 方案的收益,B X 表示B 方案的投资收益,则(40000.130000.820000.13000A E X =⨯+⨯+⨯=) 2222(40000.130000.820000.19200000A E X =⨯+⨯+⨯=)22()()[()]447.21A A A D X E X E X =-=≈同理()4000B E X = =1264.91从上面结果可看出:A 方案均收益比B 方案低,而A 方案投资风险比B 方案小.即B 方案投资风险价值大于A 方案.在进行决策时,既要考虑风险因素,又要注意报酬.一般说当两个方案投资收益相同时,应选择标准差小的方案(风险小).若两个标准差相同时,应选择收益期望大的方案.10.5.2 方差性质1若c 为常数则D (c )=02若k 为常数则D (kX )=2()k D X3若a.b 为常数则2()()D aX b a D X +=4若X 与Y 相互独立则D (X Y ±)=D (X )+D (Y )下面只证22D (2222)[()]{2()[()]}kX E kX E kX E k X kXE kX E kX =-=-+=222()2()()[()]E k X E kX E kX E kX -+ ={}22222222()[()]()[()]()k E X k E X kE XE X K D X -=-=例5 ~X N (2,5),求D (3X ) 及 D (4X -3) 解 ~(2,5X N ) ()5D X = D(3X)=9D(X)=45 D(4X -3)=16D(X)=80数学期望和方差在概率统计中经常要用到,为了便于记忆,将常用分布的数学期望和方差列成下表10-1表10-1常用分布的数学期望和方差1,0n p <0)(0.1)k =三、课堂小结本节学习了方差的定义、性质、计算方法. 四、练习1、设离散型随机变量X~(0.1)若X 取1的概率p 为X 取0的概率q 的3倍,求方差D (X )2、一批零件中有9件合格品和3件废品,在安装机器时,从这批零件中任取1件,如果取出是废品就不再放回然后再取,直到取出合格品,求取得合格品之前,已知取出废品数的数学期望与方差.3、某菜市场零售某种蔬菜,售出情况如下表:求任取500g 蔬菜售价X 元的数学期望E (X )和方差D (X )4、设连续型随机变量X 的概率密度函数为⎪⎩⎪⎨⎧=021)(x x f其他10<<x 求(1)E (X ) (2)D(X) (3)D(2X -1)5、已知随机变量X 的数学期望E (X )=-2 方差D (X )=5 求(1)E (5X -2) (2) D(-2X+5)6、某地区失业率为4.1%,随机抽取100人求(1)失业人数的期望值 (2)失业人数的方差与标准差7、若X 为随机变量,13X E =() ()42XD = 求数学期望2()E X 8、已知X~N(1,2) Y~N(2,1) 且X 、Y 相互独立 求(1)E (3X -Y+4) (2)D (2X -3Y ) (3)E(21XY -1) 9、设随机变量X 的密度函数为⎩⎨⎧+=0)(2bx a x f 其他10≤≤x且E (X )=0.6 试确定系数a 、b,并求D (X )复习课1、学时:2学时2、教学要求:(1)本章知识点复习(2)复习题评讲 教学过程一、本章知识点复习1、随机变量:通俗地说是随机事件数量化而取的变量.我们着重研究离散型与连续型随机变量2、概率分布与分布函数。