优选第二讲随机变量基础
随机变量的定义定义ppt课件.ppt
在本章中, 我们将用实数来表示随机试 验的各种结果, 即引入随机变量的概念。 这 样, 不仅可以更全面揭示随机试验的客观存 在的统计规律性, 而且可使我们用微积分的 方法来讨论随机试验。
昆虫的产卵数。
离散的
七月份南昌的最高温度;
连续的
4
例
袋中有3只黑球,2只白球,从中任意取出3只球,观察
取出的3只球中的黑球的个数.我们将3只黑球分别记
作1,2,3号,2只白球分别记作4,5号,则该试验的
样本空间为
1, 2, 3 1, 2, 4 1, 2, 5
1, 2,
3, 3,
4 4
1, 3, 5 2, 3, 5
一个实数 a , w X w a ,w 是随机事件,称为
随机变量, 简记为X。
此处用{w}表示样本空间,并非样本空间中只有一个 元素w,而是用w表示所有的元素。
说明
⑴ 随机变量常用大写的英文字母X、Y、Z、或
希腊字母、、、等பைடு நூலகம்表示.
2 随机变量X不是实数的函数而是样本点 的函数
( 3)对于随机变量,我们常常关心的是它的取值, 一般采用小写字母x, y, z等表示.
1
2.1 随机变量
一、随机变量概念的产生 二、随机变量的定义
SCHOOL OF STATISTICS JUNBAI REN
一、 随机变量概念的产生
在实际问题中,随机试验的结果可以用数量 来表示,由此就产生了随机变量的概念。
3
1、有些试验结果本身与数值有关(本身就是一 个数)。
2概率统计第二讲
∑
k ≥1
pk=1.
三、一维离散型r.v的几个常用分布 一维离散型 的几个常用分布
1. 退化分布 单点分布) 退化分布(单点分布 单点分布 X~P{X=a}=1,其中 为常数。 ~ 为常数。 = = ,其中a为常数 2. (0-1)分布 两点分布 - 分布 两点分布) 分布(两点分布 X~P{X=k}=pk(1-p)1-k, (0<p<1) k=0,1 ~ = = - - = , 3. 几何分布 X~P{X=k}= (1-p)k-1 p, (0<p<1) k=1, 2, … ~ = = - - = 4. 二项分布 二项分布B(n, p) - - X~P{X=k}= Ck pk(1-p)n-k, ~ = = n (0<p<1) k=0, 1, 2, …, n =
3. [04(一)(三)(四)一(6)] 设r.v.X服从参数为λ的指数分布 则 服从参数为λ 一 三 四一 服从参数为 的指数分布,
P { X > DX } = _____ .
4. [98(三)(四)二(5)] 设F1(x)与F2(x)分别为 r.v.X1与X2的 三 四二 与 分别为 分布函数, 为使F(x)=a F1(x)−b F2(x)是某一 的分布函数 是某一r.v.的分布函数 分布函数 为使 − 是某一 的分布函数, 在下列给定的各组数值中应取 (A) a=3/5, b= −2/5 (C) a= −1/2, b= 3/2 5. 已知 ~ 已知X X P (B) a=2/3, b= 2/3 (D) a=1/3, b= −3/2 [ ]
2. 多维离散型随机变量函数的分布律
定理2 定理 设X1,X2,… , Xn是一个n维随机变量,若y= 则 Y=g(X1,X2,…, Xn)也是一个随机变量。 以二维为例,若 (X, Y)~P(X=xi, Y=yk)=pik ,i, k=1, 2, … 则 Z=g(X, Y)~P{Z=zl}=
2023考研概率统计全考点精讲-第二讲 随机变量及其分布
第二讲 随机变量及其分布【考试要求】1.理解随机变量的概念,理解分布函数(){}()F x P X x x =≤−∞<<+∞的概念及性质,会计算与随机变量相联系的事件的概率.2.理解离散型随机变量及其概率分布的概念,掌握0-1分布、二项分布(,)B n p 、几何分布、超几何分布、泊松(Poisson)分布()P λ及其应用.3.(数一了解,数三掌握)泊松定理的结论和应用条件,会用泊松分布近似表示二项分布.4.理解连续型随机变量及其概率密度的概念,掌握均匀分布(,)U a b 、正态分布2(,)N μσ、指数分布及其应用,其中参数为λ的指数分布()λE 的概率密度为()e ,00,0x x f x x λλ−⎧>=⎨≤⎩.5.会求随机变量函数的分布.考点:随机变量与分布函数1.随机变量:设试验E 的样本空间为Ω,如果对于每一个样本点Ω∈ω,都有一个实数)(ωX 与之对应,则称定义在Ω上的单值实值函数)(ωX 为随机变量,简记为X . 通常用,,X Y Z 等表示随机变量.【注】随机变量的等式和不等式可表示随机事件. 2.分布函数(1)定义:设X 是一个随机变量,x 是任意实数,称(){}()F x P X x x =≤−∞<<+∞为X 的分布函数.(2)基本性质①单调不减,即若12x x <,则12()()F x F x ≤;②lim ()0x F x →−∞=,lim ()1x F x →+∞=; ③()F x 是右连续,即(0)()F x F x +=.【注】这三条性质是一个函数作为某随机变量的分布函数的充分必要条件. (3)其他性质(用分布函数()F x 求概率)①)()(}{a F b F b X a P −=≤<; ②)0(}{−=<a F a X P ;③)0()(}{−−==a F a F a X P ;④)0()0(}{−−−=<≤a F b F b X a P ; ⑤)()0(}{a F b F b X a P −−=<<; ⑥{}()(0)P a X b F b F a ≤≤=−−. 【注】分布函数在处连续.【例1】 下述函数中,可以作为某个随机变量的分布函数的是( ) (A ) ()211F x x =+ (B )()x x F sin = (C ) ()11arctan π2F x x =+ (D ) ()1e ,020,0xx F x x −⎧−>⎪=⎨⎪≤⎩【例2】 设随机变量X 的分布函数为()00πsin 02π12,x F x A x,x ,x ⎧⎪<⎪⎪=≤≤⎨⎪⎪>⎪⎩,则A _____=,6P X ______π⎧⎫<=⎨⎬⎩⎭.【例3】 已知随机变量X 的分布函数为()0,11,18,111,1x x F x ax b x x <−⎧⎪⎪=−⎪=⎨⎪+−<<⎪≥⎪⎩,且()F x a {}0P X a ⇔=={}114P X ==,则_____,_____a b ==. 【例4】 设随机变量X 的分布函数为⎪⎩⎪⎨⎧≥−<≤<=−1,110,210,0)(x e x x x F x,则{}1P X ==( )(A )0 (B )21(C )121−−e (D )11e −−考点:离散型随机变量及其分布1.离散型随机变量定义:若随机变量X 所有可能取值是有限或可列无限个,则称X 为离散型随机变量.2.分布律(1)定义:设离散型随机变量X 的所有可能取值为()12i x i ,,=,且X 取ix 的概率为i p ,则称{}()12i i P X x p i ,,===为离散型随机变量X 的分布律.X(2)基本性质:①0,1,2,i p i ≥=;②11ii p∞==∑.【注】这两条性质也是一个数列可以作为某随机变量分布律的充分必要条件. 3.离散型随机变量的分布函数若离散型随机变量X 的分布律为{}()12i i P X x p i ,,===,则X 的分布函数为(){}{}()i i i i x xx xF x P X x P X x p x ≤≤=≤===−∞<<+∞∑∑.若123x x x <<<,则()111212230,,,x x p x x x F x p p x x x <⎧⎪≤<⎪=⎨+≤<⎪⎪⎩. 【注】若已知X 的分布函数()F x (阶梯函数),则X 的分布律为{}()()0i i i P X x F x F x ==−−,12i ,,=.【例1】 (1)做n 次伯努利实验,已知每次成功的概率均为()10<<p p ,令X 表示n 次试验中成功的次数,求X 的分布律.(2)做伯努利试验,已知每次成功的概率均为()10<<p p ,令X 表示直到第一次成功为止所进行的实验次数,求X 的分布律.【例2】 设袋中有5个球,其中3个新球,2个旧球,从中任取3个球,用X 表示3个球中新球个数,求X 的分布律与分布函数.考点:连续型随机变量及其分布1.连续型随机变量及其概率密度(1)定义:设随机变量X 的分布函数为()F x ,若存在非负可积函数()f x ,使得对于任意实数x ,有()()xF x f t dt −∞=⎰,则称X 为连续型随机变量,()f x 称为X 的概率密度函数,简称概率密度(简写为.f .d .p ).【注】①只有存在概率密度的随机变量才能称为连续型随机变量,分布函数连续的随机变量不一定是连续型随机变量.②存在既非连续型又非离散型的随机变量.③(),()()0()F x x F x f x x F x '⎧=⎨⎩为的可导点,为的不可导点. (2)概率密度的基本性质:①()0f x ≥;②()1f x dx +∞−∞=⎰.【注】这两条性质是一个函数可以作为概率密度函数的充分必要条件.(3)连续型随机变量的其他性质: ①)(x F 处处连续.②对()+∞∞−∈∀,a ,有{}.0==a X P ③若()f x 在x 处连续,则有()()F x f x '=. ④对于任意的实数()1212x ,x x x ≤,有{}()()211221()x x P x X x F x F x f x dx <≤=−=⎰.【例1】 设随机变量X 的概率密度为()x f ,则下列函数中必为某随机变量的概率密度的是( )(A )()x f 2 (B )()x f 2 (C )()x f −1 (D )()x f −1【例2】 设随机变量X 的概率密度为()cos ,||20,||2A x x f x x ππ⎧≤⎪⎪=⎨⎪>⎪⎩,求(1)常数A ; (2)X 的分布函数为()x F . 【例3】 设随机变量X 的概率密度为()1||,||10,x x f x else −<⎧=⎨⎩,则______412=⎭⎬⎫⎩⎨⎧<<−X P .考点:常见分布1.常见的离散型随机变量 (1) 0-1分布若随机变量X 的分布律为{}()()110101kk P X k p p ,k ,p −==−=<<,则称X 服从0-1分布,记为),1(~p B X .(2) 二项分布若随机变量的分布律为{}C (1),0,1,2,k k n kn P X k p p k n −==−=,其中01p <<,则称X 服从二项分布,记为~(,)X B n p .(3) 几何分布若随机变量X 的分布律为{}1(1)k P X k p p −==−⋅,1,2,3k =,其中01p <<,则称X 服从参数为p 的几何分布,记为()~X G p .(4) 超几何分布(从未考过)若随机变量X 的分布律为{}C C C k n kM N MnNP X k −−==,其中N k ∈,且{}{}n M k N n M ,min ,0max ≤≤−+,则称X 服从超几何分布.【注】:此公式的数学模型为:设N 件产品中含M 件次品,现从中任取n 件产品,则所取的n 件产品恰有k 件次品的概率.(5) 泊松分布 ①定义若随机变量X 的分布律为{}e !kP X k k λλ−==,0,1,2,k =,其中0λ>,则称X 服从参数为λ的泊松分布,记为~()X P λ.X②泊松定理(数一了解;数三掌握)设0λ>是一个常数,n 是任意正整数,若lim n n np λ→∞=,则对于任意的非负整数k ,有()e lim 1.!nk n kkknn n C p p k λλ−−→∞−=【例1】 设随机变量X 服从参数为()2,p 的二项分布,随机变量Y 服从参数为()3,p 的二项分布,若{}519P X ≥=,则{}1_______P Y ≥=. 【例2】 设某时间段内通过一路口的汽车流量服从泊松分布,已知该时段内没有汽车通过的概率为1e,则这段时间内至少有两辆汽车通过的概率为___________. 2.常见的连续型随机变量 (1) 均匀分布若X 的概率密度为1,()0,a xb f x b a⎧<<⎪=−⎨⎪⎩其它,则称X 在()a,b 上服从均匀分布,记为()~,X U a b ,其分布函数为0,(),1,x a x aF x a x b b a x b<⎧⎪−⎪=≤<⎨−⎪⎪≥⎩. (2) 指数分布若X 的概率密度为e ,0()0,0x x f x x λλ−⎧>=⎨≤⎩,其中0λ>,则称X 服从参数为λ的指数分布,记为()XE λ,其分布函数为1e ,0()0,0x x F x x λ−⎧−≥=⎨<⎩.(3) 正态分布若随机变量X的概率密度为22()2()()x f x x μσ−−=−∞<<+∞,其中0σ>,μ与σ均为常数,则称X 服从参数为,μσ的正态分布,记为2~(,)X N μσ,其分布函数为22()2()d ()t xF x t x μσ−−=−∞<<+∞⎰.特别地,当0,1μσ==,即~(0,1)X N ,称X 服从标准正态分布,其概率密度为22(),x x x ϕ−=−∞<<+∞,分布函数22()d t xx t −Φ=⎰,x −∞<<+∞.【注】(1)指数分布的无记忆性:若()~X E λ,则对任意的0,0s t >>,有{}{}|.P X s t X s P X t >+>=>【例3】 设随机变量()6,1~U X ,则方程012=++Xy y 有实根的概率为____.【例4】 设随机变量()~2,5X U ,现对X 进行三次独立重复观测,求至少有两次观测值大于3的概率.【例5】 设随机变量Y 服从参数为12λ=的指数分布,求关于未知量x 的方程2230x Yx Y ++−=没有实根的概率.【例6】 设随机变量的概率密度函数为()221e ()x x f x k x −+−=−∞<<+∞X则常数=_______k .【例7】 设随机变量()22,X N σ且{}240.3P X <<=,则{}0_______P X <=.【例8】 设随机变量()2,X N μσ,则概率{}P X μσ−<的值随着σ的增大而( )(A )增大 (B )减小 (C )保持不变 (D )无法确定考点:随机变量函数的分布1.离散型随机变量函数的分布设X 为离散型随机变量,其概率分布为{},1,2,i i P X x p i ===,函数()g x 连续,则随机变量()Y g X =的分布律为{}(),1,2,i k k i g x y P Y y p k ====∑.做法:找到Y 全部可能的取值,算出相应值的概率.【例1】 设随机变量X 在()1,2−上服从均匀分布,1,01,0X Y X −<⎧=⎨≥⎩,求Y 的分布律.【例2】(课后作业)设随机变量X 的概率分布为,求常数和的概率分布. 2.连续型随机变量函数的分布情形一:Y 为离散型. 做法:找到Y 全部可能的取值,算出相应值的概率. 情形二:Y 为连续型.(1)分布函数法(代数法和几何法)先求出()Y g X =的分布函数()Y F y ,即()(){}()()Y g x y F y P g X y f x dx ≤=≤=⎰,再对()YF y 求导得到Y 的概率密度()Y f y .(2)公式法 若()y g x =在X 的取值区间内有连续导数()g x ',且()0g x '>或者()0g x '<,则()Y g X =是连续型随机变量,且其概率密度为{}(1,2,)3k c P X k k ===c sin()2Y X π=()()()',0,X Y f h y h y y f y αβ⎧<<⎡⎤⎪⎣⎦=⎨⎪⎩其他其中(),αβ为()y g x =的值域,()h y 是()g x 的反函数.情形三:Y 既非连续型又非离散型 做法:分布函数法求其分布函数.【例3】 设随机变量X 服从()0,2上的均匀分布,则随机变量2Y X =在()0,4内的概率密度()Y f y _______=.【例4】 设随机变量X 的概率密度为()22,00,x x f x ππ⎧<<⎪=⎨⎪⎩其它,求sin Y X =的概率密度()Y f y .。
第二讲 随机向量
E ( x11 ) E ( x12 ) E ( x1q ) E ( x ) E ( x ) E ( x ) 21 22 2q E ( X) E ( x ) E ( x ) E ( x ) p1 p2 pq
特别当时 q 1 ,便可得到随机向量 x ( x1 , x2 ,, x p )
格单调,其反函数x=(y)有连续导数,则y的概率 密度函数为
f y ( y) f x ( ( y)) | ( y) |
其中y的取值范围与x的取值范围相对应。 例 函数 设随机变量x服从均匀分布U(0,1),即密度
1 f x ( x) 0 0 x 1 其他
求y ln x( 0)的密度函数。
特别:若 y Ax b,其中 A 为 p 阶可逆常数
矩阵,b 为 p 维常数向量,则
J (x y ) A 1 | A |1
的数学期望 E (x) ( E ( x1 ), E ( x2 ),, E ( x p ))
(三)随 ii
i 1 p
2、协方差阵的分解: E ( XX ) 3、total variance :
| 4、generalized variance : |
x1 y 1 x2 ( x1 , x2 ,, x p ) J y1 ( y1 , y2 ,, y p ) x p y1
x1 y2 x2 y2 x p y2
x1 y p x2 y p x p y p
(四)随机向量X和Y的(互)协方差阵
' 注:1、非对称: X ,Y Y , X
' 2、协方差阵的分解: X ,Y E( XY ) X Y
第二章随机变量PPTppt文档
我们还可以定义其它的随机变量,例如定义:
Yቤተ መጻሕፍቲ ባይዱ
1, 0,
x 2, x 2,
Z
1, 0,
x 6, x 6.
例3 上午 8:00~9:00 在某路口观察,令X为该时间 间隔内通过的汽车数,则X就是一个随机变量.它的 取值为 0,1,…;{X1000}表示通过的汽车数小于 1000辆这一随机事件;{X 500}表示通过的汽车数大于 等于500辆这一随机事件.
定义函数:
X()10,,
1, 2,
定义1 设随机试验E的样本空间是Ω,如果对每一样 本点 都有唯一的一个实数 X ( ) 与之对应,
这样就得到一个定义在Ω上的实值单值函数 XX()
我们称之为定义在Ω上的一个随机变量.
随机变量作为样本点的函数,有两个基本特点:
变异性、随机性
例2 掷一颗骰子,令X表示出现的点数,则X就是一 个随{X机变3}量表.示它掷的出所的有点可数能不取超值过为3这1,一2随,机3,事4件,;5,6;
则随机变量 X 服从 0-1 分布,分布律为
X
0
1
Pk
0.55 0.45
例: 商店里有 10 张同类 CD 片,其中 6 张为一级品,3
张为二级品,1 张为不合格品.顾客购买时任取其中一
张,求取得合格品的概率.
1, 取得合格品
解 令 X 0, 否则, 则 X 服从 0-1 分布,
其分布律为
• 例:设一汽车在开往目的地的道路上需经过四个信号灯, 每个信号灯以1/2的概率允许或禁止汽车通过.以X表示汽 车首次停下时,它已通过的信号灯数(设各信号灯的工作是 相互独立的),求X的分布律.
基础会计学 随机变量
基础会计学随机变量
在基础会计学中,随机变量是一个非常重要的概念。
随机变量指的是在某个随机试验中可能取得的值,这些值是随机的,并且可以用来描述事件发生的概率分布。
随机变量可以分为离散随机变量和连续随机变量两种类型。
离散随机变量是指在一定范围内可能取得有限个数值的变量,比如掷硬币的结果只能是正面或反面。
而连续随机变量则是指在某一区间内可以取得任意值的变量,比如人的身高就是一个连续随机变量。
在会计学中,随机变量的应用非常广泛。
比如在风险管理中,我们可以用随机变量来描述不同风险事件发生的概率,从而制定相应的风险管理策略。
又比如在财务分析中,我们可以用随机变量来描述公司未来收入的不确定性,从而评估公司的经营风险。
随机变量还可以帮助我们进行决策分析。
通过对不同随机变量的概率分布进行分析,我们可以选择出最优的决策方案,从而提高决策的准确性和效果。
总的来说,随机变量在基础会计学中起着非常重要的作用。
通过对随机变量的研究和分析,我们可以更好地理解和应对不确定性,从而提高会计学的决策效率和准确性。
希望大家能够深入学习和理解随机变量的概念,从而更好地应用于实际的会计工作中。
第二讲 随机变量函数的数学期望、期望的性质
例2 设风速V在(0,a)上服从均匀分布,即密度函数
1 v (0, a ) f (v ) a 0 其它
又设飞机机翼受到的正压力W是V的函数W=kV2, 求W 的数学期望。 解: E (W ) kv 2 f (v )dv
a
0
1 1 2 kv dv ka 3 a
E ( X ) E ( X1 X 2
X10 )
E ( X1 ) E ( X 2 )
E( X10 )
9 20 10 1 8.784 10
即该空港巴士在到达目的地的途中平均停车 8.784次。
例5 求二项分布随机变量 X ~ b( n , p ) 的数学期望 解:二项分布的分布律为
2随机变量函数的数学期望1若离散型随机变量x的分布律为eyegxpgx2若连续型随机变量x的概率密度为fxeyegxgxfxdx设随机变量x的分布律为0202020103102002102201303ex11102002102201303ex35其它又设飞机机翼受到的正压力w是v的函数wkvewkvfvdvkvdv某公司计划开发一种新产品市场并试图确定该产品的产量
(1)若离散ቤተ መጻሕፍቲ ባይዱ随机变量X 的分布律为
P{ X xk } pk
k 1, 2,
k 1
则 E (Y ) E[ g( X )] pk g( xk ) (2)若连续型随机变量X 的概率密度为 f(x) 则 E (Y ) E[ g( X )]
g( x ) f ( x )dx
第三章 随机变量的数字特征
第二讲
随机变量的数学期望(2)
2、随机变量函数的数学期望
随机变量及其分布
80
P{ X 4} C8k0 (0.01)k (0.99)80k k4 3 1 C8k0 (0.01)k (0.99)80k k0 0.0087
解:(续)再讨论第一种方法.设Ai表示事件“第 i 个人负 责的20台设备发生故障不能得到及时维修”,则所求概率
S
P(B)
e1
0.5
P(A)
e2
1
X (e1 )
0
X (e2 )
X () 是定义在样本空间 S 上的函数
附注:随机变量与普通函数有着本质的区别. 随机变量是一种因变量(而非自变量),它的取值依赖于 样本点,所以其定义域是抽象的样本空间. 随机变量的取值随试验的结果而定,而试验各个结果的出 现有一定的概率,因而随机变量的取值也有一定的概率. 随机变量常用大写字母X, Y, Z, …表示,而以小写字母x, y, z, …表示实数. 若 L 是一个实数集合,则集合{e | X(e) ∈L}表示样本空间 S 中满足X(e) ∈L的所有样本点组成的子集(随机事件).
解:记400次射击中命中的次数为X,那么X ~ b(400, 0.02),
于是
P{ X
k}
C
k 400
(0.02)k
(0.98)400
k
,
k
0,1,
400
P{X 2}
C
k 400
(0.02)k
(0.98)400
k
k2
1 P{ X 0} P{ X 1}
, 400
1
(0.98)400
C1 400
随机变量及其分布
随机变量及其分布复习课件.ppt
F(x) x f(t)dt,
则称X为连续型随机变量,其中f(x)称为X的概率 密度函数,简称概率密度。
(II)概率密度的性质
( 1 ) 非 负 性 : f( x ) 0 , x R .
(2)规 范 性 :f(x)dx1. 4
( 3 )对 于 任 意 实 数 a b, 有
P{aXb}abf(x)dx . F(b)F(a)
求这个区间的端点,分二种情形讨论之:
17
(1)区间的一个端点是无穷大,即已知P(X < x) = p1 或P(X > x) = p2,求x .
利用 或
然后反查标准正态分布表,即可求出x (2)区间关于μ对称,不妨设为(μ−a,μ+a),而 P(μ−a<X<μ+a) = p,求a
18
四.随机变量的函数的分布 1.离散型随机变量函数的分布
几种重要的 离散型分布
均指 正 匀数 态 分分 分 布布 布
二项分布的 正态近似
二项分布的 泊松近似
二项 分布
泊几
松何
分分 布 布 21
例题选讲
例1 甲、乙、丙3人进行独立射击 每人的命中率依 次为03 04 06 设每人射击一次 试求3人命中总 数之概率分布律 分析 求离散型随机变量的概率分布的步骤为:(1) 写
23
例2 投掷一个均匀骰子n 次,求(1)恰好得到一个6点的概 率;(2)至少得到一个6点的概率;(3)为了以0.5的概率保 证至少得到一个6点,则至少要投掷几次?
所以至少要投掷4次.
24
例3 设 X 的分布律为 X 1012 1111 p 4444
求 Y X 2 的分布律 .
解 Y 的可能值为 (1)2, 02,12, 22; 即 0, 1, 4.
第二讲随机变量
P{X k} Cnk pk (1 p)nk ,
此时称, X 服从参数为 n, p 的二项分布, 记为 X ~ b(n, p).
n=1时, P{X=k}=pk(1-p)1-k,(k=0,1),
注意
即P{X=0}=1-p, P{X=1}=p
(0-1)分布
X ~ b(n, p).
P{ X
k}
C
k n
pk (1
p)nk
,
二项分布的图形特点:
Pk
对于固定 n 及 p, 当 k 增
加时, 概率 P{ X k}先
是随之增加直至达到最
大值, 随后单调减少.
O
n
完
可以证明, 一般的二项分布的图形也具有这一
性质,且当 (n 1) p 不为整数时,二项概率
P{ X k} 在 k [(n 1) p] 达到最大值; 当 (n 1) p 为整数时, 二项概率 P{ X k} 在 k (n 1) p 和 k (n 1) p 1 处达到最
记载的实际年数作对照, 这些值及 P{ X k} 的值
均列入下表.
X Pk
理论年数
实际年数
0 12 3 45 6 0.055 0.160 0.231 0.224 0.162 0.094 0.045 3.5 10.1 14.6 14.1 10.2 5.9 2.8
4 8 14 19 10 4 2
X
7
售记录知道, 某种商品每月的销售数可以用参数
5 的泊松分布来描述, 为了以 95%以上的把
握保证不脱销, 问商店在月底至少应进该种商品
多少件?
解 设该商品每月的销售数为X , 已知 X 服从参数
5 的泊松分布. 设商店在月底应进该种商品 m
第二讲随机变量基础-文档资料
A coin toss
X ( e1 )
e●
1
●
0
X (e2 )
●
Real line
1
● e S2
Mapping of the outcome of a coin toss into the set of real number ead 1 e H X(e) ail 0 e T
根据随机变量取值的不同可以分为:
本次课内容 概率的基本术语
随机变量的定义
随机变量的分布函数与概率密度
多Байду номын сангаас随机变量
第一章 随机变量基础
1.1 概率的基本术语
随机试验 Random Experiment
随机事件 Random Event
基本事件 Elementary (Simple) Event 样本空间 Sample Space 频率 概率 Frequency Probability
1.2 随机变量的定义
(Definition of a random variable)
1. 定义 设随机试验E的样本空间为S={e},如果对于每 一个eS,有一个实数X(e)与之对应,这样就得 到一个定义在S上的单值函数X(e),称X(e)为随 机变量,简记为X。 随机变量是定义在样本空间S上的单值函数
P ( 1 ) P {() I e 1 }p P ( 0 ) P { Ie ( ) 0 } 1 p I A I A
例:信息传输问题(Message Transmissions)
Let X be the number of times needs to be transmitted until it arrivers correctly at its destination. Find the probability that X is an a even number. X is a discrete random variable taking on values from S={1,2,3,….}
2随机变量PPT课件
p(k;)P{Xk}
k
e,
k0,1,2,...
k!
2021/3/12
27
泊松定理表明:
泊松分布是二项分布的极限分布,当n很 大,p很小时,二项分布就可近似地看成是参 数=np的泊松分布
2021/3/12
28
实际计算中
当n≥20,p≤0.05时,近似效果很好; 当n≥100,np≤10时,近似效果更好。
解 X:一天内出现故障的出租车数量 X~B(400,0.02)
2021/3/12
19
例
某人射击的命中率为0.02,他独立射击400次, 试求其命中次数不少于2的概率。
解 设X表示400次独立射击中命中的次数, 则X~B(400, 0.02),故
P{X2}=1- P{X=0}-P{X=1}
=1-0.98400-(400)(0.02)(0.98399)=…
2021/3/12
13
(二)二项分布
若以X表示n重伯努利试验事件A发生的 次数,则称X服从参数为n,p的二项分布。
记作X~B(n,p),其分布律为:
C P { X k } kp k(1 p )n k,(k 0 ,1 ,.n ) .., n
2021/3/12
14
例2.2.3 假设某射手每次射击命中10环的概率为
p,现独立地进行n次射击,求其{恰有k次命
中10环}的概率。
解 A={命中10 环}
P(A)=p X: n次伯努利试验中A发生的次数
2021/3/12
15
可见:
一次伯努利试验的随机变量服从两点分布。
n次伯努利试验的随机变量服从二项分布。
2021/3/12
16
例2.2.4
第二节随机变量的概念PPT实用课件
P(1.5< X
一旦我们实际<1选.7定)=了?一个学生并量了他的身高之后,
我们就得到X 的一个具体的值,记作 x.
14
下面两节中,我们将对上述两类随机变量分别 加以介绍.
事 设X地所随地试使当每X试地可种也引引X然可事引引引其1我1所这种当六 随一七故引X为这并事其X事我故使然地每设试这所、、所所,的的Y件一研以机研验得随天验研以子就入入后以件入入入随们以种子随、机旦月{入了种针件随件们{得后研天一验种以报报有,有 有Z值 值口 究 要 试 究 结 随 机 从 结 究 将 发 是 后 随 我 将 后 后 随 着 写可 要 实 发 机 均试 我 份 后 区 对 对 着 可 随 我 究 从 口 结 对 随 要AAAA童童些可可或也也袋随完验随果机试徐果随其芽说,机们其,,机试出 以完值芽试匀 验们徐,别应某试以机们随徐袋果应机完出 出出出赔赔试能能希就就中机全的机看事验州看机分,事变可分事事变验所 把全函验分 的实州事不关一验把事可机州中看关变全现现 现 现钱钱X验X值值腊相相依试刻结试来件的下来试为把件量以为件件量结有 可刻数的布 结际的件同系事可件以试下依来系量刻==}}结((XXXX字应应次验化果验与及结火与验两试可的提两可可的果的 能化与结和 果选最可的在件能及提验火次与在的化11果有有====母地地标的随可的数其果车数的类验用目出类用用目的基 的随在果指 可定高用随数研的的其出的车标数数目随本1111限限ζ确确有全机以全值概确的值全:结随的关:随随的不本 身机高确数 以了温随机学究不身概关全的有值学的机,身η、、定定部变用部无率定人无部(果机是于(机机是同事 高变等定分 用一度机变上它同高率于部人无上是变等––与无无11了了结量数结关能之数关结主数变为主变变为而件量数之布数个;变量理在而能结数关理为量XX表,,数限限22。。的的果必量果,后;,果要值量了要量量了取。 必学后量学量,解试取果;,解了必示值,,))各各的须来的,的研化来便研来来便不须中,来生来为验不的为便须22有是是,,种种概知表概概究表于究表表于同知大表并表定中同概定于知.22关可可问问率道示率率)示以)示示以的道家示量示义的率义以道,, (33以以题题分下,分分。数。。数值下接,了。了值分了数下,,本一一33..布列布布量量列触他一布一量列;;数数身、、情情情形形到的种情种形字字就一一况况况式式的身实况实式的的是列列,,,全全函高值,值全一举举面面数之函函面个的 的后数数数。。,.. ).
概率论与数理统计第二章随机变量课件
第二章随机变量第一节随机变量及其分布函数上一章中我们讨论的随机事件中有些是直接用数量来标识的,例如,抽样检验灯泡质量试验中灯泡的寿命;而有些则不是直接用数量来标识的,如性别抽查试验中所抽到的性别.为了更深入地研究各种与随机现象有关的理论和应用问题,我们有必要将样本空间的元素与实数对应起来.即将随机试验的每个可能的结果e都用一个实数X来表示.例如,在性别抽查试验中用实数“1”表示“出现男性”,用“0”表示“出现女性”.显然,一般来讲此处的实数X值将随e的不同而变化,它的值因e的随机性而具有随机性,我们称这种取值具有随机性的变量为随机变量.定义2.1设随机试验的样本空间为Ω,如果对Ω中每一个元素e,有一个实数X(e)与之对应,这样就得到一个定义在Ω上的实值单值函数X=X(e),称之为随机变量(Random variable).随机变量的取值随试验结果而定,在试验之前不能预知它取什么值,只有在试验之后才知道它的确切值;而试验的各个结果出现有一定的概率,故随机变量取各值有一定的概率.这些性质显示了随机变量与普通函数之间有着本质的差异.再者,普通函数是定义在实数集或实数集的一个子集上的,而随机变量是定义在样本空间上的(样本空间的元素不一定是实数),这也是二者的差别.本书中,我们一般以大写字母如X,Y,Z,W,…表示随机变量,而以小写字母如x,y,z,w,…表示实数.为了研究随机变量的概率规律,并由于随机变量X的可能取值不一定能逐个列出,因此我们在一般情况下需研究随机变量落在某区间(x1,x2]中的概率,即求P{x1<X≤x2},但由于P{x1<X≤x2}=P{X≤x2}-P{X≤x1},由此可见要研究P{x1<X≤x2}就归结为研究形如P{X≤x}的概率问题了.不难看出,P{X≤x}的值常随不同的x而变化,它是x的函数,我们称这函数为分布函数.定义2.2设X是随机变量,x为任意实数,函数F(x)=P{X≤x}称为X的分布函数(Distribution function).对于任意实数x1,x2(x1<x2),有P{x1<X≤x2}=P{X≤x2}-P{X≤x1}=F(x2)-F(x1),(2.1)因此,若已知X的分布函数,我们就能知道X落在任一区间(x1,x2]上的概率.在这个意义上说,分布函数完整地描述了随机变量的统计规律性.如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率.分布函数具有如下基本性质:1°F(x)为单调不减的函数.事实上,由(2.1)式,对于任意实数x1,x2(x1<x2),有F(x2)-F(x1)=P{x1<X≤x2}≥0.2°0≤F (x )≤1,且)(lim x F x +∞→=1,常记为F (+∞)=1.)(lim x F x -∞→=0,常记为F (-∞)=0.我们从几何上说明这两个式子.当区间端点x 沿数轴无限向左移动(x →-∞)时,则“X 落在x 左边”这一事件趋于不可能事件,故其概率P {X ≤x }=F (x )趋于0;又若x 无限向右移动(x →+∞)时,事件“X 落在x 左边”趋于必然事件,从而其概率P {X ≤x }=F (x )趋于1.3°F (x +0)=F (x ),即F (x )为右连续. 证略.反过来可以证明,任一满足这三个性质的函数,一定可以作为某个随机变量的分布函数. 概率论主要是利用随机变量来描述和研究随机现象,而利用分布函数就能很好地表示各事件的概率.例如,P {X >a }=1-P {X ≤a }=1-F (a ),P {X <a }=F (a -0),P {X =a }=F (a )-F (a -0)等等.在引进了随机变量和分布函数后我们就能利用高等数学的许多结果和方法来研究各种随机现象了,它们是概率论的两个重要而基本的概念.下面我们从离散和连续两种类别来更深入地研究随机变量及其分布函数,另有一种奇异型随机变量超出本书范围,就不作介绍了.第二节离散型随机变量及其分布如果随机变量所有可能的取值为有限个或可列无穷多个,则称这种随机变量为离散型随机变量.容易知道,要掌握一个离散型随机变量X 的统计规律,必须且只须知道X 的所有可能取的值以及取每一个可能值的概率.设离散型随机变量X 所有可能的取值为x k (k =1,2,…),X 取各个可能值的概率,即事件{X =x k }的概率P {X =x k }=p k , k =1,2,… (2.2)我们称(2.2)式为离散型随机变量X 的概率分布或分布律.分布律也常用表格来表示(表2-1):表2-1由概率的性质容易推得,任一离散型随机变量的分布律{pk},都具有下述两个基本性质: 1°p k ≥0,k =1,2,…; (2.3) 2°11=∑∞=k kp. (2.4)反过来,任意一个具有以上两个性质的数列{Pk},一定可以作为某一个离散型随机变量的分布律.为了直观地表达分布律,我们还可以作类似图2-1的分布律图.图2-1图2-1中x i 处垂直于x 轴的线段高度为p i ,它表示X 取x i 的概率值.例2.1 设一汽车在开往目的地的道路上需通过4盏信号灯,每盏灯以0.6的概率允许汽车通过,以0.4的概率禁止汽车通过(设各盏信号灯的工作相互独立).以X 表示汽车首次停下时已经通过的信号灯盏数,求X 的分布律.解 以p 表示每盏灯禁止汽车通过的概率,显然X 的可能取值为0,1,2,3,4,易知X 的分布律为或写成P {X =k }=(1-p )p ,k =0,1,2,3.P {X=4}=(1-p )4.将p =0.4,1-p =0.6代入上式,所得结果如表2-3所示.下面介绍几种常见的离散型随机变量的概率分布: (1)两点分布若随机变量X 只可能取x 1与x 2两值,它的分布律是P {X =x 1}=1-p (0<p <1),P {X =x 2}=p ,则称X 服从参数为p 的两点分布.特别,当x 1=0,x 2=1时两点分布也叫(0-1)分布,记作X ~(0-1)分布.写成分布律表形式见表2-4.表2-4对于一个随机试验,若它的样本空间只包含两个元素,即Ω={e 1,e 2},我们总能在Ω上定义一个服从(0-1)分布的随机变量,,,1,0)(21e e e e e X X ==⎩⎨⎧==当当用它来描述这个试验结果.因此,两点分布可以作为描述试验只包含两个基本事件的数学模型.如,在打靶中“命中”与“不中”的概率分布;产品抽验中“合格品”与“不合格品”的概率分布等等.总之,一个随机试验如果我们只关心某事件A 出现与否,则可用一个服从(0-1)分布的随机变量来描述.(2)二项分布若随机变量X 的分布律为P {X =k }=k n C p k (1-p )n -k, k =0,1,…,n , (2.5)则称X 服从参数为n ,p 的二项分布(Binomial distribution ),记作X ~b (n ,p ).易知(2.5)满足(2.3)、(2.4)两式.事实上,P (X =k )≥0是显然的;再由二项展开式知n k n k nk k nn k p p p p k X P )]1([)1(C}{0-+=-==-==∑∑=1.我们知道,P {X =k }=kn k k n p p --)1(C 恰好是[p +(1-p )]n 二项展开式中出现p k 的那一项,这就是二项分布名称的由来.回忆n 重贝努里试验中事件A 出现k 次的概率计算公式P n (k )=k n C p k (1-p )n-k, k =0,1,…,n ,可知,若X ~b (n ,p ),X 就可以用来表示n 重贝努里试验中事件A 出现的次数.因此,二项分布可以作为描述n 重贝努里试验中事件A 出现次数的数学模型.比如,射手射击n 次中,“中的”次数的概率分布;随机抛掷硬币n 次,落地时出现“正面”次数的概率分布;从一批足够多的产品中任意抽取n 件,其中“废品”件数的概率分布等等.不难看出,(0-1)分布就是二项分布在n =1时的特殊情形,故(0-1)分布的分布律也可写成P {X =k }=p k q 1-k (k =0,1)(q =1-p ).例2.2 某大学的校乒乓球队与数学系乒乓球队举行对抗赛.校队的实力较系队为强,当一个校队运动员与一个系队运动员比赛时,校队运动员获胜的概率为0.6.现在校、系双方商量对抗赛的方式,提了三种方案: (1)双方各出3人;(2)双方各出5人;(3)双方各出7人.三种方案中均以比赛中得胜人数多的一方为胜利.问:对系队来说,哪一种方案有利?解 设系队得胜人数为X ,则在上述三种方案中,系队胜利的概率为(1) P {X ≥2}=kkk k -=∑3323)6.0()4.0(C ≈0.352;(2) P {X ≥3}=kkk k -=∑5535)6.0()4.0(C ≈0.317;(3) P {X ≥4}=kkk k -=∑7747)6.0()4.0(C ≈0.290.因此第一种方案对系队最为有利.这在直觉上是容易理解的,因为参赛人数越少,系队侥幸获胜的可能性也就越大.例2.3 某一大批产品的合格品率为98%,现随机地从这批产品中抽样20次,每次抽一个产品,问抽得的20个产品中恰好有k 个(k =1,2,…,20)为合格品的概率是多少?解 这是不放回抽样.由于这批产品的总数很大,而抽出的产品的数量相对于产品总数来说又很小,那么取出少许几件可以认为并不影响剩下部分的合格品率,因而可以当作放回抽样来处理,这样做会有一些误差,但误差不大.我们将抽检一个产品看其是否为合格品看成一次试验,显然,抽检20个产品就相当于做20次贝努里试验,以X 记20个产品中合格品的个数,那么X ~b (20,0.98),即P {X =k }=k k k -2020)02.0()98.0(C ,k =1,2,…,20. 若在上例中将参数20改为200或更大,显然此时直接计算该概率就显得相当麻烦.为此我们给出一个当n 很大而p (或1-p )很小时的近似计算公式.定理2.1(泊松(Poisson)定理) 设np n =λ(λ>0是一常数,n 是任意正整数),则对任意一固定的非负整数k ,有e lim (1)!k k k n knn n n C p p k λλ-→∞-=-.证 由p n =λ/n ,有().111121111!)1()(!)1()1(1C kn k kn k kn n kn k n n n n k n n k nn k k n n n p p ---⎪⎭⎫⎝⎛-⎪⎭⎫ ⎝⎛-⋅⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅=-+--=-λλλλλ对任意固定的k ,当n →∞时,11121111→⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅n k n n ,11,e 1→⎪⎭⎫ ⎝⎛-→⎪⎭⎫ ⎝⎛---kn n n λλλ故e lim (1).!k kk n knn n n C p p k λλ--→∞-=由于λ=np n 是常数,所以当n 很大时p n 必定很小,因此,上述定理表明当n 很大p 很小时,有以下近似公式,!e )1(C k p p k kn k k nλλ--≈- (2.6)其中λ=np .从表2-5可以直观地看出(2.6)式两端的近似程度.表2-5颇佳,而当n ≥100,np ≤10时效果更好.!e k k λλ-的值有表可查(见本书附表3)二项分布的泊松近似,常常被应用于研究稀有事件(即每次试验中事件A 出现的概率p 很小),当贝努里试验的次数n 很大时,事件A 发生的次数的分布.例2.4 某十字路口有大量汽车通过,假设每辆汽车在这里发生交通事故的概率为0.001,如果每天有5000辆汽车通过这个十字路口,求发生交通事故的汽车数不少于2的概率.解 设X 表示发生交通事故的汽车数,则X ~b (n,p ),此处n =5000,p =0.001,令λ=np =5, P {X ≥2}=1-P {X <2}=1-{}∑==1k k X P=1-(0.999)5000-5(0.999)4999≈1!e 50!e 51550----. 查表可得P {X ≥2}=1-0.00674-0.03369=0.95957.例2.5 某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率.解 将一次射击看成是一次试验.设击中次数为X ,则X ~b (400,0.02),即X 的分布律为P {X =k }=k 400C (0.02)k (0.98)400-k, k =0,1,…,400. 故所求概率为P {X ≥2}=1-p {X =0}-p {X =1}=1-(0.98)400-400(0.02)(0.98)399 =0.9972.这个概率很接近1,我们从两方面来讨论这一结果的实际意义.其一,虽然每次射击的命中率很小(为0.02),但如果射击400次,则击中目标至少两次是几乎可以肯定的.这一事实说明,一个事件尽管在一次试验中发生的概率很小,但只要试验次数很多,而且试验是独立地进行的,那么这一事件的发生几乎是肯定的.这也告诉人们决不能轻视小概率事件.其二,如果在400次射击中,击中目标的次数竟不到两次,由于P {X <2}≈0.003很小,根据实际推断原理,我们将怀疑“每次射击的命中率为0.02”这一假设,即认为该射手射击的命中率达不到0.02.(3)泊松分布若随机变量X 的分布律为P {X =k } =e !k k λλ-,k =0,1,2,…, (2.7)其中λ>0是常数,则称X 服从参数为λ的泊松分布(Poisson distribution ),记为X ~P (λ). 易知(2.7)满足(2.3)、(2.4)两式,事实上,P {X =k }≥0显然;再由∑∞=-0!e k k k λλ=e -λ²e λ=1,可知∑∞==0}{k k X P =1.由泊松定理可知,泊松分布可以作为描述大量试验中稀有事件出现的次数k =0,1,…的概率分布情况的一个数学模型.比如:大量产品中抽样检查时得到的不合格品数;一个集团中生日是元旦的人数;一页中印刷错误出现的数目;数字通讯中传输数字时发生误码的个数等等,都近似服从泊松分布.除此之外,理论与实践都说明,一般说来它也可作为下列随机变量的概率分布的数学模型:在任给一段固定的时间间隔内,① 由某块放射性物质放射出的α质点,到达某个计数器的质点数;② 某地区发生交通事故的次数;③ 来到某公共设施要求给予服务的顾客数(这里的公共设施的意义可以是极为广泛的,诸如售货员、机场跑道、电话交换台、医院等,在机场跑道的例子中,顾客可以相应地想象为飞机).泊松分布是概率论中一种很重要的分布.例2.6 由某商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述.为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?解 设该商店每月销售这种商品数为X ,月底进货为a 件,则当X ≤a 时不脱销,故有P {X ≤a }≥0.95.由于X ~P (5),上式即为∑=-ak kk 05!5e ≥0.95. 查表可知∑=-95!5e k kk ≈0.9319<0.95, ∑=-105!10e k kk ≈0.9682>0.95 于是,这家商店只要在月底进货这种商品10件(假定上个月没有存货),就可以95%以上的把握保证这种商品在下个月不会脱销.下面我们就一般的离散型随机变量讨论其分布函数.设离散型随机变量X 的分布律如表2-1所示.由分布函数的定义可知F (x )=P {X ≤x }=∑∑≤≤==xx kxx kk k px X P }{,此处的∑≤xx k 和式表示对所有满足x k ≤x 的k 求和,形象地讲就是对那些满足x k ≤x 所对应的p k 的累加.例2.7 求例2.1中X 的分布函数F (x ). 解 由例2.1的分布律知 当x <0时,F (x )=P {X ≤x }=0;当0≤x <1时,F (x )=P {X ≤x }=P {X =0}=0.4;当1≤x <2时,F (x )=P {X ≤x }=P ({X =0}∪{X =1})=P {X =0}+P {X =1}=0.4+0.24=0.64; 当2≤x <3时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2})=P {X =0}+P {X =1}+P {X =2} =0.4+0.24+0.144 =0.784;当3≤x <4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3})=0.4+0.24+0.144+0.0864=0.8704;当x ≥4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3}∪{X =4}) =0.4+0.24+0.144+0.0864+0.1296=1.综上所述F (x )=P {X ≤x }=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<.4,1,43,8704.0,32,784.0,21,64.0,10,4.0,0,0x x x x x x F (x )的图形是一条阶梯状右连续曲线,在x =0,1,2,3,4处有跳跃,其跳跃高度分别为0.4,0.24,0.144,0.0864,0.1296,这条曲线从左至右依次从F (x )=0逐步升级到F (x )=1.对表2-1所示的一般的分布律,其分布函数F (x )表示一条阶梯状右连续曲线,在X =x k (k =1,2,…)处有跳跃,跳跃的高度恰为p k =P {X =x k },从左至右,由水平直线F (x )=0,分别按阶高p 1,p 2,…升至水平直线F (x )=1.以上是已知分布律求分布函数.反过来,若已知离散型随机变量X 的分布函数F (x ),则X 的分布律也可由分布函数所确定:p k =P {X =x k }=F (x k )-F (x k -0).第三节 连续型随机变量及其分布上一节我们研究了离散型随机变量,这类随机变量的特点是它的可能取值及其相对应的概率能被逐个地列出.这一节我们将要研究的连续型随机变量就不具有这样的性质了.连续型随机变量的特点是它的可能取值连续地充满某个区间甚至整个数轴.例如,测量一个工件长度,因为在理论上说这个长度的值X 可以取区间(0,+∞)上的任何一个值.此外,连续型随机变量取某特定值的概率总是零(关于这点将在以后说明).例如,抽检一个工件其长度X丝毫不差刚好是其固定值(如 1.824cm )的事件{X =1.824}几乎是不可能的,应认为P{X =1.824}=0.因此讨论连续型随机变量在某点的概率是毫无意义的.于是,对于连续型随机变量就不能用对离散型随机变量那样的方法进行研究了.为了说明方便我们先来看一个例子.例2.8 一个半径为2米的圆盘靶,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X 表示弹着点与圆心的距离,试求随机变量X 的分布函数.解 1°若x <0,因为事件{X ≤x }是不可能事件,所以F (x )=P {X ≤x }=0.2°若0≤x ≤2,由题意P {0≤X ≤x }=kx 2,k 是常数,为了确定k 的值,取x =2,有P {0≤X ≤2}=22k ,但事件{0≤X ≤2}是必然事件,故P {0≤X ≤2}=1,即22k =1,所以k =1/4,即P {0≤X ≤x }=x 2/4.于是F (x )=P {X ≤x }=P {X <0}+P {0≤X ≤x }= x 2/4.3°若x ≥2,由于{X ≤2}是必然事件,于是F (x )=P {X ≤x }=1.综上所述F (x )=⎪⎩⎪⎨⎧≥<≤<,2,1,20,41,0,02x x x x 它的图形是一条连续曲线如图2-2所示.图2-2另外,容易看到本例中X 的分布函数F (x )还可写成如下形式:F (x )=t t f xd )(⎰∞-,其中 f (t )=⎪⎩⎪⎨⎧<<.,0,20,21其他t t这就是说F (x )恰好是非负函数f (t )在区间(-∞,x ]上的积分,这种随机变量X 我们称为连续型随机变量.一般地有如下定义.定义2.3 若对随机变量X 的分布函数F (x ),存在非负函数f (x ),使对于任意实数x 有F (x )=⎰∞-xx t f d )(, (2.8)则称X 为连续型随机变量,其中f (x )称为X 的概率密度函数,简称概率密度或密度函数(Density function).由(2.8)式知道连续型随机变量X 的分布函数F (x )是连续函数.由分布函数的性质F (-∞)=0,F (+∞)=1及F (x )单调不减,知F (x )是一条位于直线y =0与y =1之间的单调不减的连续(但不一定光滑)曲线. 由定义2.3知道,f (x )具有以下性质:1°f (x )≥0;2°⎰+∞∞-x x f d )(=1;3°P {x 1<X ≤x 2}=F (x 2)-F (x 1)=⎰21d )(x x x x f (x 1≤x 2);4°若f (x )在x 点处连续,则有F ′(x )=f (x ).由2°知道,介于曲线y =f (x )与y =0之间的面积为1.由3°知道,X 落在区间(x 1,x 2]的概率P {x 1<X ≤x 2}等于区间(x 1,x 2]上曲线y =f (x )之下的曲边梯形面积.由4°知道,f (x )的连续点x 处有f (x )=.}{)()(lim lim00x x x X x P x x F x x F x x ∆∆+≤<=∆-∆+++→∆→∆这种形式恰与物理学中线密度定义相类似,这也正是为什么称f (x )为概率密度的原因.同样我们也指出,反过来,任一满足以上1°、2°两个性质的函数f (x ),一定可以作为某个连续型随机变量的密度函数.前面我们曾指出对连续型随机变量X 而言它取任一特定值a 的概率为零,即P {X =a }=0,事实上,令Δx >0,设X 的分布函数为F (x ),则由{X =a }⊂{a -Δx <X ≤a },得 0≤P {X =a }≤P {a -Δx <X ≤a }=F (a )-F (a -Δx ). 由于F (x )连续,所以)(lim 0x a F x ∆-→∆=F (a ).当Δx →0时,由夹逼定理得P {X =a }=0,由此很容易推导出P {a ≤X <b }=P {a <X ≤b }=P {a ≤X ≤b }=P {a <X <b }.即在计算连续型随机变量落在某区间上的概率时,可不必区分该区间端点的情况.此外还要说明的是,事件{X =a }“几乎不可能发生”,但并不保证绝不会发生,它是“零概率事件”而不是不可能事件.例2.9 设连续型随机变量X 的分布函数为F (x )=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x Ax x 试求:(1)系数A ;(2)X 落在区间(0.3,0.7)内的概率; (3)X 的密度函数.解 (1)由于X 为连续型随机变量,故F (x )是连续函数,因此有1=F (1)=20101lim lim)(Ax x F x x -→-→= =A ,即A =1,于是有F (x )=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x x x (2) P {0.3<X <0.7}=F (0.7)-F (0.3)=(0.7)2-(0.3)2=0.4; (3) X 的密度函数为f (x )=F ′(x )=⎩⎨⎧<≤.,0;10,2其他x x由定义2.3知,改变密度函数f (x )在个别点的函数值,不影响分布函数F (x )的取值,因此,并不在乎改变密度函数在个别点上的值(比如在x =0或x =1上f (x )的值).例2.10 设随机变量X 具有密度函数f (x )=⎪⎩⎪⎨⎧≤≤-<≤.,0,43,22,30,其他x x x kx (1) 确定常数k ;(2) 求X 的分布函数F (x );(3) 求P {1<X ≤72}. 解 (1)由⎰∞∞-x x f d )(=1,得x xx kx d )22(d 4330⎰⎰-+=1, 解得k =1/6,故X 的密度函数为f (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧≤≤-<≤.,0,43,22,30,6其他x x x x(2) 当x <0时,F (x )=P {X ≤x }=⎰∞-xt t f d )( =0; 当0≤x <3时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=⎰⎰∞-+00d )(d )(xt t f t t f =12d 620x t t x=⎰;当3≤x <4时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=0303()()()xf t dt f t dt f t dt -∞++⎰⎰⎰=233(2)23;624x t t x dt dt x +-=-+-⎰⎰当x ≥4时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=⎰⎰⎰⎰∞-+++030434d )(d )(d )(d )(xt t f t t f t t f t t f=t tt t d )22(d 64330⎰⎰-+ =1.即F (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤-+-<≤<.4,1,43,324,30,12,0,022x x x x x x x(3) P {1<X ≤7/2}=F (7/2)-F (1)=41/48.下面介绍三种常见的连续型随机变量. (1)均匀分布若连续型随机变量X 具有概率密度f (x )=⎪⎩⎪⎨⎧<<-.,0,,1其他b x a ab (2.9)则称X 在区间(a ,b )上服从均匀分布(Uniform distribution ),记为X ~U (a ,b ).易知f (x )≥0且⎰⎰∞∞--=ba x ab x x f d 1d )(=1.由(2.9)可得 1°P {X ≥b }=⎰∞bx d 0 =0,P {X ≤a }=⎰∞-ax d 0=0,即 P {a <X <b }=1-P {X ≥b }-P {X ≤a }=1;2°若a ≤c <d ≤b ,则P {c <X <d }=ab c d x a b dc--=-⎰d 1. 因此,在区间(a ,b )上服从均匀分布的随机变量X 的物理意义是:X 以概率1在区间(a ,b )内取值,而以概率0在区间(a ,b )以外取值,并且X 值落入(a ,b )中任一子区间(c ,d )中的概率与子区间的长度成正比,而与子区间的位置无关. 由(2.8)易得X 的分布函数为F (x )=⎪⎩⎪⎨⎧≥<≤--<.,1,,,,0b x b x a a b ax a x (2.10) 密度函数f (x )和分布函数F (x )的图形分别如图2-3和图2-4所示.图2-3 图2-4在数值计算中,由于四舍五入,小数点后第一位小数所引起的误差X ,一般可以看作是一个服从在[-0.5,0.5]上的均匀分布的随机变量;又如在(a ,b )中随机掷质点,则该质点的坐标X 一般也可看作是一个服从在(a ,b )上的均匀分布的随机变量.例2.11 某公共汽车站从上午7时开始,每15分钟来一辆车,如某乘客到达此站的时间是7时到7时30分之间的均匀分布的随机变量,试求他等车少于5分钟的概率.解 设乘客于7时过X 分钟到达车站,由于X 在[0,30]上服从均匀分布,即有f (x )=⎪⎩⎪⎨⎧≤≤.,0,300,301其他x显然,只有乘客在7∶10到7∶15之间或7∶25到7∶30之间到达车站时,他(或她)等车的时间才少于5分钟,因此所求概率为 P {10<X ≤15}+P {25<X ≤30}=⎰⎰+15103025d 301d 301x x =1/3. (2)指数分布若随机变量X 的密度函数为f (x )=⎩⎨⎧≤>-.00,,0,e x x x λλ (2.11) 其中λ>0为常数,则称X 服从参数为λ的指数分布(Exponentially distribution ),记作X ~E (λ).显然f (x )≥0,且x x x f x d e d )(0⎰⎰∞∞-∞-=λλ=1.容易得到X 的分布函数为F (x )=⎩⎨⎧≤>--.00,,0,e 1x x x λ指数分布最常见的一个场合是寿命分布.指数分布具有“无记忆性”,即对于任意s ,t >0,有P {X >s +t |X >s }=P {X >t }. (2.12)如果用X 表示某一元件的寿命,那么上式表明,在已知元件已使用了s 小时的条件下,它还能再使用至少t 小时的概率,与从开始使用时算起它至少能使用t 小时的概率相等.这就是说元件对它已使用过s 小时没有记忆.当然,指数分布描述的是无老化时的寿命分布,但“无老化”是不可能的,因而只是一种近似.对一些寿命长的元件,在初期阶段老化现象很小,在这一阶段,指数分布比较确切地描述了其寿命分布情况.(2.12)式是容易证明的.事实上,(){,}{}{}{}{}1()e e {}.1()es t t λs P X s X s t P X s t P X s t X s P X s P X s F s t P X t F s λλ-+->>+>+>+>==>>-+====>--(3)正态分布若连续型随机变量X 的概率密度为f (x )=222)(e π21σμσ--x , -∞<x <+∞, (2.13)其中μ,σ(σ>0)为常数,则称X 服从参数为μ,σ的正态分布(Normal distribution ),记为X ~N (μ,σ2).显然f (x )≥0,下面来证明⎰∞∞-x x f d )(=1.令σux -=t ,得到.d eπ21d e π2122)(222t x t x ⎰⎰∞∞--∞∞---=σμσ记I =t t d e22⎰∞∞--,则有I 2=⎰⎰∞∞-∞∞-+-ds d e222t s t .作极坐标变换:s =r cos θ,t =r sin θ,得到I 2=22π22r redrd πθ∞--∞=⎰⎰,而I >0,故有I,即有.π2d e 22=⎰∞∞--t t于是.1π2π21d e 21222)(=⋅=--∞∞-⎰x x σμσπ 正态分布是概率论和数理统计中最重要的分布之一.在实际问题中大量的随机变量服从或近似服从正态分布.只要某一个随机变量受到许多相互独立随机因素的影响,而每个个别因素的影响都不能起决定性作用,那么就可以断定随机变量服从或近似服从正态分布.例如,因人的身高、体重受到种族、饮食习惯、地域、运动等等因素影响,但这些因素又不能对身高、体重起决定性作用,所以我们可以认为身高、体重服从或近似服从正态分布.参数μ,σ的意义将在第四章中说明.f (x )的图形如图2-5所示,它具有如下性质:图2-5 图2-61°曲线关于x =μ对称;2°曲线在x =μ处取到最大值,x 离μ越远,f (x )值越小.这表明对于同样长度的区间,当区间离μ越远,X 落在这个区间上的概率越小;3°曲线在μ±σ处有拐点; 4°曲线以x 轴为渐近线;5°若固定μ,当σ越小时图形越尖陡(图2-6),因而X 落在μ附近的概率越大;若固定σ,μ值改变,则图形沿x 轴平移,而不改变其形状.故称σ为精度参数,μ为位置参数. 由(2.13)式得X 的分布函数F (x )=t xt d eπ21-2)(22⎰∞--σμσ. (2.14)特别地,当μ=0,σ=1时,称X 服从标准正态分布N (0,1),其概率密度和分布函数分别用)(x ϕ,Φ(x )表示,即有22e π21)(x x -=ϕ, (2.15)Φ(x )=t x t d e π2122⎰∞--. (2.16) 易知,Φ(-x )=1-Φ(x ).人们已事先编制了Φ(x )的函数值表(见本书附录).一般地,若X ~N (μ,σ2),则有σμ-X ~N (0,1).事实上,Z =σμ-X 的分布函数为 P {Z ≤x }=}{x X P ≤-σμ=P {X ≤μ+σx }=t t xd e π21222)(σμσμσ--+∞-⎰,令σμ-t =s ,得P {Z ≤x }=s xs d e π2122⎰∞--=Φ(x ),由此知Z =σμ-X ~N (0,1).因此,若X ~N (μ,σ2),则可利用标准正态分布函数Φ(x ),通过查表求得X 落在任一区间(x 1,x 2]内的概率,即P {x 1<X ≤x 2}=⎭⎬⎫⎩⎨⎧-≤-<-σμσμσμ21x X x P=⎭⎬⎫⎩⎨⎧-≤--⎭⎬⎫⎩⎨⎧-≤-σμσμσμσμ12x X P x X P =⎪⎭⎫⎝⎛-Φ-⎪⎭⎫⎝⎛-Φσμσμ12x x .例如,设X ~N (1.5,4),可得P {-1≤X ≤2}=⎭⎬⎫⎩⎨⎧-≤-≤--25.1225.125.11X P =Φ(0.25)-Φ(-1.25)=Φ(0.25)-[1-Φ(1.25)]=0.5987-1+0.8944=0.4931.设X ~N (μ,σ2),由Φ(x )函数表可得P {μ-σ<X <μ+σ}=Φ(1)-Φ(-1)=2Φ(1)-1=0.6826,P {μ-2σ<X <μ+2σ}=Φ(2)-Φ(-2)=0.9544, P {μ-3σ<X <μ+3σ}=Φ(3)-Φ(-3)=0.9974.我们看到,尽管正态变量的取值范围是(-∞,∞),但它的值落在(μ-3σ,μ+3σ)内几乎是肯定的事,因此在实际问题中,基本上可以认为有|X -μ|<3σ.这就是人们所说的“3σ原则”.例2.12 公共汽车车门的高度是按成年男子与车门顶碰头的机会在1%以下来设计的.设男子身高X 服从μ=170(cm),σ=6(cm)的正态分布,即X ~N (170,62),问车门高度应如何确定?解 设车门高度为h (cm),按设计要求P {X ≥h }≤0.01或P {X <h }≥0.99,因为X ~N (170,62),故P {X <h }=⎪⎭⎫⎝⎛-Φ=⎭⎬⎫⎩⎨⎧-<-617061706170h h X P ≥0.99, 查表得 Φ(2.33)=0.9901>0.99.故取6170-h =2.33,即h =184.设计车门高度为184(cm )时,可使成年男子与车门碰头的机会不超过1%.例2.13 测量到某一目标的距离时发生的随机误差X (单位:米)具有密度函数f (x )=3200)20(2eπ2401--x .试求在三次测量中至少有一次误差的绝对值不超过30米的概率.解 X 的密度函数为f (x )=22402)20(3200)20(eπ2401eπ2401⨯----⨯=x x ,即X ~N (20,402),故一次测量中随机误差的绝对值不超过30米的概率为P {|X |≤30}=P {-30≤X ≤30}=⎪⎭⎫⎝⎛--Φ-⎪⎭⎫⎝⎛-Φ402030402030=Φ(0.25)-Φ(-1.25)=0.5981-(1-0.8944)=0.4931.设Y 为三次测量中误差的绝对值不超过30米的次数,则Y 服从二项分布b (3,0.4931),故P {Y ≥1}=1-P {Y =0}=1-(0.5069)3=0.8698.为了便于今后应用,对于标准正态变量,我们引入了α分位点的定义. 设X ~N (0,1),若z α满足条件P {X >z α}=α,0<α<1, (2.17)则称点z α为标准正态分布的上α分位点,例如,由查表可得z 0.05=1.645,z 0.001=3.16.故1.645与3.16分别是标准正态分布的上0.05分位点与上0.001分位点.第四节 随机变量函数的分布我们常常遇到一些随机变量,它们的分布往往难于直接得到(如测量轴承滚珠体积值Y 等),但是与它们有函数关系的另一些随机变量,其分布却是容易知道的(如滚珠直径测量值X ).因此,要研究随机变量之间的函数关系,从而通过这种关系由已知的随机变量的分布求出与其有函数关系的另一个随机变量的分布.例2.14 设随机变量X 具有表2-6所示的分布律,试求X 2的分布律.表2-6“X 2=2.25”,“X 2=9”等价,所以P {X 2=0}=P {X =0}=0.1, P {X 2=2.25}=P {X =1.5}=0.3, P {X 2=9}=P {X=3}=0.1.事件“X 2=1”是两个互斥事件“X =-1”及“X =1”的和,其概率为这两事件概率和,即P {X 2=1}=P {X =-1}+P {X =+1}=0.2+0.3=0.5.于是得X 2的分布律如表2-7所示.表2-7 例2.15 设连续型随机变量X 具有概率密度f X (x ),-∞<x <+∞,求Y =g (X )=X 的概率密度.解 先求Y 的分布函数F Y (y ),由于Y =g (X )=X 2≥0,故当y ≤0时事件“Y ≤y ”的概率为0,即F Y (y )=P {Y ≤y }=0,当y >0时,有F Y (y )=P {Y ≤y }=P {X 2≤y }=P {-y ≤X ≤y }=x x f yyX d )(⎰-.将F Y (y )关于y 求导,即得Y 的概率密度为f Y (y )=()()[]⎪⎩⎪⎨⎧≤>-+.0,0,0,21y y y f y f yXX例如,当X ~N (0,1),其概率密度为(2.15)式,则Y =X 2的概率密度为f Y (y )=⎪⎩⎪⎨⎧≤>--.0,0,0,e π21221y y y y此时称Y 服从自由度为1的χ2分布.上例中关键的一步在于将事件“Y ≤y ”由其等价事件“-y ≤X ≤y ”代替,即将事件“Y ≤y ”转换为有关X 的范围所表示的等价事件,下面我们仅对Y =g (X ),其中g (x )为严格单调函数,写出一般结论.定理2.2 设随机变量X 具有概率密度f X (x ),-∞<x <+∞,又设函数g (x )处处可导且g ′(x )>0(或g ′(x )<0),则Y =g (X )是连续型随机变量,其概率密度为f Y (y )=⎩⎨⎧<<'.,0,)()]([其他βαx y h y h f X (2.18)其中α=min (g (-∞),g (+∞)),β=max (g (-∞),g (+∞)),h (y )是g (x )的反函数.我们只证g ′(x )>0的情况.由于g ′(x )>0,故g (x )在(-∞,+∞)上严格单调递增,它的反函数h (y )存在,且在(α,β)严格单调递增且可导.我们先求Y 的分布函数F Y (y ),并通过对F Y (y )求导求出f Y (y ).由于Y =g (X )在(α,β)上取值,故 当y ≤α时,F Y (y )=P {Y ≤y }=0; 当y ≥β时,F Y (y )=P {Y ≤y }=1; 当α<y <β时,F Y (y )=P {Y ≤y }=P {g (X )≤y }=P {X ≤h (y )}=⎰∞-)(d )(x h X x x f .于是得概率密度f Y (y )=[()](),,0,X f h y h y x .αβ'<<⎧⎨⎩其他对于g ′(x )<0的情况可以同样证明,即f Y (y )=[()][()],,0,fX h y h y x .αβ'<<⎧⎨⎩其他将上面两种情况合并得f Y (y )=(())(),,0,fX h y h y x .αβ'⎧<<⎨⎩其他注:若f (x )在[a ,b ]之外为零,则只需假设在(a ,b )上恒有g ′(x )>0(或恒有g ′(x )<0),此时α=min{g (a ),g (b )},β=max{g (a ),g (b )}.例2.16 设随机变量X ~N (μ,σ2).试证明X 的线性函数Y =aX +b (a ≠0)也服从正态分布.证 设X 的概率密度f X (x )=,21222)(σμ--x e π-∞<x <+∞.再令y =g (x )=ax +b ,得g (x )的反函数x =h (y )=y ba-. 所以h ′(y )=1/a .由(2.18)式Y =g (X )=aX +b 的概率密度为f Y (y )=⎪⎭⎫ ⎝⎛-a b y f a X 1, -∞<y <+∞, 即。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
The event {X=k} occurs if k-1 consecutive erroneous transmissions (failures) followed by a error-free one (success)
1 e Head X (e) 0 e Tail
根据随机变量取值的不同可以分为:
连续型随机变量(Continuous random variable)
离散型随机变量(Discrete random variable)
A discrete random variable is a random variable that can be take on at most a countable number of possible values
if rand(1,1)<0.5 % toss coin with p=0.5 x(i,1)=1; % head
else x(i,1)=0; % tail
end number=number+x(i,1);% count number of heads end P=number/N;
1.2 随机变量的定义 (Definition of a random variable) 1. 定义
0 if e not in A
IA (e) 1
if e in A
PI (0) P{IA(e) 0} 1 p PI (1) P{IA(e) 1} p
例:信息传输问题(Message Transmissions)
Let X be the number of times needs to be transmitted until it arrivers correctly at its destination. Find the probability that X is an a even number.
2. 概率分布列
P(X xk ) pk (k 1,2,...., n)
X
x1
x2 ...
pk
p1
p2 ...
xn
n
pn
pk 1
k 1
Probability mass function (PMF)
PX (xk ) P(X xk ) pk (k 1, 2,...., n)
•(0,1)分布
指示型随机变量
随机变量的可能取值为0和1两个值,PMF为
1 p k 0
PMF:
PX (k)
p
k 1
PX (k) 1 p p
01
k
(0,1)分布的随机变量; 指示型随机变量; 贝努里随机变量;
Bernoulli random variable
Let A be an event of interest in some experiment, e.g., a device is not defective. We say that a “success” occurs if A occurs when we perform the experiment. Bernoulli random variable IA is equal to 1 if A occurs and zero otherwise.
连续的样本空间: S R, or S [a,b]
由多次子试验构成的样本空间:--看下例
IF we toss a coin three times and let the triplet xyz denote the outcome “x on the first toss, y on the second toss, z on the third toss”, then the sample space of the experiment is
S={HHH, HHT, HTH, HTT, THH, THT, TTH, TTT}
The event “ one head and two tails” is defined by E={HTT, THT, TTH}
由多次子试验构成的样本空间 可数无穷的样本空间
S=S1 S1… ={HH…, HT…, TH…, TT…, …} S1={H,T}
利用频率估计概率
n次重复试验中,事件A发生的次数为nA,比值 称为事件A发生的频率。频率反映了事件A发生 的频繁程度,若事件A发生的可能性大,那么 相应的频率也大,反之则较小。
概率 P(A) lim nA n n
计算机模拟:
投掷一枚均匀硬币,模拟计算出现正面的概率。
number=0; for i=1:N % set up simulation for 4 coin toses
设随机试验E的样本空间为S={e},如果对于每 一个eS,有一个实数X(e)与之对应,这样就得 到一个定义在S上的单值函数X(e),称X(e)为随 机变量,简记为X。
随机变量是定义在样本空间S上的单值函数
Interpretation of random variable:
e●
● Real line
PX (k) P{X k} P(00....01) (1 p)k1 p qk1 p
X (e)
S
Random variable is a function that assigns a numerical value to the outcome of the experiment.
A coin toss
X (e1)
Real line
e1●
●
●
0
1
Se2● X (e2 )
Mapping of the outcome of a coin toss into the set of real number
优选第二讲随机变量基础
投掷骰子出现1点 {1,2,3,4,5,6} 投掷骰子出现偶数点
样本空间 随机事件 基本事件
关于样本空间的注释: Discrete Sample Space:
Toss a die: S={1,2,3,4,5,6} Toss a coin:S={Head, Tail}={H,T}