第6章 随机变量及其分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
请输入
更全面地把握您随的文机现象的统计规律。从推断统计 字
学的角度看,随机变量是刻画总体数据统计分布
规律主要的数学标题工具。
目
1
6.1 随机变量
录
2
6.2离散型随机变量
3
6.3随机变量的分布函数
4
6.4 连续型随机变量
6.5 随机变量的数字特征
6.6 Excel操作
6.1
随机变量
random variable
6.3.1经验分布函数
(1) 0 Fn (x) 1;(2) Fn (x) 是非减函数;(3) Fn () 0, Fn () 1 ; (4) Fn (x) 在每个观测值 x(i) 处是右连续的,点 x(i) 是 Fn (x) 的跳跃间断点, Fn (x) 在 该点的跃度就是频率 fi ( i 1, 2,L , k )。
分布函数有如下的基本性质:
性质 1 单调性:F(x) 是定义在 (, ) 上的单调不减函数。即对任意实数 x1 ,x2, 如
果 x1 x2 ,则有 F(x1) F(x2) ;
性质 2 有界性:对任意实数 x ,有 0 F(x) 1,且
F() lim F(x) 0 , F() lim F(x) 1 ;
1, 第i次试验中结果A出现 Xi 0,第i次试验中结果A不出现 则 Xi ~ b(1, p) ,根据 X 和 X1, X2,L , Xn 的定义,显然有
X X1 X2 L Xn 这个式子表明,一个服从二项分布的随机变量可以表示成 n 个相互独立且服从 0 1分
布的随机变量之和,这是一个重要的结果。
P{x1 X x2} P( X x2 ) P( X x1)
F (x2 ) F (x1)
x2 f (t)dt
x1
由此可知,当连续型随机变量 X 的密度函数 f (x) 已知时, X 在任意区间 (x1, x2 ] 上取值的
概率可以用牛顿-莱布尼兹公式计算,即
P{x1 X x2}
随机变量 X 的概率分布也可用表格形式表示
X
x1
x2
…
xi
…
P
p1
p2
…
易知 X 的概率分布有如下性质:
性质 1 pi 0 (i 1, 2,L ) ;
性质 2 pi 1 。 i 1
pi
…
6.2.1离散型随机变量的概率分布
例 6-4 已知随机变量 X 只能取-1、0、1、2 四个值,相应概率依次为 1 、 3 、5 、 7 。 2c 4c 8c 16c
这里之所以称为二项分布,是因为 P{X k} Cnk pk (1 p)nk ,(k=0,1,2,…,n)恰好 是二项式(p+q)n 展开式的通项,其中 q 1 p 。
显然,二项分布的概率分布满足 P{X k} 0 ,并且
n
Cnk p k q nk ( p q)n 1
k 0
当 n 1时,二项分布 b(1, p) 就是参数为 p 的 0 1分布,即 0 1分布是二项分布的特例。
因此我们可以利用微积分的方法来全面研究随机变量。
粗略地说,随机变量的分布函数就是“累计概率”。对于任意实数 x ,随机变量(总体) X 的分布函数 F(x) P{X x}是事件{X x}的概率,即随机变量 X 的“累计概率”
6.3.2随机变量的分布函数
经验分布函数与 分布函数的关系
6.3.2随机变量的分布函数
值,按由小到大的顺序依次记为 x(1) , x(2) ,L , x(k) ,k n ,并假设各个 x(i) 出现的频数为 ni ,
则各个 x(i) 出现的频率为
显然有
fi
ni n
,i
1, 2,L
,k
,k
n
k
k
ni n , fi 1
i 1
i 1
设函数
0,
Fn
(
x)
i
fj,
j1
1,
i 1, 2,L , k 1
(continuous random variables)
1. 随机变量 X 取无限不可列值
2. 所有可能取值不可以逐个列举出来,而是取 数轴上某一区间内或若干区间内的任意点
3. 连续型随机变量的一些例子
试验
随机变量
可能的取值
抽查一批电子元件 使用寿命(小时)
X0
新建一座住宅楼
半年后工程完成的百分比 0 X 100
6.1随机变量
例 6-2 将一枚硬币抛掷三次,观察正面 H、反面 T 出现的情况,其样本空间
={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}
设 X 表示每次试验出现正面的总次数,则 X 是随机变量。X X () 作为样本空间 上
的函数,其取值列表如下:
HHH HHT HTH THH HTT THT TTH TTT
6.3.2随机变量的分布函数
定义 6.6 设 X 是一个随机变量, x 是任意实数,函数 F(x) P{X x}
称为随机变量 X 的分布函数(distribution function)。
这个函数具有双重含义:一方面,它完整地描述了随机变量的统计规律性,根据分布函
数可以算得与随机变量 X 有关事件的概率。另一方面,这个分布函数就是普通的实函数,
例 6-8 已知某类产品的次品率为 0.2,现从一大批这类产品中随机地抽查 20 件,问恰
好有 k 件( k 1,2,,20 )次品的概率是多少?
6.2.2常用离散型随机变量的概率分布
项分布 b(n, p) 和 0 1分布 b(1, p) 有着密切的关系。仍设随机试验只有两个可能结果: A 和 A ,且 P(A) p 。现将试验独立进行 n 次,记 X 为 n 次试验中结果 A 出现的次数, 则 X ~ b(n, p) 。若记 Xi 为第 i 次试验中结果 A 出现的次数,即
(1)确定变量 X 的具体分布; (2)计算概率 P{X 0}及 P{X 0}。
例 6-5 某系统有两台机器相互独立地运转。设第一台和第二台机器发生故障的概率分
别为 0.1,0.2。以 X 表示系统中发生故障的机器数,求 X 的分布律。
6.2.1离散型随机变量的概率分布
图6-2 概率与频率对比图
6.4.1连续型随机变量及其概率密度
2. 概率密度函数
定义 6.7 设 X 为连续型随机变量,如果存在非负可积函数 f (x),使得对于任意的实
数 x1, x2 (x1 x2 ) ,都有
P(x1 X x2)
x2 f (x)dx
x1
成立,则称 f (x) 称为 X 的概率密度函数(density function),简称为 X 的概率密度。
6.2.2常用离散型随机变量的概率分布
1. 两点分布
定义 6.3 若随机变量 X 只有两个可能取值,且其概率分布为 P{X x1} p, P{X x2} 1 p (0 p 1)
称随机变量 X 服从参数为 p 的两点分布(two-point distribution)。
特别地,当 x1 1, x2 0 时,该两点分布也称为 0 1分布。其概率分布为
形)的面积,这个面积可视为形成密度曲线 y f (x) 的频率直方图在区间 (x, x x] 上取
值的频率。
6.4.1连续型随机变量及其概率密度
由微积分学基本定理,在 f (x) 的连续点处,必有 F(x) f (x) ,即分布函数 F x 是
密度函数 f (x) 的一个原函数。进一步,还有
6.2.2常用离散型随机变量的概率分布
例 6-6 已知 100 个产品中有 5 个次品,现从中有放回地取 3 次,每次任取一个,求所取 的 3 个中恰有 2 个次品的概率。
例 6-7 某导弹发射塔发射导弹的成功率为 0.9,求在 10 次发射中, (1)至少成功 2 次的概率;(2)至多成功 8 次的概率。
6.3
随机变量的分布函数
distribution function
6.3.1经验分布函数
设从总体中抽取容量为 n 的样本,样本观测值为 x1, x2,L , xn ,如果样本容量 n 较大,
则相同的观测值可能重复出现若干次。假如在 n 个样本观测值 x1, x2,L , xn 中有 k 个不同的
特别地,用一个变量X来描述某个随机
试验的所有可能结果,这个变量就是随机 变量。
根据取值情况的不同,随机变量可以分为: 离散型随机变量和连续型随机变量
离散型随机变量
(discrete random variables)
1. 随机变量 X 取有限个值或无限可列值(可 以逐个列举出来 X1 , X2,…)
X
3
2ຫໍສະໝຸດ Baidu
2
2
1
1
1
0
易见,使 X 取值为 2 的样本点构成的子集为
A {HHT,HTH,THH},
故
P{X 2} P(A) 3 / 8
类似地, P{X 1} P{HTT,THT,TTH,TTT} 4 / 8
随机变量的概念
什么是随机变量 随机变量就是其取值带有随机性的变量。在给
定的条件下,这种变量取何值事先不能确定,只能 由随机试验的结果来定,并且随试验的结果而变。
概率密度函数具有如下性质:
(1)f (x)≥0,即概率密度曲线 y=f (x)位于 x 轴上方;
(2) f (x)dx 1,即概率密度曲线 y=f (x)与 x 轴围成的图形的面积等于 1(如图 6-8
所示)。
6.4.1连续型随机变量及其概率密度
由密度函数的定义, X 落在任意区间 (x1, x2] 上的概率 P{x1 X x2}等于区间 (x1, x2] 上
P{X k} pk (1 p)1k , k 0,1; 0 p 1
或者表示为如下表格形式:
X0
1
P
1 p
p
6.2.2常用离散型随机变量的概率分布
2. 二项分布
定义 6.4 若随机变量 X 的概率分布为 P{X k} Cnk pk (1 p)nk , 0<p<1, k=0,1,2,…,n
则称 X 服从参数为 n , p 的二项分布(binomial distribution),记作 X ~ b(n, p) 。
测量一个产品的长度 测量误差(cm)
X0
6.2
离散型随机变量
Discrete random variable
6.2.1离散型随机变量的概率分布
定义 6.2 设离散型随机变量 X 的所有可能取值为 xi (i 1, 2,L ) ,相应的概率为
P{X xi} pi , i 1, 2,L 称上述这组概率为离散型随机变量 X 的概率分布或分布律(probability distribution)。
2. 以确定的概率取这些不同的值 3. 离散型随机变量的一些例子
试验
抽查100个产品 一家餐馆营业一天 电脑公司一个月的销售 销售一辆汽车
随机变量
可能的取值
取到次品的个数 顾客数 销售量 顾客性别
0,1,2, …,100 0,1,2,3, … 0,1, 2,3,… 男性为0,女性为1
连续型随机变量
x2 f (x)dx F
x1
x
x2 x1
6.4.1连续型随机变量及其概率密度
统计学原理
第6章 随机变量及其分布
随机变量
许多统计变量的取值依赖于随机试验或随机
抽样的结1果,这类变量的取值具有不确定性,通
常们被无称法请您为事输的字随先入文 机预变知量随机。请输3变与入量普的通确变2切量取所值不同,的但是可
,人 以研
您的文
究其取值的统计规律字性。引入随机变量之后,我
们就能够将随机4 事件进行定量分析 ,从而更系统
x
x
性质 3 右连续性: F(x) 在任何点 x 处右连续,即 F(x 0) F(x) ;
性质 4 对于任意实数 x1 , x2 ,且 x1 x2 , X 落在区间 (x1, x2 ] 的概率为 P{x1 X x2} P{X x2} P{X x1} F(x2) F(x1)
6.4
连续型随机变量
Continuous random variable
6.4.1连续型随机变量及其概率密度
1.频率直方图
直方图上方的曲线与直方图本身都能够反映样本数据的分布状态。随 着样本容量的持续增大以及分组的不断加细(组距越来越小),这条 曲线线就能够更准确的刻画总体数据的分布形态,这就是引入概率密 度函数(曲线)的统计意义。
曲线 f (x) 之下的曲边梯形的面积,即 P(x1 X x2)
x2 f (x)dx ,
x1
6.4.1连续型随机变量及其概率密度
由 微 积 分 知 识 , 当 x 充 分 小 时 , 随 机 变 量 X 落 在 区 间 (x, x x] 上 的 概 率
P{x X x x} xx f (x)dx f (x)x 。而 f (x)x 恰好等于图 6-10 中阴影部分(矩 x
更全面地把握您随的文机现象的统计规律。从推断统计 字
学的角度看,随机变量是刻画总体数据统计分布
规律主要的数学标题工具。
目
1
6.1 随机变量
录
2
6.2离散型随机变量
3
6.3随机变量的分布函数
4
6.4 连续型随机变量
6.5 随机变量的数字特征
6.6 Excel操作
6.1
随机变量
random variable
6.3.1经验分布函数
(1) 0 Fn (x) 1;(2) Fn (x) 是非减函数;(3) Fn () 0, Fn () 1 ; (4) Fn (x) 在每个观测值 x(i) 处是右连续的,点 x(i) 是 Fn (x) 的跳跃间断点, Fn (x) 在 该点的跃度就是频率 fi ( i 1, 2,L , k )。
分布函数有如下的基本性质:
性质 1 单调性:F(x) 是定义在 (, ) 上的单调不减函数。即对任意实数 x1 ,x2, 如
果 x1 x2 ,则有 F(x1) F(x2) ;
性质 2 有界性:对任意实数 x ,有 0 F(x) 1,且
F() lim F(x) 0 , F() lim F(x) 1 ;
1, 第i次试验中结果A出现 Xi 0,第i次试验中结果A不出现 则 Xi ~ b(1, p) ,根据 X 和 X1, X2,L , Xn 的定义,显然有
X X1 X2 L Xn 这个式子表明,一个服从二项分布的随机变量可以表示成 n 个相互独立且服从 0 1分
布的随机变量之和,这是一个重要的结果。
P{x1 X x2} P( X x2 ) P( X x1)
F (x2 ) F (x1)
x2 f (t)dt
x1
由此可知,当连续型随机变量 X 的密度函数 f (x) 已知时, X 在任意区间 (x1, x2 ] 上取值的
概率可以用牛顿-莱布尼兹公式计算,即
P{x1 X x2}
随机变量 X 的概率分布也可用表格形式表示
X
x1
x2
…
xi
…
P
p1
p2
…
易知 X 的概率分布有如下性质:
性质 1 pi 0 (i 1, 2,L ) ;
性质 2 pi 1 。 i 1
pi
…
6.2.1离散型随机变量的概率分布
例 6-4 已知随机变量 X 只能取-1、0、1、2 四个值,相应概率依次为 1 、 3 、5 、 7 。 2c 4c 8c 16c
这里之所以称为二项分布,是因为 P{X k} Cnk pk (1 p)nk ,(k=0,1,2,…,n)恰好 是二项式(p+q)n 展开式的通项,其中 q 1 p 。
显然,二项分布的概率分布满足 P{X k} 0 ,并且
n
Cnk p k q nk ( p q)n 1
k 0
当 n 1时,二项分布 b(1, p) 就是参数为 p 的 0 1分布,即 0 1分布是二项分布的特例。
因此我们可以利用微积分的方法来全面研究随机变量。
粗略地说,随机变量的分布函数就是“累计概率”。对于任意实数 x ,随机变量(总体) X 的分布函数 F(x) P{X x}是事件{X x}的概率,即随机变量 X 的“累计概率”
6.3.2随机变量的分布函数
经验分布函数与 分布函数的关系
6.3.2随机变量的分布函数
值,按由小到大的顺序依次记为 x(1) , x(2) ,L , x(k) ,k n ,并假设各个 x(i) 出现的频数为 ni ,
则各个 x(i) 出现的频率为
显然有
fi
ni n
,i
1, 2,L
,k
,k
n
k
k
ni n , fi 1
i 1
i 1
设函数
0,
Fn
(
x)
i
fj,
j1
1,
i 1, 2,L , k 1
(continuous random variables)
1. 随机变量 X 取无限不可列值
2. 所有可能取值不可以逐个列举出来,而是取 数轴上某一区间内或若干区间内的任意点
3. 连续型随机变量的一些例子
试验
随机变量
可能的取值
抽查一批电子元件 使用寿命(小时)
X0
新建一座住宅楼
半年后工程完成的百分比 0 X 100
6.1随机变量
例 6-2 将一枚硬币抛掷三次,观察正面 H、反面 T 出现的情况,其样本空间
={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}
设 X 表示每次试验出现正面的总次数,则 X 是随机变量。X X () 作为样本空间 上
的函数,其取值列表如下:
HHH HHT HTH THH HTT THT TTH TTT
6.3.2随机变量的分布函数
定义 6.6 设 X 是一个随机变量, x 是任意实数,函数 F(x) P{X x}
称为随机变量 X 的分布函数(distribution function)。
这个函数具有双重含义:一方面,它完整地描述了随机变量的统计规律性,根据分布函
数可以算得与随机变量 X 有关事件的概率。另一方面,这个分布函数就是普通的实函数,
例 6-8 已知某类产品的次品率为 0.2,现从一大批这类产品中随机地抽查 20 件,问恰
好有 k 件( k 1,2,,20 )次品的概率是多少?
6.2.2常用离散型随机变量的概率分布
项分布 b(n, p) 和 0 1分布 b(1, p) 有着密切的关系。仍设随机试验只有两个可能结果: A 和 A ,且 P(A) p 。现将试验独立进行 n 次,记 X 为 n 次试验中结果 A 出现的次数, 则 X ~ b(n, p) 。若记 Xi 为第 i 次试验中结果 A 出现的次数,即
(1)确定变量 X 的具体分布; (2)计算概率 P{X 0}及 P{X 0}。
例 6-5 某系统有两台机器相互独立地运转。设第一台和第二台机器发生故障的概率分
别为 0.1,0.2。以 X 表示系统中发生故障的机器数,求 X 的分布律。
6.2.1离散型随机变量的概率分布
图6-2 概率与频率对比图
6.4.1连续型随机变量及其概率密度
2. 概率密度函数
定义 6.7 设 X 为连续型随机变量,如果存在非负可积函数 f (x),使得对于任意的实
数 x1, x2 (x1 x2 ) ,都有
P(x1 X x2)
x2 f (x)dx
x1
成立,则称 f (x) 称为 X 的概率密度函数(density function),简称为 X 的概率密度。
6.2.2常用离散型随机变量的概率分布
1. 两点分布
定义 6.3 若随机变量 X 只有两个可能取值,且其概率分布为 P{X x1} p, P{X x2} 1 p (0 p 1)
称随机变量 X 服从参数为 p 的两点分布(two-point distribution)。
特别地,当 x1 1, x2 0 时,该两点分布也称为 0 1分布。其概率分布为
形)的面积,这个面积可视为形成密度曲线 y f (x) 的频率直方图在区间 (x, x x] 上取
值的频率。
6.4.1连续型随机变量及其概率密度
由微积分学基本定理,在 f (x) 的连续点处,必有 F(x) f (x) ,即分布函数 F x 是
密度函数 f (x) 的一个原函数。进一步,还有
6.2.2常用离散型随机变量的概率分布
例 6-6 已知 100 个产品中有 5 个次品,现从中有放回地取 3 次,每次任取一个,求所取 的 3 个中恰有 2 个次品的概率。
例 6-7 某导弹发射塔发射导弹的成功率为 0.9,求在 10 次发射中, (1)至少成功 2 次的概率;(2)至多成功 8 次的概率。
6.3
随机变量的分布函数
distribution function
6.3.1经验分布函数
设从总体中抽取容量为 n 的样本,样本观测值为 x1, x2,L , xn ,如果样本容量 n 较大,
则相同的观测值可能重复出现若干次。假如在 n 个样本观测值 x1, x2,L , xn 中有 k 个不同的
特别地,用一个变量X来描述某个随机
试验的所有可能结果,这个变量就是随机 变量。
根据取值情况的不同,随机变量可以分为: 离散型随机变量和连续型随机变量
离散型随机变量
(discrete random variables)
1. 随机变量 X 取有限个值或无限可列值(可 以逐个列举出来 X1 , X2,…)
X
3
2ຫໍສະໝຸດ Baidu
2
2
1
1
1
0
易见,使 X 取值为 2 的样本点构成的子集为
A {HHT,HTH,THH},
故
P{X 2} P(A) 3 / 8
类似地, P{X 1} P{HTT,THT,TTH,TTT} 4 / 8
随机变量的概念
什么是随机变量 随机变量就是其取值带有随机性的变量。在给
定的条件下,这种变量取何值事先不能确定,只能 由随机试验的结果来定,并且随试验的结果而变。
概率密度函数具有如下性质:
(1)f (x)≥0,即概率密度曲线 y=f (x)位于 x 轴上方;
(2) f (x)dx 1,即概率密度曲线 y=f (x)与 x 轴围成的图形的面积等于 1(如图 6-8
所示)。
6.4.1连续型随机变量及其概率密度
由密度函数的定义, X 落在任意区间 (x1, x2] 上的概率 P{x1 X x2}等于区间 (x1, x2] 上
P{X k} pk (1 p)1k , k 0,1; 0 p 1
或者表示为如下表格形式:
X0
1
P
1 p
p
6.2.2常用离散型随机变量的概率分布
2. 二项分布
定义 6.4 若随机变量 X 的概率分布为 P{X k} Cnk pk (1 p)nk , 0<p<1, k=0,1,2,…,n
则称 X 服从参数为 n , p 的二项分布(binomial distribution),记作 X ~ b(n, p) 。
测量一个产品的长度 测量误差(cm)
X0
6.2
离散型随机变量
Discrete random variable
6.2.1离散型随机变量的概率分布
定义 6.2 设离散型随机变量 X 的所有可能取值为 xi (i 1, 2,L ) ,相应的概率为
P{X xi} pi , i 1, 2,L 称上述这组概率为离散型随机变量 X 的概率分布或分布律(probability distribution)。
2. 以确定的概率取这些不同的值 3. 离散型随机变量的一些例子
试验
抽查100个产品 一家餐馆营业一天 电脑公司一个月的销售 销售一辆汽车
随机变量
可能的取值
取到次品的个数 顾客数 销售量 顾客性别
0,1,2, …,100 0,1,2,3, … 0,1, 2,3,… 男性为0,女性为1
连续型随机变量
x2 f (x)dx F
x1
x
x2 x1
6.4.1连续型随机变量及其概率密度
统计学原理
第6章 随机变量及其分布
随机变量
许多统计变量的取值依赖于随机试验或随机
抽样的结1果,这类变量的取值具有不确定性,通
常们被无称法请您为事输的字随先入文 机预变知量随机。请输3变与入量普的通确变2切量取所值不同,的但是可
,人 以研
您的文
究其取值的统计规律字性。引入随机变量之后,我
们就能够将随机4 事件进行定量分析 ,从而更系统
x
x
性质 3 右连续性: F(x) 在任何点 x 处右连续,即 F(x 0) F(x) ;
性质 4 对于任意实数 x1 , x2 ,且 x1 x2 , X 落在区间 (x1, x2 ] 的概率为 P{x1 X x2} P{X x2} P{X x1} F(x2) F(x1)
6.4
连续型随机变量
Continuous random variable
6.4.1连续型随机变量及其概率密度
1.频率直方图
直方图上方的曲线与直方图本身都能够反映样本数据的分布状态。随 着样本容量的持续增大以及分组的不断加细(组距越来越小),这条 曲线线就能够更准确的刻画总体数据的分布形态,这就是引入概率密 度函数(曲线)的统计意义。
曲线 f (x) 之下的曲边梯形的面积,即 P(x1 X x2)
x2 f (x)dx ,
x1
6.4.1连续型随机变量及其概率密度
由 微 积 分 知 识 , 当 x 充 分 小 时 , 随 机 变 量 X 落 在 区 间 (x, x x] 上 的 概 率
P{x X x x} xx f (x)dx f (x)x 。而 f (x)x 恰好等于图 6-10 中阴影部分(矩 x