生物统计课件:第2章 随机变量及其数字特征
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分布函数的定义
设X是一个随机变量,x是任意实数,则 函数
F ( x) = P{ X ≤ x}
称为X的分布函数(distribution function).
F ( x ) = P{ X ≤ x}
= ∑ pk xi ≤ x
例
X
~
0 1
1 2 1 1
3 6 2
0,
1
,
F(
x)
=
3
1
2
,
1,
x<0 0≤ x <1
伯努利概型
试验结果具有对立性的n重独 立重复试验称为n重伯努利试验,简 称伯努利试验。
伯努利试验的特点:
• 对立性 • 独立重复性
例:一次试验结果为“成功”、“失败”; 如果作两次试验呢? … … 如果作n次试验呢?
在一次Bernoulli试验中,
P (成功) = π, P (失败)= 1-π
二重Bernoulli试验,
二项分布的最可能值
n
Pk
∑ (a + b)n = Cnk akbn−k
k =0
..
0
..n
n=13, p=0.5
常见离散型随机变量(2)
定义:若随机变量X的概率函数为
P{X = k}=λke-λ k!
(λ > 0) k = 0 ,1 2,L
则称X服从参数为λ的泊松分布
(Poisson distribution),记作
P{x1 <X ≤ x2}=P{X ≤x2)−P{X ≤x1} =F(x2)−F(x1)
例
X的取值
0 12
相应概率P 0.16 0.48 0.36
0,
F(x)
=
P{X
≤
x}
=
0.16, 0.64,
1,
x<0 0≤ x <1 1≤ x< 2 2≤x
P{0.5 < X ≤ 2} = F(2) − F(0.5) =1− 0.16 = 0.84
F (4) = P( X ≤ 4) = 1 − P( X ≥ 5) = 1 − 0.37035 = 0.62965
P(2 < X < 6) = P(3 ≤ X ≤ 5) = P( X ≥ 3) − P( X ≥ 6) = 0.79392 − 0.19579 = 0.59813
例. 有10%的人对某药有胃肠道反应. 为考察某厂的产品质量, 现任选5人服用此药. 求: (1) k个人有反应的概率(k=0, 1, 2, 3, 4, 5); (2) 不多于2个人有反应的概率; (3) 有人有反应的概率。
P(成功,成功)=π2
, P(成功,失败)=π(1-π)
P(失败,成功)=π(1-π) , P(失败,失败)=(1-π)2
记成功次数为随机变量X, 则
X
0
P (1-π)2
1
2
2π(1-π) π2
P{X = k} = C2kπ k (1−π )2−k , k = 0,1,2
三重Bernoulli试验,
其中
p = P{X < 90} = Φ(90 −100) ≈ Φ(−0.67) = 0.2514 15
故 P{Y = 0} = (1− p)3 ≈ 0.4195
例.某地抽样结果表明,考生的外语成绩(百分制)近似 服从正态分布,平均成绩为72分,96分以上的占考生 总数的2.3%,试求考生的外语成绩在60分至84分之间
的概率。
解:设X为考生的外语成绩,则 X~N(72,σ2), 由题意得: P(X>96)=0.023 =1-Φ[(96-72)/σ]= 1-Φ(24/σ)
正态分布
定义:若随机变量X的概率密度函数为
f (x) =
1
- ( x- µ )2
e 2σ2
2πσ
- ∞ < x < +∞
其中,µ,σ>0为常数,则称X服从参数为µ 和σ2的正态分布(normal distribution),
记作X : N(µ ,σ2).
正态分布的图形特点
定义域 对称性 单调性 极值
P(成,成,成)=π3, P(成,成,失)=π2(1-π), 3种组合 P(成,失,失)=π (1-π)2, 3种组合 P(失,失,失)=(1-π)3
X0
1
2
3
P (1-π)3 3π (1-π)2 3π2(1-π) π3
P{X = k} = C3kπ k (1− π )3−k , k = 0,1, 2,3
第二章Leabharlann 随机变量及其数字特征关于随机变量的研究,是概率论的中心内容。 这是因为,对于一个随机试验,我们所关心的往往 是与所研究的特定问题有关的某个或某些量,而这 些量就是随机变量。也可以说:随机事件是从静态 的观点来研究随机现象,而随机变量则是一种动态 的观点,如数学分析中的常量与变量的区分那样。 变量概念是高等数学有别于初等数学的基础概念。 同样,概率论能从计算一些孤立事件的概念发展为 一个更高的理论体系,其基础概念是随机变量。
“出现的点数小于4”可表示为: {X< 4}或{X≤3}
常见的随机变量有两种类型: • 离散型 • 连续型
例: 投掷一枚硬币时出现正面的次数;
例: 新生婴儿的重量(一般在1公斤到7公斤 之间,是在区间[1, 7]上取值)。
离散型随机变量的概率分布
离散性随机变量:其取值是有限个或可列个。
定义:设离散型随机变量X所有可能取值为xi(i=1,2,…), 相应的概率P{X=xi}=pi称为离散型随机变量X的概率函数 (probability function)或分布律(distribution law)。
随机变量
定义:设E是随机试验, 它的样本空间为 Ω={e}, 如果对于Ω内的每一个 e都有一个实数x(e)和它 对应,则称x(e)为随机变量 (random variable) ,简 记为X。
随机变量的特征
•变量 •取值具有一定的概率
例:掷骰子。用X表示出现的点数,则
“出现偶数点”可表示为: {X=2}∪ {X=4} ∪{X=6}
X : π (λ ).
例.设某国每对夫妇的子女数X服从参数为λ的泊松分布, 且知一对夫妇有不超过1个孩子的概率为3e-2.求任选一 对夫妇,至少有3个孩子的概率。
解: 由题意,
Θ X ~ p(λ ), 且 P(X ≤ 1) = P{ X = 0} + P{ X = 1} = 3e−2
e −λ + λe −λ = 3e −2 ⇒ λ = 2
b
P(a < x < b) = ∫a f (x)dx
则称X为连续型随机变量(continuous random variable),f(x)称为X的概率密度 函数(probability density function)。
概率密度函数的性质
(1) f (x) ≥ 0
+∞
∫ (2) f (x)dx = 1 −∞
∞
P( X ∈ R −{a}) = ∫−∞ f (x)dx − P( X = a) = 1
由) 由) (
不能推出 A = Φ 不能推出 B = Ω
设X为连续型随机变量,称
F ( x ) = ∫−x∞ f (t )dt
为随机变量X的分布函数。
分布函数的性质
⑴ F(x)是一个单调不减函数; ⑵ 0≤ F(x) ≤1, 且
F(−∞) = lim F(x) = 0, F(+∞) = lim F(x) =1
x→−∞
x→+∞
dF (x) = f (x) dx
∫ P(x1 ≤ X ≤ x2 ) =
x2 x1
f
(t)dt
=
F (x2 ) − F (x1)
例. 设随机变量X的概率密度为
ce −2 x f (x) =
0
x>0 x≤0
X : B(n, p) 。
例. 设 X ~ B(20, 0.20) , 求P(X=4), F(4), P(2<X<6). 解: 用公式计算
P(X = 4) = C2400.24 ×0.816 = 0.218195 ≈ 0.2182
用查表法计算较简便
P( X = 4) = P( X ≥ 4) − P( X ≥ 5) =0.58855 − 0.37035=0.2182
∫b
P{a ≤ X ≤ b} =
1
e dx −
(
x−µ )2 2σ 2
a 2πσ
∫ b−µ
=σ a−µ σ
1
− y2
e 2 dy
2π
= Φ(b − µ) −Φ(a − µ)
σ
σ
Y = X −µ σ
标准正态分布函数数值表, 可以解决一般正态分布的概率计算。
例.设X: N(1,4), 求P{0<X<1.6}
3σ 原理
当 X ~ N (µ,σ 2 ) 时,
P(| X − µ |< 3σ ) = P(µ − 3σ < X < µ + 3σ ) = Φ(3) − Φ(−3) = Φ(3) −[1− Φ(3)] = 2Φ(3) −1 = 0.9974
P(| X − µ |≤ 1.96σ ) = 0.95 P(| X − µ |≤ 2.58σ ) = 0.99
对于连续型随机变量X, 它取任意指定 实数值a的概率为0。
P( X = a) = lim P(a ≤ X < a + ∆x) ∆x→0
a + ∆x
∫ = lim
f (x)dx
∆x→0 a
=0
P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b)
µ 决定了图形的中心位置, σ 决定了图形中峰的陡峭程度
∫ F (x) = 1
x
−
e
(t−µ )2 2σ 2
dt
,
−∞ <
x<∞
σ 2π −∞
正态分布的应用
• 一个地区成年人的身高 • 某零件的尺寸的误差 • 炮弹的弹着点 • 考试中成绩的分布
µ = 0,σ = 1 的正态分布称为标准正态分布。
P{X ≥ 3} = 1 − P{X = 0} − P{X = 1} − P{X = 2}
= 1− e−2 − 21 e−2 − 22 e−2 = 1− 5e−2 ≈ 0.323
1!
2!
当 较大, 接近于 时 有近似公式
Cnk
pk (1−
p)n−k
≈
λk k!
e−λ
其中λ 。
例. 假如生三胞胎的概率为10-4, 求在105次 出生中,有0, 1, 2次生三胞胎的概率。
n=105,p=10-4, λ=np=10
二项
0 4.5378×10-5 1 4.5382×10-4 2 2.2693×10-3
Poisson
4.540×10-5 4.540×10-4 2.270×10-3
连续型随机变量及其概率密度函数
定义:对于随机变量X,如果存在一个非负 的可积函数f(x),使对任意a,b(a<b)都有
1≤ x < 2 x≥2
概率函数图 分布函数图
分布函数的性质
⑴ F(x)是一个单调不减函数; ⑵ 0≤ F(x) ≤1, 且
F(−∞) = lim F(x) = 0, F(+∞) = lim F(x) =1
x→−∞
x→+∞
⑶ F(x+0)=F(x),即 F(x)是右连续的.
对于任意实数x1, x2 (x1<x2),有
P{X = k} = Cnkπ k (1− π )n−k
X :XB:(nB:, (pn), p)
常见离散型随机变量(1)
定义:若随机变量X的概率函数为
kk
n-k
P{X = k} = C p (1 - p)
n
(0 < p < 1) k = 0,1,2,L ,n
则称X服从参数为n,p的二项分布 (binomial distribution),记作
概率函数有如下性质:
(1)pi ≥0 (i=1,2,…);
∑ (2)
∞
pi = 1
i=1
例. 从中任取3 个球。 取到的白球数X是一个随机变量。
X012 P
P( X
=
0)
=
C
3 3
C
3 5
=
1 10
P(X
= 1) =
C
2 3
C
1 2
C
3 5
6 =
10
P(X
=
2) =
C
1 3
C
2 2
C
3 5
=3 10
j (x)
X ~ N (0,1)
ϕ(x) =
1
− x2
e 2 , −∞ < x < ∞
2π
Φ( x)
∫ Φ(x) = 1
x −t2
e 2 dt
2π −∞
标准正态分布概率函数的性质
j (x)
ϕ(x) = ϕ(−x) Φ(−x) =1− Φ(x)
任何一个一般的正态分布都可以 通过线性变换转化为标准正态分布.
求常数c、分布函数F(x)和 P (0 < X ≤ 1)
∫ ∫ +∞
f (x)dx = 1 ⇒
+∞ ce−2xdx = 1
−∞
0
⇒c=2
∫ F (x) =
x −∞
2e −2 x dx
=
1 − 0
e −2 x
P(0 < X ≤ 1) = F (1) − F (0)
x>0 x≤0
∫= 1 2e−2 xdx 0
医学上,常把正态变量的95%或99%的 概率落入区间即
µ ±1.96σ 或 µ ± 2.58σ 称为参考值范围。
例.一种电子元件的使用寿命X(小时)服从正态分布 N(100,152),某仪器上装有3个这种元件,三个元件损坏 与否是相互独立的.求:使用的最初90小时内无一元件损 坏的概率.
解:设Y为使用的最初90小时内损坏的元件数, 则