生统材料-实用生物统计-ch2a-62页PPT

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例2-7 如果两个白化病基因(常染色体隐性遗传方 式)携带者结婚,则他们的每个孩子患白化病的 概率为1/4。
解:定义X为: X = 0,孩子非白化病患者
X = 1,孩子为白化病患者
则 P(X = 0) = 0.75, P(X = 1) = 0.25
X的概率分布为
0 0.75
1 0.25
• 两点分布: 如果随机变量X的概率分布列为:
P( X = xi ) = p(xi ), i = 1,2,3,…… { p(xi ), i = 1, 2, 3,……}
• 离散型随机变量概率函数应满足:
对任意可能结果 xi,有
0 ≤ p( xi ) ≤ 1
非负性
且 p( xi ) 1
• 注意: i1
规范性
求和是对一切可能的结果进行的
– P:大写,概率分布
x p(x)
Hale Waihona Puke Baidu
0 0.129
1 0.264
2 0.271
3 0.185
4 0.095
5 0.039
6 0.017
• 取值可以是某个区间的一切值
• 问题:随机变量取值不可列,其概率及其分 布如何表示?
例2-6 考察35~44岁男性舒张压DBP的分布
注意:实际情况中DBP的取值是离散的,但若 无仪器测量精度限制,DBP可取连续性的一 切可能取值
• 问题: P ( X ≥ 110 ) 与P ( X >110 ) 有区别否?
• 采用类似微分的概念,定义如下: 对于随机变量 X , 如存在非负可积函数 f (x) ,
p(x X x x)
f (x) lim
x0
x
称f(x)为随机变量X的概率密度函数
• 含义:
– 概率密度与概率的关系 密度与质量、点与线
• 统计学中如何利用概率解决实际问题
例2-1 某地区青少年白血病死亡率过高,怀疑与工 业垃圾有关。据报告该地区12例白血病发生, 如果已知该地区白血病的正常发病率,请问能 否推断该地区白血病过多?
例2-2 由调查表得到的北大生科院2009级部分男生 的体重数据,如何描述这些数据?
例:联系出国除GPA外还需成绩排名:
oa b
x
概率密度函数的几何意义
• 定义:设X为一随机变量,称函数
F(x) = P(X < x) (-∞ < x < +∞) 为X的概率分布函数 F(x) — X 取小于x的诸值 xi 的概率之和 • 概率密度函数的区间累积——同时适用于离散型 随机变量及连续型随机变量
• 离散型随机变量的分布函数:
特性:任一具体血压值如117.3出现的概率为 0
将注意力从P( X = xi ) 转为P( X xi ) • 取代离散变量概率分布列的方法考察血压落在
某个范围的概率 P (90 ≤ X < 100 ) = 15%:轻度高血压 P (100 ≤ X < 110 ) = 5% :中度高血压 P ( X ≥ 110 ) = 1% :重度高血压
F(x) = P(X < x) = p( xi ) ( i = 1,2,3,…) xi x
• 离散型随机变量F(x):阶梯函数,间断点为x = xi 设x1 、 x2 、 x3的取值概率分别为p1 、 p2 、 p3 : – 当x ≤ x1时,F(x) = 0 – 当x1 < x ≤ x2时,F(x) = P(X x) = P(X = x1) = p1 – 当x2 < x ≤ x3时,
的长度、线与面积的关系
• 概率密度函数只是给出了连续性随机变量某一特 定值的函数值f(x)—不是真正意义上的取值概率:
0 ≤ f(x)
f (x)dx 1 b
P(a X b) a f (x)dx
f (x)
非负性 求和,规范性 X 落在区间[a, b) 的概率
曲线下总面积为1
阴影面积:P(a X b)
Top1%、Top 5% or Top 10%等
——成绩分布中的位置
40
50
35
30
40
25
30
20
15
20
10
10
5
0
0
• GPA——随机变量 • Top xx%——随机变量的分布 • 分布重要性:飞机什么部位需要特别加固?
• 定义:在试验中所得到的取值有随机性的量,
就称为随机变量 ,多用X、Y、Z表示
0 q
1 p
(0 p 1,q = 1 p)
例2-2 根据男生体重数据可得体重分布情况: 以X表示体重(单位kg),则有 45.0 ≤ X ≤ 90.0
例2-3 用X表示28名男生中血型为”B”的人数: X = { 0,1, 2, 3, 4, …, 28}
• 随机变量类型: – 离散型:只有有限或可列个可能取值 例:例2-3血型 X=0,1,…,28 – 连续型:取值在某个区间中连续变化 例:例2-2体重 45.0 ≤ X ≤ 90.0
F(x) = P(X x) = P(X = x1 ) + P(X = x2 )= p1 + p2
1
F(x)
p1 O
p2 O
O
p3
x
x1
x2
x3
• 连续型随机变量F(x):概率密度函数的积分
x
F (x) P( X x) f ( y)dy
——概率密度曲线下的面积
• 分布函数在x处的取值,就是随机变量x的取值落
在区间(-,x)上的概率 y
• 注意:f( y)dy 中不能用x
Y = f(x)
x
0
x
F(x)
随机变量X落入任意区间[a, b)的概率为:
b
P(a X b) a f (x)dx
b
a
f (x)dx f (x)dx
F (b) F (a)
f (x)
F(b) F(a)
oa b
x
概率分布函数的几何意义
• 随机现象结果非数量性质时可进行数值化: 例2-4 学生是否对“生统”感兴趣。 X = 0:不感兴趣 X = 1:一般 X = 3:较感兴趣 X = 4:很感兴趣
• 已知离散随机变量取每个值的概率,表示如下:
x1 p( x1
)
x2 p(x2 )
xn p(xn )
称为随机变量X的概率分布表或分布列 • P为X的概率分布,并记为:
– p:小写,某一事件的概率值
– X:大写,随机变量
– x:小写,随机变量的某个取值
例2-5 中耳炎是儿童常见病之一。设 X 代表儿童在两 岁之内犯中耳炎的次数,经调查其分布表如下:
x
0
1
2
3
4
5
6
P(x) 0.129 0.264 0.271 0.185 0.095 0.039 0.017
解:X 的概率分布及分布列表示如下
相关文档
最新文档