医学统计学-概率分布 PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、面积规律
2020/6/20
正态分布
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
1
2
3
不同
均数
2020/6/20
正态分布
不同标 准差
-3
-2
-1
0
1
2
3
2020/6/20
2正02态0/6/分20 布的特征
a. 尖峭峰 b. 正态峰 c. 平阔峰
三、正态曲线下面积分布规律
1.正态曲线下面积的意义:
2020/6/20
一、二项分布的概念
一个袋子里有5个乒乓球,其中2个黄球,3 个白球,我们进行摸球游戏,每一次摸到 黄球的概率是0.4,摸到白球的概率是0.6。
三个特点:1.各次摸球是彼此独立的;2.每 次摸球只有二种可能的结果,或黄球或白 球;3.每次摸到黄球(或摸到白球)的概率 是固定的。
279.04 230.02 / 200 0.27(g / 100g)
200 1
lg 1 ( xlg x 1.645slg x ) lg 1 1.5942 39(g / 100g)
2020/6/20
3.2 二项分布
二项分布的概念 二项分布的概率 二项分布的条件 二项分布的均数与标准差 二项分布的图形 二项分布应用实例
e F ( x) P( X x) 1
x
( x )2
2 2 dx,
2
F ( x)称为分布函数。
2020/6/20
图3-3 正态分布的概率密度函数与分布函数
2020/6/20
图3-4 正态分布的概率
2020/6/20
2.正态曲线下面积的分布规律
正态曲线
面积
1
68.27%
1.64
95%正常值范围:同质总体中包含95%的个体 值所在的范围。
⑴.正态分布法 ⑵.百分位数法 ⑶. 对数正态分布法
2020/6/20
1) 正态分布法
⑴适应资料:正态或近似正态分布资料。 ⑵计算: 以95%正常值范围为例
双侧: x 1.96S
单侧:
2020/6/20
x 1.64S (上 限) x 1.64S ( 下 限 )
1
z2 z
e 2 dz
2
2020/6/20
0.6
f((Xz))
0.5
0.4
0.3
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
4
Xz
2020/6/20
0.5
f((zX))
0.4 0.3 0.2 0.1 0.0
-4 -3 -2 -1 0 1 2 3 4
zX
2020/6/20
(z)
Φ(z)
z
0
2020/6/20
2020/6/20
2.用途
1.划分正常与异常的界限。如作诊断 指标。
2.反映某人群的某项指标的动态变化。 如某地不同时期发汞值的正常范围 可反映环境污染的变化或环境保护 的效果。
2020/6/20
3.确定医学参考值范围的方法
⑴确定一批样本含量足够大(n>100)的 “正常人”或动物作为研究对象。
-1.96~1.96 μ±1.96σ
-2.58~2.58 μ±2.58σ
面积或概率 68.27% 90.00% 95.00% 99.00%
2020/6/20
3、标准正态分布表的使用
附表c1标准正态分布表p559
查表求面积时注意: ⑴表中曲线下面积为-∞到z的面积; ⑵当μ、σ已知时,先进行变量变换求得z值,再 查表; ⑶当μ、σ未知且样本含量足够大时,可用 x 和S 分别代替μ和σ,求得z的估计值,再查表。 ⑷曲线下对称于0的区间面积相等; ⑸曲线下横轴上的总面积为100%或1。
2020/6/20
正态分布又称Gauss分布,是医学上 和生物界常见的分布形式。 是指变量值以均数为中心,左右两 侧完全对称,靠近均数两侧的频数 较多,而远离均数两侧的频数逐渐 减少。
2020/6/20
2.正态分布的概率密度函数
正 态 曲 线 所 对 应 的 函 数表 达 式 为 :
e f ( X ) 1
2) 百分位数法
⑴适用资料:适用于任意分布类型的资料, 主要用于偏态分布或分布类型不清楚的资 料。
⑵计算: 以95%正常值范围为例 双侧: P2.5~P97.5
单侧:< P95(上限) > P5(下限)
2020/6/20
正态分布应用
200例血铅值频数表及Px计算表
组段
3~ 8~ 13~ 18~ 23~ 28~ 33~ 38~ 43~ 48~ 53~ 58~62
p 38 5 (200 95% 189)
95
7
38.7(g / 100g)
2020/6/20
3)对数正态分布法
⑴适用资料:适用于对数正态分布 资料。
⑵计算: 双侧:lg1( xlg x 1.96slg x ) 单侧:lg1( xlg x 1.645slg x() 下 限 )
或 lg1( xlg x 1.645slg x() 上 限 )
表示该区间(x1,x2)包含的观察例
数占总例数的百分数或变量值落在 该区间的概率。
频数分布图示
2020/6/20
x1
x2
正态曲线下面积示意图
2020/6/20
如 果X ~ N (, 2 ),那 么X取 值 落 在 区 间 ( ,x)内 的 累 积
概 率,即 为 正 态 曲 线 下 位 于 ( ,x)的 图 形 面 积 , 记 做F ( x)。 等 于 其 概 率 密 度 函 数f ( X )在 到x上 的 积 分 ,
频数 f 36 39 47 30 18 16
3 7 1 1 1 1
累计频数Σf 36 75
122 152 170 186 189 196 197 198 199 200
累计频率(%) 18.0 37.5 61.0 76.0 85.0 93.0 94.5 98.0 98.5 99.0 99.5
100.0
2020/6/20
二、正态分布的特征
正态分布以均数为中心( χ=μ ),左右对称; 正态分布有两个参数,即均数μ和标准差σ,正
态分布记作X~N(μ,σ2), μ决定曲线在横轴 上的位置,σ决定曲线的形状。
正态曲线在横轴上方均数处最高(在χ=μ处取得 密度函数的最大值),表现为钟型曲线
正态曲线下总面积为1,正态曲线下的面积分 布有一定规律。
3.常用概率分布
正态分布 二项分布 Poisson 分布
2020/6/20
wk.baidu.com
3.1 正态分布
正态分布的图形 正态分布的特征 正态曲线下面积分布的规律 标准正态分布 正态分布的应用
2020/6/20
一、 正态分布曲线
(normal distribution curve) 1.正态分布的图形
0.025
-1.96
2020/6/20
0.025
1.96
2、标准正态曲线下面积分布规律
68.27%
95.00%
-2.58 -1.96 -1
99.00% 0
1 1.96 2.58
2020/6/20
x
z
正态曲线与标准正态曲线的面积分布规律
2020/6/20
标准正态分布 正态分布
-1~1
μ±σ
-1.64~1.64 μ±1.64σ
该曲线表现为中间高,两边低,左右对称,略 显钟形,类似于数学上的正态分布曲线。因而 这种分布也称为正态分布。
正态曲线(normal curve)是一条高峰位于中央, 两侧完全对称,而且逐渐降低,两端在无穷远 处与底线相靠,但永远不与横轴相交的钟型曲 线。
正态曲线是有固定函数式的一条曲线。因为频 率的总和等于1,因此横轴上曲线下的总面积 为100%或1,其面积分布有一定的规律性。
2020/6/20
五、正态分布的应用
(一)确定医学参考值(正常值)范围 (二)质量控制图。警戒限 x 2s ,控制限 x 3s (三)统计方法的理论基础。
二项分布
2020/6/20
❖ 医学研究中的某些观察指标服从或近似服从正态分 布;
❖ 很多统计方法是建立在正态分布的基础之上的,如t 分布、2分布、F分布都是在正态分布的基础上推演 出来的。
—
频数 f
1 5 10 20 11 21 29 25 30 20 16 8 3 1 200
表 组中值 (lgx) 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 —
flgx
0.5 3.0 7.0 16.0 9.9 21.0 31.9 90.0 39.0 28.0 24.0 12.8 5.1 1.8 230.0
2020/6/20
200例血铅值对数变换后的频数计算
真数组段
(x) 2.8~ 3.5~ 4.5~ 5.6~ 7.1~ 8.9~ 11.2~ 14.1~ 17.8~ 22.4~ 28.2~ 35.5~ 44.7~ 56.2~ 合计
对数组段
(lgx) 0.45~ 0.55~ 0.65~ 0.75~ 0.85~ 0.95~ 1.05~ 1.15~ 1.25~ 1.35~ 1.45~ 1.55~ 1.65~ 1.75~
90.00%
1.96
95.00%
2.58
2020/6/20
99.00%
2020/6/20
表 3-12 100 名女大学生血清总蛋白含量的实际分布与理论比较
范围
x 1s
血清总蛋白 实际人数
含量(g/L)
69.9~77.7
70
实际百分数 理论百分数
(%)
(%)
70
68.27
x 1.96s 66.2~81.4
“正常人”不是指机体任何器官、组织的 形态及机能都正常的人,而是指排除了影 响所研究指标的疾病和有关因素对所研究 指标的影响的同质人群。
2020/6/20
⑵根据指标的实际用途确定单、双侧。 ⑶确定百分数范围。 ⑷根据资料的分布特点,选用恰当的界
值计算方法。
2020/6/20
4.常用参考值范围估计方法
94
94
95.00
x 2.58s 63.7~83.9
99
99
99.00
2020/6/20
四、标准正态分布
(standard normal distribution)
标准正态分布变换 标准正态分布曲线下面积的分布规律 标准正态分布表的使用
2020/6/20
1、标准正态分布变换
一般正态分布为一个分布族:N(μ,σ2)。 为
n次中摸到x次黄球(或白球)的概率分布 就是二项分布。
2020/6/20
医学研究中很多现象观察结果是以两分 类变量来表示的,如阳性与阴性、治愈与 未愈、生存与死亡等等。如果每个观察对
象阳性结果的发生概率均为,阴性结果的 发生概率均为(1-);而且各个观察对
象的结果是相互独立的,那么,重复观察n 个人,发生阳性结果的人数x的概率分布为 二项分布。
2020/6/20
频数分布逐渐接近正态分布示意图
2020/6/20
40
Frequency
30
20
10
0 1.2290
1.2410
1.2530
1.2650
1.2770
图 体模“骨密度”测量值的分布接近正态分布示意图 (频率密度=频率/组距)
面积的意义
2020/6/20
2020/6/20
正态分布曲线图示
了应用方便,可以进行变量变换,正态分布 就变换为标准正态分布。
z x
标准正态分布的μ=0,=1,记为 N(0,1)
2020/6/20
经标准正态变量z变换:一般正态分布N (, 2 )被转化为
标准正态分布N (0,1); 其中z x
概率密度函数: (z)
1
z2
e 2,
2
分布函数: (z)
,
(
X 2 2
)
2
X
2
f ( X ) 概 率 密 度 函 数 (probability densityfunction)
3.14159,e 2.71828, 和 为 两 个 参 数.
以f ( X )为 纵 坐 标 ,X为 横 坐 标 , 绘 制 曲 线 即为
正态曲线。
记 为X ~ N (, 2 ),
❖ 很多其他分布的极限为正态分布。二项分布和 Poission分布样本含量足够大时近似正态分布。
2020/6/20
医学参考值范围 1. 正态分布法 2. 百分位数法 3. 对数正态分布法
2020/6/20
1.医学参考值概念
是指大多数处于相同生理状态下的“正常人” 的某项指标(形态、机能及代谢产物等) 数值变化波动的范围。由于正常个体间存 在变异、机体内外环境改变,时间、地点、 条件的不同,使这些生理指标有一定的波 动范围,因此,实际应用中,一般采用正 常值范围.
f(lgx)2
0.25 1.80 4.90 12.80 8.91 21.00 35.09 36.00 50.70 39.20 36.00 20.48 8.67 3.24 279.04
xlg x
f lg x 230.0 1.15(g / 100g)
f
200
slg x
f (lg x)2 ( f lg x)2 / f f 1
2020/6/20
正态分布
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
1
2
3
不同
均数
2020/6/20
正态分布
不同标 准差
-3
-2
-1
0
1
2
3
2020/6/20
2正02态0/6/分20 布的特征
a. 尖峭峰 b. 正态峰 c. 平阔峰
三、正态曲线下面积分布规律
1.正态曲线下面积的意义:
2020/6/20
一、二项分布的概念
一个袋子里有5个乒乓球,其中2个黄球,3 个白球,我们进行摸球游戏,每一次摸到 黄球的概率是0.4,摸到白球的概率是0.6。
三个特点:1.各次摸球是彼此独立的;2.每 次摸球只有二种可能的结果,或黄球或白 球;3.每次摸到黄球(或摸到白球)的概率 是固定的。
279.04 230.02 / 200 0.27(g / 100g)
200 1
lg 1 ( xlg x 1.645slg x ) lg 1 1.5942 39(g / 100g)
2020/6/20
3.2 二项分布
二项分布的概念 二项分布的概率 二项分布的条件 二项分布的均数与标准差 二项分布的图形 二项分布应用实例
e F ( x) P( X x) 1
x
( x )2
2 2 dx,
2
F ( x)称为分布函数。
2020/6/20
图3-3 正态分布的概率密度函数与分布函数
2020/6/20
图3-4 正态分布的概率
2020/6/20
2.正态曲线下面积的分布规律
正态曲线
面积
1
68.27%
1.64
95%正常值范围:同质总体中包含95%的个体 值所在的范围。
⑴.正态分布法 ⑵.百分位数法 ⑶. 对数正态分布法
2020/6/20
1) 正态分布法
⑴适应资料:正态或近似正态分布资料。 ⑵计算: 以95%正常值范围为例
双侧: x 1.96S
单侧:
2020/6/20
x 1.64S (上 限) x 1.64S ( 下 限 )
1
z2 z
e 2 dz
2
2020/6/20
0.6
f((Xz))
0.5
0.4
0.3
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
4
Xz
2020/6/20
0.5
f((zX))
0.4 0.3 0.2 0.1 0.0
-4 -3 -2 -1 0 1 2 3 4
zX
2020/6/20
(z)
Φ(z)
z
0
2020/6/20
2020/6/20
2.用途
1.划分正常与异常的界限。如作诊断 指标。
2.反映某人群的某项指标的动态变化。 如某地不同时期发汞值的正常范围 可反映环境污染的变化或环境保护 的效果。
2020/6/20
3.确定医学参考值范围的方法
⑴确定一批样本含量足够大(n>100)的 “正常人”或动物作为研究对象。
-1.96~1.96 μ±1.96σ
-2.58~2.58 μ±2.58σ
面积或概率 68.27% 90.00% 95.00% 99.00%
2020/6/20
3、标准正态分布表的使用
附表c1标准正态分布表p559
查表求面积时注意: ⑴表中曲线下面积为-∞到z的面积; ⑵当μ、σ已知时,先进行变量变换求得z值,再 查表; ⑶当μ、σ未知且样本含量足够大时,可用 x 和S 分别代替μ和σ,求得z的估计值,再查表。 ⑷曲线下对称于0的区间面积相等; ⑸曲线下横轴上的总面积为100%或1。
2020/6/20
正态分布又称Gauss分布,是医学上 和生物界常见的分布形式。 是指变量值以均数为中心,左右两 侧完全对称,靠近均数两侧的频数 较多,而远离均数两侧的频数逐渐 减少。
2020/6/20
2.正态分布的概率密度函数
正 态 曲 线 所 对 应 的 函 数表 达 式 为 :
e f ( X ) 1
2) 百分位数法
⑴适用资料:适用于任意分布类型的资料, 主要用于偏态分布或分布类型不清楚的资 料。
⑵计算: 以95%正常值范围为例 双侧: P2.5~P97.5
单侧:< P95(上限) > P5(下限)
2020/6/20
正态分布应用
200例血铅值频数表及Px计算表
组段
3~ 8~ 13~ 18~ 23~ 28~ 33~ 38~ 43~ 48~ 53~ 58~62
p 38 5 (200 95% 189)
95
7
38.7(g / 100g)
2020/6/20
3)对数正态分布法
⑴适用资料:适用于对数正态分布 资料。
⑵计算: 双侧:lg1( xlg x 1.96slg x ) 单侧:lg1( xlg x 1.645slg x() 下 限 )
或 lg1( xlg x 1.645slg x() 上 限 )
表示该区间(x1,x2)包含的观察例
数占总例数的百分数或变量值落在 该区间的概率。
频数分布图示
2020/6/20
x1
x2
正态曲线下面积示意图
2020/6/20
如 果X ~ N (, 2 ),那 么X取 值 落 在 区 间 ( ,x)内 的 累 积
概 率,即 为 正 态 曲 线 下 位 于 ( ,x)的 图 形 面 积 , 记 做F ( x)。 等 于 其 概 率 密 度 函 数f ( X )在 到x上 的 积 分 ,
频数 f 36 39 47 30 18 16
3 7 1 1 1 1
累计频数Σf 36 75
122 152 170 186 189 196 197 198 199 200
累计频率(%) 18.0 37.5 61.0 76.0 85.0 93.0 94.5 98.0 98.5 99.0 99.5
100.0
2020/6/20
二、正态分布的特征
正态分布以均数为中心( χ=μ ),左右对称; 正态分布有两个参数,即均数μ和标准差σ,正
态分布记作X~N(μ,σ2), μ决定曲线在横轴 上的位置,σ决定曲线的形状。
正态曲线在横轴上方均数处最高(在χ=μ处取得 密度函数的最大值),表现为钟型曲线
正态曲线下总面积为1,正态曲线下的面积分 布有一定规律。
3.常用概率分布
正态分布 二项分布 Poisson 分布
2020/6/20
wk.baidu.com
3.1 正态分布
正态分布的图形 正态分布的特征 正态曲线下面积分布的规律 标准正态分布 正态分布的应用
2020/6/20
一、 正态分布曲线
(normal distribution curve) 1.正态分布的图形
0.025
-1.96
2020/6/20
0.025
1.96
2、标准正态曲线下面积分布规律
68.27%
95.00%
-2.58 -1.96 -1
99.00% 0
1 1.96 2.58
2020/6/20
x
z
正态曲线与标准正态曲线的面积分布规律
2020/6/20
标准正态分布 正态分布
-1~1
μ±σ
-1.64~1.64 μ±1.64σ
该曲线表现为中间高,两边低,左右对称,略 显钟形,类似于数学上的正态分布曲线。因而 这种分布也称为正态分布。
正态曲线(normal curve)是一条高峰位于中央, 两侧完全对称,而且逐渐降低,两端在无穷远 处与底线相靠,但永远不与横轴相交的钟型曲 线。
正态曲线是有固定函数式的一条曲线。因为频 率的总和等于1,因此横轴上曲线下的总面积 为100%或1,其面积分布有一定的规律性。
2020/6/20
五、正态分布的应用
(一)确定医学参考值(正常值)范围 (二)质量控制图。警戒限 x 2s ,控制限 x 3s (三)统计方法的理论基础。
二项分布
2020/6/20
❖ 医学研究中的某些观察指标服从或近似服从正态分 布;
❖ 很多统计方法是建立在正态分布的基础之上的,如t 分布、2分布、F分布都是在正态分布的基础上推演 出来的。
—
频数 f
1 5 10 20 11 21 29 25 30 20 16 8 3 1 200
表 组中值 (lgx) 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 —
flgx
0.5 3.0 7.0 16.0 9.9 21.0 31.9 90.0 39.0 28.0 24.0 12.8 5.1 1.8 230.0
2020/6/20
200例血铅值对数变换后的频数计算
真数组段
(x) 2.8~ 3.5~ 4.5~ 5.6~ 7.1~ 8.9~ 11.2~ 14.1~ 17.8~ 22.4~ 28.2~ 35.5~ 44.7~ 56.2~ 合计
对数组段
(lgx) 0.45~ 0.55~ 0.65~ 0.75~ 0.85~ 0.95~ 1.05~ 1.15~ 1.25~ 1.35~ 1.45~ 1.55~ 1.65~ 1.75~
90.00%
1.96
95.00%
2.58
2020/6/20
99.00%
2020/6/20
表 3-12 100 名女大学生血清总蛋白含量的实际分布与理论比较
范围
x 1s
血清总蛋白 实际人数
含量(g/L)
69.9~77.7
70
实际百分数 理论百分数
(%)
(%)
70
68.27
x 1.96s 66.2~81.4
“正常人”不是指机体任何器官、组织的 形态及机能都正常的人,而是指排除了影 响所研究指标的疾病和有关因素对所研究 指标的影响的同质人群。
2020/6/20
⑵根据指标的实际用途确定单、双侧。 ⑶确定百分数范围。 ⑷根据资料的分布特点,选用恰当的界
值计算方法。
2020/6/20
4.常用参考值范围估计方法
94
94
95.00
x 2.58s 63.7~83.9
99
99
99.00
2020/6/20
四、标准正态分布
(standard normal distribution)
标准正态分布变换 标准正态分布曲线下面积的分布规律 标准正态分布表的使用
2020/6/20
1、标准正态分布变换
一般正态分布为一个分布族:N(μ,σ2)。 为
n次中摸到x次黄球(或白球)的概率分布 就是二项分布。
2020/6/20
医学研究中很多现象观察结果是以两分 类变量来表示的,如阳性与阴性、治愈与 未愈、生存与死亡等等。如果每个观察对
象阳性结果的发生概率均为,阴性结果的 发生概率均为(1-);而且各个观察对
象的结果是相互独立的,那么,重复观察n 个人,发生阳性结果的人数x的概率分布为 二项分布。
2020/6/20
频数分布逐渐接近正态分布示意图
2020/6/20
40
Frequency
30
20
10
0 1.2290
1.2410
1.2530
1.2650
1.2770
图 体模“骨密度”测量值的分布接近正态分布示意图 (频率密度=频率/组距)
面积的意义
2020/6/20
2020/6/20
正态分布曲线图示
了应用方便,可以进行变量变换,正态分布 就变换为标准正态分布。
z x
标准正态分布的μ=0,=1,记为 N(0,1)
2020/6/20
经标准正态变量z变换:一般正态分布N (, 2 )被转化为
标准正态分布N (0,1); 其中z x
概率密度函数: (z)
1
z2
e 2,
2
分布函数: (z)
,
(
X 2 2
)
2
X
2
f ( X ) 概 率 密 度 函 数 (probability densityfunction)
3.14159,e 2.71828, 和 为 两 个 参 数.
以f ( X )为 纵 坐 标 ,X为 横 坐 标 , 绘 制 曲 线 即为
正态曲线。
记 为X ~ N (, 2 ),
❖ 很多其他分布的极限为正态分布。二项分布和 Poission分布样本含量足够大时近似正态分布。
2020/6/20
医学参考值范围 1. 正态分布法 2. 百分位数法 3. 对数正态分布法
2020/6/20
1.医学参考值概念
是指大多数处于相同生理状态下的“正常人” 的某项指标(形态、机能及代谢产物等) 数值变化波动的范围。由于正常个体间存 在变异、机体内外环境改变,时间、地点、 条件的不同,使这些生理指标有一定的波 动范围,因此,实际应用中,一般采用正 常值范围.
f(lgx)2
0.25 1.80 4.90 12.80 8.91 21.00 35.09 36.00 50.70 39.20 36.00 20.48 8.67 3.24 279.04
xlg x
f lg x 230.0 1.15(g / 100g)
f
200
slg x
f (lg x)2 ( f lg x)2 / f f 1