第三章 正态分布与参考值范围
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
μ
μ+σ μ+1.96σ
μ+2.58σ
表1 正态分布曲线下面积规律
标准正态分布 正态分布 面积或概率
-1~1
μ±σ
68.27%
-1.96~1.96 μ±1.96σ 95.00%
-2.58~2.58 μ±2.58σ 99.00%
z 或 x zs
计算正态曲线下面积实例
例1
x 1.14mmol / L, s 0.298mmol / L
即该地正常女子血清甘油三脂在 1.10mmol/L以下者,估计占总人数的 44.43%。
例3-1和3-2见P22。
实例图示
1.8
百度文库
1.5
1.2
0.9
0.6
0.3
44.43%
0.0
0
0.5
1
1.5
2
X
概率密度函数与累积分布函数
1
f(X) F(X) 0.8
0.6 0.4 0.2
0 -4 -3 -2 -1 0 1 2 3 4
0.3
N(1,1.22 )
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
4
X
正态分布数列中的每个个体加 上一个不为零的常数K后,均
数的变化
xn
(xi n
K
)
K
x i Kx n
• 均数改变为原均数+K
标准差的变化
• 标准差不变,等于原数列的标准差
Sn
(xi k) (x k)2
以f ( X )为纵坐标,X为横坐标,绘制的曲线就是
正态曲线(normal curve )
正态分布的概率分布函数
(二)、正态曲线( normal curve )
f(X)
X
正态曲线的定义
• 正态曲线是一条高峰位于中央,两侧逐 渐下降并完全对称,曲线两端永远不与 横轴相交的钟形曲线
正态分布的特征
Judge the index value of someone is normal or not?
因为参考值范围覆盖了绝大多数个体,所以 如果某个个体的测量值超出此范围,我们可以
据此推断他的这项指标存在着异常。 基于临床实践,从个体角度,作为临床上判定正
常与异常的参考标准 基于预防医学实践,从人群角度,可用来评价儿
• 首先,正常人不是指完全健康的 人,而是指符合特定健康水平的 人。在使用或指定临床参考值范 围时,“正常人”是指相对于我 们所研究的指标正常的人,即排 除了对研究指标有影响的疾病或 有关因素的同质人群。
例如:制定血清谷丙转氨酶的参考值范围,你 认为正常人的条件是什么呢?
➢ 无肝肾心脑肌肉等疾病
➢ 近期未服用对肝脏有损伤的药物如氯丙嗪,异烟 肼等
试估计该地正常女子血清甘油三脂在1.10 mmol/L以 下者占正常女子血清甘油三脂总人数的百分比。
将X=1.10代入标准正态变量变换公式,得:
z 1.10 1.14 0.14 0.29
计算正态曲线下面积实例
查附表1,在表的左侧找到-0.1,在 表的上方找到0.04,,两者的相交处为 0.4443=44.43%。
?
姚明:2.26米, 身高高于正常 人 参考值范围的上限, 属于身高指标异常 。 但是他很健康,并 没有相关的疾病。
Two、How to Make Reference Range
First step
Sampling from Normal Population 确定同质的参照总体
The choice of sample
n 1
k xi x 2 ks
n 1
三 标准正态分布
标准正态分布 (standard normal distribution) 的两个参数为:μ=0,σ=1 记为 N(0,12)
任意一个服从N(μ,σ2)分布的随机变量X经过
标准化变换,也叫z变换(u变换),均可转换为 μ=0,σ=1的标准正态分布。
➢ 检测前未作剧烈运动
例如:如果我们想制定某市成人居民中血铅 的参考值范围,我们规定凡是满足下列条 件的个体均可进入我们的研究:
➢1: adult people wuho have stayed in the city for more than one year
➢2 : without obvious liver or kidney diseases ➢3 : without the history of obvious lead
X
三、 正态分布的应用
• 一种最常见、最重要的连续分布 • 很多正常人的生理、生化指标的理论分布 • 数理统计中发展得最为完善的一种分布 • 很多统计推断都是在正态分布条件下进行
• 很多非正态分布的资料,当观察例数足够 多时,可以用正态分布作为它的极限分布
• 有时,也将非正态分布资料转化为正态分 布来处理
第三章 正态分布与医学参考值范围
第一节 正态分布
正态分布
正态分布(normal distribution)也叫高斯分布( Gaussian distribution),是最常见、最重要的一种连 续型分布
一、正态分布的数学形式和正态曲线下面积的规律
二、正态分布的特征
三、标准正态分布
频数分布图
频数分布逐渐接近正态分布示意图
n 1
xi x 2 s
n 1
正态分布数列中的每个个体乘 以一个不为零或一的常数K后,
均数的变化
xn
(xi n
K
)
K
x i Kx n
• 均数改变为原均数× K
标准差的变化
• 标准差改变,等于原数列标准差的K倍
Sn
(xi k) (x k)2
正态分布曲线下面积规律图2
x 1.96s x x 1.96s或 1.96 x 1.96
68.27%
μ-2.58σ
μ-1.96σ
μ-σ
95.00% 99.00%
μ
μ+σ μ+1.96σ
μ+2.58σ
0.6
f (X )
0.5
N(1,0.82 )
0.4 N (0,12 )
标准正态曲线下的面积特点
• 附表1 为标准正态分布曲线下的面积,表 上所查到的面积为从-到z的面积;
• 假设横轴上曲线下的面积为1,即100% • 曲线下,横轴上对称于0的面积相等 • 实际工作中经常要用的面积分布规律有
以下三点,68.27%,95%,99%的面积公
式见表1和下图。
标准正态分布曲线下面积规律
• 正态分布是单峰分布,曲线以均数为中 心,左右完全对称,正态曲线以X轴为 渐近线,曲线两端无线接近X轴,但不 相交;
• 正态曲线在均数μ处取得该概率密度函数 的最大值,X越远离均数,f(X)值越小, 在x=μ±处有拐点,表现为钟形曲线;
• X取值范围理论上没有边界,应为:∞~+ ∞,X离μ越远,函数f(X)值越接近 0,但不会等于0。
Third step
Minimize Measure Error 控制检测误差
Minimize Measure Error Standardize 标准化
• 统一测量方法 • 统一仪器 • 统一试剂 • 统一精密度 • 统一操作熟练度
Fourth step Grouping or not?
• 分组的原则:如果组间差异有统计学意义, 而且分组具有实际意义,则一定应分组。
z x 或z x x
s
标准正态分布的概率密度函数
(z)
1
z2
e2
2
( z )
标准正态分布的分布函数
• 经常会用到正态分布曲线下一定范围的面积占总 面积的百分数,用以估计落在该范围内的频数占 总频数的百分比。
• 可通过对式(3-1)积分求得,表示从-到x或z 的面积F(x)或Φ(z)(总面积为1)。见图3-5。
F(X ) 1
(X )2
X
e
(2 2 )dX
2
(z) 1
z
z2
e 2 dz
2
( z )
曲线下面积
0.5
f(X)
0.4
-∞
u 0.3
0.2
附表1(P213)
0.1
就是根据标准正
0.0
态分布的分布函
数制定的 -4 -3 -2 -1 0 1 2 3 4 X
婴儿身体发育的参考值(均值)
男孩 头围(cm) 体重kg 第一周 34.00 3.00 第一个月 35.81 3.82 第二个月 37.70 5.00 第三个月 39.50 5.83 第四个月 40.60 6.43 第五个月 41.70 7.01 第六个月 42.73 7.68 第七个月 43.29 8.04 第八个月 43.85 8.37 第九个月 44.35 8.77 第十个月 44.95 9.03 第十一个月 45.48 9.27
(一)、正态分布的概率密度函数
f (X)
1
2
exp
(
X
2
2
)2
,
X
=3.14159,exp 是以2.72818为底的自然对数指数
X ~ N (, 2 ), 为X的总体均数,为总体标准差
f ( X )称为概率密度函数(probabilit y density function )
contact or lead-related occupation
Second step
Select enough sample 选择足够例数的参照样本
选择足够例数的参照样本 The choice of sample
• 随机选取样本 Random
• 样本含量(n)Sample size: the bigger the better, but in common sense the sample should involve at least 100 individuals.
正态分布的特征
• 正态分布有两个参数,μ 决定曲线在横轴上的 位置,μ增大,曲线沿横轴向右移;反之, μ 减小,曲线沿横轴向左移; 决定曲线的形 状,当 μ恒定时,越大,数据越分散,曲线 越“矮胖”;反之,越小,数据越集中,曲 线越“瘦高”;
• 习惯上用N(μ ,2);表示均数为μ 、标准 差为的正态分布;正态分布的特殊形式: 标准正态分布N(0 ,1);
双侧95%的面积的公式
1.96 u 1.96
1.96 x 或 x x 1.96
s
正态分布曲线下面积规律图2
x 1.96s x x 1.96s或 1.96 x 1.96
68.27%
μ-2.58σ
μ-1.96σ
μ-σ
95.00% 99.00%
68.27%
-2.58 -1.96
95.00%
99.00%
-1
0
1
1.96
2.58
正态曲线下的面积特点
• μ ,已知时,进行标准正态变换再 查表
• μ ,未知时,用x 样本均数 x 和样 本标准差s代替总体参数进行标准正 态变换后再查表
• 95%,99%的面积公式见表1
正态分布曲线下面积规律的推导
童的发育水平
正常人的手指血流
呈黃藍色 (perfusion unit約215)
參考值:PU>150
手指潰爛之病人血流 呈紫灰藍色
(PU約为19)
Help us to judge whether someone is sick .
Index abnormal
?
sick or unhealthiness
正态分布的特征
正态曲线下的面积分布有一定的规律: • 1.曲线下的面积即为概率,可以通过式3-2求
得。 • 2.曲线下的总面积为1或100%,以μ为中心左
右两侧面积各占50%,越靠近μ处,曲线下面 积越大,两边逐渐减少,超过一定范围以外 的面积(概率)可以忽略。 • 3.所有正态曲线,在μ左右的任意个标准差范 围内面积相同。
• 因此,很有必要制定一个正常人群的 参考值范围以判断某个个体某项指标 正常与否。
一、医学参考值范围的概念
• 又称参考值范围(reference range), 是指“正常”人的解剖,生理、生 化等数据大多数个体值的波动范围。
• 常用95%的参考值范围
The Purpose of the Reference Range
• 例如:如果我们想制定身高的参考值范围, 不仅应考虑性别,年龄的差异,而且还应将 地区之间的差异考虑在内。
• For example, we we want to make a reference range of height. Not only gender, age, but also geographic factors should be considered.
正态分布的应用
• 深入统计描述和推断的基础 计算参考值范围的基础 计算可信区间的基础 进行假设检验的基础
• 质量控制图 • 二项分布、Poisson分布的正态分布
近似
第二节 医学参考值范围
• 由于存在个体变异,来自正常人群的 生理、生化指标在不同个体之间存在 着差异,即使是同一个个体,某些指 标也会因时间、空间的改变而有一定 程度的波动。
μ+σ μ+1.96σ
μ+2.58σ
表1 正态分布曲线下面积规律
标准正态分布 正态分布 面积或概率
-1~1
μ±σ
68.27%
-1.96~1.96 μ±1.96σ 95.00%
-2.58~2.58 μ±2.58σ 99.00%
z 或 x zs
计算正态曲线下面积实例
例1
x 1.14mmol / L, s 0.298mmol / L
即该地正常女子血清甘油三脂在 1.10mmol/L以下者,估计占总人数的 44.43%。
例3-1和3-2见P22。
实例图示
1.8
百度文库
1.5
1.2
0.9
0.6
0.3
44.43%
0.0
0
0.5
1
1.5
2
X
概率密度函数与累积分布函数
1
f(X) F(X) 0.8
0.6 0.4 0.2
0 -4 -3 -2 -1 0 1 2 3 4
0.3
N(1,1.22 )
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
4
X
正态分布数列中的每个个体加 上一个不为零的常数K后,均
数的变化
xn
(xi n
K
)
K
x i Kx n
• 均数改变为原均数+K
标准差的变化
• 标准差不变,等于原数列的标准差
Sn
(xi k) (x k)2
以f ( X )为纵坐标,X为横坐标,绘制的曲线就是
正态曲线(normal curve )
正态分布的概率分布函数
(二)、正态曲线( normal curve )
f(X)
X
正态曲线的定义
• 正态曲线是一条高峰位于中央,两侧逐 渐下降并完全对称,曲线两端永远不与 横轴相交的钟形曲线
正态分布的特征
Judge the index value of someone is normal or not?
因为参考值范围覆盖了绝大多数个体,所以 如果某个个体的测量值超出此范围,我们可以
据此推断他的这项指标存在着异常。 基于临床实践,从个体角度,作为临床上判定正
常与异常的参考标准 基于预防医学实践,从人群角度,可用来评价儿
• 首先,正常人不是指完全健康的 人,而是指符合特定健康水平的 人。在使用或指定临床参考值范 围时,“正常人”是指相对于我 们所研究的指标正常的人,即排 除了对研究指标有影响的疾病或 有关因素的同质人群。
例如:制定血清谷丙转氨酶的参考值范围,你 认为正常人的条件是什么呢?
➢ 无肝肾心脑肌肉等疾病
➢ 近期未服用对肝脏有损伤的药物如氯丙嗪,异烟 肼等
试估计该地正常女子血清甘油三脂在1.10 mmol/L以 下者占正常女子血清甘油三脂总人数的百分比。
将X=1.10代入标准正态变量变换公式,得:
z 1.10 1.14 0.14 0.29
计算正态曲线下面积实例
查附表1,在表的左侧找到-0.1,在 表的上方找到0.04,,两者的相交处为 0.4443=44.43%。
?
姚明:2.26米, 身高高于正常 人 参考值范围的上限, 属于身高指标异常 。 但是他很健康,并 没有相关的疾病。
Two、How to Make Reference Range
First step
Sampling from Normal Population 确定同质的参照总体
The choice of sample
n 1
k xi x 2 ks
n 1
三 标准正态分布
标准正态分布 (standard normal distribution) 的两个参数为:μ=0,σ=1 记为 N(0,12)
任意一个服从N(μ,σ2)分布的随机变量X经过
标准化变换,也叫z变换(u变换),均可转换为 μ=0,σ=1的标准正态分布。
➢ 检测前未作剧烈运动
例如:如果我们想制定某市成人居民中血铅 的参考值范围,我们规定凡是满足下列条 件的个体均可进入我们的研究:
➢1: adult people wuho have stayed in the city for more than one year
➢2 : without obvious liver or kidney diseases ➢3 : without the history of obvious lead
X
三、 正态分布的应用
• 一种最常见、最重要的连续分布 • 很多正常人的生理、生化指标的理论分布 • 数理统计中发展得最为完善的一种分布 • 很多统计推断都是在正态分布条件下进行
• 很多非正态分布的资料,当观察例数足够 多时,可以用正态分布作为它的极限分布
• 有时,也将非正态分布资料转化为正态分 布来处理
第三章 正态分布与医学参考值范围
第一节 正态分布
正态分布
正态分布(normal distribution)也叫高斯分布( Gaussian distribution),是最常见、最重要的一种连 续型分布
一、正态分布的数学形式和正态曲线下面积的规律
二、正态分布的特征
三、标准正态分布
频数分布图
频数分布逐渐接近正态分布示意图
n 1
xi x 2 s
n 1
正态分布数列中的每个个体乘 以一个不为零或一的常数K后,
均数的变化
xn
(xi n
K
)
K
x i Kx n
• 均数改变为原均数× K
标准差的变化
• 标准差改变,等于原数列标准差的K倍
Sn
(xi k) (x k)2
正态分布曲线下面积规律图2
x 1.96s x x 1.96s或 1.96 x 1.96
68.27%
μ-2.58σ
μ-1.96σ
μ-σ
95.00% 99.00%
μ
μ+σ μ+1.96σ
μ+2.58σ
0.6
f (X )
0.5
N(1,0.82 )
0.4 N (0,12 )
标准正态曲线下的面积特点
• 附表1 为标准正态分布曲线下的面积,表 上所查到的面积为从-到z的面积;
• 假设横轴上曲线下的面积为1,即100% • 曲线下,横轴上对称于0的面积相等 • 实际工作中经常要用的面积分布规律有
以下三点,68.27%,95%,99%的面积公
式见表1和下图。
标准正态分布曲线下面积规律
• 正态分布是单峰分布,曲线以均数为中 心,左右完全对称,正态曲线以X轴为 渐近线,曲线两端无线接近X轴,但不 相交;
• 正态曲线在均数μ处取得该概率密度函数 的最大值,X越远离均数,f(X)值越小, 在x=μ±处有拐点,表现为钟形曲线;
• X取值范围理论上没有边界,应为:∞~+ ∞,X离μ越远,函数f(X)值越接近 0,但不会等于0。
Third step
Minimize Measure Error 控制检测误差
Minimize Measure Error Standardize 标准化
• 统一测量方法 • 统一仪器 • 统一试剂 • 统一精密度 • 统一操作熟练度
Fourth step Grouping or not?
• 分组的原则:如果组间差异有统计学意义, 而且分组具有实际意义,则一定应分组。
z x 或z x x
s
标准正态分布的概率密度函数
(z)
1
z2
e2
2
( z )
标准正态分布的分布函数
• 经常会用到正态分布曲线下一定范围的面积占总 面积的百分数,用以估计落在该范围内的频数占 总频数的百分比。
• 可通过对式(3-1)积分求得,表示从-到x或z 的面积F(x)或Φ(z)(总面积为1)。见图3-5。
F(X ) 1
(X )2
X
e
(2 2 )dX
2
(z) 1
z
z2
e 2 dz
2
( z )
曲线下面积
0.5
f(X)
0.4
-∞
u 0.3
0.2
附表1(P213)
0.1
就是根据标准正
0.0
态分布的分布函
数制定的 -4 -3 -2 -1 0 1 2 3 4 X
婴儿身体发育的参考值(均值)
男孩 头围(cm) 体重kg 第一周 34.00 3.00 第一个月 35.81 3.82 第二个月 37.70 5.00 第三个月 39.50 5.83 第四个月 40.60 6.43 第五个月 41.70 7.01 第六个月 42.73 7.68 第七个月 43.29 8.04 第八个月 43.85 8.37 第九个月 44.35 8.77 第十个月 44.95 9.03 第十一个月 45.48 9.27
(一)、正态分布的概率密度函数
f (X)
1
2
exp
(
X
2
2
)2
,
X
=3.14159,exp 是以2.72818为底的自然对数指数
X ~ N (, 2 ), 为X的总体均数,为总体标准差
f ( X )称为概率密度函数(probabilit y density function )
contact or lead-related occupation
Second step
Select enough sample 选择足够例数的参照样本
选择足够例数的参照样本 The choice of sample
• 随机选取样本 Random
• 样本含量(n)Sample size: the bigger the better, but in common sense the sample should involve at least 100 individuals.
正态分布的特征
• 正态分布有两个参数,μ 决定曲线在横轴上的 位置,μ增大,曲线沿横轴向右移;反之, μ 减小,曲线沿横轴向左移; 决定曲线的形 状,当 μ恒定时,越大,数据越分散,曲线 越“矮胖”;反之,越小,数据越集中,曲 线越“瘦高”;
• 习惯上用N(μ ,2);表示均数为μ 、标准 差为的正态分布;正态分布的特殊形式: 标准正态分布N(0 ,1);
双侧95%的面积的公式
1.96 u 1.96
1.96 x 或 x x 1.96
s
正态分布曲线下面积规律图2
x 1.96s x x 1.96s或 1.96 x 1.96
68.27%
μ-2.58σ
μ-1.96σ
μ-σ
95.00% 99.00%
68.27%
-2.58 -1.96
95.00%
99.00%
-1
0
1
1.96
2.58
正态曲线下的面积特点
• μ ,已知时,进行标准正态变换再 查表
• μ ,未知时,用x 样本均数 x 和样 本标准差s代替总体参数进行标准正 态变换后再查表
• 95%,99%的面积公式见表1
正态分布曲线下面积规律的推导
童的发育水平
正常人的手指血流
呈黃藍色 (perfusion unit約215)
參考值:PU>150
手指潰爛之病人血流 呈紫灰藍色
(PU約为19)
Help us to judge whether someone is sick .
Index abnormal
?
sick or unhealthiness
正态分布的特征
正态曲线下的面积分布有一定的规律: • 1.曲线下的面积即为概率,可以通过式3-2求
得。 • 2.曲线下的总面积为1或100%,以μ为中心左
右两侧面积各占50%,越靠近μ处,曲线下面 积越大,两边逐渐减少,超过一定范围以外 的面积(概率)可以忽略。 • 3.所有正态曲线,在μ左右的任意个标准差范 围内面积相同。
• 因此,很有必要制定一个正常人群的 参考值范围以判断某个个体某项指标 正常与否。
一、医学参考值范围的概念
• 又称参考值范围(reference range), 是指“正常”人的解剖,生理、生 化等数据大多数个体值的波动范围。
• 常用95%的参考值范围
The Purpose of the Reference Range
• 例如:如果我们想制定身高的参考值范围, 不仅应考虑性别,年龄的差异,而且还应将 地区之间的差异考虑在内。
• For example, we we want to make a reference range of height. Not only gender, age, but also geographic factors should be considered.
正态分布的应用
• 深入统计描述和推断的基础 计算参考值范围的基础 计算可信区间的基础 进行假设检验的基础
• 质量控制图 • 二项分布、Poisson分布的正态分布
近似
第二节 医学参考值范围
• 由于存在个体变异,来自正常人群的 生理、生化指标在不同个体之间存在 着差异,即使是同一个个体,某些指 标也会因时间、空间的改变而有一定 程度的波动。