医学统计学第3讲正态分布共34页
合集下载
正态分布 课件

在气象中,某地每年七月份的平均气温、平均湿度 以及降雨量等,水文中的水位;
总之,正态分布广泛存在于自然界、生产及科学技术的许多领域中。
正态分布在概率和统计中占有重要地位。
4、正态曲线的性质
(1)曲线在x轴的上方,与x轴不相交.
(μ-σ,μ+σ]
0.6826
(μ-2σ,μ+2σ]
0.9544
(μ-3σ,μ+3σ]
0.9974
(2)曲线是单峰的,它关于直线x=μ对称.
(4)曲线与x轴之间的面积为1.
(3)曲线在x=μ处达到峰值(最高点)
(5)若 固定, 随 值的变化而沿x轴平移, 故 称为位置参数
(6)当μ一定时,曲线的形状由σ确定 .σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.
5、特殊区间的概率:
m-a
m+a
x=μ
若X~N ,则对于任何实数a>0,概率 为如图中的阴影部分的面积,对于固定的 和 而言,该面积随着 的减少而变大。这说明 越小, 落在区间 的概率越大,即X集中在 周围概率越大。
4
0.04
[0.5,1)
8
0.08
[1,1.5)
15
0.15
[1.5,2)
22
0.22
[2,2.5)
25
0.25
[2.5,3)
14
0.14
[3,3.5)
6
0.06
[3.5,4)
4
0.04
[4,4.5)
2
0.02
11
高尔顿钉板实验的 频率分布直方图
这条曲线具有 “中间高,两头低” 的特征,像这种类型的曲线, 就是(或近似地是)以下函数的图像:
总之,正态分布广泛存在于自然界、生产及科学技术的许多领域中。
正态分布在概率和统计中占有重要地位。
4、正态曲线的性质
(1)曲线在x轴的上方,与x轴不相交.
(μ-σ,μ+σ]
0.6826
(μ-2σ,μ+2σ]
0.9544
(μ-3σ,μ+3σ]
0.9974
(2)曲线是单峰的,它关于直线x=μ对称.
(4)曲线与x轴之间的面积为1.
(3)曲线在x=μ处达到峰值(最高点)
(5)若 固定, 随 值的变化而沿x轴平移, 故 称为位置参数
(6)当μ一定时,曲线的形状由σ确定 .σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.
5、特殊区间的概率:
m-a
m+a
x=μ
若X~N ,则对于任何实数a>0,概率 为如图中的阴影部分的面积,对于固定的 和 而言,该面积随着 的减少而变大。这说明 越小, 落在区间 的概率越大,即X集中在 周围概率越大。
4
0.04
[0.5,1)
8
0.08
[1,1.5)
15
0.15
[1.5,2)
22
0.22
[2,2.5)
25
0.25
[2.5,3)
14
0.14
[3,3.5)
6
0.06
[3.5,4)
4
0.04
[4,4.5)
2
0.02
11
高尔顿钉板实验的 频率分布直方图
这条曲线具有 “中间高,两头低” 的特征,像这种类型的曲线, 就是(或近似地是)以下函数的图像:
医学统计学-正态分布

37
习题
三、最佳选择题
❖ 1、描述一组偏态分布资料的变异度,以( )指标较好。
A.全距 B.标准差
C.变异系数
D.四分位间距 E.方差
❖ 2、用均数和标准差可以全面描述( )资料的特征/
A.正偏态分布 B.负偏态分布 C.正态分布
D.对称分布 E.对数正态分布
❖ 3、各观察值均加(或减)同一数后( )。
2. 制定医学参考值范围
x 2s
3. 控制实验误差:上下警戒限:x 3s
上下控制限:
2021年9月29日星期三
23
四、医学参考值范围
❖参考值范围(reference ranges)
❖医学参考值(reference value)是指正常人的各种 生理、生化数据,组织或排泄物中各种成分的含 量。
❖ 正常人测定值的波动范围,称为参考值范围。参 考值范围在诊断方面可用于划分正常或异常。
是一种很重要的连续分布
2021年9月29日星期三
f(x)
x
μ 4
1.正态分布的概念和特征
❖ 正态分布的密度函数,即正态分布的方程
f(x)
1
1 ( xμ )2
e2 σ
σ 2π
x
π、e分别为圆周率和自然对数的底, μ为总体参数,σ为总体标准差
X 为连续随机变量
当x确定后,就可由此式求得其密度函数f(x), 即纵坐标的高度了,嘿嘿
2021年9月29日星期三
34
小结
❖ 3.正态分布用N(μ, σ2) 表示,为了应用方便,常对变量x 作 u 变x 换 ,使μ=0,σ =1,则正态分布转换为标准 正态分布,用N(0,1)表示。
❖ 4.正态曲线下面积的分布有一定规律。理论上μ±1σ, μ±1.96σ和μ±2.58σ区间的面积(观察单位数)各占总 面积的(总观察单位数)的68.27%,95%和99%,可 用来估计医学参考值范围和质量控制等方面。
第三章正态分布医学统计学ppt课件

• A.97.5% B.95% C.10% D.5% E.2.5%
• 3、对于标准正态分布变量,—— 范围内正态曲线下面积包 含有95%变量值。
累计频率(%) (5) 0.83 3.33 8.33
15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17 100.00
120
100
(一)图示法 1、频数表和直方图目测法
(一)图示法
Q--Q图:对应于正态分布的Q--Q图就是由标准 正态分布的分位数为横坐标,样本值为纵坐标的散点 图。
• 2.确定肺活量的95%参考值范围 由于肺活量只过低为异常,故只计算P5
• 3.确定尿铅的95%参考值范围 由于尿铅只以过高为异常,应计算P95
2023/10/15
王晓敏
47
医学参考值范围的题目: (1)判断分布类型:正态分布或偏态分布? (2)判断:单侧或双侧?
王晓敏
第四节 正态性判定 (test of normality)
频数 (2) 1 3 6 8 12 20 27 18 12 8 4 1
频率(%) (3) 0.83 2.50 5.00 6.67
10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83
累计频数 (4) 1 4 10 18 30 50 77 95 107 115 119 120
正态分布的特征
⑴ 正态曲线在横轴上方均数处最高; 注: X离μ越远, f(x)越小,逐渐接近0,但不 会等于0,故正态曲线永远不与横轴相交
⑵ 以均数为中心,左右对称;
f(x)
μ
王晓敏
⑶ 正态分布有两个参数 和 ; μ:位置参数 ; σ:形状参数 总体均数μ是位置参数: 描述正态分布的集中趋势位置。 总体标准差σ是变异度参数,决定曲线形态: 描述正态分布离散趋势,越小,分布越集中, 曲线形状越“瘦高”;反之越“矮胖”。
• 3、对于标准正态分布变量,—— 范围内正态曲线下面积包 含有95%变量值。
累计频率(%) (5) 0.83 3.33 8.33
15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17 100.00
120
100
(一)图示法 1、频数表和直方图目测法
(一)图示法
Q--Q图:对应于正态分布的Q--Q图就是由标准 正态分布的分位数为横坐标,样本值为纵坐标的散点 图。
• 2.确定肺活量的95%参考值范围 由于肺活量只过低为异常,故只计算P5
• 3.确定尿铅的95%参考值范围 由于尿铅只以过高为异常,应计算P95
2023/10/15
王晓敏
47
医学参考值范围的题目: (1)判断分布类型:正态分布或偏态分布? (2)判断:单侧或双侧?
王晓敏
第四节 正态性判定 (test of normality)
频数 (2) 1 3 6 8 12 20 27 18 12 8 4 1
频率(%) (3) 0.83 2.50 5.00 6.67
10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83
累计频数 (4) 1 4 10 18 30 50 77 95 107 115 119 120
正态分布的特征
⑴ 正态曲线在横轴上方均数处最高; 注: X离μ越远, f(x)越小,逐渐接近0,但不 会等于0,故正态曲线永远不与横轴相交
⑵ 以均数为中心,左右对称;
f(x)
μ
王晓敏
⑶ 正态分布有两个参数 和 ; μ:位置参数 ; σ:形状参数 总体均数μ是位置参数: 描述正态分布的集中趋势位置。 总体标准差σ是变异度参数,决定曲线形态: 描述正态分布离散趋势,越小,分布越集中, 曲线形状越“瘦高”;反之越“矮胖”。
医学统计学之正态分布

随机变量 U 在区间 (u1,u2)所对应的面积 即为随机变量 X 在区 间(x1,x2)所对应的面 积
第23页
举例 说明 通 过正 态分 布 求随 机 变量的
频数分布范围。
例:某地 13 岁女孩 118 人的身高(cm)
资料,估计该地 13 岁正常女孩身高在 135
厘米以下及 155 厘米以上者各占正常女孩
N(μ1 ,σ2)、N(μ2 ,σ2)
N(μ,0.52)、N(μ,12)、N(μ,22)
max
σ=0.5
f(x)
f(x)
σ=1 σ=2
0 医学统计学之正态分布
µ1
µ2
0
µ
第13页
➢ 正态曲线下面积分布有一定规律性。
✓ 对于服从正态分布随机变量(X),随机变量值出现在某 一区区间间所(围成x1,区x2)域概面率积与大正小态相分对布应概(率相密等度)曲。线与横轴在该
医学统计学之正态分布
第26页
✓ 制定医学参考值范围时,应从正常人群中抽样,且样本含量应 较大(n>100),根据资料的分布类型采用正态分布法或百分位 数法。 正态分布法: 适用于资料服从正态分布或近似正态分布时。 公式;
双侧 1-α参考值范围: X U 2 S
单侧 1-α参考值范围: X U S或 X U S
式中σ为总体标准差;μ为总体均数;π
为圆周率,即3.14159···;e为自然对数底,
即2.71828···。
医学统计学之正态分布
第9页
✓ 若某一随机变量概率密度函数(频率曲线方程) 为上式,则称该变量X服从参数为μ和σ正态分布, 记为:X~N(μ,σ2)。
✓ 函数方程中μ为位置参数,σ为形状参数。
本资料起源
第23页
举例 说明 通 过正 态分 布 求随 机 变量的
频数分布范围。
例:某地 13 岁女孩 118 人的身高(cm)
资料,估计该地 13 岁正常女孩身高在 135
厘米以下及 155 厘米以上者各占正常女孩
N(μ1 ,σ2)、N(μ2 ,σ2)
N(μ,0.52)、N(μ,12)、N(μ,22)
max
σ=0.5
f(x)
f(x)
σ=1 σ=2
0 医学统计学之正态分布
µ1
µ2
0
µ
第13页
➢ 正态曲线下面积分布有一定规律性。
✓ 对于服从正态分布随机变量(X),随机变量值出现在某 一区区间间所(围成x1,区x2)域概面率积与大正小态相分对布应概(率相密等度)曲。线与横轴在该
医学统计学之正态分布
第26页
✓ 制定医学参考值范围时,应从正常人群中抽样,且样本含量应 较大(n>100),根据资料的分布类型采用正态分布法或百分位 数法。 正态分布法: 适用于资料服从正态分布或近似正态分布时。 公式;
双侧 1-α参考值范围: X U 2 S
单侧 1-α参考值范围: X U S或 X U S
式中σ为总体标准差;μ为总体均数;π
为圆周率,即3.14159···;e为自然对数底,
即2.71828···。
医学统计学之正态分布
第9页
✓ 若某一随机变量概率密度函数(频率曲线方程) 为上式,则称该变量X服从参数为μ和σ正态分布, 记为:X~N(μ,σ2)。
✓ 函数方程中μ为位置参数,σ为形状参数。
本资料起源
医学统计学PPT(南医大)03-正态分布课件

e 2 2
2
★★
2 1 3
3 1 2
7
正态分布 均数相等、方差不等的正态分布图示
f (X)
1
( X )2
e 2 2
2
★★
2 3 1 2
1 3
8
正态分布 特征★★
集中性 单峰分布;高峰在均数处 对称性 以均数为中心,均数两侧完全对称 μ位置参数(左右),σ形态参数(胖矮、高瘦) 有些指标本身不服从正态分布,但经过变换之后可以服从正态分布(发汞) 正态曲线下的面积分布有一定的规律
9
正态分布 正态曲线下面积的分布规律★★
1. X轴与正态曲线所夹面积恒等于1 2. 对称区域面积相等
-x x
-x1 -x2 x2 x1
10
正态分布 正态曲线下面积的分布规律★★
3. 不论均数或标准差多大,曲线下面积完全决定于以标准差为单位 从点x到µ的离差
S(-, )=0.5 S(-, -1)=0.1587 S(-, -2)=0.0228 S(-, -3)=0.0013
12
正态分布 正态曲线下面积的分布规律★★
3. 不论均数或标准差多大,曲线下面积完全决定于以标准差为单位 从点x到µ的离差
X2=-σ2 X1=-σ1 X3=-σ3
2 1
0.1587 0.1587 0.1587
3
X3 X1 X2
13
正态分布 正态曲线下面积的分布规律★★
3. 不论均数或标准差多大,曲线下面积完全决定于以标准差为单位 从点x到µ的离差
正常人(Normal People) 不是指健康人,排除了影响所研究的指 标的疾病和有关因素的同质的人群
对于服从正态分布的指标,其参考值范围的制定可依据正态分布 的面积分布规律;对于不服从正态分布的指标,可利用百分位数 法制定参考值范围
2
★★
2 1 3
3 1 2
7
正态分布 均数相等、方差不等的正态分布图示
f (X)
1
( X )2
e 2 2
2
★★
2 3 1 2
1 3
8
正态分布 特征★★
集中性 单峰分布;高峰在均数处 对称性 以均数为中心,均数两侧完全对称 μ位置参数(左右),σ形态参数(胖矮、高瘦) 有些指标本身不服从正态分布,但经过变换之后可以服从正态分布(发汞) 正态曲线下的面积分布有一定的规律
9
正态分布 正态曲线下面积的分布规律★★
1. X轴与正态曲线所夹面积恒等于1 2. 对称区域面积相等
-x x
-x1 -x2 x2 x1
10
正态分布 正态曲线下面积的分布规律★★
3. 不论均数或标准差多大,曲线下面积完全决定于以标准差为单位 从点x到µ的离差
S(-, )=0.5 S(-, -1)=0.1587 S(-, -2)=0.0228 S(-, -3)=0.0013
12
正态分布 正态曲线下面积的分布规律★★
3. 不论均数或标准差多大,曲线下面积完全决定于以标准差为单位 从点x到µ的离差
X2=-σ2 X1=-σ1 X3=-σ3
2 1
0.1587 0.1587 0.1587
3
X3 X1 X2
13
正态分布 正态曲线下面积的分布规律★★
3. 不论均数或标准差多大,曲线下面积完全决定于以标准差为单位 从点x到µ的离差
正常人(Normal People) 不是指健康人,排除了影响所研究的指 标的疾病和有关因素的同质的人群
对于服从正态分布的指标,其参考值范围的制定可依据正态分布 的面积分布规律;对于不服从正态分布的指标,可利用百分位数 法制定参考值范围
《医学统计学》正态分布与医学参考值范围课件

正态分布还可以用于评估数据 的分布情况,以及异常值的识 别和处理。
正态分布在医学研究中广泛应 用于统计分析,如描述性统计 、参数估计和假设检验等。
医学参考值范围的局限性
医学参考值范围是基于一定样本量和 特定人群特征确定的,因此其适用范 围有限,可能不适用于特殊人群或不 同地区和族裔的人群。
医学参考值范围仅适用于单个生理指 标的评估,对于多个指标的综合评估 需要更多的专业知识和临床判断。
医学参考值范围的使用方法
1 2 3
判断个体指标是否异常
通过将个体指标值与医学参考值范围进行比较, 可以判断个体指标是否异常。
辅助临床诊断
医生可以根据个体指标的异常程度,结合患者的 临床表现和其他检查结果,进行综合判断,提高 诊断的准确性和可靠性。
监测治疗效果
通过监测治疗效果,可以及时调整治疗方案,提 高治疗效果。
案例二
总结词
胆固醇水平呈正态分布,医学参考值范围为3.1-5.2mmol/L。
详细描述
总胆固醇水平在正常范围内时,其分布也接近正态分布。医学上通常根据总胆固醇水平来判断个体心 血管疾病的患病风险。正常的总胆固醇水平参考值为3.1-5.2mmol/L。若总胆固醇水平超过 5.2mmol/L,则可能增加患心血管疾病的风险。
《医学统计学》正态分布与 医学参考值范围课件
汇报人: 2023-12-24
目录
• 正态分布概述 • 正态分布与医学参考值范围的
关系 • 正态分布的检验方法 • 医学参考值范围的解读与使用 • 案例分析
01
正态分布概述
正态分布的定义
01
正态分布是一种概率分布,其概 率密度函数呈钟形,对称分布于 均值(μ)周围。
P-P图法
医学统计学3正态

标准正态分布
• 标准正态分布(standard normal distribution)是 均数为0,标准差为1的正态分布。 • 记为N(0,1)。 • 标准正态分布是一条曲线。 • 概率密度函数:
( u)
1 2
e
u2 2
(-∞< u <+∞)
正态分布的应用
• 估计频数分布
• 确定临床参考值范围
1.96σ的面积为
A. 95%
B. 45%
C. 97.5% D. 47.5% E. 不能确定(与标准差的大小有关)
E 6.正态分布N(μ,σ),当μ恒定时,σ
越大,则
A.曲线沿横轴越向右移动 B.曲线沿横轴越向左移动 C.曲线形状和位置都不变 D.观察值变异程度越小,曲线越“瘦”
E.观察值变异程度越大,曲线越“胖”
E、以上都不是。
A
4、要评价某市一名8岁女孩的身高是否偏高或偏矮,
应选用的统计方法是:
A、用该市8岁女孩身高的95%或99%正常值范围来
评价;
B、作身高差别的假设检验来评价;
C、用身高均数的95%或99%的可信区间来评价;
DD 5.正态曲线下、横轴上,从均数μ到μ+
例:
• 已知某地140名正常成年男子红细胞计数近似服 从正态分布,均数=4.78×1012/L, S=0.38×1012/L
• 试估计: 1,该地正常成年男子红细胞计数在4.0×1012/L以下 者占该地正常成年男子总数的百分比; 2,红细胞计数在4.0×1012/L~5.5×1012/L者占该 地正常男子总数的百分比。
第三章
正态分布normal distribution 医学参考值范围
主要内容(Content)
祝晓明《医学统计学》医统-第三章正态分布与医学参考值范围

若偏态分布资料经变量变换能转换为正态分布或近似正态分布仍可用正态分布表31医学参考值范围的正态分布法和百分位数法计算公式正态分布法百分位数法下限上限下限上限901649095196959925899medicalreferencerange34例33已知某地140名正常成年男子红细胞计数近似服从正态分布4781012l0381012近似正态分布资料可按正态分布法处理因红细胞计数值过大或过小均为异常故应估计双侧95参考值范围
Medical reference range
例3-4 某年某地测得 100 名正常成年人的血铅含量 值(μg/dl),试确定该地正常成年人血铅含量的 95%参考值范围。 根据经验已知正常成年人的血铅含量近似对数正 态分布,因此首先对原始数据作对数变换,经正态
性检验可知对数值服从正态分布(P>0.50),故
三、医学参考值范围的计算方法
百分位数法适合于任何分布类型的资料,在实际中 最为常用。由于参考值范围所涉及的常常是波动较 大的两端数据,使用百分位数法必须要有较大的样 本含量,否则结果不稳定。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
0.38
0.38
= P(2.05 z 1.89)
1 1.89 2.05 10.0294 0.0202 0.9504
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占该 地正常成年男子总数的95.04%。
课后习题: P25 计算题2
第二节 医学参考值范围
一、基本概念
变换 z
X
化成
0
Medical reference range
例3-4 某年某地测得 100 名正常成年人的血铅含量 值(μg/dl),试确定该地正常成年人血铅含量的 95%参考值范围。 根据经验已知正常成年人的血铅含量近似对数正 态分布,因此首先对原始数据作对数变换,经正态
性检验可知对数值服从正态分布(P>0.50),故
三、医学参考值范围的计算方法
百分位数法适合于任何分布类型的资料,在实际中 最为常用。由于参考值范围所涉及的常常是波动较 大的两端数据,使用百分位数法必须要有较大的样 本含量,否则结果不稳定。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
0.38
0.38
= P(2.05 z 1.89)
1 1.89 2.05 10.0294 0.0202 0.9504
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占该 地正常成年男子总数的95.04%。
课后习题: P25 计算题2
第二节 医学参考值范围
一、基本概念
变换 z
X
化成
0
医学统计学第3讲正态分布

正态分布的标准化
1
Z-分数
2
通过计算标准差的倍数来表示某个观测
值相对于均值的位置。
3
标准化公式
将非标准正态分布转化为标准正态分布, 使得均值为0,标准差为1。
标准正态分布表
通过查表可以得到标准正态分布下的累 积概率、百分位数等信息态分布用于描述人群中的身高 分布,帮助我们了解平均身高、 身高偏差等统计特征。
考试成绩
正态分布可以帮助我们分析考试 成绩,确定合理的分数划分和评 估标准。
药物疗效
正态分布在医药领域中应用广泛, 如药物疗效的评估和剂量的确定。
正态分布与置信区间
置信区间的计算
使用正态分布的特性来估计样本均值的真实范围,提供统计推断的依据。
置信水平
置信区间的可信程度,常用的置信水平有95%和99%。
医学统计学第3讲:正态分布
探索正态分布的特征、应用和优缺点以及在医学研究中的重要性。让我们一 起开始这个令人兴奋的主题!
什么是正态分布?
正态分布是一种连续概率分布,常用于描述自然界中的许多现象,如身高、 体重等。其特征是钟形曲线,均值和标准差能够完全定义分布。
正态分布的形状和密度曲线
正态分布的密度曲线呈现出典型的钟形形状,其峰值出现在均值处。均值、标准差和曲线的形态密切相关,构 成了正态分布的基本特征。
标准误差是测量样本均值与总体均值之间的差异的指标,用于衡量样本均值的精确性。
正态分布在线性回归中的应用
正态分布在线性回归模型中的误差项满足正态分布的假设,确保回归结果的 准确性和可信度。
样本大小
影响置信区间的宽度,样本大小越大,置信区间越窄。
正态分布与假设检验
1
零假设与备择假设
医学统计学课件 正态分布

Ø 为位置参数; Ø 为形态参数。
12
正态分布的位置参数
2 1 3
3 1 2
13
正态分布的形状参数
2 3 1 2
1 3
正态分布的特征 (II)
• 有些指标本身不服从正态分布,但通过适当的变换(transformation )后服从正态分布; Ø 例:对数正态分布(log-normal distribution)
• 参考值范围应为双侧范围。用正态分布法求95%参考值范围的上、下界限: • 此范围可用以判断该地区成年女性血清总蛋白正常与否。
X 1.96s 73.5 1.96 3.9 65.9 ~ 81.1(g/L)
39
小结
• 正态分布是医学研究中最重要的分布之一。正态分布 N(,2) 以 为中心,左右对称, 决定了正态分布的形状。 • 正态分布的曲线下面积可以通过标准正态分布曲线下面积表得到。 • 绝大多数正常人某项指标的波动范围称为参考值范围。参考值范围的计算方法包括正态分布法和百分位数法,可根据
-1.0 0.1587 0.1539 0.1492 0.1446 0.1401
-0.5 0.3085 0.3015 0.2946 0.2877 0.2810
0
0.5000 0.4920 0.4840 0.4761 0.4681
u0
25
常用正态分布的曲线下面积及界值
2.5%
95%
2.5%
-1.96
+1.96
• 根据标准正态离差公式
• 查表得其对应的下侧尾部面积为2.28%。即该地低出生体重儿占所有出生婴儿的2.28%。
u X 2500 3200 2
350
30
应用:估计参考值范围
• 参考值范围(reference interval )又称正常值范围(normal range ),是指绝大多数正常人某项指标的波动范围。 • 参考值范围是临床医生判断正常与异常的参考依据 。
12
正态分布的位置参数
2 1 3
3 1 2
13
正态分布的形状参数
2 3 1 2
1 3
正态分布的特征 (II)
• 有些指标本身不服从正态分布,但通过适当的变换(transformation )后服从正态分布; Ø 例:对数正态分布(log-normal distribution)
• 参考值范围应为双侧范围。用正态分布法求95%参考值范围的上、下界限: • 此范围可用以判断该地区成年女性血清总蛋白正常与否。
X 1.96s 73.5 1.96 3.9 65.9 ~ 81.1(g/L)
39
小结
• 正态分布是医学研究中最重要的分布之一。正态分布 N(,2) 以 为中心,左右对称, 决定了正态分布的形状。 • 正态分布的曲线下面积可以通过标准正态分布曲线下面积表得到。 • 绝大多数正常人某项指标的波动范围称为参考值范围。参考值范围的计算方法包括正态分布法和百分位数法,可根据
-1.0 0.1587 0.1539 0.1492 0.1446 0.1401
-0.5 0.3085 0.3015 0.2946 0.2877 0.2810
0
0.5000 0.4920 0.4840 0.4761 0.4681
u0
25
常用正态分布的曲线下面积及界值
2.5%
95%
2.5%
-1.96
+1.96
• 根据标准正态离差公式
• 查表得其对应的下侧尾部面积为2.28%。即该地低出生体重儿占所有出生婴儿的2.28%。
u X 2500 3200 2
350
30
应用:估计参考值范围
• 参考值范围(reference interval )又称正常值范围(normal range ),是指绝大多数正常人某项指标的波动范围。 • 参考值范围是临床医生判断正常与异常的参考依据 。
医学统计学(课件)正态分布

CV舒张压
10.7 100% 77.5
13.8%
17.1
CV收缩压
100% 122.9
13.9%
第三章 正态分布及应用
一、正态分布(Normal Distribution)
f (X) 1.2 1
0.8
f (X) 1.2 1
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
3.8 4.2 4.6 5.0 5.4 5.8 X
异常
正常
异常
单侧上限
双侧下限 双侧上限
单侧上限---过高异常 双侧---过高、过低均异常
(b)24小时尿糖参考值范围 (c)白细胞数参考值范围
(五)选择适当的百分范围
参考值的百分范围应根据资料的性质和研究目的选 择,它与诊断阈值有确定的关系。百分范围的不同将导 致不同的假阳性率和假阴性率。
图3-6 正常人和病人数据分布重叠
图3-2 正态分布曲线下的面积
1 2
3
-4 -3 -2 -1 01 1 22 3 43 5 6 7
1 2 3
图3-3 三种不同均值的正态分布
-5 -4 -3 -2 -1 0 1 2 3 4 5
1 2 3 图3-4 三种不同标准差的正态分布
0.6
f (X )
0.5
上限: X 1.96S 4.78 1.96 0.38 5.52(1012 / L)
例3.5 见第二章表2-4资料。为该地区50岁~60岁女性高 血脂诊断与治疗提供参考依据,试估计血清甘油三脂含量的 95%单侧参考值范围。
(630 0.95 580)
P 1.90
卫生统计学03正态分布

40
30
20
10
Std. Dev = .37
Mean = 4.78
0
N = 140.00
3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90 6.10
医学统计学
湖北中医学院卫生教研室
3
第一节 正态分布的概念和特性
▪ 某地用随机抽样方法检查了140名成年男子的红细胞数,当取组距为0.1 时
X - 1.96 X + S 1,.96S
作为正常值范围。
医学统计学
湖北中医学院卫生教研室
11
第二节 正态分布的应用
▪ 比如,第二章表2.2中列出的140名成年男子的红细 胞数,其和分别为:
▪
均 数 4.78 (×1012/L)
▪
标准差 0.37 (×1012/L)
ቤተ መጻሕፍቲ ባይዱ
▪ 因此,其正常值范围可定为:
▪ (4.78-1.96×0.37, 4.78+1.96×0.37)
68.3% 95.0% 99.0%
m4+ 2.585s
医学统计学
湖北中医学院卫生教研室
10
第二节 正态分布的应用
▪ 一、估计医学正常值范围
• 不少医学现象是服从正态分布或近似正态分布。比如,同性 别、年龄儿童的身高;同性别健康成人的红细胞、血红蛋白 量、脉搏数等。
• 对于这些正态分布或近似正态分布的资料,只 要样本含量足够大(N>100)时,可用
0
1
2
3
4
5
s1 <s2 <s3
医学统计学
湖北中医学院卫生教研室
9
第一节 正态分布的概念和特性
30
20
10
Std. Dev = .37
Mean = 4.78
0
N = 140.00
3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90 6.10
医学统计学
湖北中医学院卫生教研室
3
第一节 正态分布的概念和特性
▪ 某地用随机抽样方法检查了140名成年男子的红细胞数,当取组距为0.1 时
X - 1.96 X + S 1,.96S
作为正常值范围。
医学统计学
湖北中医学院卫生教研室
11
第二节 正态分布的应用
▪ 比如,第二章表2.2中列出的140名成年男子的红细 胞数,其和分别为:
▪
均 数 4.78 (×1012/L)
▪
标准差 0.37 (×1012/L)
ቤተ መጻሕፍቲ ባይዱ
▪ 因此,其正常值范围可定为:
▪ (4.78-1.96×0.37, 4.78+1.96×0.37)
68.3% 95.0% 99.0%
m4+ 2.585s
医学统计学
湖北中医学院卫生教研室
10
第二节 正态分布的应用
▪ 一、估计医学正常值范围
• 不少医学现象是服从正态分布或近似正态分布。比如,同性 别、年龄儿童的身高;同性别健康成人的红细胞、血红蛋白 量、脉搏数等。
• 对于这些正态分布或近似正态分布的资料,只 要样本含量足够大(N>100)时,可用
0
1
2
3
4
5
s1 <s2 <s3
医学统计学
湖北中医学院卫生教研室
9
第一节 正态分布的概念和特性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以服从正态分布。 • 正态曲线下的面积分布有一定的规律。
N(, 2)
N(0,1)
0.6
f (X )
0.5
N(1,0.82)
0.4 N(0,12 )
0.3
N(1,1.22)
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
4
X
方差相等、均数不等的正态分布图示
2 1 3
3 1 2
均数相等、方差不等的正态分布图示
• 密度函数f(X) 离散型随机变量:f(x)=P(X) 连续性变量:
F(b)F(a)b af(x)dx
1.正态分布的图形
(a)
(b)
(c)
(d)
近似正态曲线
正态分布的密度函数,即正态曲线的方程
f X
1
e12
X2
2
-∞ < x < ∞
3.14159
2.71828
X ~ N ( ,2 ) ,为 X 的 总 体 均 数 , 为 总 体 标 准 差
计算标准离差:
104.0110.15 u1 5.86 1.05
查表得:
u2108.05 .81610.150.37
(u1)= (-1.05)=0.1469, (u2)= (-0.37)=0.3557
S= (u1) - (u2)= 0.3557-0.1469=0.2088=20.88%
故估计该市某年身高界于104.0~108.0cm范围内的5岁女孩 所占比例为20.88%,在此范围内的人数为120×20.88%= 25名。
单侧下限---过低异常 单侧上限---过高异常 双侧---过高、过低均异常
异常 正常
单侧下限
正常 异常
单侧上限
异常
正常
异常
双侧下限 双侧上限
正常人与病人的数据分布重叠示意图(单侧)
假阴性
正常人
病人
假阳性
正常人与病人的数据分布重叠示意图(单侧)
假阴性率
正常人
病人
假阳性率
正常人与病人的数据分布重叠示意图(双侧)
即该地正常女子血清甘油三脂在1.10mmol/L以下者,估 计占总人数的44.43%。
1.8
1.5
1.2
0.9
0.6
0.344.43%源自0.000.51
1.5
2
X
例:已知某年某市120名5岁女孩身高 X110.15cm,
S=5.86cm,现预估计该市某年身高界于104.0~108.0cm范围 内的5岁女孩所占比例及120名5岁女孩中身高界于104.0~ 108.0cm范围内的人数。
制定参考值范围
参考值范围又称正常值范围,医学上是指 绝大多数正常人的某指标值所在的范围。
参考值范围的意义
划分正异常
制定步骤
1. 从“正常人”总体中抽样:明确研究总体 2. 控制检测误差 3. 判断是否需要分组(如性别、年龄)确定 4. 根据专业知识决定单侧还是双侧 5. 选择百分界值 6. 确定可疑范围
X 1.64S( 下 限 )
百分位数法
双侧95%正常值范围: P2.5~P97.5 单侧95%正常值范围: < P95(上限)
6985.2070% -1.96σ -1σ μ 1σ 1.96σ
标准正态曲线下面积分布规律
6985.2070%
双侧u
-1.96 -1
0
1 1.96
双侧u0.05=1.96,双侧u0.01=2.58
正态分布的应用
• 估计频数分布 • 制定参考值范围 • 质量控制 • 统计分析方法的基础
正态分布的应用
假阴性率 病人
正常人
假阳性率 病人
估计方法
正态分布法 对数正态分布法 百分位数法
正态分布法
双侧100(1-α)%正常值范围: X u / 2 S 单侧100(1-α)%正常值范围: X u S (上 限 )
X u S( 下 限 )
双侧95%正常值范围: X 1.96S 单侧95%正常值范围: X 1.64S (上 限 )
3 1 2
2
1 3
正态曲线下面积分布规律
• X轴与正态曲线所夹面积 恒等于1 。
• 对称区域面积相等。
S(-, -X)
S( +X,)=S(-, -X)
X
X
对称区域面积相等
S( -x1, -x2)
S( -x1, -x2)= S( +x1, +x2)
-x1 -x2
+x2 + x1
正态曲线下面积分布规律
u X ——标准正态离差
标准正态分布的密度函数:
f u
1
u2
e2
2
-∞<u<+∞
标准正态分布
2.正态分布的特征
• 单峰分布;高峰在均数处; • 以均数为中心,均数两侧完全对称。 • 正态分布有两个参数(parameter),即位置参数(均
数)和变异度参数(标准差)。 • 有些指标本身不服从正态分布,但经过变换之后可
25 20 15 10
5 0
109 113 117 121 125 129 133
10 8 6 4 2 0 105 109 113 117 121 125 129 133
107 109 111 113 115 117 119 121 123 125 127 129 131 133
分布特点
• 单峰,钟形 • 以均数为中心,两侧对称 • 尾端不与横轴相交 • 均数—位置,标准差—形状 • 曲线下面积分布有特殊规律
估计频数分布
例:X = 1.14mmol/L , S=0.298mmol/L ,试估计该地正
常女子血清甘油三脂在1.10 mmol/L以下者占正常女子血 清甘油三脂总人数的百分比。
X~N(1.14,0.2982)
计算标准离差 u1.101.140.14 0.29
查表得 (-0.14)=0.4443=44.43%
以 f(X )为 纵 坐 标 , X 为 横 坐 标 , 绘 制 的 曲 线 就 是 正 态 曲 线 ( n o rm a l c u rv e )
因此,正态分布曲线是一簇曲线
均数为0,标准差为1的正态分布,这种正态分布称 为标准正态分布。
对于任意一个服从正态分布N(μ,σ2)的随机变量,可 作如下的标准化变换,也称u变换。
正态 分布
第三章 正态分布
又称为高斯分布,是以均 数为中心,呈对称的钟形 分布,是最常见、最重要 的一种连续型分布。
K. Pearson
随机变量的概率分布
• 随机变量的概念:即变量,按一定的概率可以在一 个特定数据集中取值的变量,通常指医学研究中研 究对象具有的某种特征。
• 概率分布是指确定一个随机变量取给定值或属于一 给定集合的概率的函数。统计学上,分布函数F(X) 即总体中个体值小于或等于X的观察值的比例。
N(, 2)
N(0,1)
0.6
f (X )
0.5
N(1,0.82)
0.4 N(0,12 )
0.3
N(1,1.22)
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
4
X
方差相等、均数不等的正态分布图示
2 1 3
3 1 2
均数相等、方差不等的正态分布图示
• 密度函数f(X) 离散型随机变量:f(x)=P(X) 连续性变量:
F(b)F(a)b af(x)dx
1.正态分布的图形
(a)
(b)
(c)
(d)
近似正态曲线
正态分布的密度函数,即正态曲线的方程
f X
1
e12
X2
2
-∞ < x < ∞
3.14159
2.71828
X ~ N ( ,2 ) ,为 X 的 总 体 均 数 , 为 总 体 标 准 差
计算标准离差:
104.0110.15 u1 5.86 1.05
查表得:
u2108.05 .81610.150.37
(u1)= (-1.05)=0.1469, (u2)= (-0.37)=0.3557
S= (u1) - (u2)= 0.3557-0.1469=0.2088=20.88%
故估计该市某年身高界于104.0~108.0cm范围内的5岁女孩 所占比例为20.88%,在此范围内的人数为120×20.88%= 25名。
单侧下限---过低异常 单侧上限---过高异常 双侧---过高、过低均异常
异常 正常
单侧下限
正常 异常
单侧上限
异常
正常
异常
双侧下限 双侧上限
正常人与病人的数据分布重叠示意图(单侧)
假阴性
正常人
病人
假阳性
正常人与病人的数据分布重叠示意图(单侧)
假阴性率
正常人
病人
假阳性率
正常人与病人的数据分布重叠示意图(双侧)
即该地正常女子血清甘油三脂在1.10mmol/L以下者,估 计占总人数的44.43%。
1.8
1.5
1.2
0.9
0.6
0.344.43%源自0.000.51
1.5
2
X
例:已知某年某市120名5岁女孩身高 X110.15cm,
S=5.86cm,现预估计该市某年身高界于104.0~108.0cm范围 内的5岁女孩所占比例及120名5岁女孩中身高界于104.0~ 108.0cm范围内的人数。
制定参考值范围
参考值范围又称正常值范围,医学上是指 绝大多数正常人的某指标值所在的范围。
参考值范围的意义
划分正异常
制定步骤
1. 从“正常人”总体中抽样:明确研究总体 2. 控制检测误差 3. 判断是否需要分组(如性别、年龄)确定 4. 根据专业知识决定单侧还是双侧 5. 选择百分界值 6. 确定可疑范围
X 1.64S( 下 限 )
百分位数法
双侧95%正常值范围: P2.5~P97.5 单侧95%正常值范围: < P95(上限)
6985.2070% -1.96σ -1σ μ 1σ 1.96σ
标准正态曲线下面积分布规律
6985.2070%
双侧u
-1.96 -1
0
1 1.96
双侧u0.05=1.96,双侧u0.01=2.58
正态分布的应用
• 估计频数分布 • 制定参考值范围 • 质量控制 • 统计分析方法的基础
正态分布的应用
假阴性率 病人
正常人
假阳性率 病人
估计方法
正态分布法 对数正态分布法 百分位数法
正态分布法
双侧100(1-α)%正常值范围: X u / 2 S 单侧100(1-α)%正常值范围: X u S (上 限 )
X u S( 下 限 )
双侧95%正常值范围: X 1.96S 单侧95%正常值范围: X 1.64S (上 限 )
3 1 2
2
1 3
正态曲线下面积分布规律
• X轴与正态曲线所夹面积 恒等于1 。
• 对称区域面积相等。
S(-, -X)
S( +X,)=S(-, -X)
X
X
对称区域面积相等
S( -x1, -x2)
S( -x1, -x2)= S( +x1, +x2)
-x1 -x2
+x2 + x1
正态曲线下面积分布规律
u X ——标准正态离差
标准正态分布的密度函数:
f u
1
u2
e2
2
-∞<u<+∞
标准正态分布
2.正态分布的特征
• 单峰分布;高峰在均数处; • 以均数为中心,均数两侧完全对称。 • 正态分布有两个参数(parameter),即位置参数(均
数)和变异度参数(标准差)。 • 有些指标本身不服从正态分布,但经过变换之后可
25 20 15 10
5 0
109 113 117 121 125 129 133
10 8 6 4 2 0 105 109 113 117 121 125 129 133
107 109 111 113 115 117 119 121 123 125 127 129 131 133
分布特点
• 单峰,钟形 • 以均数为中心,两侧对称 • 尾端不与横轴相交 • 均数—位置,标准差—形状 • 曲线下面积分布有特殊规律
估计频数分布
例:X = 1.14mmol/L , S=0.298mmol/L ,试估计该地正
常女子血清甘油三脂在1.10 mmol/L以下者占正常女子血 清甘油三脂总人数的百分比。
X~N(1.14,0.2982)
计算标准离差 u1.101.140.14 0.29
查表得 (-0.14)=0.4443=44.43%
以 f(X )为 纵 坐 标 , X 为 横 坐 标 , 绘 制 的 曲 线 就 是 正 态 曲 线 ( n o rm a l c u rv e )
因此,正态分布曲线是一簇曲线
均数为0,标准差为1的正态分布,这种正态分布称 为标准正态分布。
对于任意一个服从正态分布N(μ,σ2)的随机变量,可 作如下的标准化变换,也称u变换。
正态 分布
第三章 正态分布
又称为高斯分布,是以均 数为中心,呈对称的钟形 分布,是最常见、最重要 的一种连续型分布。
K. Pearson
随机变量的概率分布
• 随机变量的概念:即变量,按一定的概率可以在一 个特定数据集中取值的变量,通常指医学研究中研 究对象具有的某种特征。
• 概率分布是指确定一个随机变量取给定值或属于一 给定集合的概率的函数。统计学上,分布函数F(X) 即总体中个体值小于或等于X的观察值的比例。