医学统计学第三讲正态分布及其应用
合集下载
医学统计学. 正态分布及其应用ppt课件
准化变换。
ppt精选版
24
N(μ,σ2)
N(0,1)
从一般的正态分布转变为标准的正态分布
标准正态分布的密度函数为
(X ) 1 eZ2 2 2
ppt精选版
26
➢ 对上式求积分可得到标准正态变量Z的分布函 数。
➢ 由于积分计算繁琐,统计学家按标准正态分布
的累积概率分布函数(-Z)编制了附表2
(P315),标准正态分布曲线下的面积,由表 可查出曲线下某区间的面积。
20
曲线下的面积的计算
对于任意一个区间的曲线下面积,在知道变 量值x对应的概率密度函数f (x)后,都可以根 据微积分的方法求出其面积的大小
f(x)
F
x
P(a
x
b)
b
a
f
(x)dx
?
x ab
ppt精选版
21
实际工作中,常需要了解正态曲
线下横轴上某一区间的面积占总
面积的百分数,以便估计该区间
的例数占总例数的百分数(频数
概率 29
查附表2时注意事项:
➢ 曲线下横轴上的总面积为100%或1; ➢ 表中曲线下面积为-∞到Z的面积;
➢ 对于服从正态分布的变量x,先进行标准 化变换(Z X ),然后借助标准正态分
布表可得到任意(x1, x2)范围内的面积或频 数比例。
ppt精选版
30
Z1 Z2
图4.7 查表法求标准正态曲线下面积示意图
X<μ范围内曲线下的面积相等,各占50%;
S(X,)=S(-,-X)
S(-,-X)
S(X,)
-X X
X轴
正态分布对称性
ppt精选版
15
二.正态密度函数曲线下的面积规律
ppt精选版
24
N(μ,σ2)
N(0,1)
从一般的正态分布转变为标准的正态分布
标准正态分布的密度函数为
(X ) 1 eZ2 2 2
ppt精选版
26
➢ 对上式求积分可得到标准正态变量Z的分布函 数。
➢ 由于积分计算繁琐,统计学家按标准正态分布
的累积概率分布函数(-Z)编制了附表2
(P315),标准正态分布曲线下的面积,由表 可查出曲线下某区间的面积。
20
曲线下的面积的计算
对于任意一个区间的曲线下面积,在知道变 量值x对应的概率密度函数f (x)后,都可以根 据微积分的方法求出其面积的大小
f(x)
F
x
P(a
x
b)
b
a
f
(x)dx
?
x ab
ppt精选版
21
实际工作中,常需要了解正态曲
线下横轴上某一区间的面积占总
面积的百分数,以便估计该区间
的例数占总例数的百分数(频数
概率 29
查附表2时注意事项:
➢ 曲线下横轴上的总面积为100%或1; ➢ 表中曲线下面积为-∞到Z的面积;
➢ 对于服从正态分布的变量x,先进行标准 化变换(Z X ),然后借助标准正态分
布表可得到任意(x1, x2)范围内的面积或频 数比例。
ppt精选版
30
Z1 Z2
图4.7 查表法求标准正态曲线下面积示意图
X<μ范围内曲线下的面积相等,各占50%;
S(X,)=S(-,-X)
S(-,-X)
S(X,)
-X X
X轴
正态分布对称性
ppt精选版
15
二.正态密度函数曲线下的面积规律
卫生统计学 03正态分布
此可作为判断该地区成年女子血清总蛋白含量正常与 否的参考值。
参考值范围的解释
估计得该地成年女子血清总蛋白95%的参考值范围为 65.9-81.1g/L。
此可作为判断该地区成年女子血清总蛋白含量正常与否 的参考值。 就血清总蛋白而言,该范围包括了该地正常成年女子 总人数的95%。
单侧与双侧参考值范围
根据医学专业知识确定!
双侧:白细胞计数,血清总胆固醇, 单侧:上限: 转氨酶,尿铅,发汞 …… 下限: 肺活量,IQ,
正常人与病人的数据分布重叠示意图(单侧)
正常人 假阴性率 病人 假阳性率
正常人与病人的数据分布重叠示意图(单侧)
正常人 假阴性率 病人 假阳性率
正常人与病人的数据分布重叠示意图(双侧)
e
− u2 2
(-∞< u <+∞)Βιβλιοθήκη 正态分布转换为标准正态分布
若 X~N(µ,σ2),作变换: N
u=
X −µ
则u服从标准正态分布。 u称为标准正态离差(standard normal deviation)
σ
标准正态分布曲线下面积Φ(u)
u
-3.0 -2.5 -2.0 -1.9 -1.6 -1.0 -0.5 0 0.00 0.02 0.04 0.06 0.08 0.0013 0.0013 0.0012 0.0011 0.0010 0.0062 0.0059 0.0055 0.0052 0.0049 0.0228 0.0217 0.0207 0.0197 0.0188 0.0287 0.0274 0.0262 0.0250 0.0239 0.0548 0.0526 0.0505 0.0485 0.0465 0.1587 0.1539 0.1492 0.1446 0.1401 0.3085 0.3015 0.2946 0.2877 0.2810 0.5000 0.4920 0.4840 0.4761 0.4681
医学统计学 正态分布及其应用
26/43
为什么要确定一个范围? 既然同属正常人,就不能以甲的数据为标准, 认为乙异常,亦不能以甲此时的数据为标准, 认为彼时的异常。所以必须确定一个波动范 围。如WBC:4000~10000个/mm3 “正常”是一个相对的概念 “正常人”是指排除了影响所研究指标的疾 病和有关因素的人。
27/43
同质 正常 “足够数量” 例数过少,代表性差;例数过多增加成本, 且易导致正常标准把握不严,影响数据的可 靠性。 一般认为每组100例以上 ;有人认为确定临 床生化指标的正常值应取300~500例。
30/43
控制检测误差
通过人员培训、控制检测条件、重复测 定等措施,严格控制检测误差。
(二)主要特征:
1、正态分布以均值μ为中心,左右对称。 2、正态分布中,曲线下面积集中在以均值μ为中心 的中心部分,越远离中心,曲线越接近 X 轴,曲线 下面积越小,超过一定范围以外的面积可以忽略。
8/43
3、正态分布曲线完全由参数μ和σ决定。
μ是位置参数,决定分布曲线在横轴的偏
移位置。
σ是变异参数,决定分布曲线的形态。
71.67
95.00 98.33
68.27
95.00 99.00
25/43
参考值范围
(reference interval)
又称正常值范围(normal range) 正常人的形态、功能、生化等各种指标的波 动范围。简称正常值。 为什么波动? “个体变异” 同一指标的数据因人而异 同一个体的数据随环境、时间等改变而变
9/43
方差相等、均数不等的正态分布图示
2 1 3
3
1
2
10/43
均数相等、方差不等的正态分布图示
第三章 正态分布及其应用
二、标准正态分布
正态分布是一个分布族,对应于不同的参数 和 会产生不同位置、不同形状的正态 分布,为了应用方便,我们将正态分布转化成标准正态分布。
u x
f (X )
1
(x )
2
2
e
2
2
, X
ห้องสมุดไป่ตู้
(u )
1 2
u
2
e
2
, u
由频数分布表可知尿汞值呈偏态分布,且尿汞值仅 以过高为异常(单侧) ,所以采用百分位数法计算 上侧界值即求第 95 百分位数 P95。 公式: P
X
L
i fx
(n x%
8 .0 11
fL )
PX 4 0 .0
( 2 8 2 9 5 % 2 6 3 ) 4 3 .6 ( / L )
正 态 分 布
正态分布是医学和生物学中最常见,也是最重要的一种连续性分布,如正常人的 身高,体重,红细胞数,血红蛋白等。我们可以从频数表和频数图对正态分布进行研 究。 120 名正常成年男子红细胞计数的频数表(×1012/L)
组段(1) 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~ 5.90~6.20 合计 频数(2) 2 5 10 19 23 24 21 11 4 1 120 频率(%) (3) 1.7 4.2 8.3 15.8 19.2 20.0 17.5 9.2 3.3 0.8 100.0 累计频数(4) 2 7 17 36 59 83 104 115 119 120 累计频率(%)(5) 1.7 5.9 14.2 30.0 49.2 69.2 86.7 95.9 99.2 100.0
03正态分布与医学参考值范围(医学统计学)
σ 是形状参数,决定着正态曲线的分布形状
正态曲线下的面积分布有一定的规律
图3-3
图3-4
方差相等、均数不等的正态分布图示
2 1 3
3 1 2
正态方程的积分式(分布函数):
F(X)为正态变量X的累计分布函数,反映正态曲线 下,横轴尺度自-∞到X的面积,即下侧累积面积 。
Normal distribution
图3-5
图3-6
正态分布是一种对称分布,其对称轴为直线X=µ,即均 数位置,理论上:
µ±1σ范围内曲线下的面积占总面积的68.27% µ±1.96σ范围内曲线下的面积占总面积的95% µ±2.58σ范围内曲线下的面积占总面积的99% 实际应用中:
±1 S范围内曲线下的面积占总面积的68.27% ±1.96 S范围内曲线下的面积占总面积的95% ±2.58 S范围内曲线下的面积占总面积的99%
属异常,采用双侧界值;有些指标仅过大或者过 小为异常,采用单侧界值。
肺活量参考值范围
白细胞数参考值范围
血铅参考值范围
5. 选择适当的百分数范围 结合专业知识,根据研究目的、研究指标的性质、
数据分布特征等情况综合考虑。百分数范围的不同 将导致不同的假阳性率和假阴性率。
6. 选择计算参考值范围的方法
异常
正常
异常
异常
正常
双侧下限
双侧上限
单侧下限
正常
异常
单侧上限
例3-3 已知某地140名正常成年男子红细胞计数近似服 从正态分布, X =4.78×1012/L,S =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。
X z0.05 2S 4.78 1.960.38 4.04 , 5.52
正态曲线下的面积分布有一定的规律
图3-3
图3-4
方差相等、均数不等的正态分布图示
2 1 3
3 1 2
正态方程的积分式(分布函数):
F(X)为正态变量X的累计分布函数,反映正态曲线 下,横轴尺度自-∞到X的面积,即下侧累积面积 。
Normal distribution
图3-5
图3-6
正态分布是一种对称分布,其对称轴为直线X=µ,即均 数位置,理论上:
µ±1σ范围内曲线下的面积占总面积的68.27% µ±1.96σ范围内曲线下的面积占总面积的95% µ±2.58σ范围内曲线下的面积占总面积的99% 实际应用中:
±1 S范围内曲线下的面积占总面积的68.27% ±1.96 S范围内曲线下的面积占总面积的95% ±2.58 S范围内曲线下的面积占总面积的99%
属异常,采用双侧界值;有些指标仅过大或者过 小为异常,采用单侧界值。
肺活量参考值范围
白细胞数参考值范围
血铅参考值范围
5. 选择适当的百分数范围 结合专业知识,根据研究目的、研究指标的性质、
数据分布特征等情况综合考虑。百分数范围的不同 将导致不同的假阳性率和假阴性率。
6. 选择计算参考值范围的方法
异常
正常
异常
异常
正常
双侧下限
双侧上限
单侧下限
正常
异常
单侧上限
例3-3 已知某地140名正常成年男子红细胞计数近似服 从正态分布, X =4.78×1012/L,S =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。
X z0.05 2S 4.78 1.960.38 4.04 , 5.52
医学统计学3. 正态分布及应用
例习题3-1题
130名健康成年男子脉搏资料的均数、标准差分 别为:71.32与5.80 (次/分);问在正态分布假定下, 脉搏在65~75(次/分)之间有多少人?
Z1
65
71.32 5.80
1.09,该界值左侧面积为0.1379
Z2
75
71.32 5.80
0.63,该界值左侧面积为0.7357
肺活量参考 值范围
白细胞数参 血铅参考值范
考值范围
围
5. 选择适当的百分数范围 结合专业知识,根据研究目的、研究指标的性质、 数据分布特征等情况综合考虑。百分数范围的不同 将导致不同的假阳性率和假阴性率。
6. 选择计算参考值范围的方法 根据资料的分布类型,样本含量的多少和研究目 的等,选用适当的方法确定参考值范围。
过低异常 过高异常
过低异常过高异常
表 3-1 医学参考值范围的正态分布法和百分位数法计算公式
概率 (%) 双侧
正态分布法
单侧
下限
上限
百分位数法
双侧
单侧 下限 上限
90 X 1.64S X 1.28S X 1.28S
P5 ~ P95
P10
P90
95 X 1.96S X 1.64S X 1.64S
P2.5~P97.5 P5
Z=0.43,所对应左侧的面积 P=1-0.3336
Standard normal distribution 图3-7
0.07
f(X)
0.06
0.05
0.04
0.03
0.02
0.01
0 57 60 63 66 69 X 72 75 78 81 84
P(65 x 75) (0.43) (1)
《医学统计学》正态分布与医学参考值范围课件
正态分布还可以用于评估数据 的分布情况,以及异常值的识 别和处理。
正态分布在医学研究中广泛应 用于统计分析,如描述性统计 、参数估计和假设检验等。
医学参考值范围的局限性
医学参考值范围是基于一定样本量和 特定人群特征确定的,因此其适用范 围有限,可能不适用于特殊人群或不 同地区和族裔的人群。
医学参考值范围仅适用于单个生理指 标的评估,对于多个指标的综合评估 需要更多的专业知识和临床判断。
医学参考值范围的使用方法
1 2 3
判断个体指标是否异常
通过将个体指标值与医学参考值范围进行比较, 可以判断个体指标是否异常。
辅助临床诊断
医生可以根据个体指标的异常程度,结合患者的 临床表现和其他检查结果,进行综合判断,提高 诊断的准确性和可靠性。
监测治疗效果
通过监测治疗效果,可以及时调整治疗方案,提 高治疗效果。
案例二
总结词
胆固醇水平呈正态分布,医学参考值范围为3.1-5.2mmol/L。
详细描述
总胆固醇水平在正常范围内时,其分布也接近正态分布。医学上通常根据总胆固醇水平来判断个体心 血管疾病的患病风险。正常的总胆固醇水平参考值为3.1-5.2mmol/L。若总胆固醇水平超过 5.2mmol/L,则可能增加患心血管疾病的风险。
《医学统计学》正态分布与 医学参考值范围课件
汇报人: 2023-12-24
目录
• 正态分布概述 • 正态分布与医学参考值范围的
关系 • 正态分布的检验方法 • 医学参考值范围的解读与使用 • 案例分析
01
正态分布概述
正态分布的定义
01
正态分布是一种概率分布,其概 率密度函数呈钟形,对称分布于 均值(μ)周围。
P-P图法
正态分布及其应用
正态分布及其应用
正态分布(也被称为高斯分布)是概率统计学中常见的一种连续型概率分布。
正态分布的概率密度函数具有钟形曲线的特征,它由两个参数决定:均值μ和方差σ²。
正态分布在许多实际问题中具有广泛的应用。
以下是一些常见的应用:
1. 自然科学研究:正态分布被广泛用于描述许多自然现象,如测量误差、实验数据分布等。
2. 金融领域:正态分布被用于描述许多金融指标的变动,如股票价格、债券收益率等。
投资者可以利用正态分布进行风险管理和投资决策。
3. 质量控制:正态分布被应用于质量控制,例如在制造业中检测产品的质量是否合格。
4. 医学研究:正态分布经常用于研究人群的生理指标或疾病的发病率,如身高、体重、血压等。
5. 教育测量:正态分布可应用于评估学生的考试成绩、能力水平等。
6. 数据分析:正态分布常用于数据分析和拟合,在假设检验、参数估计和统计推断等方面被广泛使用。
总之,正态分布在许多领域中都有广泛的应用,特别是在统计学和概率论中被广泛研究和应用。
医学统计学第3讲正态分布
正态分布的标准化
1
Z-分数
2
通过计算标准差的倍数来表示某个观测
值相对于均值的位置。
3
标准化公式
将非标准正态分布转化为标准正态分布, 使得均值为0,标准差为1。
标准正态分布表
通过查表可以得到标准正态分布下的累 积概率、百分位数等信息态分布用于描述人群中的身高 分布,帮助我们了解平均身高、 身高偏差等统计特征。
考试成绩
正态分布可以帮助我们分析考试 成绩,确定合理的分数划分和评 估标准。
药物疗效
正态分布在医药领域中应用广泛, 如药物疗效的评估和剂量的确定。
正态分布与置信区间
置信区间的计算
使用正态分布的特性来估计样本均值的真实范围,提供统计推断的依据。
置信水平
置信区间的可信程度,常用的置信水平有95%和99%。
医学统计学第3讲:正态分布
探索正态分布的特征、应用和优缺点以及在医学研究中的重要性。让我们一 起开始这个令人兴奋的主题!
什么是正态分布?
正态分布是一种连续概率分布,常用于描述自然界中的许多现象,如身高、 体重等。其特征是钟形曲线,均值和标准差能够完全定义分布。
正态分布的形状和密度曲线
正态分布的密度曲线呈现出典型的钟形形状,其峰值出现在均值处。均值、标准差和曲线的形态密切相关,构 成了正态分布的基本特征。
标准误差是测量样本均值与总体均值之间的差异的指标,用于衡量样本均值的精确性。
正态分布在线性回归中的应用
正态分布在线性回归模型中的误差项满足正态分布的假设,确保回归结果的 准确性和可信度。
样本大小
影响置信区间的宽度,样本大小越大,置信区间越窄。
正态分布与假设检验
1
零假设与备择假设
医学统计学第3讲正态分布
86
146
百分
35.98326
61.08787
194 位数法 81.17155 212 实例 88.70293 228 234 95.39749 97.90795 98.32636
17~
19~21
111 2 239 0 95% 212 1 12.88 μ 235 P95 mol/kg 16 1 0 1 236 2 120 1 119 3 239 239 -
制定参考值范围
参考值范围又称正常值范围,医学上是指 绝大多数正常人的某指标值所在的范围。 参考值范围的意义
划分正异常
制定步骤
1. 2. 3. 4. 5. 6. 从“正常人”总体中抽样:明确研究总体 控制检测误差 判断是否需要分组(如性别、年龄)确定 根据专业知识决定单侧还是双侧 选择百分界值 确定可疑范围
单侧上限---过高异常 双侧---过高、过低均异常
单侧下限---过低异常
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性 病人 假阳性
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性率 病人 假阳性率
正常人与病人的数据分布重叠示意图(双侧)
N(, 2)
N(0,1)
0.6 0.5
f (X )
N (1,0.8 )
2
0.4 0.3 0.2 0.1 0
N (0,1 )
N (1,1.2 )
2
2
-4
-3
-2
-1
0
1
[医学]第三章 统计学正态分布及其应用(医学统计学)
(一)医学参考值范围意义: 医学参考值范围(亦称为正常值
范围)是指正常人的解剖、生理、生 化等各种指标的波动范围。它主要用 于划分正常与异常的界限。
(二)医学参考值范围制定的一般原则:
1、抽取足够数量的“正常人”作为调查对象
2、对选定的正常人进行统一而准确的测定
3、考虑是否应按性别、年龄、职业等因素分组确定 医学参考值范围 4、确定取单侧还是双侧医学参考值范围 5、选定适当的百分界限 6、选择适当制定方法
=0.1392=13.92%
即身高界于116.5-119.0cm范围内 的7岁男童比例为13.92%,其人数 为110×13.92%=15(人)。
第三节 正态分布的应用
一、估计频数分布 二、制定参考值范围 三、质量控制 四、统计处理方法的基础
一、估计频数分布
例3.3 例3.4 (略)
二、制定参考值范围
第三章 统计学正
态分布及其应用 (医学统计学)
卫生统计学
第三章 正态分布及其应用
第一节、正态分布的概念及特征
一、正态分布图形 两头低,中间高,左右对称,呈钟
型的单峰曲线。
正态分布特征
1、曲线在横轴上方均数处最高; 2、以均数为中心,左右对称; 3、正态分布有两个参数:
位置参数μ 、形状参数σ 4、正态分布曲线下的面积有一定的分布 规律。
正态分布是一个分布族。对应于不 同的参数μ和σ会产生不同位置不同形状 的正态分布。
为了应用方便,令
ux
u变换
标准正态 分布
u服从均数为0、标准差为1的正态分布
-1.0 2.5%
-1.96
68.27%
+1.0 95.00% 2.5%
+1.96
范围)是指正常人的解剖、生理、生 化等各种指标的波动范围。它主要用 于划分正常与异常的界限。
(二)医学参考值范围制定的一般原则:
1、抽取足够数量的“正常人”作为调查对象
2、对选定的正常人进行统一而准确的测定
3、考虑是否应按性别、年龄、职业等因素分组确定 医学参考值范围 4、确定取单侧还是双侧医学参考值范围 5、选定适当的百分界限 6、选择适当制定方法
=0.1392=13.92%
即身高界于116.5-119.0cm范围内 的7岁男童比例为13.92%,其人数 为110×13.92%=15(人)。
第三节 正态分布的应用
一、估计频数分布 二、制定参考值范围 三、质量控制 四、统计处理方法的基础
一、估计频数分布
例3.3 例3.4 (略)
二、制定参考值范围
第三章 统计学正
态分布及其应用 (医学统计学)
卫生统计学
第三章 正态分布及其应用
第一节、正态分布的概念及特征
一、正态分布图形 两头低,中间高,左右对称,呈钟
型的单峰曲线。
正态分布特征
1、曲线在横轴上方均数处最高; 2、以均数为中心,左右对称; 3、正态分布有两个参数:
位置参数μ 、形状参数σ 4、正态分布曲线下的面积有一定的分布 规律。
正态分布是一个分布族。对应于不 同的参数μ和σ会产生不同位置不同形状 的正态分布。
为了应用方便,令
ux
u变换
标准正态 分布
u服从均数为0、标准差为1的正态分布
-1.0 2.5%
-1.96
68.27%
+1.0 95.00% 2.5%
+1.96
医学统计学(课件)正态分布
CV舒张压
10.7 100% 77.5
13.8%
17.1
CV收缩压
100% 122.9
13.9%
第三章 正态分布及应用
一、正态分布(Normal Distribution)
f (X) 1.2 1
0.8
f (X) 1.2 1
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
3.8 4.2 4.6 5.0 5.4 5.8 X
异常
正常
异常
单侧上限
双侧下限 双侧上限
单侧上限---过高异常 双侧---过高、过低均异常
(b)24小时尿糖参考值范围 (c)白细胞数参考值范围
(五)选择适当的百分范围
参考值的百分范围应根据资料的性质和研究目的选 择,它与诊断阈值有确定的关系。百分范围的不同将导 致不同的假阳性率和假阴性率。
图3-6 正常人和病人数据分布重叠
图3-2 正态分布曲线下的面积
1 2
3
-4 -3 -2 -1 01 1 22 3 43 5 6 7
1 2 3
图3-3 三种不同均值的正态分布
-5 -4 -3 -2 -1 0 1 2 3 4 5
1 2 3 图3-4 三种不同标准差的正态分布
0.6
f (X )
0.5
上限: X 1.96S 4.78 1.96 0.38 5.52(1012 / L)
例3.5 见第二章表2-4资料。为该地区50岁~60岁女性高 血脂诊断与治疗提供参考依据,试估计血清甘油三脂含量的 95%单侧参考值范围。
(630 0.95 580)
P 1.90
医学统计学.正态分布及其应用
双侧界值: X ZS X Z S 单侧上界:X Z S ;单侧下界:
对数正态分布法:
适用于对数正态分布资料
双侧界值: lg
1
( X lg x Z S lg x )
百分位数法:
常用于偏态分布资料 双侧界值: P2.5和P97.5;单侧上界: P95;或单侧下界: P5
例4.22 已知z1=-1.20,z2=1.60,欲求标准正 态下(-1.20 , 1.60)范围的面积。
查表φ(-1.20)=0.1151 ; φ(1.60)=1-0.0548=0.9452
则 D=φ(1.60)-φ(-1.20)=0.8301
曲线下面积分布规律
标准正态分布 -1~1 -1.64-1.64 -1.96~1.96 -2.58~2.58
生不同位置、不同形状正态分布, (x1,x2)范围内的面积也不同, 计算起来很麻烦。
22
三、标准正态分布 为了计算方便,对于正态或近似正态 分布的资料,只要得出均数和标准 差,可通过标准转化,转化成求标 准正态曲线下横轴自-∞到z的面积。 为了便于应用,统计学家按Φ(z)编 制了标准正态分布曲线下的面积表, 由此表可查出曲线下某区间的面积, 这样就可对符合正态分布资料的频 数分布作出估计。
1 f (X ) e 2
( X )2 2 2
-∞<X<+∞
则称X服从正态分布,记作x~N(, 2)
正态分布的参数 :μ为总体均数,σ为总体标准差, 固定常数: π为圆周率,e为自然对数的底变量:X
11
2.正态分布的特征
图形特点:
1. 钟型、均数处最高 f(X)
2. 均数为中心的左右对称
又称正常值范围(normal range)
对数正态分布法:
适用于对数正态分布资料
双侧界值: lg
1
( X lg x Z S lg x )
百分位数法:
常用于偏态分布资料 双侧界值: P2.5和P97.5;单侧上界: P95;或单侧下界: P5
例4.22 已知z1=-1.20,z2=1.60,欲求标准正 态下(-1.20 , 1.60)范围的面积。
查表φ(-1.20)=0.1151 ; φ(1.60)=1-0.0548=0.9452
则 D=φ(1.60)-φ(-1.20)=0.8301
曲线下面积分布规律
标准正态分布 -1~1 -1.64-1.64 -1.96~1.96 -2.58~2.58
生不同位置、不同形状正态分布, (x1,x2)范围内的面积也不同, 计算起来很麻烦。
22
三、标准正态分布 为了计算方便,对于正态或近似正态 分布的资料,只要得出均数和标准 差,可通过标准转化,转化成求标 准正态曲线下横轴自-∞到z的面积。 为了便于应用,统计学家按Φ(z)编 制了标准正态分布曲线下的面积表, 由此表可查出曲线下某区间的面积, 这样就可对符合正态分布资料的频 数分布作出估计。
1 f (X ) e 2
( X )2 2 2
-∞<X<+∞
则称X服从正态分布,记作x~N(, 2)
正态分布的参数 :μ为总体均数,σ为总体标准差, 固定常数: π为圆周率,e为自然对数的底变量:X
11
2.正态分布的特征
图形特点:
1. 钟型、均数处最高 f(X)
2. 均数为中心的左右对称
又称正常值范围(normal range)
医学统计学正态分布及其应用
0.00 -0.02 -0.04 -0.06 -0.08 0.0013 0.0013 0.0012 0.0011 0.0010 0.0062 0.0059 0.0055 0.0052 0.0049 0.0228 0.0217 0.0207 0.0197 0.0188 0.0287 0.0274 0.0262 0.0250 0.0239 0.0548 0.0526 0.0505 0.0485 0.0465 0.1587 0.1539 0.1492 0.1446 0.1401 0.3085 0.3015 0.2946 0.2877 0.2810 0.5000 0.4920 0.4840 0.4761 0.4681
35
估计频数分布
首先计算标准离差:
u 132.00 142.67 1.78 6.00
查标准正态分布表: (-1.78)=0.0375(3.75%)
结果:该地12岁男童身高在132cm以下者, 估计约占3.75%。
36
估计频数分布
X us
X ±1.00s X ±1.96s X ±2.58s
表 2.7 120 名 12 岁男童身高的分布比较
身高范围(cm)
实际分布
人数
百分数(%)
136.67~148.67
86
71.67
130.91~154.43
114
95.00
127.19~158.15
118
98.33
理论分布(%)
68.27 95.00 99.00
37
质量控制
质量控制的意义
监控日常工作、科研过程、生产过程中误差的 变化,分析变化的趋势是否出现异常,从而引 起警觉和注意,以便分析原因,并及时采取措 施。
医学统计学3正态
标准正态分布
• 标准正态分布(standard normal distribution)是 均数为0,标准差为1的正态分布。 • 记为N(0,1)。 • 标准正态分布是一条曲线。 • 概率密度函数:
( u)
1 2
e
u2 2
(-∞< u <+∞)
正态分布的应用
• 估计频数分布
• 确定临床参考值范围
1.96σ的面积为
A. 95%
B. 45%
C. 97.5% D. 47.5% E. 不能确定(与标准差的大小有关)
E 6.正态分布N(μ,σ),当μ恒定时,σ
越大,则
A.曲线沿横轴越向右移动 B.曲线沿横轴越向左移动 C.曲线形状和位置都不变 D.观察值变异程度越小,曲线越“瘦”
E.观察值变异程度越大,曲线越“胖”
E、以上都不是。
A
4、要评价某市一名8岁女孩的身高是否偏高或偏矮,
应选用的统计方法是:
A、用该市8岁女孩身高的95%或99%正常值范围来
评价;
B、作身高差别的假设检验来评价;
C、用身高均数的95%或99%的可信区间来评价;
DD 5.正态曲线下、横轴上,从均数μ到μ+
例:
• 已知某地140名正常成年男子红细胞计数近似服 从正态分布,均数=4.78×1012/L, S=0.38×1012/L
• 试估计: 1,该地正常成年男子红细胞计数在4.0×1012/L以下 者占该地正常成年男子总数的百分比; 2,红细胞计数在4.0×1012/L~5.5×1012/L者占该 地正常男子总数的百分比。
第三章
正态分布normal distribution 医学参考值范围
主要内容(Content)
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态曲线下面积分布规律
正态分布 μ±σ μ±1.96σ μ±2.58σ
面积或概率 68.27% 95.00% 99.00%
标准正态分布的意义
标准正态曲线下面积分布有规律,统计 学家将曲线下所有的U值对应的的面积全部计 算出来,并做成一个表,叫“标准正态分布 表”,供查用。见P261附表1。
借助于“标准正态分布表”,任何正态 分布都可以进行正态变换,计算出曲线任意 两个变量值之间的面积。
(一)估计频数分布
例题2.20 某项研究显示,某地婴儿出生体重均数 为3100g,标准差为300g,试估计该地当年出生低体 重儿(≤2500g)所占比例。
解:已知婴儿出生体重服从正态分布。记做变
量X, 则当X ≤2500时,其对应于标准正态分布的u
值为:
u X m 2500 3100 2.00
300
查表得:Φ (-2.00)=0.0228=2.28%,即该地当 年低体重出生儿的比例为2.28%
(二)制订医学参考值范围
定义:指包括绝大多数正常人的人体形态、功能 和代谢等各种生理生化指标的波动范围,也可以 看作是常数,又称“正常值”
曲线下面积
0.5
-∞
f(X)
0.4
u 0.3
(u)
1
u
u 2
e 2 du
2
0.2
附表1(P261)
0.1
就是根据此公式
和图形制定的 0.0
-4 -3 -2 -1 0 1 2 3 4
X
F(X)
1
2
X
( X m)2
e
2( 2 )dX
正态曲线下面积
标准正态曲线下面积分布规律
f ( X )称为概率密度函数(probabilit y density function )
以f ( X )为纵坐标,X为横坐标,绘制的曲线就是
正态曲线(normal curve )
分析三条正态曲线的共同特征:
①均数处最高 (一个最高点) ②左右对称(一个对称轴x=µ)
观察以上三条正态曲线,归纳出正态曲线的性质
正态分布
正态分布是应用最 广德泛莫的佛一最种早连发续现型了分二布项. 概 率的一个近似公式,这一公式 被认为是正态分布的首次露面.
德莫佛
正态分布在十九世纪前叶由 高斯加以推广,所以通常称为高 斯分布.
高斯
正态分布(normal distribution)也 叫高斯分布(Gaussian distribution), 是最常见、最重要的一种连续型分布。
例题2.18:已知u1=-1.2,u2=1.6, 求标准正态曲线下(-1.2,1.6)范围内的面 积。
请同学们不看书,自己试做一下。 题目有什么不同,如何解决?
例题2.19:已知120名5岁女孩身高X=110.15, S=5.86,现欲估计该市城区某年身高界于 104.0~108.0cm范围内的5岁女孩所占比例和人 数。
因为医学卫生领域中,有许多变量为连 续的随机变量,并呈现正态分布。如,身高 、体重,血压。
(二)、正态分布的特征
正态分布曲线的密度函数:
f (X)
1
2
exp
(
X
2
m
2
)2
,
X
=3.14159,exp 是以2.72818为底的自然对数指数
X ~ N (m, 2 ), m为X的总体均数,为总体标准差
近.
0.6
0.5
曲线1
0.4
曲线2
0.3
曲线3
0.2
0.1
0.0
0
1
234Fra bibliotek56
三条不同μ和σ的正态分布曲线
当σ相同时,正态分布曲线的位置由μ来决定.
σ为正态曲线的形态参数
③正态分布有两个参数,一个正态分布
可以表示为N(µ,σ2)
④正态曲线下面的面积分布有一定规律
二、标准正态分布
经标准正态变量u变换:一般正态分布 N (m, 2 )被变为
标准正态分布N (0,1); 即令u X m
f (u)
1
2
exp
u2 2
,
f(X)
X
X
a
mσ
标准正态分布 (standard normal distribution) 的两个参数为:μ=0,σ=1 记为 N(0,1)
一般正态分布为一个分布族:N(m,2) ;标准 正态分布只有一个 N(0,1) ;这样简化了便 于应用 。
解:第一步,将该分布进行标准正态变换,以样本均数和 标准差代替总体均数和标准差,进行U变换。
U1=(104.0-110.15)/5.86 =-1.05 , U2=(108.0-110.15)/5.86 =-0.37
第二步,查附表1得: Ф (u1)=0.1469 ,Ф (u2)=0.3557
D=0.3557-0.1469=0.2088
①当曲线m 一在定x轴时的,上曲方线,的与形x状轴由不相确交定.. 越大,曲线越“矮 胖示”总②,曲表线示关总于体直的线分布x 越 m分对散称;,且越在小x,曲m时线位越于“最瘦高高点”.,表
体的③分当布时越x集中m.,曲线上升;当时 x m,曲线下降.并且当
曲线向左µ、为右正两态边无曲限线延的伸时位,置以参x轴数为渐近线,向它无限靠
f=120×0.2088=25(人)
三、正态分布的应用
正态分布是一种重要的分布,它是许多统计处理 方法的基础。对于服从正态分布或近似正态分布或对 数正态分布的资料,都可以借助于正态分布的规律来 解决问题。其在医药卫生领域的应用有以下方面: (一)估计频数分布 (二)制定医学参考值范围 (三)质量控制 (四)作为许多统计方法的基础
例题2.17:已知u1=-1.76,u2=-0.25, 求标准正态曲线下(-1.76,-0.25)范围内 的面积。
解:查附表1,得; Φ(u1)=0.0392,同理,Φ(u2)=0.4013, 则(-1.76,-0.25)范围内的面积为 D= Φ(u2)-Φ(u1)=0.4013-0.0392=0.3621
正态分布及其应用
一、正态分布的概念和特征
(一)、正态分布的概念和图形
频 数 f(x)
5岁女孩身高的直方图
身高x(cm)
频 数 f(x)
5岁女孩身高的直方图
身高X(cm)
频数
ab
组段
频 数 f(x)
5岁女孩身高的频数分布曲线
身高x(cm)
f(X)
X
m
正态分布以均数为中心,左右两侧对称, 靠近均数两侧的频数较多,而距均数两侧较远 处,频数逐渐减少,形成的钟形分布。