祝晓明《医学统计学》医统-第三章正态分布与医学参考值范围
合集下载
03-医学统计学正态分布与医学参考值范围
1
ze
z2 2
dz
( X
)
2
标准正态分布的应用
实际应用中,经z变换可把求解任意一个正态分布曲线 下面积的问题,转化成标准正态分布曲线下相应面积的 问题。
欲求服从标准正态分布的随机变量在区间(-∞, z)(z≤0) 上曲线下的面积,可直接查表;对(z>0) 可根据对称性 算得,计算公式为:
正态分布的应用
• 制定医学参考值范围 • 质量控制 • 正态分布是很多统计方法的理论基础
医学参考值范围
概述
医学参考值范围(reference value range),指正常人 的解剖、生理、生化、免疫及组织代谢产物的含量等 各种数据的波动范围。
医学参考值范围,习惯上是包含95%的参照总体的 范围。
卫生部“十二五”规划教材
医学统计学
正态分布与医学参考值范围
正态分布
概述
正态分布(normal distribution),是 一种连续型随机变量常见而重要的分 布。
它首先由莫阿弗尔于1733年提出。 之后高斯对其进一步研究,使正态分 布广为人知。
A. de Moivre
Gauss
正态曲线 正态曲线(normal curve),是一条高峰位于中央,两侧逐 渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。
Φ(z) =1-Φ( -z ) z在区间( z1, z2 )取值概率的计算公式为:
P(z1<z<z2 ) = Φ(z2)- Φ(z1)
【例】由160名7岁男孩身高测量的数据算得样本均数为 122.6cm、样本标准差为4.8cm。已知身高数据服从正态分布, 试估计该地当年7岁男孩身高介于119cm到125cm范围所占的 比例。
正态分布与医学参考值范围
确定医学参考值范围的意义
1. 基于临床实践,从个体角度, 作为临床上判定正常与异常的 参考标准,即用于划分界限或 分类。
2. 基于预防医学实践,从人群角 度,可用来评价儿童的发育水 平,如制订不同年龄、性别儿 童某项发育指标的等级标准。
确定95%参考值范围示意图
二、制订医学参考值范围的注意事项
1. 确定同质的参照总体 一般选择“正常”人,主要是排除了对研究指标
例3-1 若X~
,试计算X 取值在区间
上的概率。
Standard normal distribution
例3-2 已知某地140名正常成年男子红细胞计数近似 服从正态分布, =4.78×1012/L, =0.38×1012/L。 ①该地正常成年男子红细胞计数在4.0×1012/L以下 者占该地正常成年男子总数的百分比;
服从正态分布, =4.78×1012/L, =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。 近似正态分布资料可按正态分布法处理,因红细胞 计数值过大或过小均为异常,故应估计双侧95%参 考值范围:
即该地正常成年男子红细胞计数的95%参考值范围 为4.04×1012/L~5.52×1012/L。
查附表1
,表明该地成年男子红
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
正常成年男子总数的百分比
=
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占 该地正常成年男子总数的95.04%。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
1. 基于临床实践,从个体角度, 作为临床上判定正常与异常的 参考标准,即用于划分界限或 分类。
2. 基于预防医学实践,从人群角 度,可用来评价儿童的发育水 平,如制订不同年龄、性别儿 童某项发育指标的等级标准。
确定95%参考值范围示意图
二、制订医学参考值范围的注意事项
1. 确定同质的参照总体 一般选择“正常”人,主要是排除了对研究指标
例3-1 若X~
,试计算X 取值在区间
上的概率。
Standard normal distribution
例3-2 已知某地140名正常成年男子红细胞计数近似 服从正态分布, =4.78×1012/L, =0.38×1012/L。 ①该地正常成年男子红细胞计数在4.0×1012/L以下 者占该地正常成年男子总数的百分比;
服从正态分布, =4.78×1012/L, =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。 近似正态分布资料可按正态分布法处理,因红细胞 计数值过大或过小均为异常,故应估计双侧95%参 考值范围:
即该地正常成年男子红细胞计数的95%参考值范围 为4.04×1012/L~5.52×1012/L。
查附表1
,表明该地成年男子红
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
正常成年男子总数的百分比
=
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占 该地正常成年男子总数的95.04%。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
医学统计学正态分布及参考值范围
u~N(0,1)
( ) ( ) ②改变形状: ( 1.96) 使标准差由σ变为 1——“x–μ/ σ” 68.27%
95% 100% 99%
0
u
-2.58 -1.96 -1
1
1.96 2.58
标准正态分布表
标准正态分布曲线下的面积可以通过查标准正 态分布表得到
估计方法
正态分布法 百分位数法
正态分布法 应用条件 :正态分布或近似正态分布资料
正态分布法制定医学参考值
参考值范围 (%) 双侧 只有下限 90 95 99 μ±1.64σ μ±1.96σ μ±2.58σ μ-1.28σ μ-1.64σ μ-2.33σ 单侧 只有上限 μ+1.28σ μ+1.64σ μ+2.33σ
人数
20 15 10 5 0
3.7
4.1
4.5
4.9
5.3
5.7
红细胞数(1012/L)
顶端逐渐接近一 条光滑的曲线
1.2 1
概率密度
0.8 0.6 0.4 0.2 0 3.5 4 4.5 5 5.5 6
人数
5.7
红细胞数(1012/L)
红细胞数(1012/L)
正态分布曲线
中间高
正态分布曲线X 的取值是连续的
实际应用中,常用样本均数X 及样本标准差S来代替μ和σ 。
百分位数法
应用条件 :
参考值范围 (%) 90
Байду номын сангаас
偏态分布资料
双侧 只有下限 P5~P95 P10 单侧 只有上限 P90
95
P2.5~P97.5
P5
P95
99
第三章 正态分布与参考值范围
(一)、正态分布的概率密度函数
f (X)
1
2
exp
(
X
2
2
)2
,
X
=3.14159,exp 是以2.72818为底的自然对数指数
X ~ N (, 2 ), 为X的总体均数,为总体标准差
f ( X )称为概率密度函数(probabilit y density function )
童的发育水平
正常人的手指血流
呈黃藍色 (perfusion unit約215)
參考值:PU>150
手指潰爛之病人血流 呈紫灰藍色
(PU約为19)
Help us to judge whether someone is sick .
Index abnormal
?
sick or unhealthiness
正态分布的应用
• 深入统计描述和推断的基础 计算参考值范围的基础 计算可信区间的基础 进行假设检验的基础
• 质量控制图 • 二项分布、Poisson分布的正态分布
近似
第二节 医学参考值范围
• 由于存在个体变异,来自正常人群的 生理、生化指标在不同个体之间存在 着差异,即使是同一个个体,某些指 标也会因时间、空间的改变而有一定 程度的波动。
• 因此,很有必要制定一个正常人群的 参考值范围以判断某个个体某项指标 正常与否。
一、医学参考值范围的概念
• 又称参考值范围(reference range), 是指“正常”人的解剖,生理、生 化等数据大多数个体值的波动范围。
• 常用95%的参考值范围
The Purpose of the Reference Range
3章 正态分布与医学参考值范围
在4-5.5范围内所占的比例。(教材22页)
25
y
0 .2 .4 .6 .8 1
3 4 5 x
5.5
6 7 26
5.5 4.78 4 4.78 P(4.00 X 5.50) ( ) ( ) 0.38 0.38 [1 ( 1.89)] ( 2.05) (1 0.0294) 0.0202 0.9504
该曲线的函数表达式 f(x) 称为正态分布密度函数
(probability density function,PDF)。
5
X
1 f (X ) e 2
( X )2 2 2
习惯上用N(μ,σ2)表示均数为μ, 标准差为σ的正态分布。
6
.08
.02
.04
.06
30
(二)选择足够例数的参照样本
通常情况下,确定参考值范围需要大样本,如果例 数过少,确定的参考值范围往往不够准确。 参照样本含量的确定没有统一的规则,一般认为至 少应在120例以上。
(三)控制检测误差
为保证原始数据可靠,检测过程中要严格控制随机 误差,避免系统误差和过失误差。
31
(四)选择单、双侧界值
单侧下限---过低异常 过低均异常 单侧上限---过高异常 双侧---过高、
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
如肺活量
如尿铅值
如体重
32
(五)选择适当的百分数范围
结合专业知识,根据研究目的、研究指标的性质、 数据分布特征等情况综合考虑。百分数范围的不 同将导致不同的假阳性率和假阴性率。 最常用的百分界限是95%,也可以选80%、90%、 99%等。
25
y
0 .2 .4 .6 .8 1
3 4 5 x
5.5
6 7 26
5.5 4.78 4 4.78 P(4.00 X 5.50) ( ) ( ) 0.38 0.38 [1 ( 1.89)] ( 2.05) (1 0.0294) 0.0202 0.9504
该曲线的函数表达式 f(x) 称为正态分布密度函数
(probability density function,PDF)。
5
X
1 f (X ) e 2
( X )2 2 2
习惯上用N(μ,σ2)表示均数为μ, 标准差为σ的正态分布。
6
.08
.02
.04
.06
30
(二)选择足够例数的参照样本
通常情况下,确定参考值范围需要大样本,如果例 数过少,确定的参考值范围往往不够准确。 参照样本含量的确定没有统一的规则,一般认为至 少应在120例以上。
(三)控制检测误差
为保证原始数据可靠,检测过程中要严格控制随机 误差,避免系统误差和过失误差。
31
(四)选择单、双侧界值
单侧下限---过低异常 过低均异常 单侧上限---过高异常 双侧---过高、
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
如肺活量
如尿铅值
如体重
32
(五)选择适当的百分数范围
结合专业知识,根据研究目的、研究指标的性质、 数据分布特征等情况综合考虑。百分数范围的不 同将导致不同的假阳性率和假阴性率。 最常用的百分界限是95%,也可以选80%、90%、 99%等。
03正态分布与医学参考值范围 (1)
根据经验已知正常成年人的血铅含量近似对数正 态分布,因此首先对原始数据作对数变换,经正 态性检验可知对数值服从正态分布(P>0.50), 故编制对数值频数表,再利用正态分布法求95% 参考值范围。
44556677777888888899 10 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 13 13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 26 26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51
X2
1.96
1.96
P1.96 z 1.96 1.96 1.96 1 1.96 1.96
1 2 1.96 1 20.025 0.95
Standard normal distribution
2
e dx X
1 2
X
2
Normal distribution
正态分布是单峰分布,以 X 为中心左右完全对称
正态曲线在 X 处有拐点,呈现为钟型
正态分布由两个参数 和 σ 决定
是位置参数,决定着正态曲线在X轴上的位置
σ 是形状参数,决定着正态曲线的分布形状
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
44556677777888888899 10 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 13 13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 26 26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51
X2
1.96
1.96
P1.96 z 1.96 1.96 1.96 1 1.96 1.96
1 2 1.96 1 20.025 0.95
Standard normal distribution
2
e dx X
1 2
X
2
Normal distribution
正态分布是单峰分布,以 X 为中心左右完全对称
正态曲线在 X 处有拐点,呈现为钟型
正态分布由两个参数 和 σ 决定
是位置参数,决定着正态曲线在X轴上的位置
σ 是形状参数,决定着正态曲线的分布形状
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
03-医学统计学正态分布与医学参考值范围
制订的注意事项
a、抽取足够例数的同质“正常人”样本 ★“正常人”的定义,样本量(n>120),随机化。
b、确定具有实际意义的统一测量标准 ★指标的测量方法等要有规定,控制测量误差。
c、根据指标的性质确定是否要分组 ★根据实际情况、专业知识。
d、根据指标含义决定单、双侧范围 ★单侧下限,过低异常;单侧上限,过高异常;双侧,
正态曲线下面积分布规律
3、所有的正态曲线,在μ左右的任意个标准差范围内面 积相同。
一些特殊情况,在μ±σ范围内的面积约为68.27%,在 μ±1.96σ范围内的面积约为95.00%,在μ±2.58σ范围内的 面积约为99.00%。
标准正态分布
对任意一个服从N (μ, σ2 )分布的随机变量X,经
f (X )
0.9
0.8
σ=0
0.7
0.6
0.5 0.4
σ =1
0.3
σ =2
0.2
0.1
0
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
X
正态曲线下面积分布规律
1、服从正态分布的随机变量在某一区间上的曲线下面 积与其在同一区间上取值的概率相等。
2、曲线下的总面积为1或100%,以μ为中心左右两侧面 积各占50%,越靠近μ 处曲线下面积越大,两边逐渐减 少。
z1=( 119-122.6 )/4.8 = -0.75 z2=( 125-122.6 )/4.8 = 0.5 查标准正态分布表
Φ(z1) = Φ( -0.75 ) = 0.2266 Φ(z2) = Φ(0.5 ) = 1- Φ( -0.5 )=1-0.3085= 0.6915 Φ(z2)- Φ(z1)=0.6915-0.2266= 0.4649 7岁男孩身高介于119cm到125cm范围所占的比例为46.49%
医学统计学-正态分布和医学参考值范围
正态分布 和 标准正态分布 曲线下面积分布规律
正态分布
标准正态分布
面积
11 -1---- +1
1.961.96-1 .96------ +1.96 2.58 2.58-2.58 ---- +2.58-
68.27% 95.00% 99.00%
实际工作中经常要用的面积分布规律有以下三点:
xsxs 范围内占正态曲线下面积 68.27%,也就是说
.
8)选定合适的百分界限,
参考值范围是指绝大多数正常人的测定值应该所在
的范围,这个“绝大多数”习惯上指80%、90%、95%
99%
最常用的是95%
9)对资料的分布进行正态正态性检验
10)根据资料的分布类型制定适当的方 法
进行参考估计范围。
.
3.参考值范围的估计方法
估计参考值范围方法很多。主要是正态分布法。百分位数法和对 数正态分布法,以95%为例来说明。
u110.0 5 4 .8 16 1.1 05 1.05
查附表u (2 1)10.0 5 8 .8 16 1.1 05 0.37
u 1 1 .0 50 .146 u2 9 0.3 70.3557
D u 2 u 1 0 . 3 3 0 . 1 5 4 0 . 2 7 6 0 9
取单或双侧正常值范围。
5.百分位数法应用广泛,计算较简单,故制定正常值范围时应
首选百分位数法。
6.近似正态分布资料以 X uS 法估计正常值范围,较百
分位数法稳定,受两端数据影响较小。
.
医学统计方法(试题分析)
二、选择题:
1、某资料的观察值呈正态分布,理论上有________的观察值落
a.-1.645到+1.645
3 医学统计学正态分布与参考值
…… 0.06 0.07 0.08 0.09 …… 0.0011 0.0011 0.0010 0.0010 …… 0.0015 0.0015 0.0014 0.0014 …… …… …… …… …… …… 0.0052 0.0051 0.0049 0.0048 …… …… …… …… …… …… 0.0250 0.0244 0.0239 0.0233 …… …… …… …… …… …… 0.4364 0.4325 0.4286 0.4247 …… 0.4761 0.4721 0.4681 0.4641
2. 计算法:常用偏度与峰度进行评定,其度 量指标分别为偏度系数和峰度系数。
Expected Normal Value Expected CumProb
Normal Q-Q Plot of BLOOD
90
80
70
60
60
70
80
90
Observed Value
图6-8 108个原始数据的Q-Q图
Normal P-P Plot of BLOOD
表6-2 108名正常成年女子血清总蛋白(g/L)频数分布
组段 ⑴
64.0~ 66.0~ 68.0~ 70.0~ 72.0~ 74.0~ 76.0~ 78.0~ 80.0~ 82.0~84.0 合计
频数,f ⑵
2 6 8 15 25 23 14 7 6 2 108
组中值,X ⑶
65.0 67.0 69.0 71.0 73.0 75.0 77.0 79.0 81.0 83.0 -
x越远离μ,f (x)值越小。
3. 位置参数μ,
f (x)
f (μ)
形态参数σ
4. μ±ϭ为拐点的横坐标
第三章正态分布与医学参考值范围
换。
令Z=(X-µ )/σ
变量u就服从均数为0,标准差为1的正态分布,
这种正态分布称为标准正态分布,这种变换称为
标准化变换或Z变换。
标准正态分布的密度函数:
1 f X e 2
-∞<z<+∞
1 X m 2 2
,
f z
1 e 2
z2 2
f (z)为标准正态分布的密度函数,
±2.58 S范围内曲线下的面积占总面积的99%
正态曲线下的面积规律
90%
5%
5%
m-1.64
m
m+1.64
正态曲线下的面积规律
95% 2.5% 2.5%
m-1.96
m
m+1.96
正态曲线下的面积规律
99%
0.5%
0.5%
m-2.58
m
m+2.58
三、 标准正态分布 对任意一个服从正态分布N(µ , σ 2) 的 随机变量,可作如下标准转换,也称Z变
12
12 8 Std. Dev = 4.34 4 Mean = 18.6 N = 120.00
Frequency
0
9.0 11.0 13.0 15.0 17.0 19.0 21.0 23.0 25.0 27.0 29.0
正常成人血清铁含量接近正态分布示意图
正态分布
图2-4 频数分布逐渐接近正态分布示意
0为最小值,即X m时,
3). 正态分布有两个参数,即均数µ 和标准差σ。 µ 是位置参数,σ是变异度参数(形状参数)。常用 N(µ ,σ2)表示均数为μ,标准差为σ的正态分布;用 N(0,1)表示标准正态分布。
祝晓明《医学统计学》医统-第三章正态分布与医学参考值范围
若偏态分布资料经变量变换能转换为正态分布或近似正态分布仍可用正态分布表31医学参考值范围的正态分布法和百分位数法计算公式正态分布法百分位数法下限上限下限上限901649095196959925899medicalreferencerange34例33已知某地140名正常成年男子红细胞计数近似服从正态分布4781012l0381012近似正态分布资料可按正态分布法处理因红细胞计数值过大或过小均为异常故应估计双侧95参考值范围
Medical reference range
例3-4 某年某地测得 100 名正常成年人的血铅含量 值(μg/dl),试确定该地正常成年人血铅含量的 95%参考值范围。 根据经验已知正常成年人的血铅含量近似对数正 态分布,因此首先对原始数据作对数变换,经正态
性检验可知对数值服从正态分布(P>0.50),故
三、医学参考值范围的计算方法
百分位数法适合于任何分布类型的资料,在实际中 最为常用。由于参考值范围所涉及的常常是波动较 大的两端数据,使用百分位数法必须要有较大的样 本含量,否则结果不稳定。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
0.38
0.38
= P(2.05 z 1.89)
1 1.89 2.05 10.0294 0.0202 0.9504
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占该 地正常成年男子总数的95.04%。
课后习题: P25 计算题2
第二节 医学参考值范围
一、基本概念
变换 z
X
化成
0
Medical reference range
例3-4 某年某地测得 100 名正常成年人的血铅含量 值(μg/dl),试确定该地正常成年人血铅含量的 95%参考值范围。 根据经验已知正常成年人的血铅含量近似对数正 态分布,因此首先对原始数据作对数变换,经正态
性检验可知对数值服从正态分布(P>0.50),故
三、医学参考值范围的计算方法
百分位数法适合于任何分布类型的资料,在实际中 最为常用。由于参考值范围所涉及的常常是波动较 大的两端数据,使用百分位数法必须要有较大的样 本含量,否则结果不稳定。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
0.38
0.38
= P(2.05 z 1.89)
1 1.89 2.05 10.0294 0.0202 0.9504
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占该 地正常成年男子总数的95.04%。
课后习题: P25 计算题2
第二节 医学参考值范围
一、基本概念
变换 z
X
化成
0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医 学 统 计 学
第三章 正态分布与医学参考值范围
流行病与卫生统计学教研室
祝晓明
第一节 正态分布
正态分布(normal distribution)
又称为高斯分布。首先由德国数学家
和天文学家德·莫阿弗尔提出,高斯
虽然发现稍晚,但他迅速将正态分布
应用于天文学,并对其性质作了进一 步的研究,使正态分布的应用价值广 为人知。
图3-1 某地成年男子红细胞数的分布逐渐接近正态分布示意图
f ( X ) ( f i / n ) / X i f (X )
正态分布有两个参数:
1
和 , 分别表示均数和标准差。
2
e
( X )2 2 2
X
二、正态分布的特征
如果随机变量X的分布服从以下函数
频数
2 6 11 25 32 27 17 13 4 2 1 140
频 率(%)
1.4 4.3 7.9 17.9 22.9 19.3 12.1 9.3 2.9 1.4 0.7
累积频率(%)
1.4 5.7 13.6 31.5 54.4 73.7 85.8 95.1 98.0 99.4 100.0 100.0
化成 0 和
1 的标准正态分布。
Z变换也称随机变量的标准化变换。
图 标准正态分布及曲线下面积
可以利用标准正态分布表求出与原始变量X 有关的概率值。
概率密度函数
概率分布函数
正 态 分 布 标 准 正 态 分 布
1 f (X) e 2
1 X2 2
1 X FX ( ) e 2
2 1 X 2
d x
1 z e 2
2 z
2
1 e z 2
z
2 z
2
d z
如何根据概率分布函数去求阴影部分面积? Z转换的目的?
( Z ) 1 ( Z )
σ
是形状参数,决定着正态曲线的分布形状
1
2
3
-4
-3
-2
-1
01
1
2 2
2
3
3 4
3
5
6
7
-5
-4
-3
-2
1
1
-1
0
1
2
2
3
3
4
5
图3-3 三种不同均值的正态分布
图3-4 三种不同标准差的正态分布
4.正态曲线下的面积分布有一定的规律
问题:曲线下面积的含义? 如何计算?
4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.50
5.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 …… 5.02 4.76
表2-2 某地140名正常男子红细胞数的频数表
红细胞数
3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~ 6.00 合计
图3-5 图3-6
正态曲线下某一区间的面积占总面积
的百分数有何意义?
1.该区间的例数占总例数的百分数(频数分布) 2.观察值落在该区间的概率 3.从此总体随机抽得该区间观察值的概率
图 正态曲线面积分布示意图
三、标准正态分布
对任何参数的正态分布,都可以通过一个简单的变量 变换 z
X
问题:s=? σ=? 那当μ和σ已知时z=?
2 N ( , ) 例3-1 若X~ ,试计算X 取值在区间
1 .9 6 上的概率。
1 . 9 6 X 1 z 1 . 9 6 1
1 . 9 6 X 2 z 1 . 9 6 2
概率密度函数
1 f (X) e 2
1 X2 2
概率分布函数
X 1 F (X ) e 2
2 1 X 2
d x
则称连续型随机变量X服从正态分布,记为X~ X的取值范围理论上没有边界
N ( , 2 )
正态分布的主要特征:
1.单峰分布,以 X 为中心,左右完全对称。 以X轴为渐近线,两端与X轴永不相交。
2.在 X 处有最大值,其值为 f( ) 1( 2 ); X越远离对称轴,y越小。
正态曲线在 X 处有拐点,呈现为钟型
3.正态分布由两个参数 和
σ
决定
是位置参数,决定着正态曲线在X轴上的位置
查附表1
(2 . 0 5 ) 0 . 0 2 0 2 ,表明该地成年男子红
细胞计数低于 4×102/L 者约占该地正常成年男子总
卡尔·弗里德里希·高斯
(C.F.Gauss,1777-1855)
例2-1 某地用随机抽样方法检查了140名成年男子的红细胞
数,检测结果如表所示:
4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.18
4.92 4.27 4.77 4.88 5.00 4.73 4.47 5.34
-
第一节 正态分布(Normal Distribution)
一、正态曲线
f ( X ) 1.2
1 0.8 0.6 0.4 0.2 0 3.8 4.2 4.6 5.0 5.4 5.8 X
f ( X ) 1.2
1 0.8 0.6 0.4 0.2 0 3.8 4.2 4.6 5 5.4 5.8 X
f (X )1.2 1 0.8 0.6 0.4 0.2 0 3.6 4 4.4 4.8 5.2 5.6 6 X
P 1 . 9 6 z 1 . 9 6 1 . 9 6 1 . 9 61 1 . 9 6 1 . 9 6
1 2 1 . 9 6 1 2 0 . 0 2 5 0 . 9 5
例3-2 已知某地140名正常成年男子红细胞计数近似 服从正态分布,X =4.78×1012/L,S =0.38×1012/L。① 该地正常成年男子红细胞计数在4.0×1012/L以下者 占该地正常成年男子总数的百分比;
X X4 . 0 4 . 7 8 z 2 . 0 5 S 0 . 3 8
第三章 正态分布与医学参考值范围
流行病与卫生统计学教研室
祝晓明
第一节 正态分布
正态分布(normal distribution)
又称为高斯分布。首先由德国数学家
和天文学家德·莫阿弗尔提出,高斯
虽然发现稍晚,但他迅速将正态分布
应用于天文学,并对其性质作了进一 步的研究,使正态分布的应用价值广 为人知。
图3-1 某地成年男子红细胞数的分布逐渐接近正态分布示意图
f ( X ) ( f i / n ) / X i f (X )
正态分布有两个参数:
1
和 , 分别表示均数和标准差。
2
e
( X )2 2 2
X
二、正态分布的特征
如果随机变量X的分布服从以下函数
频数
2 6 11 25 32 27 17 13 4 2 1 140
频 率(%)
1.4 4.3 7.9 17.9 22.9 19.3 12.1 9.3 2.9 1.4 0.7
累积频率(%)
1.4 5.7 13.6 31.5 54.4 73.7 85.8 95.1 98.0 99.4 100.0 100.0
化成 0 和
1 的标准正态分布。
Z变换也称随机变量的标准化变换。
图 标准正态分布及曲线下面积
可以利用标准正态分布表求出与原始变量X 有关的概率值。
概率密度函数
概率分布函数
正 态 分 布 标 准 正 态 分 布
1 f (X) e 2
1 X2 2
1 X FX ( ) e 2
2 1 X 2
d x
1 z e 2
2 z
2
1 e z 2
z
2 z
2
d z
如何根据概率分布函数去求阴影部分面积? Z转换的目的?
( Z ) 1 ( Z )
σ
是形状参数,决定着正态曲线的分布形状
1
2
3
-4
-3
-2
-1
01
1
2 2
2
3
3 4
3
5
6
7
-5
-4
-3
-2
1
1
-1
0
1
2
2
3
3
4
5
图3-3 三种不同均值的正态分布
图3-4 三种不同标准差的正态分布
4.正态曲线下的面积分布有一定的规律
问题:曲线下面积的含义? 如何计算?
4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.50
5.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 …… 5.02 4.76
表2-2 某地140名正常男子红细胞数的频数表
红细胞数
3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~ 6.00 合计
图3-5 图3-6
正态曲线下某一区间的面积占总面积
的百分数有何意义?
1.该区间的例数占总例数的百分数(频数分布) 2.观察值落在该区间的概率 3.从此总体随机抽得该区间观察值的概率
图 正态曲线面积分布示意图
三、标准正态分布
对任何参数的正态分布,都可以通过一个简单的变量 变换 z
X
问题:s=? σ=? 那当μ和σ已知时z=?
2 N ( , ) 例3-1 若X~ ,试计算X 取值在区间
1 .9 6 上的概率。
1 . 9 6 X 1 z 1 . 9 6 1
1 . 9 6 X 2 z 1 . 9 6 2
概率密度函数
1 f (X) e 2
1 X2 2
概率分布函数
X 1 F (X ) e 2
2 1 X 2
d x
则称连续型随机变量X服从正态分布,记为X~ X的取值范围理论上没有边界
N ( , 2 )
正态分布的主要特征:
1.单峰分布,以 X 为中心,左右完全对称。 以X轴为渐近线,两端与X轴永不相交。
2.在 X 处有最大值,其值为 f( ) 1( 2 ); X越远离对称轴,y越小。
正态曲线在 X 处有拐点,呈现为钟型
3.正态分布由两个参数 和
σ
决定
是位置参数,决定着正态曲线在X轴上的位置
查附表1
(2 . 0 5 ) 0 . 0 2 0 2 ,表明该地成年男子红
细胞计数低于 4×102/L 者约占该地正常成年男子总
卡尔·弗里德里希·高斯
(C.F.Gauss,1777-1855)
例2-1 某地用随机抽样方法检查了140名成年男子的红细胞
数,检测结果如表所示:
4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.18
4.92 4.27 4.77 4.88 5.00 4.73 4.47 5.34
-
第一节 正态分布(Normal Distribution)
一、正态曲线
f ( X ) 1.2
1 0.8 0.6 0.4 0.2 0 3.8 4.2 4.6 5.0 5.4 5.8 X
f ( X ) 1.2
1 0.8 0.6 0.4 0.2 0 3.8 4.2 4.6 5 5.4 5.8 X
f (X )1.2 1 0.8 0.6 0.4 0.2 0 3.6 4 4.4 4.8 5.2 5.6 6 X
P 1 . 9 6 z 1 . 9 6 1 . 9 6 1 . 9 61 1 . 9 6 1 . 9 6
1 2 1 . 9 6 1 2 0 . 0 2 5 0 . 9 5
例3-2 已知某地140名正常成年男子红细胞计数近似 服从正态分布,X =4.78×1012/L,S =0.38×1012/L。① 该地正常成年男子红细胞计数在4.0×1012/L以下者 占该地正常成年男子总数的百分比;
X X4 . 0 4 . 7 8 z 2 . 0 5 S 0 . 3 8