正态分布与医学参考值(修改)
03-医学统计学正态分布与医学参考值范围
1
ze
z2 2
dz
( X
)
2
标准正态分布的应用
实际应用中,经z变换可把求解任意一个正态分布曲线 下面积的问题,转化成标准正态分布曲线下相应面积的 问题。
欲求服从标准正态分布的随机变量在区间(-∞, z)(z≤0) 上曲线下的面积,可直接查表;对(z>0) 可根据对称性 算得,计算公式为:
正态分布的应用
• 制定医学参考值范围 • 质量控制 • 正态分布是很多统计方法的理论基础
医学参考值范围
概述
医学参考值范围(reference value range),指正常人 的解剖、生理、生化、免疫及组织代谢产物的含量等 各种数据的波动范围。
医学参考值范围,习惯上是包含95%的参照总体的 范围。
卫生部“十二五”规划教材
医学统计学
正态分布与医学参考值范围
正态分布
概述
正态分布(normal distribution),是 一种连续型随机变量常见而重要的分 布。
它首先由莫阿弗尔于1733年提出。 之后高斯对其进一步研究,使正态分 布广为人知。
A. de Moivre
Gauss
正态曲线 正态曲线(normal curve),是一条高峰位于中央,两侧逐 渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。
Φ(z) =1-Φ( -z ) z在区间( z1, z2 )取值概率的计算公式为:
P(z1<z<z2 ) = Φ(z2)- Φ(z1)
【例】由160名7岁男孩身高测量的数据算得样本均数为 122.6cm、样本标准差为4.8cm。已知身高数据服从正态分布, 试估计该地当年7岁男孩身高介于119cm到125cm范围所占的 比例。
正态分布与医学参考值范围
1. 基于临床实践,从个体角度, 作为临床上判定正常与异常的 参考标准,即用于划分界限或 分类。
2. 基于预防医学实践,从人群角 度,可用来评价儿童的发育水 平,如制订不同年龄、性别儿 童某项发育指标的等级标准。
确定95%参考值范围示意图
二、制订医学参考值范围的注意事项
1. 确定同质的参照总体 一般选择“正常”人,主要是排除了对研究指标
例3-1 若X~
,试计算X 取值在区间
上的概率。
Standard normal distribution
例3-2 已知某地140名正常成年男子红细胞计数近似 服从正态分布, =4.78×1012/L, =0.38×1012/L。 ①该地正常成年男子红细胞计数在4.0×1012/L以下 者占该地正常成年男子总数的百分比;
服从正态分布, =4.78×1012/L, =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。 近似正态分布资料可按正态分布法处理,因红细胞 计数值过大或过小均为异常,故应估计双侧95%参 考值范围:
即该地正常成年男子红细胞计数的95%参考值范围 为4.04×1012/L~5.52×1012/L。
查附表1
,表明该地成年男子红
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
正常成年男子总数的百分比
=
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占 该地正常成年男子总数的95.04%。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
医学统计学正态分布及参考值范围
正态分布的特征 位置参数——均数μ
决定正态分布曲线在横轴上 的集中位置。固定形态参数σ ,改变μ的值,曲线沿 x轴平 行移动,曲线形状不变。
1.2 1 0.8 0.6 0.4 0.2 0 3.5 4
μ=4.75
μ=5.95
4.5
5
5.5
6
6.5
7
正态分布位置变换示意图
形态参数——标准差σ
决定正态分布曲线的形状。 固定位置参数μ ,σ值变小 ,曲线变“瘦高”(陡峭), σ值变大,曲线变“矮胖”( 平坦),曲线位置不变 。
应用
估计医学参考值范围 质量控制:临床检验、生物鉴定、食品卫生 监督 其他许多统计方法的基础
医学参考值估计
含义
绝大多数(一般95%或99%)正常人的各 种生理、生化、组织或排泄物中各种成 分的含量
考虑问题
确定目标总体 选择“正常人” 选择一批病人作为制订参考值之参考 统一测量方法和条件 确定观察对象例数 确定单双侧位界 确定参考值组数 选定百分位界
0.8 0.6 0.4 0.2 0
σ=0.5 σ=1 σ=2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 正态分布形态变换示意图
正态分布的特征 (4)正态分布曲线下的面积规律: 服从正态分布的随机变量在一区间上曲线下 的面积与该随机变量在同一区间内取值的概 率相等。 概率分布函数:
两边低
左右对称 呈钟形
两边低
X
中间高,两边低,左右对称,呈钟形
正态分布的数学函数表达式
如果随机变量X的概率密度函数满足
µ为总 体均数
X
σ2 为总 体方差 则称X服从正态分布,记作X~N(µ,σ2)。
1 f(x) e 2
3章 正态分布与医学参考值范围
25
y
0 .2 .4 .6 .8 1
3 4 5 x
5.5
6 7 26
5.5 4.78 4 4.78 P(4.00 X 5.50) ( ) ( ) 0.38 0.38 [1 ( 1.89)] ( 2.05) (1 0.0294) 0.0202 0.9504
该曲线的函数表达式 f(x) 称为正态分布密度函数
(probability density function,PDF)。
5
X
1 f (X ) e 2
( X )2 2 2
习惯上用N(μ,σ2)表示均数为μ, 标准差为σ的正态分布。
6
.08
.02
.04
.06
30
(二)选择足够例数的参照样本
通常情况下,确定参考值范围需要大样本,如果例 数过少,确定的参考值范围往往不够准确。 参照样本含量的确定没有统一的规则,一般认为至 少应在120例以上。
(三)控制检测误差
为保证原始数据可靠,检测过程中要严格控制随机 误差,避免系统误差和过失误差。
31
(四)选择单、双侧界值
单侧下限---过低异常 过低均异常 单侧上限---过高异常 双侧---过高、
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
如肺活量
如尿铅值
如体重
32
(五)选择适当的百分数范围
结合专业知识,根据研究目的、研究指标的性质、 数据分布特征等情况综合考虑。百分数范围的不 同将导致不同的假阳性率和假阴性率。 最常用的百分界限是95%,也可以选80%、90%、 99%等。
统计学课件-正态分布与医学参考值范围
三、醫學參考值範圍
(一)概念
醫學參考值範圍是指大多數正常人的 樣調查正常人的結果,可以確定一個大多數 正常人的某項指標的參考值範圍。最常用的 是95%參考值範圍。
(二)制定方法
1.正態分佈法 如生理指標為正態分佈的資料, 可應用正態分佈理論,制定參考值範圍。 95%參考值範圍如下: (1)雙側95%參考值範圍為: (2)單側95%參考值範圍,如指標值過高為 不正常,其上限為: X 1.64s (3)單側95%參考值範圍,如指標值過低為 不正常,其下限為: X 1.64s
正態分佈與醫學參考值範圍
一、正態分佈
正態分佈曲線是一個以均數為中心,左右兩側對 稱的鐘型曲線,簡稱正態曲線。
(一)正態分佈曲線的特徵:
1.曲線高峰位於中央(均數所在處)。 2.圍繞均數兩側完全對稱。曲線兩側逐漸下降, 兩尾端逐漸靠近橫軸,但永遠不與之相交。
3.正態分佈有兩個參數,即均數和標準差。一 般用N(,2)表示均數為,方差為2的正態
分佈。
(二)正態分佈曲線下麵積分布規律
1.在( - , + )範圍內,占正態分佈曲線下 麵積的68.27%;u在曲線正中間撒 2.在( -1.96 , +1.96 )範圍內,占正態分佈 曲線下麵積的95%; 3.在( -2.58 , +2.58 )範圍內,占正態分佈 曲線下麵積的99%。 熟記這些數據
2.百分位數法 對於某些生理指標,如果呈偏 態分佈的,可用百分位數法制定參考值範圍。 (1)如果指標值過高和過低都不正常,可定 雙側95%參考值範圍P2.5 ~P97.5 ; (2)若指標值過高為不正常,可定單側95% 參考值範圍,其上限為P95; (3)若指標值過低為不正常,其下限為P5 。 (在參考範圍之內,或者在參考範圍以外正常 值偏低或偏高)
03正态分布与医学参考值范围 (1)
44556677777888888899 10 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 13 13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 26 26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51
X2
1.96
1.96
P1.96 z 1.96 1.96 1.96 1 1.96 1.96
1 2 1.96 1 20.025 0.95
Standard normal distribution
2
e dx X
1 2
X
2
Normal distribution
正态分布是单峰分布,以 X 为中心左右完全对称
正态曲线在 X 处有拐点,呈现为钟型
正态分布由两个参数 和 σ 决定
是位置参数,决定着正态曲线在X轴上的位置
σ 是形状参数,决定着正态曲线的分布形状
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
正态分布与医学参考值范围
正态分布与医学参考值范围正态分布是统计学中一种非常重要的概率分布,也被称为高斯分布。
它的图像呈现出钟形曲线,对称地分布在均值附近。
在医学领域中,正态分布的应用非常广泛,特别是在确定医学参考值范围时起到了至关重要的作用。
本文将就正态分布与医学参考值范围进行探讨。
正态分布在医学参考值范围确定中的应用主要是基于以下原因:1. 数据收集的特点:医学实验往往需要收集大量的数据,包括身高、体重、血压、血糖等指标。
这些指标在人群中的分布往往符合正态分布。
通过对数据的收集和统计分析,可以获得数据的平均值和标准差,从而确定参考值范围。
2. 对异常值的处理:在医学实验中,常常会遇到一些异常值,例如极端高或者极端低的数据。
正态分布的特点在于异常值对结果的影响很小,因为正态分布对于极端值的权重较低,大部分的数据都集中在均值附近。
因此,正态分布在医学参考值的确定中能够较好地处理这些异常值。
3. 统计推断的基础:医学研究中常需进行统计推断,例如判断某个治疗方法是否有效,或者不同人群之间是否存在显著差异。
正态分布作为统计学中的基础分布,提供了一种有效的工具来进行统计推断。
通过对数据进行假设检验、置信区间估计等方法,可以对医学参考值范围进行准确的推断。
医学参考值范围在实际应用中的确定过程一般包括以下步骤:1. 数据收集与整理:收集与特定指标相关的数据,如血液数据、生化指标等。
然后对数据进行整理,排除异常值。
2. 数据的分布检验:通过对数据的正态性检验,判断数据是否符合正态分布。
常用的检验方法有 Shapiro-Wilk 检验、Lilliefors 检验等。
若数据不符合正态分布,可能需要进行数据转换或者使用非参数方法来进行分析。
3. 参数估计:对符合正态分布的数据,通过计算平均值和标准差来估计总体的参数。
平均值代表了数据的集中趋势,标准差代表了数据的离散程度。
4. 构建医学参考值范围:根据正态分布的性质,通常采用均值加减2倍标准差的方法来构建医学参考值范围。
03-医学统计学正态分布与医学参考值范围
制订的注意事项
a、抽取足够例数的同质“正常人”样本 ★“正常人”的定义,样本量(n>120),随机化。
b、确定具有实际意义的统一测量标准 ★指标的测量方法等要有规定,控制测量误差。
c、根据指标的性质确定是否要分组 ★根据实际情况、专业知识。
d、根据指标含义决定单、双侧范围 ★单侧下限,过低异常;单侧上限,过高异常;双侧,
正态曲线下面积分布规律
3、所有的正态曲线,在μ左右的任意个标准差范围内面 积相同。
一些特殊情况,在μ±σ范围内的面积约为68.27%,在 μ±1.96σ范围内的面积约为95.00%,在μ±2.58σ范围内的 面积约为99.00%。
标准正态分布
对任意一个服从N (μ, σ2 )分布的随机变量X,经
f (X )
0.9
0.8
σ=0
0.7
0.6
0.5 0.4
σ =1
0.3
σ =2
0.2
0.1
0
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
X
正态曲线下面积分布规律
1、服从正态分布的随机变量在某一区间上的曲线下面 积与其在同一区间上取值的概率相等。
2、曲线下的总面积为1或100%,以μ为中心左右两侧面 积各占50%,越靠近μ 处曲线下面积越大,两边逐渐减 少。
z1=( 119-122.6 )/4.8 = -0.75 z2=( 125-122.6 )/4.8 = 0.5 查标准正态分布表
Φ(z1) = Φ( -0.75 ) = 0.2266 Φ(z2) = Φ(0.5 ) = 1- Φ( -0.5 )=1-0.3085= 0.6915 Φ(z2)- Φ(z1)=0.6915-0.2266= 0.4649 7岁男孩身高介于119cm到125cm范围所占的比例为46.49%
正态分布和医学参考值范围1
4、制定正常值范围时,应根据指标的实际用途和特征来决定 取单或双侧正常值范围。 5.百分位数法应用广泛,计算较简单,故制定正常值范围时应 首选百分位数法。 6.近似正态分布资料以 X uS 法估计正常值范围,较百 分位数法稳定,受两端数据影响较小。
医学统计方法(试题分析)
二、选择题:
1、某资料的观察值呈正态分布,理论上有________的观察值落 在 x 1.96s 范围内。 a.68.27% b.90% c.95% d.99% e.45% 2、正态曲线下,从均数μ到μ+1.645σ的面积为 ________。 a.45% b.90% c.95% d.47.5% e.99% 3、标准正态分布是指_________正态分布。 a.μ=0 σ=1 b.μ=1 σ=0 c.μ=0 σ任意 d.μ任意 σ=1 e.以上都不对 X 1.960S X 1.645S 4、资料呈偏态分布,90%双侧正常值范围为_________。 a. x 1.96s b. x 1.64s c.P2.5~P97.5 d.P5~P95 e.0~P90
4)统一测量方法与条件,控制测量误差
测量方法与条件统一,是控制系统误差,测量误差,保证参 考值的可靠性与代表性的重要措施,如检验人员操作方法,熟 练程度相近,实验室条件一致,测试仪器型号相同这些要求应 该满足。
5)确定观察例数(样本含量)
在一般的情况下观察例数越多(抽取样本含量是够大)结果 越接近总体,如白细胞分类计数时,数的白细胞越多,分类计 数就越正确,变异程度较大指标,多一些观察例数是恰当的, 一般样本含量最好将在100例以上。
6、在正态分布资料中,95%的双侧正常值范围常用________ 表示。 a. X 1.960S b.P25~P97.5 X 2.58S d.P5~∞ c. e.P5~P95 7.用百分位数法确定正常值范围,适用于_________资料。 a.分布不对称或不知分布 b.正态分布 c.大样本资料 d.小样本资料 e.以上都对 8、标准正态分布曲线下中间 90%的面积所对应的横轴尺度 u 的范围是________。 a.-1.645到+1.645 b.-∞到+1.645 c.-∞到+2.282 d.-1.282到+1.282 X 1.96S e.-1.96到+1.96
新版正态分布与医学参考值范围
新版正态分布与医学参考值范围
第9页
四、曲线下面积
u
-∞
附表1(p225)就是依据此公式和图形制订
新版正态分布与医学参考值范围
第10页
曲线下面积分布规律
查附表1(p322)
例6-3(P94)
新版正态分布与医学参考值范围
第17页
2.百分位数法
双侧95%参考值范围: P2.5~P97.5 单侧95%参考值范围: < P95(上限) 或 > P5(下限)适合用于偏态分布资料 例6-4(P95)
新版正态分布与医学参考值范围
第2页
新版正态分布与医学参考值范围
第3页
一、数学形式
新版正态分布与医参考值范围
第4页
二、正态曲线( normal curve )
图形特点: 钟型中间高两头低左右对称最高处对应于X轴值就是均数曲线下面积为1标准差决定曲线形状
新版正态分布与医学参考值范围
第5页
g/L ,
新版正态分布与医学参考值范围
第14页
二、正态分布应用
1、预计医学参考值范围2、质量控制3.正态分布是许多统计方法理论基础
新版正态分布与医学参考值范围
第15页
第二节 医学参考值范围
临床上常见参考值是指包含绝大多数正常人人体形态、机能和代谢产物等各种生理及生化指标,过去称正常值。 步骤: 1. 从“正常人”总体中抽样: 明确研究总体 2. 统一测定方法以控制系统误差。 3. 判断是否需要分组(如性别、年纪)确定。 4. 依据专业知识决定单侧还是双侧。
新版正态分布与医学参考值范围
《医学统计学》正态分布与医学参考值范围课件
正态分布还可以用于评估数据 的分布情况,以及异常值的识 别和处理。
正态分布在医学研究中广泛应 用于统计分析,如描述性统计 、参数估计和假设检验等。
医学参考值范围的局限性
医学参考值范围是基于一定样本量和 特定人群特征确定的,因此其适用范 围有限,可能不适用于特殊人群或不 同地区和族裔的人群。
医学参考值范围仅适用于单个生理指 标的评估,对于多个指标的综合评估 需要更多的专业知识和临床判断。
医学参考值范围的使用方法
1 2 3
判断个体指标是否异常
通过将个体指标值与医学参考值范围进行比较, 可以判断个体指标是否异常。
辅助临床诊断
医生可以根据个体指标的异常程度,结合患者的 临床表现和其他检查结果,进行综合判断,提高 诊断的准确性和可靠性。
监测治疗效果
通过监测治疗效果,可以及时调整治疗方案,提 高治疗效果。
案例二
总结词
胆固醇水平呈正态分布,医学参考值范围为3.1-5.2mmol/L。
详细描述
总胆固醇水平在正常范围内时,其分布也接近正态分布。医学上通常根据总胆固醇水平来判断个体心 血管疾病的患病风险。正常的总胆固醇水平参考值为3.1-5.2mmol/L。若总胆固醇水平超过 5.2mmol/L,则可能增加患心血管疾病的风险。
《医学统计学》正态分布与 医学参考值范围课件
汇报人: 2023-12-24
目录
• 正态分布概述 • 正态分布与医学参考值范围的
关系 • 正态分布的检验方法 • 医学参考值范围的解读与使用 • 案例分析
01
正态分布概述
正态分布的定义
01
正态分布是一种概率分布,其概 率密度函数呈钟形,对称分布于 均值(μ)周围。
P-P图法
《医学统计学》正态分布与医学参考值范围课件
《医学统计学》正态分布与医学参考值范围课件•正态分布概述•正态分布与医学参考值范围•正态分布的图形展示目录•医学参考值范围的计算实例•总结与展望CHAPTER正态分布概述正态分布的定义正态分布的基本性质钟形曲线正态分布的均数(期望值)和标准差(波动程度)是两个关键参数。
均数与标准差概率密度函数正态分布的应用CHAPTER正态分布与医学参考值范围定义计算医学参考值范围的定义与计算正态分布是统计学中常用的概率分布,它描述了许多医学指标的分布特征。
正态分布的曲线呈钟形,中间高,两侧低,左右对称。
在医学参考值范围的制定中,正态分布被用来确定正常范围。
一般来说,如果一个指标的分布接近正态分布,则认为其医学参考值范围是合理的。
正态分布在医学参考值范围中的应用医学参考值范围的解读与使用解读医学参考值范围是一个重要的临床工具,它可以帮助医生判断患者的某一指标是否正常。
同时,它也提供了对临床实验结果的解读和比较的基础。
使用在使用医学参考值范围时,医生应注意其局限性,并结合患者的具体情况进行综合考虑。
例如,不同年龄、性别、种族等人群的医学参考值范围可能存在差异。
因此,医生应根据患者的具体情况选择适用的参考值范围。
CHAPTER正态分布的图形展示正态分布的直方图直方图显示了正态分布的概率密度函数,可以直观地观察到正态分布的形状和特征。
直方图中的横轴表示变量值,纵轴表示在该变量值下的概率密度。
正态分布的直方图呈现出钟形曲线,左右对称,最高点出现在均值处,且在均值附近概率密度较大。
箱线图由箱子、中线、耳朵等组成,其中箱子代表四分位数范围,中线代表均值,耳朵代表标准差。
箱子的高度表示数据的相对波动程度,箱子越窄表示数据越集中。
箱线图展示了正态分布的四分位数和异常值,可以直观地判断数据的集中趋势和离散程度。
合正态分布。
QQ图中的横轴和纵轴分别表示数据的累计概率和标准化的变量值。
如果数据符合正态分布,那么QQ图上的点应该大致沿着参考线(45度直线)分布。
祝晓明《医学统计学》医统-第三章正态分布与医学参考值范围
Medical reference range
例3-4 某年某地测得 100 名正常成年人的血铅含量 值(μg/dl),试确定该地正常成年人血铅含量的 95%参考值范围。 根据经验已知正常成年人的血铅含量近似对数正 态分布,因此首先对原始数据作对数变换,经正态
性检验可知对数值服从正态分布(P>0.50),故
三、医学参考值范围的计算方法
百分位数法适合于任何分布类型的资料,在实际中 最为常用。由于参考值范围所涉及的常常是波动较 大的两端数据,使用百分位数法必须要有较大的样 本含量,否则结果不稳定。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
0.38
0.38
= P(2.05 z 1.89)
1 1.89 2.05 10.0294 0.0202 0.9504
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占该 地正常成年男子总数的95.04%。
课后习题: P25 计算题2
第二节 医学参考值范围
一、基本概念
变换 z
X
化成
0
正态分布+参考值
n x%
fl
fx为Px所在组频数
Σfl 为 小于L 各组段 的累计 频数
46
P95
11
2 23995% 212 12.88mol /
16
kg
47
48
11
正态曲线下的面积规律
对称区域面积相等。
S(-x1, -x2)
S(x1,x2)=S(-x2,-x1)
-x1 -x2
x2 x1
12
正态曲线下的面积规律
2.5%
95%
2.5%
-1.96
+1.96
13
正态曲线下的面积规律
90%
5%
5%
-1.64
+1.64
14
正态曲线下的面积规律
排除了影响所研究的指标的疾病和有关因素的 同质的人群。
32
参考值范围确定的原则
选定同质的正常人作为研究对象 控制检测误差 判断是否分组(性别,年龄组) 单、双侧问题 选择百分界值(90%,95%) 确定可疑范围
33
单侧与双侧参考值范围
根据医学专业知识确定!
双侧:白细胞计数,血清总胆固醇, 单侧:上限: 转氨酶,尿铅,发汞 ……
正态分布及其应用 :张旭辉 顾逸霏
Normal distribution and its applications
Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University
取样时间
31
参考值范围(reference interval)
正态分布与医学参考值范围
何平平 北京大学医学部流行病与卫生统计学系 Tel:82801619
一、正态分布
正态分布曲线是一个以均数为中心,左右两侧对 称的钟型曲线,简称正态曲线。 (一)正态分布曲线的特征:
1.曲线高峰位于中央(均数所在处)。 2.围绕均数两侧完全对称。曲线两侧逐渐下降, 两尾端逐渐靠近横轴,但永远不与之相交。 3.正态分布有两个参数,即均数和标准差。一 般用N(,2)表示均态分布进行如下标准化转换
Z X
变换后的分布称为标准正态分布,就是总体均数为 0,标准差为1的正态分布,常用N(0,1)表示。
标准正态分布曲线下面积分布规律是: 1.在区间(-1,1)占总面积的68.27%; 2.在区间(-1.96,1.96)占总面积的95%; 3.在区间(-2.58,2.58)占总面积的99%。
(二)正态分布曲线下面积分布规律
1.在( - , + )范围内,占正态分布曲线下 面积的68.27%; 2.在( -1.96 , +1.96 )范围内,占正态分布 曲线下面积的95%; 3.在( -2.58 , +2.58 )范围内,占正态分布 曲线下面积的99%。
2.百分位数法 对于某些生理指标,如果呈 偏态分布的,可用百分位数法制定参考值范围。 (1)如果指标值过高和过低都不正常,可定 双侧95%参考值范围P2.5 ~P97.5 ; (2)若指标值过高为不正常,可定单侧95%参 考值范围,其上限为P95; (3)若指标值过低为不正常,其下限为P5 。
三、医学参考值范围 (一)概念
医学参考值范围是指大多数正常人的解剖、 生理、生化等各种数据的波动范围。根据抽 样调查正常人的结果,可以确定一个大多数 正常人的某项指标的参考值范围。最常用的 是95%参考值范围。
第三章 正态分布与医学参考值范围
第一节 正 态 分 布
一、正态分布的概念(normal distribution)
组 段 110~ 112~ 114~ 116~ 118~ 120~ 122~ 124~ 126~ 128~ 130~ 132~ 134~136 合 计 频 数 ( f) 1 3 9 9 15 18 21 14 10 4 3 2 1 110 组中值 ( X) 111 113 115 117 119 121 123 125 127 129 131 133 135 —
③μ±2.58σ范围内,曲线下面积占总面积的
99.00%。即有99.00%的变量值分布在此范围 内。
三、标准正态分布
为了应用方便,利用下面的公式进行变量 变换,使μ=0,σ=1,将坐标原点移到μ 的位置,横轴尺度以σ为单位。即设
X z
则将正态分布变换为标准正态分布。
标准正态分布 曲线下面积规律:
计算通式
X z / 2 s
如,某地调查正常成年男子144人的红细 胞数,近似正态分布,均数为5.38×1012/L, 标准差s=0.44×1012/L,其95%参考值范围:
下限: X - 1.96s=5.38-1.96× 0.44=4.52(1012/L) 上限: X +1.96s=5.38+1.96× 0.44=6.24(1012/L)
20 频数 15
10
5
0
110 112 114 116 118 120 122 124 126 128 130 132 134 136
组段
二、正态分布的特征
1、 正态曲线是 单峰分布,以均 数为中心左右对 称。
2、正态曲 线在均数处 最高
第六章正态分布与医学参考值范围
图2-4 频数分布逐渐接近正态分布示意
一、数学形式
f (X ) 1
( X )2 exp 2 2 2 Βιβλιοθήκη , X
=3.14159, 是以2.72818为底的自然对数指数 exp
X ~ N ( , ), 为X的总体均数,为总体标准差
0.6 0.5
f (X )
N (1,0.8 )
2
0.4 0.3
N (0,1 )
N (1,1.2 )
2
2
0.2 位置参数μ决定曲线的位置,形态参数σ决定曲线的形态 0.1 0 -4 -3 -2 -1 0 1 2 3
4
X
① X 轴与正态曲线所夹面积恒等于 1 或 100%; ② 区间 的面积为 68.27%; ③ 区间 1.96 的面积为 95.00%; ④ 区间 2.58 的面积为 99.00%。
举例:
① 10,单 =0.05, t0.05,10 1.812 ,则有
P(t 1.812) 0.05 或 P(t 1.812) 0.05
② 10,双 =0.05,t0.05 / 2,10 2.228 ,则有
P (t 2.228) P (t 2.228) 0.05
双侧95%参考值范围: P2.5~P97.5
单侧95%参考值范围: < P95(上限)
或 > P5(下限)
适用于偏态分布资料
例6-4(P95)
第三节 与正态分布有关的统计量 分布
一、t分布
随机变量X
u X
N(,2)
均数 X 2 N ( , n)
t X S n X SX
正态分布和医学正常值范围
正态分布和医学正常值范围的估计一、正态分布(一)正态分布的图形将表18-1的110名20岁健康男大学生身高频数分布绘成图18-1中的(1),可见高峰位于中部,左右两侧大致对称。
可以设想,如果抽样观察例数逐渐增多,组段不断分细,就会逐渐形成一条高峰位于中央(均数所在处)、两侧完全对称地降低、但永远不与横轴相交的钟型曲线(图18-1中的(3)),这条曲线近似于数学上的正态分布(normaldistribution)曲线。
统计学家按其变化参数,推导出正态分布密度函数f(X)-∞<X<+∞公式(18.16)式中μ为均数;σ为标准差;π为圆周率;е为自然对数的底,即2.71828.以上均为常数,仅X为变量。
为了应用方便,常将式(18.16)进行变量变换—u变换(即u=(X-μ)/σ),u变换后,μ=0,σ=1,使原来的正态分布变换为标准正态分布(standard normal distribution)亦称u分布,如图18-2.图18-1 频数分布逐渐接近正态分布示意图18-2 正态分布与标准正态分布的面积与纵高此时,式(18.16)化成- ∞<u<+∞公式(18.17)式中,φ(u)为标准正态分布的密度函数,即纵轴高度。
根据X和u的不同取值,分别按式(18.16)和式(18.17)可以绘出正态分布和标准正态分布的图形(图18-2)。
(二)正态分布的特征由式(18.16 )gn (18.17)可看出正态分布有下列特征:①正态曲线(normal curve)在横轴上方均数处最高。
②正态分布以均数为中心,左右对称。
③正态分布两个参数(parameter),即均数μ和标准差σ;常用N(μ,σ)表示均数为μ、标准差为σ的正态分布;所以标准正态分布用N(0,1)表示。
④正态曲线在±1σ处各有一人拐点。
⑤正态曲线下的面积分布有一定的规律。
二、正态曲线下面积的分布规律正态曲线下一定区间的面积可以通过对式(18.16)和式(18.17)积分求得。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
几个重要区间 双侧 u-1.96,1.96 X X -1.96S, X +1.96S P=0.95 u-2.58,2.58 X X -2.58S, P=0.99
X+
2.58S
单侧 u(-,1.64 X X +1.64S P =0.95 u-1.64,) X X -1.64S P =0.95 u(-,2.33 X X +2.33S P =0.99 u-2.33,) X X -2.33S P =0.99
6.24(10 / L)
12
〖例5〗某市1974年为了解该地居民发汞的基础水 平,调查了留住该市一年以上,无汞作业接触史的 健康居民238人的发汞含量如下表,试估计该市健 康居民发汞值的95%参考值范围。 解:求单侧95%上限,用百分位数法,即求P95。
Pr Lr
i f
r r(n r % 〖例2〗某市1982年110名7岁男童身高,均数 为119.95cm,标准差为4.72cm, 1.试估计 该地7岁男童身高在110cm以下者占该地男童 总数的百分数。2.分别求
X 1s
X 1.96 s
X 2.58s
范围内人数占总数的百分数 解:
x X 110 119.65 u 2.11 s 4.72 Φ(u) Φ(2.11) 0.0174
查表注意
利用均数和标准差先对x做标准化变换,求得 u值 曲线下对称于0的区间,面积相等 曲线下横轴上的总面积为100%或1 如:区间(2.58,∞)的面积 φ(-2.58)=0.005 区间(-∞,2.58)的面积 φ(2.58)=1-φ(-2.58)=0.995 P(∣u∣>1.96)=2φ(-1.96)=0.05 P(∣u∣<2.58)=φ(2.58)-φ(-2.58)=0.99
正态性检验
图示法:多采用分位数图(quantilequantile plot,Q-Q plot)和概率图 (probability- probability plot,P-P plot)。 计算法:常用偏度与峰度进行评定, 其度量指标分别为偏度系数和峰度系 数。
二、正态分布的应用
估计医学参考值范围 质量控制
μ是总体均数;σ是总体标准差(永远大
于零)。这两个参数可完全决定一个正态 分布, 故常简记为N(μ,σ2 ) 当μ=0, σ=1时,这样的正态分布称为 标准正态分布, 简记为N(0, 1)
位置参数对曲线分布的影响
形态参数对曲线分布的影响
正态曲线下面积的分布规律
正态曲线下一定区间的面积
1 P F ( x) 2
确定研究总体,保证研究对象的同质性。 确定样本容量,一般n 100. 确定单侧或双侧(根据专业知识)。 确定适当百分范围。常取90%,95%,99% 等 选定适当统计方法:
正态分布法 百分位数法
二、参考值范围的估计方法
正态分布法(适于正态分布资料) X us 双侧95%参考值范围:X 1.96S 单侧95%参考值范围: X -1.64S 或X +1.64S 百分位数法(适于非正态分布资料) 双侧95%参考值范围: P2.5,P97.5 单侧95%参考值范围: P5 或 P95
标准差单位
任何正态变量X~N(μ,σ2 )经过一个变 换
u
x
便有u~N(0, 1)。这个变换称为标准化 变换, 变换后的 u 称为 标准化正态离 差(standardized deviate)或称 u 值, 实 际上就是用标准差σ作单位来度量离均 差的大小。
正态分布特征
正态曲线在横轴上方均数处最高,即频数 最大 正态分布以均数为中心,左右对称,无限 接近于x轴 曲线与横轴所围面积为1。正态曲线下面 积分布有一定规律
正态分布的概率密度函数
1 ( x )2 /(2 2 ) f ( x) e 2 - x
两个参数:总体均数,总体方差 2
F ( x)
x
1 f ( x)dx 2 - x
x
e
( x )2 /(2 2 )
120名成年男子RBC的实际分布与理论分布比较
XS X 1.00S X -1.64S X 1.96S X 2.58S
RBC范围
4.15~5.28 3.79 3.61~5.83 3.26~6.18
实际分布 % 人数 83 113 114 120 69.17 94.17 95.00 100.00
正态分布与参考值范围
生物统计学系 谭旭辉
第一节 正态分布
一、正态分布曲线(normal distribution)
图4-2 某地150名正常成年男子红细胞数 (1012/L)频数分布图
正态分布的重要性
实践中许多连续型随机变量的频率密度 直方图形状是中间高、两边低、左右对 称的,称这样的变量服从正态分布或高 斯分布 许多分布在一定条件下趋于正态分布 最常见最重要的一种连续性分布 ﹟normal 不是指“正常”,“对称”
〖例4〗某地调查正常成年男子144人的红细 胞数,均数5.38×1012/L ,标准差为 0.44×1012/L 。试估计该地成年男子红细胞 数的95%参考值范围。
下限: X 1.96s 5.38 1.96 (0.44)
4.52(10 / L)
12
上限: X 1.96s 5.38 1.96 (0.44)
得该地男童身高在110cm以下者,估计约占 1.74%
X 1.96 s X X 1.96 s X ( ) ( ) s s (1.96) (1.96) 1 2 (1.96) 1 2 0.025 95%
求某部分面积所对应的变量值
〖例3〗前面例1中,求中间80%成年男子 的红细胞计数范围。 解:P=0.1 u=-1.282 根据对称性得区 间 u-1.282,1.282 X X -1.282S, X +1.282S X3.99, 5.44 1012/L
〖例1〗随机抽取某市120名成年男子测红细胞 计数, 得 X =4.7168, S=0.5665。求红细胞计 数在(4.0~5.0)1012/L 之间的人数及所占比例。 解:已知 X =4.7168, S=0.5665
X =4时,u=(4-4.7168)/0.5665= -1.265 X =5时,u=(5-4.7168)/0.5665= 0.500 P =(0.5)-(-1.265)=(1-0.3085)-0.1029 =0.5886 人数: 1200.5886 71人 (实际人数为70人)
求两个变量之间的面积
一般正态分布概率密度曲线下的面积可 通过标准化变换后按上述方法来计算。 例如: ( 1.96 , 1.96 ) 区间上, 正态分布N(μ,σ2 )曲线下的面积分 别为
( μ 1.96σ ) μ ( μ 1.96σ ) μ Φ Φ σ σ Φ 1.96 Φ 1.96 [1 Φ 1.96 ] Φ 1.96 0.95
dx
u
x
标准正态 分布函数
x x
1 ( x) (u )du 2 - x
e
u 2 / 2
du
标准正态分布
标准正态分布的概率密度函数
(u )
1 2
e
u
2
2
, u
u称为标准正态变量或标准正态离 差,表示x与μ的差相当于多少个
理论分布 % 68.27 95.00 95.00 99.00
为应用方便,将标准正态分布的双侧 尾部面积之和等于α 时所对应的变 量值称为正态分布的双侧临界值,记 为uα/2(zα/2)即P(|u|> uα/2)=α 对数正态分布 原始数据经对数转化后服从正态分布, 如正常成人血铅含量,医院病人的住 院天数等
f
r
)
0.4 P 95 2.3 16 (238 95% 212) 2.65
该市健康居民发汞值的95%参考值范围应小于 2.65g/g。
某市238名健康人发汞含量
发汞值(g/g) 人数 累积频数 累积频率(%)
0.30.71.11.51.92.32.7-
20
66 60 48 18 16 6
正态分布是许多统计方法的理论基础
第二节 医学参考值范围
一、基本概念
同质观察单位某项测定指标按一定 标准确定的波动范围称参考值范围 (range of reference value)也 有称正常值范围(range of normal value),前者较合理。
参考值范围估计的一般原则与步骤
e
x
( x )2 /( 2 2 )
dx
1 P (u ) 2
e
u
t 2 / 2
dt
按标准正态分 布公式计算曲 线下面积
一般统计学书籍均附有标准正态分布的分布 函数Φ(u)表。由概率密度曲线的对称性:
Φ u 1 Φu
借助这个表格可以得到任何区间上标准正态 分布曲线下的面积, 即变量落在该区间上的概 率。
20
86 146 194 212 228 234
8.40
36.13 61.34 81.51 89.08 95.80 98.32
3.13.53.9-4.3 合计
1
0 3 238
235
235 238 -