统计学--正态分布和参考值范围
03-医学统计学正态分布与医学参考值范围
1
ze
z2 2
dz
( X
)
2
标准正态分布的应用
实际应用中,经z变换可把求解任意一个正态分布曲线 下面积的问题,转化成标准正态分布曲线下相应面积的 问题。
欲求服从标准正态分布的随机变量在区间(-∞, z)(z≤0) 上曲线下的面积,可直接查表;对(z>0) 可根据对称性 算得,计算公式为:
正态分布的应用
• 制定医学参考值范围 • 质量控制 • 正态分布是很多统计方法的理论基础
医学参考值范围
概述
医学参考值范围(reference value range),指正常人 的解剖、生理、生化、免疫及组织代谢产物的含量等 各种数据的波动范围。
医学参考值范围,习惯上是包含95%的参照总体的 范围。
卫生部“十二五”规划教材
医学统计学
正态分布与医学参考值范围
正态分布
概述
正态分布(normal distribution),是 一种连续型随机变量常见而重要的分 布。
它首先由莫阿弗尔于1733年提出。 之后高斯对其进一步研究,使正态分 布广为人知。
A. de Moivre
Gauss
正态曲线 正态曲线(normal curve),是一条高峰位于中央,两侧逐 渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。
Φ(z) =1-Φ( -z ) z在区间( z1, z2 )取值概率的计算公式为:
P(z1<z<z2 ) = Φ(z2)- Φ(z1)
【例】由160名7岁男孩身高测量的数据算得样本均数为 122.6cm、样本标准差为4.8cm。已知身高数据服从正态分布, 试估计该地当年7岁男孩身高介于119cm到125cm范围所占的 比例。
正态分布与医学参考值范围
1. 基于临床实践,从个体角度, 作为临床上判定正常与异常的 参考标准,即用于划分界限或 分类。
2. 基于预防医学实践,从人群角 度,可用来评价儿童的发育水 平,如制订不同年龄、性别儿 童某项发育指标的等级标准。
确定95%参考值范围示意图
二、制订医学参考值范围的注意事项
1. 确定同质的参照总体 一般选择“正常”人,主要是排除了对研究指标
例3-1 若X~
,试计算X 取值在区间
上的概率。
Standard normal distribution
例3-2 已知某地140名正常成年男子红细胞计数近似 服从正态分布, =4.78×1012/L, =0.38×1012/L。 ①该地正常成年男子红细胞计数在4.0×1012/L以下 者占该地正常成年男子总数的百分比;
服从正态分布, =4.78×1012/L, =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。 近似正态分布资料可按正态分布法处理,因红细胞 计数值过大或过小均为异常,故应估计双侧95%参 考值范围:
即该地正常成年男子红细胞计数的95%参考值范围 为4.04×1012/L~5.52×1012/L。
查附表1
,表明该地成年男子红
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
正常成年男子总数的百分比
=
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占 该地正常成年男子总数的95.04%。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
卫生统计学--离散趋势的统计描述(衡量离散程度的指标、正态分布及应用、医学参考值范围)
课后习题:
3、将一组计量资料整理成频数表的目的( ) A、化为计数资料 B、便于计算 C、提供原始数据 D、为能够更精确的检验 E、描述数据的分布特征
4、6人接种流感疫苗一个月后,测定抗体 滴度为1:20、1:40、1:80、1:80、1:160、 1:320,求平均滴度应选用的指标是( )
表2-7 282名正常人尿汞值( g/L )测量结果
尿汞值
频 数f
累计频数 f
累计频率(%)
0~
45
45
16.0
8.0~
64
109
38.6
16.0~
96
205
72.7
24.0~
38
243
86.2
32.0~
20
263
93.3
40.0~
11
274
97.2
48.0~
5
279
98.9
56.0~
2
281
99.6
统计学方法是( )
A、用均数评价 B、用中位数评价 C、用几何均数评价D、用变异系数评价 E、用医学参考值范围评价
2.用于计算变异系数 3.用于计算标准误 4.结合均值与正态分布的规律,估计参考值范
围
第一节 衡量离散程度的指标 (五)变异系数(coefficient of variation)
变异系数常用于比较度量单位不同或均数相 差悬殊的两组(或多组)资料的变异程度。
S CV 100%
X
例题:某地7岁男孩身高的均数为 123.10cm,标准差为4.71cm;体重 均数为22.29kg,标准差为2.26kg, 比较其变异度?
随机变量X N(,2)
拓展
Z X
医学统计学简答题
1、正态分布的特点及其应用性质:①以均数为中心,两头低中间高,左右完全对称的钟型曲线;②只有一个高峰,在X=μ,总体中位数亦为μ;③μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为形态参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;④对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布;⑤正态分布在μ±1σ处各有一个拐点;⑥正态曲线下的面积分布有一定的规律:X轴与正态曲线所夹面积恒为1;区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。
应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。
2、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。
方法:①正态分布法:②百分位数法(偏态分布):3、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散。
标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与n的关系:随着n增加,样本标准差稳定于总体标准差;随着n增加,样本标准误减少并趋于0。
03正态分布与医学参考值范围 (1)
44556677777888888899 10 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 13 13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 26 26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51
X2
1.96
1.96
P1.96 z 1.96 1.96 1.96 1 1.96 1.96
1 2 1.96 1 20.025 0.95
Standard normal distribution
2
e dx X
1 2
X
2
Normal distribution
正态分布是单峰分布,以 X 为中心左右完全对称
正态曲线在 X 处有拐点,呈现为钟型
正态分布由两个参数 和 σ 决定
是位置参数,决定着正态曲线在X轴上的位置
σ 是形状参数,决定着正态曲线的分布形状
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
第3章正态分布与医学参考值范围
表2-4 某地630名正常女性血清甘油三酯含量(mmol/L)的频数表
甘油三脂
频数
累积频数
累积频率(%)
0.10~
27
27
4.3
0.40~
169
196
31.1
0.70~
167
363
57.6
1.00~
94
457
72.5
1.30~
81
538
85.4
1.60~
42580ຫໍສະໝຸດ 92.11.90~
28
608
96.5
0 .3 8
0 .3 8
= P (2.05z1.89)
1 1 . 8 9 2 . 0 5 1 0 . 0 2 9 4 0 . 0 2 0 2 0 . 9 5 0 4
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占 该地正常成年男子总数的95.04%。
根据经验已知正常成年人的血铅含量近似对数正 态分布,因此首先对原始数据作对数变换,经正 态性检验可知对数值服从正态分布(P>0.50), 故编制对数值频数表,再利用正态分布法求95% 参考值范围。
44556677777888888899 10 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 13 13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 26 26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51
正态分布和医学参考值范围1
4、制定正常值范围时,应根据指标的实际用途和特征来决定 取单或双侧正常值范围。 5.百分位数法应用广泛,计算较简单,故制定正常值范围时应 首选百分位数法。 6.近似正态分布资料以 X uS 法估计正常值范围,较百 分位数法稳定,受两端数据影响较小。
医学统计方法(试题分析)
二、选择题:
1、某资料的观察值呈正态分布,理论上有________的观察值落 在 x 1.96s 范围内。 a.68.27% b.90% c.95% d.99% e.45% 2、正态曲线下,从均数μ到μ+1.645σ的面积为 ________。 a.45% b.90% c.95% d.47.5% e.99% 3、标准正态分布是指_________正态分布。 a.μ=0 σ=1 b.μ=1 σ=0 c.μ=0 σ任意 d.μ任意 σ=1 e.以上都不对 X 1.960S X 1.645S 4、资料呈偏态分布,90%双侧正常值范围为_________。 a. x 1.96s b. x 1.64s c.P2.5~P97.5 d.P5~P95 e.0~P90
4)统一测量方法与条件,控制测量误差
测量方法与条件统一,是控制系统误差,测量误差,保证参 考值的可靠性与代表性的重要措施,如检验人员操作方法,熟 练程度相近,实验室条件一致,测试仪器型号相同这些要求应 该满足。
5)确定观察例数(样本含量)
在一般的情况下观察例数越多(抽取样本含量是够大)结果 越接近总体,如白细胞分类计数时,数的白细胞越多,分类计 数就越正确,变异程度较大指标,多一些观察例数是恰当的, 一般样本含量最好将在100例以上。
6、在正态分布资料中,95%的双侧正常值范围常用________ 表示。 a. X 1.960S b.P25~P97.5 X 2.58S d.P5~∞ c. e.P5~P95 7.用百分位数法确定正常值范围,适用于_________资料。 a.分布不对称或不知分布 b.正态分布 c.大样本资料 d.小样本资料 e.以上都对 8、标准正态分布曲线下中间 90%的面积所对应的横轴尺度 u 的范围是________。 a.-1.645到+1.645 b.-∞到+1.645 c.-∞到+2.282 d.-1.282到+1.282 X 1.96S e.-1.96到+1.96
医学统计学-正态分布和医学参考值范围
② 百分位数法,
如资料呈偏态分布或分布不明,用百分位数法:
双侧 95% P2。5 —— P97。5 单侧 95% P95 (单侧上界 ) 计算用百分位数的公式:
P5 (单侧下界)
例9-12 利用例9-7的资料计算6岁以下男童发铅值95%的参考值范 围。发铅值是一个偏态分布的 资料,可用百分数法制定其参考 值范围 ,发铅过高才属异常,所以应计算其
.
8)选定合适的百分界限,
参考值范围是指绝大多数正常人的测定值应该所在
的范围,这个“绝大多数”习惯上指80%、90%、95%
99%
最常用的是95%
9)对资料的分布进行正态正态性检验
10)根据资料的分布类型制定适当的方 法
进行参考估计范围。
.
3.参考值范围的估计方法
估计参考值范围方法很多。主要是正态分布法。百分位数法和对 数正态分布法,以95%为例来说明。
10 .0 4 11 .1 05
u1
1.05 5.86
10.08 11.105
u2
查附表(1)
0.37 5.86
u 1 1 .0 50 .146 u2 9 0.3 70.3557
D u 2 u 1 0 . 3 3 0 . 1 5 4 0 . 2 7 6 0 9
.
正态分布的应用:
取单或双侧正常值范围。
5.百分位数法应用广泛,计算较简单,故制定正常值范围时应
首选百分位数法。
6.近似正态分布资料以 X uS 法估计正常值范围,较百
分位数法稳定,受两端数据影响较小。
.
医学统计方法(试题分析)
二、选择题:
1、某资料的观察值呈正态分布,理论上有________的观察值落
正态分布及参考值范围
f(x)值越小。在 处有拐点。
(3)正态分布有两个参数:位置参数——均数 μ和形态参数(又叫变异度参数)——标准差σ 。正态分布曲线只与这两个参数有关。
正态分布的特征
位置参数——均数μ
决定正态分布曲线在横轴上 的集中位置。固定形态参数σ ,改变μ的值,曲线沿 x轴平 行移动,曲线形状不变。
68.27% 95% 99% -2.58 -1.96 -1 0 1 1.96 2.58
某地108名正常成年女子的血清总蛋白(g/L)含量如 下表,试估计该地正常女子血清总蛋白<68.0g/L、 <78.0g/L、和 ≥78.0g/L所占正常女子总人数的百 分比。
表 某地108名正常成年女子的血清总蛋白(g/L)含量 67.3 75.4 73.1 70.9 75.1 72.6 78.2 68.8 73.8 71.5 66.5 75.1 70.7 68.9 73.3 72.3 76.5 74.3 75.9 75.4 67.2 71.8 76.2 70.6 。。。。。。。。。。。。。。。。。。。。。。。。。。 64.1 75.1 76.3 77.8 65.2 75.0 72.7 78.8 71.1 71.8 72.9 76.1 71.2 75.2 72.9 79.5 73.9 75.2 73.1 79.5 81.8 74.5 81.6 74.5
百分位数法 应用条件 : 偏态分布资料
参考值范围 (%)
90
双侧 P5~P95
只有下限
单侧
只有上限
P10
P90
95
P2.5~P97.5
P5
P95
99
P0.5~P99.5
P1
统计学--正态分布和参考值范围
➢估计频数分布
➢制定参考值范围
➢质量控制
2020/8/8
➢统计方法的基础
2
一、正态分布
(一)正态分布的图形 例:某地7岁男童身高的
频数分布
2020/8/8
3
正态分布图形特点
▪ 正态分布 频数分布是中间(靠近均数)频数多, 两边频数少,且左右对称。
▪ 正态曲线 呈钟型:两头低中间高,左右对称
▪ 若指标X的频数分布图接近正态分布曲线, 则初步判断该指标服从正态分布。
2020/8/8
29
正态分布时:
▪ 偏度系数r1=0;峰度系数r2=0 非正态分布时:
▪ R1>0 正偏态; r1 <0 负偏态 ▪ r2 >0 尖峭峰; r2 <0 平阔峰
2020/8/8
30
作业 p31~32 三、计算分析题
题 1. 2. 3.
▪ 要求: *不必抄题目,只写明页数和题号 *能用spss计算的均用spss计算 *写出主要的命令和结果 如:weight case, frequencies
2020/8/8
8
正态曲线下面积的分布规律---续
▪ (-1, +1) 的面积占总面积的68.27% ▪ (-1.96, +1.96)的面积占总面积的95.00% ▪ (-2.58, +2.58)的面积占总面积的99.00%
2020/8/8
9
三、标准正态分布
▪ 标准正态分布与标准化变换 ▪ 标准正态分布表
压 ▪ >95mmHg :高血压
2020/8/8
23
参考值范围的确定
▪ 方法:正态近似法,百分位数法
▪ 95%参考值(正常值)范围
医学统计学(第2章)正态分布
dx
(2-18) )
F(X)
p(a〈x〈b)
0 12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
正态分布曲线下面积的含义
1.表示变量值(x)在a-b区间变量值所占 1.表示变量值 表示变量值( 全部(总体)变量值的比例或概率 比例或概率(p)。 全部(总体)变量值的比例或概率(p)。 2变量值在整个曲线下的面积为100%,或 变量值在整个曲线下的面积为100%,或 出现的概率为1 出现的概率为1。
第五节 医学参考值范围的制定
一、概念 医学参考值是指包括绝大多数“ 医学参考值是指包括绝大多数“正 常人” 的各种生理及生化指标常数, 常人 ” 的各种生理及生化指标常数 , 也 称正常值。 称正常值。 正常值是指在一定范围内波动的值, 正常值是指在一定范围内波动的值, 医学上常用95% 医学上常用95%的范围作为判定正常或 异常的参考标准。 异常的参考标准。
二、 标准正态分布
1.标准正态分布及标准化变量值(u) 标准正态分布及标准化变量值( ) 标准正态分布及标准化变量值 任何正态分布的X值通过 值转换后,称为标 任何正态分布的 值通过u值转换后 称为标 准化的正态分布, 准化的正态分布,即u ~N( µ=0 , σ2=1) ( ) 概率密度函数为: 。概率密度函数为: 2
Φ(−u) 表示从-∞到- u值对应曲线范围 表示从- 值分布比例。 内X值分布比例。
例1: :
Φ(u = −1) = 0.1587 Φ(µ =1) =1− Φ(u = −1)
=1− 0.1587 = 0.8413
例2:标准正态变量值u=(-1,1)和u= 标准正态变量值u=( 1.96,1.96)区间内面积各为多少? ( -1.96,1.96)区间内面积各为多少?
参考值范围的计算公式
参考值范围的计算公式好的,以下是为您生成的关于“参考值范围的计算公式”的文章:在咱们日常生活和学习中,经常会碰到各种各样需要参考值范围的情况。
比如说,体检时医生会根据一些指标的参考值范围来判断我们的身体是否健康;在科学实验中,研究人员也需要依靠参考值范围来评估实验结果的合理性。
那这参考值范围到底是咋算出来的呢?别急,让我慢慢给您道来。
咱先来说说啥是参考值范围。
简单来说,就是一组数据中大多数正常个体的数值所在的范围。
就好比一群学生考试的成绩,大部分人都在某个分数段里,这个分数段就可以看作是参考值范围。
那这计算公式是咋来的呢?这就得提到统计学啦。
常见的计算参考值范围的方法有不少,比如正态分布法、百分位数法。
先说正态分布法。
假设我们有一组数据,它们符合正态分布,那这计算就相对简单些。
咱先得算出这组数据的均值和标准差。
均值您就理解成这组数据的平均水平,标准差呢,则反映了数据的离散程度。
比如说,咱们测了一群人的身高,算出来均值是 170 厘米,标准差是 5 厘米。
那 95%的参考值范围大概就是均值加减 1.96 倍的标准差,也就是 170 ± 1.96×5,算出来就是 160.2 厘米到 179.8 厘米。
这意味着,大概 95%的人的身高会在这个范围内。
再说说百分位数法。
这个方法就更直观一些。
比如说,咱们要算 95%的参考值范围,那就把这组数据从小到大排好序,然后找到第 2.5 百分位数和第 97.5 百分位数,这两个数之间的范围就是啦。
我给您讲个事儿,之前我有个朋友是做健康管理的。
有一次,他们公司接到一个大项目,要为一家企业的员工做健康体检报告分析。
其中有一项是血脂检测,可把他们给忙坏了。
因为不同年龄段、性别的人的血脂参考值范围都不太一样。
他们就得用各种计算公式,结合大量的数据,才能给出准确的分析结果。
我朋友那几天天天加班,对着电脑算啊算,眼睛都快花了。
最后终于顺利完成了任务,得到了企业的好评。
统计学--正态分布和参考值范围
2019/1/10
9
三、标准正态分布
标准正态分布与标准化变换 标准正态分布表
2019/1/10
这样可将所有不同均数和标准差的资料 都转换为均数为0,标准差为1的分布, 即标准正态分布。
2019/1/10
11
标准正态分布的累计函数
1 u Φ (u) e du 2 σ
2019/1/10
26
三、 百 分 位 数 法
200名血铅频数表及P95计算表
组段
3~ 8 ~
频数f
36 39
累计频数f
36 75
累计频率(%)
18.5 37.5
12 ~
18 ~ 23 ~ 28 ~ 33 ~ 38 ~
47
20 18 16 3 7
122
152 170 186 189 196
61.0
2019/1/10
4
正态分布的概率密度函数:
1 1 2 x / 2 f x e 2 x
为总体均数, 为标准差,
3.14159
e 2.71828
5
记为:X~N(,)
2019/1/10
记为:X~N(,)
如某年某地7岁男孩的身高X服从 均数为121( cm )、标准差为5 (cm)的正态分布,可记为X~ N(122,5)
2019/1/10
6
(二)正态分布的两个参数
描述了正态分布的集中趋势位置。 描述正态分布的离散程度。 越小,曲 线越瘦高,分布越集中;反之,...
2019/1/10
2019/1/10
-3
-2
-1
0
1
2
第六章 正态分布与医学参考值范围
0.2-0.45 2.0-4.0 X10E9/L X10E9/L 1.0-3.3 X10E9/L
13 平均血红蛋白浓度(MCHC)
14 红细胞分布宽度CV(RDW%) 0.137 15 血小板计数(PLT) 16 血小板分布宽度(PDW) 17 平均血小板体积(MPV) 170 14.8 11.50 80-300 12-18 4.0-12.0 X10E9/L fl fl
姓 名:XXX 性 别:女 年 龄:30岁 No 项 目
1 白细胞计数(WBC)
2 中性粒细胞百分率(NEUT%) 3 中间细胞百分率(MXD%) 4 淋巴细胞百分率(LYMPH%) 5 中性粒细胞绝对值(NEUT#) 6 中间细胞绝对值 (MXD# ) 7 淋巴细胞绝对值(LYMPH#) 8 红细胞计数(RBC)
姓 名:XXX 性 别:女 年 龄:30岁 No 项 目
1 白细胞计数(WBC)
2 中性粒细胞百分率(NEUT%) 3 中间细胞百分率(MXD%) 4 淋巴细胞百分率(LYMPH%) 5 中性粒细胞绝对值(NEUT#) 6 中间细胞绝对值 (MXD# ) 7 淋巴细胞绝对值(LYMPH#) 8 红细胞计数(RBC)
树 叶 频 数
树叶长度(cm)
正态分布的特征
1. 位于直角坐标系上方,以x=μ为中心,左右完全对 称,两端以x轴为渐近线 2. 在x=μ处,f(x)有最大值;x越远离μ, f(x)值越小
3. 正态分布有两个参数:位置参数 μ 和形态参数 σ
图6-3 正态分布形态变换示意图
4. 正态曲线下的面积分布有一定的规律
7.20
0.667 0.033 0.300 4.80 0.20 2.20 3.48
3.5-10
3章 正态分布与医学参考值范围
u
19
标准正态分布(累积)分布函 数为:
(u )
u
-
1 e 2
u2 2
du
20
对于任何参数μ和σ的正态分布,都可以通过一个简单 的变量变换化成标准正态分布,即:
u
X
标准化
21
X1
u
X
u1
为了方便,统计学家编制了标准正态分布曲线下面
积分布表,通过查表可以得到u值左侧的面积。
(C.F.Gauss,1777-1855)
2
值广为人知。
高斯的肖像已经被印在从1989年至 2001年流通的10德国马克的纸币上。
3
一、正态曲线
图2-1
图3-1
图3-2
某地正常成年男子红细胞数的分布情况
4
正态曲线:是一条高峰位于中央,两侧逐渐下降并
完全对称,曲线两端永远不与横轴相交的钟型曲线。
-3
-2 -
+ +2 +3
-4
-3
-2
-1
0
1
2
3
4
10
正态曲线下的面积规律
1-S(- , +)=0.3174 1-S(-2 , +2)=0.0456 1-S(-3 , +3)=0.0026
-3
-2 -
+ +2 +3
-4
-3
28
第二节 医学参考值范围
一、医学参考值范围的概念
医学参考值范围(reference value range):指
正常人体的解剖、生理、生化、免疫及组织代谢产物 的含量等各种数据的波动范围。
医学统计学第3讲正态分布
86
146
百分
35.98326
61.08787
194 位数法 81.17155 212 实例 88.70293 228 234 95.39749 97.90795 98.32636
17~
19~21
111 2 239 0 95% 212 1 12.88 μ 235 P95 mol/kg 16 1 0 1 236 2 120 1 119 3 239 239 -
制定参考值范围
参考值范围又称正常值范围,医学上是指 绝大多数正常人的某指标值所在的范围。 参考值范围的意义
划分正异常
制定步骤
1. 2. 3. 4. 5. 6. 从“正常人”总体中抽样:明确研究总体 控制检测误差 判断是否需要分组(如性别、年龄)确定 根据专业知识决定单侧还是双侧 选择百分界值 确定可疑范围
单侧上限---过高异常 双侧---过高、过低均异常
单侧下限---过低异常
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性 病人 假阳性
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性率 病人 假阳性率
正常人与病人的数据分布重叠示意图(双侧)
N(, 2)
N(0,1)
0.6 0.5
f (X )
N (1,0.8 )
2
0.4 0.3 0.2 0.1 0
N (0,1 )
N (1,1.2 )
2
2
-4
-3
-2
-1
0
1
第3章正态分布与医学参考值范围
X 1.64S X 1.96S X 2.58S
X 1.28S X 1.64S X 2.33S
X 1.28S X 1.64S X 2.33S
Medical reference range 例3-3 已知某地140名正常成年男子红细胞计数近似 服从正态分布,X =4.78×1012/L,S =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。
有影响的疾病或有关因素的同质人群。
2. 选择足够例数的参照样本
通常情况下,确定参考值范围需要大样本,如果
例数过少,确定的参考值范围往往不够准确。
3. 控制检测误差
为保证原始数据可靠,检测过程中要严格控制随 机误差,避免系统误差和过失误差。
Medical reference range 4. 选择单、双侧界值
对数组段 0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~ 1.3~ 1.4~ 1.5~ 1.6~ 1.7~1.8 合计 频数 4 2 5 9 12 15 18 14 12 5 3 1 100 累计频数 4 6 11 20 32 47 65 79 91 96 99 100 —
Medical reference range
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
Medical reference range
表 3-1 医学参考值范围的正态分布法和百分位数法计算公式 概率 (%) 90 95 99 双侧 正态分布法 单侧 下限 上限 百分位数法 单侧 双侧 下限 上限 P5 ~ P95 P2.5~ P97.5 P0.5~ P99.5 P10 P5 P1 P90 P95 P99
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
u
e
u
2
2
du
标准正态分布图形
-3 -2
2012-9-29
-1
0
1
2
3
12
标准正态分布表(P803附表1)把标准正态分
布曲线下的面积编制成工具表
列出标准正态曲线下从-∞到u范围内的面积 F(u)值。 而且F(u)= F(-u)。 -∞到u= - 0.50范围内的面积:
F(-0.5)= 0.3085 -∞到u= 0.50 范围内的面积为多少呢 F(0.5) =1- F(-0.5) =1-0.3085=0.6915
7
二、正态曲线下面积的分布规律
1
( X )
2
F(X )
2
X
e
2
2
dX
F(X)为正态变量X的分布函数,即 对概率密度函数求积分
2012-9-29
8
正态曲线下面积的分布规律---续
(-1, +1) 的面积占总面积的68.27% (-1.96, +1.96)的面积占总面积的95.00% (-2.58, +2.58)的面积占总面积的99.00%
2012-9-29
21
正常人与病人的分布有重叠
减少假阳性可选用95%或99%:鉴定诊断。 减少假阴性可选用80%或90%:筛选可疑者。
2012-9-29
22
正常人和病人的分布重叠较多
需要确定可疑范围。 如 舒张压 =<90mmHg:正常 >90mmHg 且 =<95mmHg :临界高血 压 >95mmHg :高血压
如某年某地7岁男孩的身高X服从 均数为121( cm )、标准差为5 (cm)的正态分布,可记为X~ N(122,5)
2012-9-29
6
(二)正态分布的两个参数
描述了正态分布的集中趋势位置。 描述正态分布的离散程度。 越小,曲 线越瘦高,分布越集中;反之,...
2012-9-29
例2 :某地调查110名健康成年男性的第 一秒肺通气量的均数为4.2(L),标准差 为0.7 (L)。请据此估计该地成年男子第 一秒肺通气量的95%参考值范围。
下限为:4.2-1.64×0.7=3.052 (L)
该地成年男性的第一秒肺通气量95%参考值范 围为:不低于3.052 (L)。 参考值范围 : > 3.052 (L)
2012-9-29
26
三、 百 分 位 数 法
200名血铅频数表及P95计算表
组段
3~ 8 ~
频数f
36 39
累计频数f
36 75
累计频率(%)
18.5 37.5
12 ~
18 ~ 23 ~ 28 ~ 33 ~ 38 ~
47
20 18 16 3 7
122
152 170 186 189 196
61.0
查标准正态表得: F( -2 )=0.0228
估计该地当年低体重儿所占的比例为 2.28%
2012-9-29 19
第五节 医学参考值范围的制定
reference ranges亦称正常值范围 绝大多数正常人某指标测定值所在的范围
绝大多数:90%、95%、99%等等。 正常人是指排除了影响所研究指标的疾病和有 关因素的同质人群。
2012-9-29
4
正态分布的概率密度函数:
f x 1
2
e
1 2 x /
2
x
为总体均数, 为标准差,
3 . 14159
e 2 . 71828
记为:X~N(,)
2012-9-29 5
记为:X~N(,)
正态分布和参考值范围的估计
《医学统计学》 供研究生用
2012年9月29日星期六
医学统计学----研究生用
1
第四节
正态分布
(normal distribution)
正态分布 正态分布的两个参数 正态曲线下面积分布规律 标准正态分布 标准正态分布与标准化变换 标准正态分布表 正态分布的应用 估计频数分布 制定参考值范围 质量控制 统计方法的基础 2012-9-29
x 1 . 96 s 143 . 08 1 . 96 6 . 58
下限为:143.08 – 1.96 ×6.58=130.18(cm) 上限为:143.08 + 1.96 ×6.58=155.98(cm)
该地14岁女孩身高的95%参考值范围为 130.2~156.0 (cm)。
2012-9-29 25
2012-9-29
23
参考值范围的确定
方法:正态近似法,百分位数法 95%参考值(正常值)范围 正态近似法 百分位数法 双侧 P2.5 ~ P97.5 X ±1.96s 单侧下限 P5 X -1.64s X +1.64s 单侧上限 P95
2012-9-29
24
二、正态近似法
例1:某地农村1999年130名14岁女孩身高 资料(cm)均数为143.08,标准差为6.58。 求该地14岁女孩身高的95%参考值范围。
应遵循一定步骤确定参考值范围。 计算方法有正态分布法和百分位数法。
2012-9-29
20
一、确定参考值范围基本步骤
从正常人总体中抽取足够含量的样本;n >100 控制测量误差下进行准确而统一的测定; 判定是否需要分组;有无年龄、性别差异等? 确定取单侧还是双侧范围值:红细胞?肺通气 量?尿铅? 选定适当的百分界限; 对资料进行正态性检验; 计算参考值范围。
2012-9-29
15
对于非标准正态分布,求曲线下任意(X1,X2)范 围内的面积
例 Mean=121.95,s=4.72㎝,n=110
(1) 估计界于116.5~119.0范围内7岁男童的比例 (2) (2) 估计界于116.5~119.0范围的男童人数。
u1=(116.5-121.95)/4.72=-1.15; u2=(119.0 -121.95)/4.72=-0.63。 F(-1.15)=0.1251;F(-0.63)=0.2643。
2012-9-29
-3
-2
-1
0
1
2
13
3
标准正态分布面积分布规律
-∞到u= - 2.58范围内的面积:0.0049 -∞到u= - 1.96范围内的面积:0.0250 -∞到u= 0.00范围内的面积:0.5000 (-1, 1) 的面积占总面积的68.27% (-1.96, 1.96)的面积占总面积的95.00% (-2.58, 2.58)的面积占总面积的99.00%
2012-9-29
-3
-2
-1
0
1
2
14
3
标准正态分布,求曲线下任意(X1,X2) 范围内的面积
例 u1=-1.50,u2=-0.31,欲求标准正态 曲线下(-1.50,-0.31)范围内的面积。 (-∞,u1)的面积F(-1.50)= 0.0668; (-∞,u2) 的面积F(-0.31)=0.3783。 则(-1.50,-0.31) 的面积 D=F(u2)-F(u1)=0.3783-0.0668 =O.3115。
27
SPSS下的正态性检验
正态性检验有两大类:图示法和计算法。 SPSS下可以采用图示法中的概率图进行 正态性检验; 概率图(probability-probability plot, P-P plot)或分位数图(quantile-quantile plot,Q-Q plot); 如果散点图几乎在一条直线上,可认为该 资料服从正态分布。
2012-9-29
31
2012-9-29
9
三、标准正态分布
标准正态分布与标准化变换 标准正态分布表
2012-9-29
10
标准化变换: u变换
u X
这样可将所有不同均数和标准差的资料 都转换为均数为0,标准差为1的分布, 即标准正态分布。
2012-9-29
11
标准正态分布的累计函数
Φ (u) 1 2σ
2012-9-29 28
正态性检验的计算法
矩法(method of moment):对偏度和峰度 进行检验。 偏度(skewness):反映分布的对称情况。 峰度(kurtosis):反映分布的尖峭程度。 分别用偏度系数r1(coefficient of skewness) 和峰度系数r2(coefficient of kurtosis)表示。
76.0 85.0 93.0 94.0 98.0
43 ~
48 ~ 53 ~ 58~62
1
1 1 1
197
198 199 200
98.5
99.0 99.5 100.0
P95 L
2012-9-29
i f
n x %
f L 38
5 7
200
0 . 95 189 38 . 7 ( g / 100 g )
(1) 0.2643-0.1251=13.92%; (2) 110×13.92%=15。
2012-9-29 16
正态分布的特征
正态曲线呈钟型,在横轴的上方,均数位
置最高; 正态分布以均数为中心,左右对称; 正态分布有两个参数,即均数和标准差; 标准正态分布的均数为0,标准差为1; 正态曲线在±1 各有一拐点; 正态分布的面积分布有一定的规律性。
2012-9-29
17
正态分布的应用
估计频数分布 制定参考值范围 质量控制 统计方法的基础