第三章 统计学正态分布及其应用(医学统计学)

合集下载

医学统计学 正态分布(精)

医学统计学 正态分布(精)

参考值范围的估计方法:正态分布法

2.5% 95% 2.5%
-1.96

+1.96
【例5.6 】某地调查正常成年男子144人的红细胞 数,近似正态分布,得均数 X =5.38×1012/L,
标准差S=0.44×1012/L。试估计该地成年男子红
细胞数的95%参考值范围。 解:双侧,95%界值u=1.96
X 2S 作为上下警戒值,
X 3S 作为上下控制值
4)正态分布是许多统计方法的理论基础
u 检验是以正态分布为理论基础的假设 检验方法; 统计学中的三大统计分布:卡方分布,t 分布, F 分布都是在正态分布的基础上推 导出来的; 某些分布的极限形式为正态分布:如 t 分 布,二项分布,Poisson分布等。均可按正 态近似的原理来处理。
应用本法的条件是样本含量较多,分布趋于稳定,样本含量 不少于150为宜。 其优点是可用于任何分布甚至分布不明的 资料。
【例5.7 】 用硫酸-高锰酸钾-硝酸消化法和无火焰原子吸 收光谱法测得某市238 名正常人发汞值如表5.6,试确定 该市发汞值的95%正常值范围。
表5.4 238例正常人发汞值的频数分布
X ±us
(cm)
人数
百分数(%)
(%)
────────────────────────────────────
X ±1.00s 119.41±1.00×4.38 X ±1.96s 119.41±1.96×4.38
115.03-123.79 110.83-127.99 108.11-130.71
83 113 119
参考值范围的涵义:绝大多数的正常人在该范围内 绝大多数,习惯上指正常人的80%,90%,95% (最常用)或99%等。 例如,根据正常人样本确定了血清谷草转氨酶正常 值单侧95%上限为37U/L。即容许有5%的正常人被 判为异常,称为假阳性

预防医学统计学正态分布及其应用

预防医学统计学正态分布及其应用

2
其中 x
0
x
式中 为实数, >0 .则称X服从参数为 ,2旳正态分 布,记为N(, 2).可表为X~N(, 2).
图象见右上角
二、正态分布图形特征
1、高峰位于中央,两侧逐渐下降并对称,
曲线两端不与横轴相交
f (x)
2、以均数为中心,左右对称
3、正态分布有两个参数:
(1)位置参数 μ (2)形态参数σ
95%参照值范围为(2.96,6.72)(mmol/L)
(2) 3.80-4.84
u=
= - 1.08
0.96
Ф(u) =Ф(-1.08)=0.1401
即血清总胆固醇低于3.80 mmol/L所占旳 百分比为14.01%。
95.00% 2.5%
μ -1.96 σ
μ + 1.96σ
1
2 μ-σ
3
μ+σ
四、 原则正态分布
参数=0,2=1旳正态分布称为原则正态
分布,记作X~N(0, 1)。
(x)
其密度函数为
(x)
1
x2
e2
2
( x )
4 2 0 2 4
2、原则正态分布曲表
Φ(面积,即相应u值左侧原则正态分布曲线 下面积。
N(4,7/5)
2 0 2 4 6 x
三、正态曲线下面积旳分布规律
正态曲线与X轴所夹旳面积恒等于1或100%
面积总 等于1
已知:X服从均数为μ ,原则差为σ旳正态分
布,试估计X取值在μ± σ, μ±1.96 σ,
μ±2.58σ区间上旳概率
f (x)
1
e
(
x )2 2 2
2

医学统计学 正态分布及其应用

医学统计学 正态分布及其应用

26/43
为什么要确定一个范围? 既然同属正常人,就不能以甲的数据为标准, 认为乙异常,亦不能以甲此时的数据为标准, 认为彼时的异常。所以必须确定一个波动范 围。如WBC:4000~10000个/mm3 “正常”是一个相对的概念 “正常人”是指排除了影响所研究指标的疾 病和有关因素的人。
27/43
同质 正常 “足够数量” 例数过少,代表性差;例数过多增加成本, 且易导致正常标准把握不严,影响数据的可 靠性。 一般认为每组100例以上 ;有人认为确定临 床生化指标的正常值应取300~500例。
30/43
控制检测误差
通过人员培训、控制检测条件、重复测 定等措施,严格控制检测误差。
(二)主要特征:
1、正态分布以均值μ为中心,左右对称。 2、正态分布中,曲线下面积集中在以均值μ为中心 的中心部分,越远离中心,曲线越接近 X 轴,曲线 下面积越小,超过一定范围以外的面积可以忽略。
8/43
3、正态分布曲线完全由参数μ和σ决定。
μ是位置参数,决定分布曲线在横轴的偏
移位置。
σ是变异参数,决定分布曲线的形态。
71.67
95.00 98.33
68.27
95.00 99.00
25/43
参考值范围
(reference interval)
又称正常值范围(normal range) 正常人的形态、功能、生化等各种指标的波 动范围。简称正常值。 为什么波动? “个体变异” 同一指标的数据因人而异 同一个体的数据随环境、时间等改变而变
9/43
方差相等、均数不等的正态分布图示
2 1 3
3
1
2
10/43
均数相等、方差不等的正态分布图示

医学统计学-4-正太分布及应用

医学统计学-4-正太分布及应用
(u)
1 2 e
u 2 2
,(-∞< u <+∞)
对其定积分:
(u )
1 2
u
e
u 2 2
du
式中 (u)为标准正态变量u的累计分布函数, 反映了横轴自-∞到u的正态曲线下面积,也 就是下侧累计面积(概率)。 引入标准化变换后,对于其他任何正态分 N ( , 2 ) 都可以借助标准正态分布表估计 布 任意(X1,X2)范围内的频数比例。
1、参考值范围确定的注意点
“正常人” 的概念 样本数据大小的问题 检测误差的问题 判断是否分组 单、双侧的问题 “绝大多数”的含义 是否需要确定可疑范围 变量转换的问题
不管将正常界值定在什么位置,都可能出现假 阳性或假阴性,产生这两种误判的根本原因是 正常人的分布与病人的分布有重叠 。
(一)估计频率分布
例、若由某项研究得某地婴儿出生体重为 3100g,标准差为300g,试估计该地区当年出 生低体重儿(出生体重≤2500g)所占比例。 认为当年该地区婴儿出生体重近似服从正态分 布N(3100,3002),作标准化变换:
u X

2500 3100 2.00 300
注意点二
对于非标准正态分布,求曲线下任意(X1, X2)范围内的面积,可先作标准化变换, 再借助标准正态分布表求得。
例、某市120名12岁男童身高的例子中已求得均 数为 143.05cm,标准差s=5.82cm。设该资料服 从正态分布,试求① 该地12岁男童身高在132cm 以下者占该地12岁男童总数的比例,② 分别求 X ±1s、 X ±1.96s和 X ±2.58s范围内12岁男童占 该组儿童总数的实际百分数,并与理论百分数比 较。

医学统计学. 正态分布及其应用

医学统计学. 正态分布及其应用
44
表4.6 参考值范围的制定
45

例4.24 某地调查正常成年男子200人的红 细胞数,得均数 X =55.26×1012/L,标准 差S=0.38×1012/L,试估计该地正常成年 男子红细胞数的95%参考值范围。
46
解:该地正常成年男子红细胞数的95%参考值范围为
下限:
X-1.96S =55.26 - 1.96×0.38=54.52(×1012/L)
生不同位置、不同形状正态分布, (x1,x2)范围内的面积也不同, 计算起来很麻烦。
22
三、标准正态分布 为了计算方便,对于正态或近似正态 分布的资料,只要得出均数和标准 差,可通过标准转化,转化成求标 准正态曲线下横轴自-∞到z的面积。 为了便于应用,统计学家按Φ(z)编 制了标准正态分布曲线下的面积表, 由此表可查出曲线下某区间的面积, 这样就可对符合正态分布资料的频 数分布作出估计。
曲线下在区间(μ-2.58σ,μ+2.58σ)的面积为99%。
16
■μ士σ范围内的面积占正态曲线下面积的68.27%,也
就是说有68.27%的变量值分布在此范围内。
68.27%
-

+
17
μ士1.64σ范围内的面积占正态曲线下面积的90%,也就是 说有90%的变量值分布在此范围内。
90%
5%
线,近似于数学上的正态分布曲线。
7
一.正态分布的概念和特征
1.正态分布的概念
在医学卫生领域中,许多变量的频 数分布是中间(靠近均数处)频数多,两边 频数少,且左右对称。如人体的许多生 理、生化指标等。这种变量的频数分布 规律可用概率论中的一种重要的随机变 量分布—正态分布(Normal distribution)加 以描述。

正态分布在医学统计学区间估计的应用

正态分布在医学统计学区间估计的应用

正态分布在医学统计学区间估计的应用
正态分布在医学统计学区间估计中有着重要的作用,下面来看看它具体在医学统计学中的应用:
一、正态分布在病人总死亡评估中的应用
1、采用正态分布加以拟合,以此为基础进行参数的估计,来评估患病的总死亡率;
2、正态分布用于估计患者每一种病的能力,以及每个患者的健康状况,对有效的病人总死亡率的有效性的评估;
3、采用正态分布加以建模,以评估人群特定疾病的潜在病死率。

二、正态分布在病人康复情况评估中的应用
1、用正态分布拟合以此来评价患者在疾病入院状态以及出院状态,以便记录每一个患者的康复情况;
2、用正态分布拟合对比康复情况和病人体重、血压等参数,以便来评估疾病康复速度及相关变量;
3、采用正态分布估计病人疾病康复时间,以及评估病人康复率。

三、正态分布在医療安全性评估中的应用
1、用正态分布运算识别医疗机构中的安全缺陷及其准确性;
2、采用正态分布估计对医疗安全性的危害概率;
3、用正态分布拟合以此来评估医疗安全事件的频率和比例,以此来发现有关的风险因素。

四、正态分布在药物毒性监测中的应用
1、用正态分布评估药物毒副作用出现的概率,评估药物在不同患者身上的作用效果;
2、运用正态分布来收集药物实验结果,以检测出不同的药物的毒性;
3、采用正态分布来评估药物的安全程度及其有效性。

总而言之,正态分布在医学统计学区间估计中有着重要的应用,可以在病人总死亡评估、病人康复情况评估、医療安全性评估以及药物毒性监测中使用,在这些医学领域中都能发挥作用。

医学统计学总复习(刘桂芬主编-研究生使用) (1)

医学统计学总复习(刘桂芬主编-研究生使用) (1)
① 绘制散点图,初步判断是否呈直线趋势; ② 计算 a、b。(如果基本呈直线趋势) ③ 对 b 作假设检验:方法:a. F 检验
b. t 检验 c. 用 r 检验来代替。 ④ 作结论:如 P≤0.05, 说明方程成立,列出回归方程;如 P>0.05, 说明方程不成立,不列回归方程。 5. 直线相关的概念 6. 直线相关的主要用途:用于分析两变量是否有相关关系及其方 向
观察人数
期内死亡人数
- 14 -
x~
nx
Dx
0~
25
10
1~
22
20
2~
10
9
3~
11
7
4~
10
1
5~
8
4
6~
4
0
7~
4
1
8~
3
0
9~
3
0
10~
2
0
11~
1
0
第三部分 期末成绩评定
一、成绩评定方法 总评(100%)=平时作业 10%+基础理论知识考试(笔试)60%+操作 技能考试(上机)30% 二、考试题型 (一)基础理论知识考试(笔试)(考试时间:100 分钟) 1、最佳选择题(单选)(30%,30 小题,每题 1 分) 2、辨析题(30%,10 小题,每题 3 分) 3、简答题(10%,2 小题,每题 5 分) 4、分析应用题(30%,5-6 题)
第十六章 生存分析
1.生存资料的特点 2.生存分析的几个基本概念(生存时间、死亡概率与生存概率、生存 率、中位生存期) 3.生存分析的用途 4.生存率计算方法:(1)K-M 法:例数少,且为未分组;(2)寿命表 法:例数多,且为频数表资料(注意:生存概率与生存率的结果) 5.生存率曲线比较:(1)log-rank test:两组或多组;(2)Gehan Score test:两组 6.Cox 模型(不要求) 第二十二章 医学论文统计结果报告

03正态分布与医学参考值范围(医学统计学)

03正态分布与医学参考值范围(医学统计学)
σ 是形状参数,决定着正态曲线的分布形状
正态曲线下的面积分布有一定的规律
图3-3
图3-4
方差相等、均数不等的正态分布图示
2 1 3
3 1 2
正态方程的积分式(分布函数):
F(X)为正态变量X的累计分布函数,反映正态曲线 下,横轴尺度自-∞到X的面积,即下侧累积面积 。
Normal distribution
图3-5
图3-6
正态分布是一种对称分布,其对称轴为直线X=µ,即均 数位置,理论上:
µ±1σ范围内曲线下的面积占总面积的68.27% µ±1.96σ范围内曲线下的面积占总面积的95% µ±2.58σ范围内曲线下的面积占总面积的99% 实际应用中:
±1 S范围内曲线下的面积占总面积的68.27% ±1.96 S范围内曲线下的面积占总面积的95% ±2.58 S范围内曲线下的面积占总面积的99%
属异常,采用双侧界值;有些指标仅过大或者过 小为异常,采用单侧界值。
肺活量参考值范围
白细胞数参考值范围
血铅参考值范围
5. 选择适当的百分数范围 结合专业知识,根据研究目的、研究指标的性质、
数据分布特征等情况综合考虑。百分数范围的不同 将导致不同的假阳性率和假阴性率。
6. 选择计算参考值范围的方法
异常
正常
异常
异常
正常
双侧下限
双侧上限
单侧下限
正常
异常
单侧上限
例3-3 已知某地140名正常成年男子红细胞计数近似服 从正态分布, X =4.78×1012/L,S =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。
X z0.05 2S 4.78 1.960.38 4.04 , 5.52

第三章-统计学正态分布及其应用(医学统计学)-幻灯片

第三章-统计学正态分布及其应用(医学统计学)-幻灯片
-1.96
68.27%
+1.0 95.00% 2.5%
+1.96
二、标准正态分布表 附表Ⅰ
Φ(u)
-∞ -3 -2
-1
0
+1 +2 +3 + ∞
查表确定标准正态分布曲线下的面积时 必须注意:
(1)当μ,σ和X已知时,先按u变 换公式求得u值,再用u值查表;
ux
当μ,σ和X未知时,用样本均数 和样本标准差S代替求u值。
Ф(u2)- Ф(u1) = 0.2643 - 0.1251
=0.1392=13.92%
即身高界于116.5-119.0cm范围内 的7岁男童比例为13.92%,其人数 为110×13.92%=15(人)。
第三节 正态分布的应用
一、估计频数分布 二、制定参考值范围 三、质量控制 四、统计处理方法的基础
u1=
= - 1.15
4.72
119.0-121.95
u2=
= - 0.63
4.72
例3.3 已知 X=121.95cm, S=4.72cm 欲估计身高界于116.5-119.0cm范
围内的7岁男童比例及人数。
求该面积
-1.15 -0.63
Ф(u1) =Ф(-1.15)=0.1251
Ф(u2) =Ф(-0.63)=0.2643
1、正态分布法
(1)适用范围:(近似)正态分布或对数正态分布 资料
x (2)计算公式: ±uS x 双侧: 95% ±1.96S
x 99% ±2.58S x 单侧: 上限 95% +1.645S
x 99% +2.326S x 下限 95% -1.645S
x 99% -2.326S
2、百分位数法 (1)适用范围: a.偏态分布资料 b.分布不清资料 c.开口资料

医学统计学3. 正态分布及应用

医学统计学3. 正态分布及应用

例习题3-1题
130名健康成年男子脉搏资料的均数、标准差分 别为:71.32与5.80 (次/分);问在正态分布假定下, 脉搏在65~75(次/分)之间有多少人?
Z1
65
71.32 5.80
1.09,该界值左侧面积为0.1379
Z2
75
71.32 5.80
0.63,该界值左侧面积为0.7357
肺活量参考 值范围
白细胞数参 血铅参考值范
考值范围

5. 选择适当的百分数范围 结合专业知识,根据研究目的、研究指标的性质、 数据分布特征等情况综合考虑。百分数范围的不同 将导致不同的假阳性率和假阴性率。
6. 选择计算参考值范围的方法 根据资料的分布类型,样本含量的多少和研究目 的等,选用适当的方法确定参考值范围。
过低异常 过高异常
过低异常过高异常
表 3-1 医学参考值范围的正态分布法和百分位数法计算公式
概率 (%) 双侧
正态分布法
单侧
下限
上限
百分位数法
双侧
单侧 下限 上限
90 X 1.64S X 1.28S X 1.28S
P5 ~ P95
P10
P90
95 X 1.96S X 1.64S X 1.64S
P2.5~P97.5 P5
Z=0.43,所对应左侧的面积 P=1-0.3336
Standard normal distribution 图3-7
0.07
f(X)
0.06
0.05
0.04
0.03
0.02
0.01
0 57 60 63 66 69 X 72 75 78 81 84
P(65 x 75) (0.43) (1)

《医学统计学》医统-第三章正态分布与医学参考值范围

《医学统计学》医统-第三章正态分布与医学参考值范围
估计该地正常成年男子红细胞计数95%参考值范围。
• 近似正态分布资料可按正态分布法处理,因红细胞 计数值过大或过小均为异常,故应估计双侧95%参 考值范围:
X z 0 . 0 5 2 S 4 . 7 8 1 . 9 6 0 . 3 8 4 . 0 4 , 5 . 5 2
即该地正常成年男子红细胞计数的95%参考值范围 为4.04×1012/L~5.52×1012/L。
表3-2 某年某地100名正常成年人血铅含量(μg/dl)对数值频数表
对数组段
频数
累计频数
0.6~
4
4
0.7~
2
6
0.8~
5
11
0.9~
9
20
1.0~
12பைடு நூலகம்
32
1.1~
15
47
1.2~
18
65
1.3~
14
79
1.4~
12
91
1.5~
5
96
1.6~
3
99
1.7~1.8
1
100
合计
100

A
36
Medical reference range
P2.5~P97.5 P5
P95
99 X 2.58S X 2.33S X 2.33S P0.5~P99.5 P1 P99
A
33
Medical reference range 例3-3 已知某地140名正常成年男子红细胞计数近似服
从正态分布,X =4.78×1012/L,S =0.38×1012/L,
,求单侧95%上限值: l g 1 ( X 1 . 6 4 S ) l g 1 ( 1 . 2 1 . 6 4 0 . 2 4 0 6 ) 3 9 . 3 1 7 3 (μg/dl)

《医学统计学》正态分布与医学参考值范围课件

《医学统计学》正态分布与医学参考值范围课件

《医学统计学》正态分布与医学参考值范围课件•正态分布概述•正态分布与医学参考值范围•正态分布的图形展示目录•医学参考值范围的计算实例•总结与展望CHAPTER正态分布概述正态分布的定义正态分布的基本性质钟形曲线正态分布的均数(期望值)和标准差(波动程度)是两个关键参数。

均数与标准差概率密度函数正态分布的应用CHAPTER正态分布与医学参考值范围定义计算医学参考值范围的定义与计算正态分布是统计学中常用的概率分布,它描述了许多医学指标的分布特征。

正态分布的曲线呈钟形,中间高,两侧低,左右对称。

在医学参考值范围的制定中,正态分布被用来确定正常范围。

一般来说,如果一个指标的分布接近正态分布,则认为其医学参考值范围是合理的。

正态分布在医学参考值范围中的应用医学参考值范围的解读与使用解读医学参考值范围是一个重要的临床工具,它可以帮助医生判断患者的某一指标是否正常。

同时,它也提供了对临床实验结果的解读和比较的基础。

使用在使用医学参考值范围时,医生应注意其局限性,并结合患者的具体情况进行综合考虑。

例如,不同年龄、性别、种族等人群的医学参考值范围可能存在差异。

因此,医生应根据患者的具体情况选择适用的参考值范围。

CHAPTER正态分布的图形展示正态分布的直方图直方图显示了正态分布的概率密度函数,可以直观地观察到正态分布的形状和特征。

直方图中的横轴表示变量值,纵轴表示在该变量值下的概率密度。

正态分布的直方图呈现出钟形曲线,左右对称,最高点出现在均值处,且在均值附近概率密度较大。

箱线图由箱子、中线、耳朵等组成,其中箱子代表四分位数范围,中线代表均值,耳朵代表标准差。

箱子的高度表示数据的相对波动程度,箱子越窄表示数据越集中。

箱线图展示了正态分布的四分位数和异常值,可以直观地判断数据的集中趋势和离散程度。

合正态分布。

QQ图中的横轴和纵轴分别表示数据的累计概率和标准化的变量值。

如果数据符合正态分布,那么QQ图上的点应该大致沿着参考线(45度直线)分布。

医学统计学.正态分布及应用PPT医学课件

医学统计学.正态分布及应用PPT医学课件

u
0
28
关于正态分布总结
正态分布是描述个体变异的重要分布之一,也 是统计学理论中的重要分布之一;
正态分布的优良性质-函数的分布
正态分布是由两个参数决定的一簇分布 正态分布曲线下的面积是有规律的,且与标准
正态分布曲线下的面积对应(以标准正态离差为 单位)。
29
正态分布的应用
二次大战期间们,英国生物学家peter blacket t 向海军部建议组建科研小组协助解决战略, 战术问题.运筹学(operational research) 诞生.
正态分布及其应用
1
一个问题
一个1.72米的男生和一个1.72米的女生哪个高?
2
该直方图给了我们什么信息?
120名7岁男童的身高分布的频率分布图
身高低于116厘米的儿童累计频率为多少?
25
身高大于1 24厘米的儿童累计频率 为多少? 20
15
10
5
0 108 110 112 114 116 118 120 122 124 126 128 130 132
1-S(-32, ,++32)=0)=.301.0704256
-3 -2 - + +2 +3
-4 -3 -2 -1 0 1 2 3 4
17
正态曲线下的面积规律
S(-, -)=3210.)5=0.01025128387
S(-, +)=3211)=0.969758772
0.017 0.025 0.058 0.117 0.158 0.20 0.15 0.125 0.075 0.042 0.025 0.008
累计频数 (4) 2 5 12 26 45 69 87 102 111 116 119 120

医学统计学正态分布及其应用

医学统计学正态分布及其应用

0.00 -0.02 -0.04 -0.06 -0.08 0.0013 0.0013 0.0012 0.0011 0.0010 0.0062 0.0059 0.0055 0.0052 0.0049 0.0228 0.0217 0.0207 0.0197 0.0188 0.0287 0.0274 0.0262 0.0250 0.0239 0.0548 0.0526 0.0505 0.0485 0.0465 0.1587 0.1539 0.1492 0.1446 0.1401 0.3085 0.3015 0.2946 0.2877 0.2810 0.5000 0.4920 0.4840 0.4761 0.4681
35
估计频数分布
首先计算标准离差:
u 132.00 142.67 1.78 6.00
查标准正态分布表: (-1.78)=0.0375(3.75%)
结果:该地12岁男童身高在132cm以下者, 估计约占3.75%。
36
估计频数分布
X us
X ±1.00s X ±1.96s X ±2.58s
表 2.7 120 名 12 岁男童身高的分布比较
身高范围(cm)
实际分布
人数
百分数(%)
136.67~148.67
86
71.67
130.91~154.43
114
95.00
127.19~158.15
118
98.33
理论分布(%)
68.27 95.00 99.00
37
质量控制
质量控制的意义
监控日常工作、科研过程、生产过程中误差的 变化,分析变化的趋势是否出现异常,从而引 起警觉和注意,以便分析原因,并及时采取措 施。

医学统计学第3讲正态分布

医学统计学第3讲正态分布

86
146
百分
35.98326
61.08787
194 位数法 81.17155 212 实例 88.70293 228 234 95.39749 97.90795 98.32636
17~
19~21
111 2 239 0 95% 212 1 12.88 μ 235 P95 mol/kg 16 1 0 1 236 2 120 1 119 3 239 239 -
制定参考值范围
参考值范围又称正常值范围,医学上是指 绝大多数正常人的某指标值所在的范围。 参考值范围的意义
划分正异常
制定步骤
1. 2. 3. 4. 5. 6. 从“正常人”总体中抽样:明确研究总体 控制检测误差 判断是否需要分组(如性别、年龄)确定 根据专业知识决定单侧还是双侧 选择百分界值 确定可疑范围
单侧上限---过高异常 双侧---过高、过低均异常
单侧下限---过低异常
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性 病人 假阳性
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性率 病人 假阳性率
正常人与病人的数据分布重叠示意图(双侧)
N(, 2)
N(0,1)
0.6 0.5
f (X )
N (1,0.8 )
2
0.4 0.3 0.2 0.1 0
N (0,1 )
N (1,1.2 )
2
2
-4
-3
-2
-1
0
1

医学统计学(课件)正态分布

医学统计学(课件)正态分布

CV舒张压

10.7 100% 77.5
13.8%
17.1
CV收缩压

100% 122.9
13.9%
第三章 正态分布及应用
一、正态分布(Normal Distribution)
f (X) 1.2 1
0.8
f (X) 1.2 1
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
3.8 4.2 4.6 5.0 5.4 5.8 X
异常
正常
异常
单侧上限
双侧下限 双侧上限
单侧上限---过高异常 双侧---过高、过低均异常
(b)24小时尿糖参考值范围 (c)白细胞数参考值范围
(五)选择适当的百分范围
参考值的百分范围应根据资料的性质和研究目的选 择,它与诊断阈值有确定的关系。百分范围的不同将导 致不同的假阳性率和假阴性率。
图3-6 正常人和病人数据分布重叠
图3-2 正态分布曲线下的面积
1 2
3
-4 -3 -2 -1 01 1 22 3 43 5 6 7
1 2 3
图3-3 三种不同均值的正态分布
-5 -4 -3 -2 -1 0 1 2 3 4 5
1 2 3 图3-4 三种不同标准差的正态分布
0.6
f (X )
0.5
上限: X 1.96S 4.78 1.96 0.38 5.52(1012 / L)
例3.5 见第二章表2-4资料。为该地区50岁~60岁女性高 血脂诊断与治疗提供参考依据,试估计血清甘油三脂含量的 95%单侧参考值范围。
(630 0.95 580)
P 1.90
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

诊断界值
(2)正常人分布与病人分布有重叠
假阴性(漏 诊)
假阳性(误 诊)
正常人
病人
诊断界值
a.如需兼顾假阳性和假阴性,取95%较 适当; b.如主要目的是减少假阳性(如用于确
诊病人或选定科研病例),宁取99%。
c.如主要目的是减少假阴性(如用于初 筛搜查病人),宁取80%或90%。
6、选择适当制定方法(见下)。
有的人,而是指排除影响被研究指标的 疾病和因素的人。
例如,制定SGPT(谷丙转氨酶)正常值 范围,“正常人”的条件是: a.无肝、肾、心、脑、肌肉等疾患;
b.近期无服用损肝的药物(如氯丙 嗪,异烟肼) c.测定前未作剧烈运动。
(2)医学参考值范围制定所需的样
本例数一般要求 n>100
2、对选定的正常人进行统一而准确的测 定: (1)测定的方法、仪器、试剂,操作的熟
正常人的某项观察值均在该范围之 内。这个绝大多,习惯上指正常人
的80%、90%、95%、99%(最常
用是95%)。
根据所选定的百分界限,会造成假阳性
或/和假阴性。 如何选定百分位数,以平衡假阳性和假阴
性:
(1)正常人的分布和病人的分布没有重 叠,这是只要求减少假阳性,则取99%较
为理想。
正常人
病人
已知 X=121.95cm, S=4.72cm
欲估计身高界于116.5-119.0cm范 围内的7岁男童比例及人数。
求该面积
116.5
119.0
u1=
116.5-121.95 4.72 119.0-121.95 4.72
= - 1.15
u2=
= - 0.63
例3.3
已知 X=121.95cm, S=4.72cm
1、抽取足够数量的“正常人”作为调查对象
2、对选定的正常人进行统一而准确的测定
3、考虑是否应按性别、年龄、职业等因素分组确定
医学参考值范围
4、确定取单侧还是双侧医学参考值范围
5、选定适当的百分界限
6、选择适当制定方法
(二)医学参考值范围制定的一般原则: 1、抽取足够数量的“正常人”作为调 查对象
“正常人”-不是指任何一点小病都没
2、百分位数法
(1)适用范围:
a.偏态分布资料
b.分布不清资料 c.开口资料
(2)计算公式: 双侧: 95% 99% 单侧: 上限 P2..5~P97.5 P0.5~P99.5 95% 99% P95 P99
下限
95%
99%
P5
P1
二、质量控制
上控制线 警戒线
x+3S
x+2S
x
下控制线
x -2S x -3S
三、正态分布是很多统计方法的 理论基础。
(1)μ-位置参数:
当 σ一定时,μ越大,曲线越向右移动; μ越小,曲线越向左移动。 (2)σ-离散度参数,决定曲线的形态:
当μ一定时,
σ越大,表示数据越分散,曲线越“胖”;
σ越小,表示数据越集中,曲线越“瘦”。
三、正态曲线下面积分布规律
无论μ σ取什么值,正态曲线与横轴间的 面积总等于1 面积 总等 于1
(三)制定医学参考值范围常用方法:
1、正态分布法
(1)适用范围:(近似)正态分布或对数正态分布 资料 (2)计算公式:
x ±uS 双侧: 95% x ±1.96S 99% x±2.58S 单侧: 上限 95% x +1.645S 99% x +2.326S 下限 95% x -1.645S 99% x -2.326S
练程度,方法的精确度均要统一;
(2)要尽量与应用医学参考值范围时的实 际情况一致。
3、考虑是否应按性别、年龄、职业等 因素分组确定医学参考值范围。 原则上,组间差别明显,并有实际意义, 应分开制定,否则应合并。
考察组间差别最简便而有效的方法是:
从频数分布表,直接比较各组的分布
范围,高峰位置,分布趋势等是否相近, 如相近就合并,如差异明显,就分组。或 做两样本均数的假设检验,有差别就分组, 无差别就合并。
4、确定取单侧还是双侧医学参考值范围。 (1)白细胞数过高和过低均属于异常,
需制定下限(最小值)和上限(最大 值),称双侧医学参考值范围。
(2)肺活量只过低为异常,只需制定医学
参考值范围的下限; 尿铅只过高为异常,
只需制定医学参考值范围的上限;均称单
侧医学参考值范围。
5、选定适当的百分界限。 正常值范围的意思:绝大多数
的正态分布。
为了应用方便,令
u
u变换
x

标准正态 分布
u服从均数为0、标准差为1的正态分布
68.27%
-1.0
+1.0
95.00%
2.5%
2.5%
-1.96
+1.96
二、标准正态分布表 附表Ⅰ
Φ(u)
-∞ -3 -2 -1 0 +1 +2 +3 + ∞
查表确定标准正态分布曲线下的面积时 必须注意:
(1)当μ,σ和X已知时,先按u变 换公式求得u值,再用u值查表;
u
x

当μ,σ和X未知时,用样本均数 和样本标准差S代替求u值。
u
x x
s
(2)查表时,可以利用标准正态分布 的两个特征: a.曲线下对称于0的区间,面积相等;
b.曲线下横轴上的总面积为100%或1。
例3.3
卫生统计学
第三章 正态分布及其应用
第一节、正态分布的概念及特征
一、正态分布图形
两头低,中间高,左右对称,呈钟 型的单峰曲线。
正态分布特征
1、曲线在横轴上方均数处最高;
2、以均数为中心,左右对称;
3、正态分布有两个参数: 位置参数μ 、形状参数σ
4、正态分布曲线下的面积有一定的分布 规律。
二、正态分布的两个参数
熟记下列常用的曲线下面积分布规律:
1、μ±σ的区间占总面积的68.27%
2、μ±1.96σ的区间占总面积的95%
3、μ±2.58σ的区间占总面积的99%
68.27%
X-S
X+S
95.00%
2.5%
2.5%
X-1.96S
X+1.96S
第二节
标准正态分布
一、标准正态分布与标准化变换
正态分布是一个分布族。对应于不 同的参数μ和σ会产生不同位置不同形状
欲估计身高界于116.5-119.0cm范 围内的7岁男童比例及人数。
求该面积
-1.15
-0.63
Ф(u1) =Ф(-1.15)=0.1251
Ф(u2) =Ф(-0.63)=0.2643 Ф(u2)- Ф(u1) = 0.2643 - 0.1251 =0.1392=13.92% 即身高界于116.5-119.0cm范围内 的7岁男童比例为13.92%,其人数 为110×13.92%=15(人)。
第三节
正态分布的应用
一、估计频数分布 二、制定参考值范围 三、质量控制
四、统计处理方法的基础
一、估计频数分布
例3.3
Hale Waihona Puke 例3.4(略)二、制定参考值范围
(一)医学参考值范围意义:
医学参考值范围(亦称为正常值 范围)是指正常人的解剖、生理、生
化等各种指标的波动范围。它主要用
于划分正常与异常的界限。
(二)医学参考值范围制定的一般原则:
相关文档
最新文档