医学统计学 正态分布(精)
医学统计学 常用概率分布-正态分布
N (123.02,4.792)
(2)身高在120~128者占该地8岁男孩总数的百分比;
解析:
58.65%
58.65%
120cm 128cm N (123.02,4.792)
-0.63 1.46 N (0,1)
(3)该地80%男孩的身高集中在哪个范围?
解析:
80%
10%
10%
10% Z1
80%
10% Z2
任意正态分布曲线 X~N(μ,σ2)
标准正态分布曲线 X~N(0,1)
采用定积分的办法,对函数式 (1) 或 (2) 定积分, 算得从 -∞ 到 x累计面积,从而推算出该区间事件发 生的概率值。 .
j(Z )
1 2
Z
e
Z
2
/ 2
dZ
图 6 正态分布(左)及标准正态曲线下(右)的累计面积
1.2 正态概率密度曲线下的面积 1.3 正态分布的应用
1.4 正态分布的判断
一、正态分布的概念
正态分布(normal distribution)
德莫佛最早发现了二项概率
的一个近似公式,这一公式被 认为是正态分布的首次露面。
德莫佛
正态分布在十九世纪前叶由
高斯加以推广,所以通常称为 高斯分布(Gauss distribution)。
单侧临界值:标准正态分布单侧尾部面积等于α 时所对应 的正侧变量值,记作Zα 。
若按左单侧算,则是 97.5% 参考值范围
按左单侧算,是 95% 参考值范围
举例2: 某地调查120名健康成年男性的第一秒肺通 气量得均数 X =4.2(L), 标准差S =0.7(L),试据此估 计其第一秒肺通气量的95%参考值范围。 解析: 分布近似正态 1. 2. 仅过低为异常 3. 求下界值
医学统计学-4-正太分布及应用
1 2 e
u 2 2
,(-∞< u <+∞)
对其定积分:
(u )
1 2
u
e
u 2 2
du
式中 (u)为标准正态变量u的累计分布函数, 反映了横轴自-∞到u的正态曲线下面积,也 就是下侧累计面积(概率)。 引入标准化变换后,对于其他任何正态分 N ( , 2 ) 都可以借助标准正态分布表估计 布 任意(X1,X2)范围内的频数比例。
1、参考值范围确定的注意点
“正常人” 的概念 样本数据大小的问题 检测误差的问题 判断是否分组 单、双侧的问题 “绝大多数”的含义 是否需要确定可疑范围 变量转换的问题
不管将正常界值定在什么位置,都可能出现假 阳性或假阴性,产生这两种误判的根本原因是 正常人的分布与病人的分布有重叠 。
(一)估计频率分布
例、若由某项研究得某地婴儿出生体重为 3100g,标准差为300g,试估计该地区当年出 生低体重儿(出生体重≤2500g)所占比例。 认为当年该地区婴儿出生体重近似服从正态分 布N(3100,3002),作标准化变换:
u X
2500 3100 2.00 300
注意点二
对于非标准正态分布,求曲线下任意(X1, X2)范围内的面积,可先作标准化变换, 再借助标准正态分布表求得。
例、某市120名12岁男童身高的例子中已求得均 数为 143.05cm,标准差s=5.82cm。设该资料服 从正态分布,试求① 该地12岁男童身高在132cm 以下者占该地12岁男童总数的比例,② 分别求 X ±1s、 X ±1.96s和 X ±2.58s范围内12岁男童占 该组儿童总数的实际百分数,并与理论百分数比 较。
医学统计学正态分布
F '( x) f ( x) ,
b
F (b) F (a) f ( x)dx
a
f ( x)dx 1
第4页/共24页
5.2 正态分布
频率密度图:直条高度表示频率密度,直条面积表示频率大小
第5页/共24页
• 正态分布又称Gauss分布,是最重要一种的连续 型分布。
1855)
‘数学王子’高斯(1777- 德国数学家、物理学家、天文学家
第22页/共24页
谢谢大家,再见
第23页/共24页
谢谢您的观看!
第24页/共24页
• 取不同随机变量值的概率按随机变量值的分布称为随机变量的概率分布 • 概率分布是统计学赖以发展的理论基础,任何统计方法都离不开特定的统计分布
第2页/共24页
• 随机变量:无法事先确定其具体取值的变量
• 随机变量的分类:连续型随机变量和离散型随机变 量 1)连续型随机变量:可在某一实数区间内任意取 值
第6页/共24页
正态分布的重要性
1、某些医学现象服从或近似服从正态分布; 如:同性别、同年龄儿童的身高,同性别健康成 人的红细胞数,血红蛋白量,脉搏数等,以及实 验中的试验误差等
2、很多统计方法是建立在正态分布的基础之上的; 如:t检验,卡方检验,F检验
3、很多其他分布的极限为正态分布。 如:t分布,卡方分布,二项分布等分布
u0
第18页/共24页
[例5.1] 求标准正态分布曲线下区间(-∞,1.96) 的面积
(1)先求区间(-∞,-1.96)的面积,查附表1 ,得标准正 态分布曲线下区间(-∞,-1.96)的面积是0.0250
(2) 区间(-∞,1.96)的面积为1-(1.96,∞)的面积,即1-
医学统计学正态分布
正态分布的假设检验
假设检验是医学统计学中常用的方法之一。
通过检验数据是否服从正态分布,可以判断相关统计推断的适用性。
正态分布的可视化方法
图表是可视化呈现正态分布的重要工具。
直方图、箱线图和概率图等方法可以帮助理解数据的分布特征。
医学统计学正态分布
医学统计学中,正态分布是一个重分布,又称为高斯分布,是一种以钟形曲线为特征的概率分布。
它具有对称性、单峰性和中心极限定理等重要特点。
正态分布的公式和参数
正态分布的概率密度函数可以使用以下公式表示:
()=1/(√(2)) * e^(-((−)²/2²))
其中,表示均值,表示标准差。
正态分布的应用领域
正态分布在医学统计学中广泛应用。
它可以用来描述人口生理指标、药物浓度、医学测试结果等。
正态分布与医学统计学的关系
医学统计学研究中常常假设数据服从正态分布。
正态分布的假设可以帮助进行参数估计和假设检验等统计推断。
正态分布的重要性
正态分布的重要性在于它在自然界和人类行为中的广泛应用。
医学统计学(第2章)正态分布
dx
(2-18) )
F(X)
p(a〈x〈b)
0 12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
正态分布曲线下面积的含义
1.表示变量值(x)在a-b区间变量值所占 1.表示变量值 表示变量值( 全部(总体)变量值的比例或概率 比例或概率(p)。 全部(总体)变量值的比例或概率(p)。 2变量值在整个曲线下的面积为100%,或 变量值在整个曲线下的面积为100%,或 出现的概率为1 出现的概率为1。
第五节 医学参考值范围的制定
一、概念 医学参考值是指包括绝大多数“ 医学参考值是指包括绝大多数“正 常人” 的各种生理及生化指标常数, 常人 ” 的各种生理及生化指标常数 , 也 称正常值。 称正常值。 正常值是指在一定范围内波动的值, 正常值是指在一定范围内波动的值, 医学上常用95% 医学上常用95%的范围作为判定正常或 异常的参考标准。 异常的参考标准。
二、 标准正态分布
1.标准正态分布及标准化变量值(u) 标准正态分布及标准化变量值( ) 标准正态分布及标准化变量值 任何正态分布的X值通过 值转换后,称为标 任何正态分布的 值通过u值转换后 称为标 准化的正态分布, 准化的正态分布,即u ~N( µ=0 , σ2=1) ( ) 概率密度函数为: 。概率密度函数为: 2
Φ(−u) 表示从-∞到- u值对应曲线范围 表示从- 值分布比例。 内X值分布比例。
例1: :
Φ(u = −1) = 0.1587 Φ(µ =1) =1− Φ(u = −1)
=1− 0.1587 = 0.8413
例2:标准正态变量值u=(-1,1)和u= 标准正态变量值u=( 1.96,1.96)区间内面积各为多少? ( -1.96,1.96)区间内面积各为多少?
第三章-统计学正态分布及其应用(医学统计学)-幻灯片
68.27%
+1.0 95.00% 2.5%
+1.96
二、标准正态分布表 附表Ⅰ
Φ(u)
-∞ -3 -2
-1
0
+1 +2 +3 + ∞
查表确定标准正态分布曲线下的面积时 必须注意:
(1)当μ,σ和X已知时,先按u变 换公式求得u值,再用u值查表;
ux
当μ,σ和X未知时,用样本均数 和样本标准差S代替求u值。
Ф(u2)- Ф(u1) = 0.2643 - 0.1251
=0.1392=13.92%
即身高界于116.5-119.0cm范围内 的7岁男童比例为13.92%,其人数 为110×13.92%=15(人)。
第三节 正态分布的应用
一、估计频数分布 二、制定参考值范围 三、质量控制 四、统计处理方法的基础
u1=
= - 1.15
4.72
119.0-121.95
u2=
= - 0.63
4.72
例3.3 已知 X=121.95cm, S=4.72cm 欲估计身高界于116.5-119.0cm范
围内的7岁男童比例及人数。
求该面积
-1.15 -0.63
Ф(u1) =Ф(-1.15)=0.1251
Ф(u2) =Ф(-0.63)=0.2643
1、正态分布法
(1)适用范围:(近似)正态分布或对数正态分布 资料
x (2)计算公式: ±uS x 双侧: 95% ±1.96S
x 99% ±2.58S x 单侧: 上限 95% +1.645S
x 99% +2.326S x 下限 95% -1.645S
x 99% -2.326S
2、百分位数法 (1)适用范围: a.偏态分布资料 b.分布不清资料 c.开口资料
《医学统计学》正态分布与医学参考值范围课件
正态分布还可以用于评估数据 的分布情况,以及异常值的识 别和处理。
正态分布在医学研究中广泛应 用于统计分析,如描述性统计 、参数估计和假设检验等。
医学参考值范围的局限性
医学参考值范围是基于一定样本量和 特定人群特征确定的,因此其适用范 围有限,可能不适用于特殊人群或不 同地区和族裔的人群。
医学参考值范围仅适用于单个生理指 标的评估,对于多个指标的综合评估 需要更多的专业知识和临床判断。
医学参考值范围的使用方法
1 2 3
判断个体指标是否异常
通过将个体指标值与医学参考值范围进行比较, 可以判断个体指标是否异常。
辅助临床诊断
医生可以根据个体指标的异常程度,结合患者的 临床表现和其他检查结果,进行综合判断,提高 诊断的准确性和可靠性。
监测治疗效果
通过监测治疗效果,可以及时调整治疗方案,提 高治疗效果。
案例二
总结词
胆固醇水平呈正态分布,医学参考值范围为3.1-5.2mmol/L。
详细描述
总胆固醇水平在正常范围内时,其分布也接近正态分布。医学上通常根据总胆固醇水平来判断个体心 血管疾病的患病风险。正常的总胆固醇水平参考值为3.1-5.2mmol/L。若总胆固醇水平超过 5.2mmol/L,则可能增加患心血管疾病的风险。
《医学统计学》正态分布与 医学参考值范围课件
汇报人: 2023-12-24
目录
• 正态分布概述 • 正态分布与医学参考值范围的
关系 • 正态分布的检验方法 • 医学参考值范围的解读与使用 • 案例分析
01
正态分布概述
正态分布的定义
01
正态分布是一种概率分布,其概 率密度函数呈钟形,对称分布于 均值(μ)周围。
P-P图法
《医学统计学》医统-第三章正态分布与医学参考值范围
• 近似正态分布资料可按正态分布法处理,因红细胞 计数值过大或过小均为异常,故应估计双侧95%参 考值范围:
X z 0 . 0 5 2 S 4 . 7 8 1 . 9 6 0 . 3 8 4 . 0 4 , 5 . 5 2
即该地正常成年男子红细胞计数的95%参考值范围 为4.04×1012/L~5.52×1012/L。
表3-2 某年某地100名正常成年人血铅含量(μg/dl)对数值频数表
对数组段
频数
累计频数
0.6~
4
4
0.7~
2
6
0.8~
5
11
0.9~
9
20
1.0~
12பைடு நூலகம்
32
1.1~
15
47
1.2~
18
65
1.3~
14
79
1.4~
12
91
1.5~
5
96
1.6~
3
99
1.7~1.8
1
100
合计
100
—
A
36
Medical reference range
P2.5~P97.5 P5
P95
99 X 2.58S X 2.33S X 2.33S P0.5~P99.5 P1 P99
A
33
Medical reference range 例3-3 已知某地140名正常成年男子红细胞计数近似服
从正态分布,X =4.78×1012/L,S =0.38×1012/L,
,求单侧95%上限值: l g 1 ( X 1 . 6 4 S ) l g 1 ( 1 . 2 1 . 6 4 0 . 2 4 0 6 ) 3 9 . 3 1 7 3 (μg/dl)
医学统计学 常用概率分布-正态分布
正态分布N (μ, σ2)下:
μ -1.96σ
μ +1.96σ
X= μ -1.96σ时,所对应的左侧累积概率是多少?
X= μ +1.96σ时,所对应的右侧累积概率是多少? X在(μ -1.96σ ,μ +1.96σ )间对应概率是多少?
常用的正态分布、标准正态分布曲线下面积规律
正态分布 µ ±1.64σ µ ±1.96σ µ ±2.58σ 标准正态分布 0±1.64 0±1.96 0±2.58 面积规律 90.00% 95.00% 99.00%
X1 X 2) 2 N (123.02,4.79
N (0,1)
三、正态分布的应用
1. 确定医学参考值范围
参考值范围(reference range):指特定“正常”人群的解 剖、生理、生化指标及组织代谢含量等数据中大多数个
体取值所在的范围。
举例:制定成年健康女性血红蛋白的参考值范围
制定步骤:
首先要确定一批样本含量足够大的“正常人”
5. 对频率密度分布图,横轴上曲线下面积为1;其面积与
概率分布有对应关系,可通过求面积确定其概率值。
由μ, σ决定的正态分布曲线 N (μ, σ2)具有多样性..
为了应用方便,常将正态概率函数中的 x 作如 下变量代换,令:
u
x
u称为标准正态变量。把u代入概率密度函数 , 得标准正态分布的概率密度函数:
2
)
, X
正态分布的密度函数,即正态曲线的函数表达式
⑴ 位置参数: μ
当σ固定不变时,μ越大,曲线沿横轴越向右移动;反 之, μ越小,则曲线沿横轴越向左移动,所以μ叫正态曲 线N(μ, σ2)的位置参数, 。
《医学统计学》正态分布与医学参考值范围课件
《医学统计学》正态分布与医学参考值范围课件•正态分布概述•正态分布与医学参考值范围•正态分布的图形展示目录•医学参考值范围的计算实例•总结与展望CHAPTER正态分布概述正态分布的定义正态分布的基本性质钟形曲线正态分布的均数(期望值)和标准差(波动程度)是两个关键参数。
均数与标准差概率密度函数正态分布的应用CHAPTER正态分布与医学参考值范围定义计算医学参考值范围的定义与计算正态分布是统计学中常用的概率分布,它描述了许多医学指标的分布特征。
正态分布的曲线呈钟形,中间高,两侧低,左右对称。
在医学参考值范围的制定中,正态分布被用来确定正常范围。
一般来说,如果一个指标的分布接近正态分布,则认为其医学参考值范围是合理的。
正态分布在医学参考值范围中的应用医学参考值范围的解读与使用解读医学参考值范围是一个重要的临床工具,它可以帮助医生判断患者的某一指标是否正常。
同时,它也提供了对临床实验结果的解读和比较的基础。
使用在使用医学参考值范围时,医生应注意其局限性,并结合患者的具体情况进行综合考虑。
例如,不同年龄、性别、种族等人群的医学参考值范围可能存在差异。
因此,医生应根据患者的具体情况选择适用的参考值范围。
CHAPTER正态分布的图形展示正态分布的直方图直方图显示了正态分布的概率密度函数,可以直观地观察到正态分布的形状和特征。
直方图中的横轴表示变量值,纵轴表示在该变量值下的概率密度。
正态分布的直方图呈现出钟形曲线,左右对称,最高点出现在均值处,且在均值附近概率密度较大。
箱线图由箱子、中线、耳朵等组成,其中箱子代表四分位数范围,中线代表均值,耳朵代表标准差。
箱子的高度表示数据的相对波动程度,箱子越窄表示数据越集中。
箱线图展示了正态分布的四分位数和异常值,可以直观地判断数据的集中趋势和离散程度。
合正态分布。
QQ图中的横轴和纵轴分别表示数据的累计概率和标准化的变量值。
如果数据符合正态分布,那么QQ图上的点应该大致沿着参考线(45度直线)分布。
医学统计学第3讲正态分布
正态分布的标准化
1
Z-分数
2
通过计算标准差的倍数来表示某个观测
值相对于均值的位置。
3
标准化公式
将非标准正态分布转化为标准正态分布, 使得均值为0,标准差为1。
标准正态分布表
通过查表可以得到标准正态分布下的累 积概率、百分位数等信息态分布用于描述人群中的身高 分布,帮助我们了解平均身高、 身高偏差等统计特征。
考试成绩
正态分布可以帮助我们分析考试 成绩,确定合理的分数划分和评 估标准。
药物疗效
正态分布在医药领域中应用广泛, 如药物疗效的评估和剂量的确定。
正态分布与置信区间
置信区间的计算
使用正态分布的特性来估计样本均值的真实范围,提供统计推断的依据。
置信水平
置信区间的可信程度,常用的置信水平有95%和99%。
医学统计学第3讲:正态分布
探索正态分布的特征、应用和优缺点以及在医学研究中的重要性。让我们一 起开始这个令人兴奋的主题!
什么是正态分布?
正态分布是一种连续概率分布,常用于描述自然界中的许多现象,如身高、 体重等。其特征是钟形曲线,均值和标准差能够完全定义分布。
正态分布的形状和密度曲线
正态分布的密度曲线呈现出典型的钟形形状,其峰值出现在均值处。均值、标准差和曲线的形态密切相关,构 成了正态分布的基本特征。
标准误差是测量样本均值与总体均值之间的差异的指标,用于衡量样本均值的精确性。
正态分布在线性回归中的应用
正态分布在线性回归模型中的误差项满足正态分布的假设,确保回归结果的 准确性和可信度。
样本大小
影响置信区间的宽度,样本大小越大,置信区间越窄。
正态分布与假设检验
1
零假设与备择假设
医学统计学-正态分布
正态分布的概率密度
正态曲线(normal curve):高峰位于中 央,两侧逐渐下降并完全对称,曲线两 段永远不与横轴相交的钟型曲线。
正态曲线的函数表达式 f ( x) 称为正态分布 概率密度函数:
1 f ( x) e 2 ( x )2 2 2
8
正态分布的参数
如果变量X的概率密度函数服从上述函数,则称
4
概率密度
组段
各个组段的概率
95100105110115120125130135140-
概率 0.0006 0.0049 0.0440 0.1532 0.2936 0.3037 0.1515 0.0421 0.0061 0.0003
– P(110cm身高<115cm)= 0.153 – P(105cm身高<120cm)= 0.0440+0.1532+0.2936=0.4908 – P(身高<120cm)= 0.4963 组距越小,组段就越多,能够计算概率的区 间就越多
肺通气量的95%参考值范围 – 根据肺通气量的背景和已知的影响因素,制定 入选标准和排除标 – 入选标准和排除标准所确定的人群中随机抽样 – 确定单双侧和分布:单侧,近似正态 – 已知 x =4.5L, s=0.6L.
22
参考值范围估计正态分布法 分位数法双侧%
单侧
只有下 限 只有上 限
双侧
单侧
16
标准正态分布曲线下面积 (u) 表、图
17
-1.96≤x≤1.96的概率:
18
例:设u1=-1.83,u2=-0.3,求标准正态分布曲
线下(-1.83,-0.30)范围内的面积
医学统计学第3讲正态分布
86
146
百分
35.98326
61.08787
194 位数法 81.17155 212 实例 88.70293 228 234 95.39749 97.90795 98.32636
17~
19~21
111 2 239 0 95% 212 1 12.88 μ 235 P95 mol/kg 16 1 0 1 236 2 120 1 119 3 239 239 -
制定参考值范围
参考值范围又称正常值范围,医学上是指 绝大多数正常人的某指标值所在的范围。 参考值范围的意义
划分正异常
制定步骤
1. 2. 3. 4. 5. 6. 从“正常人”总体中抽样:明确研究总体 控制检测误差 判断是否需要分组(如性别、年龄)确定 根据专业知识决定单侧还是双侧 选择百分界值 确定可疑范围
单侧上限---过高异常 双侧---过高、过低均异常
单侧下限---过低异常
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性 病人 假阳性
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性率 病人 假阳性率
正常人与病人的数据分布重叠示意图(双侧)
N(, 2)
N(0,1)
0.6 0.5
f (X )
N (1,0.8 )
2
0.4 0.3 0.2 0.1 0
N (0,1 )
N (1,1.2 )
2
2
-4
-3
-2
-1
0
1
医学统计学之正态分布的概念与特征(doc 10页)
医学统计学之正态分布的概念与特征(doc 10页)部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑1统计的工作内容?P2实验设计、收集资料、整理资料、分析资料2资料的类型 P2-P3(1)计量资料:观察指标用定量的方法测定其数值的大小所得的资料。
一般用度量衡单位表示。
如身高、体重、浓度。
(2)计数资料:(分类)疗效(3)等级分组资料3变异与同质的概念?P3(1)变异:在临床治疗中,用同样的药物治疗病情相同的病人,疗效也不尽相同,即使在实验室里,动物与动物之间也有明显的差异,这种现象称为个体差异或者变异。
(2)同质:研究对象某一个或者几个属性相同称为同质,例如同种族、年龄、性别的健康人。
4总体样本的概念?P3(1)总体:是同质的个体所构成的全体。
有限总体:研究单位是有限的。
无限总体:研究单位是无限的。
(2)样本:从总体中随机抽取部分有代表性的观察单位。
其实测值的集合。
5误差的类型?P6(1)系统误差(2)随机测量误差(3)抽样误差6概率的概念特征?P6概念:描写某一事件发生的可能性大小的一个量度。
特征:(1)肯定发生的时间成为必然事件。
概率为12)可能发生也可能不发生的事件称为随机事件或者偶然事件概率0-1(3)概率小于等于0.05或者小于等于0.01事件成为小概率事件。
7频率的概念?频率指样本的实际发生率。
8,频率表的绘制步骤?P8-P9(1)求极差:最大值减最小值(2)确定组距分组:组距=极差除以10(3)划计(4)计数9描写集中与离散趋势的指标?集中趋势:算术均数、中位数、几何均数离散趋势:全距、四分位间距方差、标准差、变异系数10.频数分布表的用途?P10(1)作为陈述资料的形式,可以替代原始的资料,便于进一步分析。
(2)便于观察资料的分布类型,医学研究中常见的资料分布类型可以分为对称分布和偏态分布两大类。
(3)便于发现资料中某些远离群体的特大或者特小的可疑值。
(4)当样本含量比较大时,可用各组段的频率作为概率的估计值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参考值范围的估计方法:正态分布法
2.5% 95% 2.5%
-1.96
+1.96
【例5.6 】某地调查正常成年男子144人的红细胞 数,近似正态分布,得均数 X =5.38×1012/L,
标准差S=0.44×1012/L。试估计该地成年男子红
细胞数的95%参考值范围。 解:双侧,95%界值u=1.96
X 2S 作为上下警戒值,
X 3S 作为上下控制值
4)正态分布是许多统计方法的理论基础
u 检验是以正态分布为理论基础的假设 检验方法; 统计学中的三大统计分布:卡方分布,t 分布, F 分布都是在正态分布的基础上推 导出来的; 某些分布的极限形式为正态分布:如 t 分 布,二项分布,Poisson分布等。均可按正 态近似的原理来处理。
应用本法的条件是样本含量较多,分布趋于稳定,样本含量 不少于150为宜。 其优点是可用于任何分布甚至分布不明的 资料。
【例5.7 】 用硫酸-高锰酸钾-硝酸消化法和无火焰原子吸 收光谱法测得某市238 名正常人发汞值如表5.6,试确定 该市发汞值的95%正常值范围。
表5.4 238例正常人发汞值的频数分布
X ±us
(cm)
人数
百分数(%)
(%)
────────────────────────────────────
X ±1.00s 119.41±1.00×4.38 X ±1.96s 119.41±1.96×4.38
115.03-123.79 110.83-127.99 108.11-130.71
83 113 119
参考值范围的涵义:绝大多数的正常人在该范围内 绝大多数,习惯上指正常人的80%,90%,95% (最常用)或99%等。 例如,根据正常人样本确定了血清谷草转氨酶正常 值单侧95%上限为37U/L。即容许有5%的正常人被 判为异常,称为假阳性
5.估计界值
即根据资料的分布类型,样本含量的多少及研究者 的要求,选用适当的方法,确定正常值范围的界值。
(2)制定参考值范围的方法
1. 正态分布法 : 用本法的条件是资料服从正态分布,样本均数和标 准差趋于稳定,样本含量不少于50为宜。亦可用 于经变量变换后服从正态分布的资料,如对数正 态分布。 估计公式: X us
表5.2 常用 u 值表 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 参考值范围(%) 单侧 双侧 ──────────────────────────── 80 0.842 1.282 90 1.282 1.645 95 1.645 1.960 99 2.326 2.576 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━
围7岁男童人数占该组儿童总数的实际百分数,说明与
理论百分数是否相近。
1) 按式(5.2)求u :
110 119 .41 u 2.15 4.38
查附表1,得0.0158,即该地7岁男童身高在110cm以下者,估计约 占1.58%
2) 计算结果见表5.1
表 5.1 120 名 7 岁男童身高的实际分布与理论分布比较 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 身高范围 实际分布 理论分布 ───────
谢谢大家,再见
正常人:并不是指机体的任何器官、组织的形态和 机能都是正常的人,而是指排除了影响所研究指 标的疾病和有关因素的人
例数过少,代表性差;例数过多增加成本,且易导 致正常标准把握不严,影响数据的可靠性。
一般认为每组100例以上 ;有人认为确定临床生化
指标的正常值应取300-500例
2.对选定的正常人进行准确而统一的测定
2
X ,S
2 2
2
变量近似服从均数为 X, 方差为 S 的正态分布
【例5.5】 在例2.1中,某地120名7岁男童的身高,已
知均数 X =119.41cm,标准差S =4.38cm, (1)试估计
该地7岁男童身高在110cm以下者占该地7岁男童总数的
百分数。(2)分别求 X±1s,X ±1.96s, X±2.58s范
下限为 X -1.960s = 5.38-1.960(0.44) =4.52(1012/L) 上限为 X +1.960s = 5.38+1.960(0.44) =6.24(1012/L)
2. 百分位数法 根据正常人样本,计算选定的百分范围所对应的百 分位数
表5.3 常用正常值范围所对应的百分位数 Px ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 单侧 双侧 参考值范围 (%) ───────── ───────── 下限 上限 下限 上限 ──────────────────────────── 80 P20 P80 P10 P90 90 P10 P90 P5 P95 95 P5 P95 P2.5 P97.5 99 P1 P99 P0.5 P99.5 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━ 发汞值 频数 累计频数 累计频率 (μg/g) f Σf (%) ──────────────────────── 0.3~ 20 20 8.4 0.7~ 66 86 36.1 1.1~ 60 146 61.3 1.5~ 48 194 81.5 1.9~ 18 212 89.1 2.3~ 16 228 95.8 2.7~ 6 234 98.3 3.1~ 1 235 98.7 3.5~ 0 235 98.7 3.9~4.3 3 238 100.0 ━━━━━━━━━━━━━━━━━━━━━━━━
保证原始资料可靠,是确定正常值范围的前提
3.决定取单侧范围值还是双侧范围值
正常值范围是取单侧还是双侧需根据指标的实际用 途来确定 过低和过高均属异常,需要分别确定下限和上限: 双侧范围。例如:白细胞总数 过高为异常,只需确定其上限,如:尿铅 仅过低为异常,只需确定其下限:如肺活量、智商
4.选定适当的百分范围
解:发汞值过高为异常,故取单侧95%上限
P95 2.3
0.4 238 95% 212 2.65( g / ) 16
3) 质量控制
变量的值落在区间 1.96 , 1.96 外的概率为0.05 变量的值落在区间 2.58 , 2.58 外的概率为0.01
5.2.4
正态分布的应用
1)概括估计变量值的频数分布 某些医学现象服从正态分布或近似服从正态 分布 如:同性别、同年龄儿童的身高,同性别健康 成人的红细胞数,血红蛋白量,脉搏数等, 以及实验中的试验误差等。
对正态分布的资料,只要求得均数和标准差, 便可以就其频数分布做出大概估计
N( , )
现代医学对正常值的概念有了较大的发展 : 如卫生学上对食品、空气、水、化妆品等的卫生标 准的制订 ;流行病学中某传染病隔离期限的确定; 在儿少卫生中不同性别、年龄儿童的各项生长发育 指标的等级标准的确定;动物实验中标准动物的确 定等等;
(1)确定正常值范围的一般原则和步骤
1.抽取足够例数的正常人样本
如环境中某些有害物质的浓度,食品中某些药物的残留量, 某些临床检验结果,某些疾病的潜伏期以及医院病人住院天 数等,都呈偏态分布,不便作统计处理,常在施以对数变换 后,如果能转换为正态分布,亦可按正态分布规律处理。
2)制定参考值范围
参考值范围,又称正常值范围, 是指绝大多数正 常人的某指标范围。 它来源于临床上对疾病诊断和治疗的实际需要,系 指正常人的解剖、生理、生化等各项指标观察值的 波动范围。 同为正常人的观测值因人、因时而异,因此不能将 某人某时的观察值作为正常值,而必须确定一个波 动范围
69.17 94.17 99.17
68.27 95.00 99.00
X ±2.58s 119.41±2.58×4.38
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
图5.6 某地120名7岁男童身高的实际频数分布与正态理论分布比较
很多医学资料是呈偏态分布的,有的经过变量变换 可转换为正态分布