(精品)医学统计学课件:正态分布
医学统计学 正态分布(精)
参考值范围的估计方法:正态分布法
2.5% 95% 2.5%
-1.96
+1.96
【例5.6 】某地调查正常成年男子144人的红细胞 数,近似正态分布,得均数 X =5.38×1012/L,
标准差S=0.44×1012/L。试估计该地成年男子红
细胞数的95%参考值范围。 解:双侧,95%界值u=1.96
X 2S 作为上下警戒值,
X 3S 作为上下控制值
4)正态分布是许多统计方法的理论基础
u 检验是以正态分布为理论基础的假设 检验方法; 统计学中的三大统计分布:卡方分布,t 分布, F 分布都是在正态分布的基础上推 导出来的; 某些分布的极限形式为正态分布:如 t 分 布,二项分布,Poisson分布等。均可按正 态近似的原理来处理。
应用本法的条件是样本含量较多,分布趋于稳定,样本含量 不少于150为宜。 其优点是可用于任何分布甚至分布不明的 资料。
【例5.7 】 用硫酸-高锰酸钾-硝酸消化法和无火焰原子吸 收光谱法测得某市238 名正常人发汞值如表5.6,试确定 该市发汞值的95%正常值范围。
表5.4 238例正常人发汞值的频数分布
X ±us
(cm)
人数
百分数(%)
(%)
────────────────────────────────────
X ±1.00s 119.41±1.00×4.38 X ±1.96s 119.41±1.96×4.38
115.03-123.79 110.83-127.99 108.11-130.71
83 113 119
参考值范围的涵义:绝大多数的正常人在该范围内 绝大多数,习惯上指正常人的80%,90%,95% (最常用)或99%等。 例如,根据正常人样本确定了血清谷草转氨酶正常 值单侧95%上限为37U/L。即容许有5%的正常人被 判为异常,称为假阳性
医学统计学. 正态分布及其应用ppt课件
ppt精选版
24
N(μ,σ2)
N(0,1)
从一般的正态分布转变为标准的正态分布
标准正态分布的密度函数为
(X ) 1 eZ2 2 2
ppt精选版
26
➢ 对上式求积分可得到标准正态变量Z的分布函 数。
➢ 由于积分计算繁琐,统计学家按标准正态分布
的累积概率分布函数(-Z)编制了附表2
(P315),标准正态分布曲线下的面积,由表 可查出曲线下某区间的面积。
20
曲线下的面积的计算
对于任意一个区间的曲线下面积,在知道变 量值x对应的概率密度函数f (x)后,都可以根 据微积分的方法求出其面积的大小
f(x)
F
x
P(a
x
b)
b
a
f
(x)dx
?
x ab
ppt精选版
21
实际工作中,常需要了解正态曲
线下横轴上某一区间的面积占总
面积的百分数,以便估计该区间
的例数占总例数的百分数(频数
概率 29
查附表2时注意事项:
➢ 曲线下横轴上的总面积为100%或1; ➢ 表中曲线下面积为-∞到Z的面积;
➢ 对于服从正态分布的变量x,先进行标准 化变换(Z X ),然后借助标准正态分
布表可得到任意(x1, x2)范围内的面积或频 数比例。
ppt精选版
30
Z1 Z2
图4.7 查表法求标准正态曲线下面积示意图
X<μ范围内曲线下的面积相等,各占50%;
S(X,)=S(-,-X)
S(-,-X)
S(X,)
-X X
X轴
正态分布对称性
ppt精选版
15
二.正态密度函数曲线下的面积规律
医学统计学 常用概率分布-正态分布
N (123.02,4.792)
(2)身高在120~128者占该地8岁男孩总数的百分比;
解析:
58.65%
58.65%
120cm 128cm N (123.02,4.792)
-0.63 1.46 N (0,1)
(3)该地80%男孩的身高集中在哪个范围?
解析:
80%
10%
10%
10% Z1
80%
10% Z2
任意正态分布曲线 X~N(μ,σ2)
标准正态分布曲线 X~N(0,1)
采用定积分的办法,对函数式 (1) 或 (2) 定积分, 算得从 -∞ 到 x累计面积,从而推算出该区间事件发 生的概率值。 .
j(Z )
1 2
Z
e
Z
2
/ 2
dZ
图 6 正态分布(左)及标准正态曲线下(右)的累计面积
1.2 正态概率密度曲线下的面积 1.3 正态分布的应用
1.4 正态分布的判断
一、正态分布的概念
正态分布(normal distribution)
德莫佛最早发现了二项概率
的一个近似公式,这一公式被 认为是正态分布的首次露面。
德莫佛
正态分布在十九世纪前叶由
高斯加以推广,所以通常称为 高斯分布(Gauss distribution)。
单侧临界值:标准正态分布单侧尾部面积等于α 时所对应 的正侧变量值,记作Zα 。
若按左单侧算,则是 97.5% 参考值范围
按左单侧算,是 95% 参考值范围
举例2: 某地调查120名健康成年男性的第一秒肺通 气量得均数 X =4.2(L), 标准差S =0.7(L),试据此估 计其第一秒肺通气量的95%参考值范围。 解析: 分布近似正态 1. 2. 仅过低为异常 3. 求下界值
医学统计学课件之正态分布(Normal Distribution)
Ⅱ类错误 本质为不拒绝实际上不成立的H0 犯该类错误的最大概率为 “存伪”、“假阴性”、“漏诊”
两类错误此消彼长,欲同时减少他们的唯 一手段——增大样本含量
返回
严密的科研设计是保证假设检验结论正确性 的前提
选用合适的检验方法,必须以符合其适用条 件为前提
正确理解假设检验的统计意义
假设检验与可信区间的联系与区别
返回
计量资料的t检验 计量资料的ANOVA 计数资料的卡方检验 非参数的秩和检验
Example
从
总体中重复随机抽样10000次,
每次抽取n为9的样本
其中,2个样本的观测值及其均数和标准差:
身高观测值
均数 标准差
1 125 124 117 116 125 132 122 118 115 121.56 5.55
准差进行反映的,也叫标准误。
结论
只要抽样,则必定存在抽样误差
标准误越小,意味着抽样误差越小;反之,则大
抽样误差的大小反映的就是样本统计量对总体参 数的偏离程度
尽量减少抽样误差的最佳方法——增大样本含量 均为反映离散程度的统计指标
不同
定义 单个原始观测值对均数 样本均数对总体均数
正态分布(Normal Distribution)
u变换
标准正态变换
目的
标准正态分布曲线下面积规律
双侧95%或99%面积(1.96与2.58)
单侧95%或99%面积(1.645与2.32)
正态性检验(Normality test)
符合正态概率密度函数 矩法 偏度系数与峰度系数 W检验或D检验 原始目测法 P-P plot Q-Q plot
返回
可信区间
正态分布完整ppt课件
使用如Shapiro-Wilk检验、Kolmogorov-Smirnov检验等方法,对 误差项进行正态性检验,以验证其是否符合正态分布。
方差分析中F分布应用
01 02
F分布的定义
F分布是一种连续型概率分布,常用于方差分析中的假设检验。在方差 分析中,通过比较不同组间的方差与组内方差,判断各因素对结果的影 响是否显著。
筛选方法
包括单变量分析和多变量分析等,结合临床 意义和统计学显著性进行生物标志物的筛选 。
社会科学调查数据分析
社会科学调查数据特点
大量、复杂、多维度的数据,往往需要进行统计分析和数据挖掘。
正态分布在社会科学调查数据分析中的应用
通过对调查数据进行正态性检验,选择合适的数据处理和分析方法,如参数检验、回归分析等。
有对称性和单峰性。
性质
对称性:正态分布曲线关于均值对称 。
单峰性:正态分布曲线只有一个峰值 ,位于均值处。
均值、中位数和众数相等。
概率密度函数在均值两侧呈指数下降 。
正态曲线特点
01
02
03
04
形状
钟形曲线,中间高,两边低。
对称性
关于均值对称,即左右两侧形 状相同。
峰值
位于均值处,且峰值高度由标 准差决定。
05
正态分布在金融学领域应用
风险评估及资产组合优化
风险评估
正态分布用于描述金融资产的收益和风险分布,通过计算均值和标准差来评估投资组合 的风险水平。
资产组合优化
基于正态分布假设,利用马科维茨投资组合理论等方法,构建最优资产组合以降低风险 并提高收益。
VaR(Value at Risk)计算
正态分布用于计算投资组合在一定置信水平下的最大可能损失(VaR),以衡量潜在风 险。
第三章正态分布医学统计学ppt课件
• 3、对于标准正态分布变量,—— 范围内正态曲线下面积包 含有95%变量值。
累计频率(%) (5) 0.83 3.33 8.33
15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17 100.00
120
100
(一)图示法 1、频数表和直方图目测法
(一)图示法
Q--Q图:对应于正态分布的Q--Q图就是由标准 正态分布的分位数为横坐标,样本值为纵坐标的散点 图。
• 2.确定肺活量的95%参考值范围 由于肺活量只过低为异常,故只计算P5
• 3.确定尿铅的95%参考值范围 由于尿铅只以过高为异常,应计算P95
2023/10/15
王晓敏
47
医学参考值范围的题目: (1)判断分布类型:正态分布或偏态分布? (2)判断:单侧或双侧?
王晓敏
第四节 正态性判定 (test of normality)
频数 (2) 1 3 6 8 12 20 27 18 12 8 4 1
频率(%) (3) 0.83 2.50 5.00 6.67
10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83
累计频数 (4) 1 4 10 18 30 50 77 95 107 115 119 120
正态分布的特征
⑴ 正态曲线在横轴上方均数处最高; 注: X离μ越远, f(x)越小,逐渐接近0,但不 会等于0,故正态曲线永远不与横轴相交
⑵ 以均数为中心,左右对称;
f(x)
μ
王晓敏
⑶ 正态分布有两个参数 和 ; μ:位置参数 ; σ:形状参数 总体均数μ是位置参数: 描述正态分布的集中趋势位置。 总体标准差σ是变异度参数,决定曲线形态: 描述正态分布离散趋势,越小,分布越集中, 曲线形状越“瘦高”;反之越“矮胖”。
医学统计学正态分布
正态分布的假设检验
假设检验是医学统计学中常用的方法之一。
通过检验数据是否服从正态分布,可以判断相关统计推断的适用性。
正态分布的可视化方法
图表是可视化呈现正态分布的重要工具。
直方图、箱线图和概率图等方法可以帮助理解数据的分布特征。
医学统计学正态分布
医学统计学中,正态分布是一个重分布,又称为高斯分布,是一种以钟形曲线为特征的概率分布。
它具有对称性、单峰性和中心极限定理等重要特点。
正态分布的公式和参数
正态分布的概率密度函数可以使用以下公式表示:
()=1/(√(2)) * e^(-((−)²/2²))
其中,表示均值,表示标准差。
正态分布的应用领域
正态分布在医学统计学中广泛应用。
它可以用来描述人口生理指标、药物浓度、医学测试结果等。
正态分布与医学统计学的关系
医学统计学研究中常常假设数据服从正态分布。
正态分布的假设可以帮助进行参数估计和假设检验等统计推断。
正态分布的重要性
正态分布的重要性在于它在自然界和人类行为中的广泛应用。
医学统计学第章正态分布课件(一)
医学统计学第章正态分布课件(一)医学统计学是医学专业一门重要的理论课程,其中正态分布是医学统计学的基础之一。
本文将围绕医学统计学第一章正态分布课件展开,从以下几个方面进行详细介绍。
一、正态分布的基本概念正态分布是一种连续分布,其曲线呈钟形,左右对称。
正态分布的重要性在于它可以描述很多自然现象和社会现象,具有很多重要的性质,如对称性、两侧尾部渐进水平等。
二、正态分布的特征参数正态分布有两个主要的参数:均值μ和标准差σ。
均值μ描述了正态分布的位置,标准差σ描述了正态分布的分散程度。
此外,正态分布还有一个常用的标准化形式,称为标准正态分布。
三、正态分布的重要性质正态分布具有很多重要的性质,如定积分为1、均值、中位数和众数相等、标准差越小曲线越窄等。
四、正态分布的应用正态分布在医学统计学中的应用非常广泛。
医学研究中,很多指标都服从正态分布,如身高体重、血压、血糖、白细胞计数等。
利用正态分布的概率性质,可以计算出一些有用的指标,如置信区间、假阳性率、假阴性率等。
五、正态分布的检验检验数据是否符合正态分布是医学统计学中非常重要的一项工作。
一般通过直方图、Q-Q图、K-S检验等方式进行正态性检验。
如果数据不符合正态分布,可以考虑对数据进行变换或采用非参数检验方法。
六、正态分布的扩展在医学统计学中,还有一些常见的分布与正态分布密切相关,如t分布、F分布、卡方分布等。
这些分布也都具有很多重要的性质和应用。
综上所述,医学统计学第一章正态分布课件内容十分丰富,具有很强的实用性和指导意义。
医学专业的学生们应该认真学习其中的内容,掌握正态分布的特征参数、重要性质和应用等方面的基本知识,为今后的学习和实践打下坚实的基础。
《医学统计学》正态分布与医学参考值范围课件
《医学统计学》正态分布与医学参考值范围课件•正态分布概述•正态分布与医学参考值范围•正态分布的图形展示目录•医学参考值范围的计算实例•总结与展望CHAPTER正态分布概述正态分布的定义正态分布的基本性质钟形曲线正态分布的均数(期望值)和标准差(波动程度)是两个关键参数。
均数与标准差概率密度函数正态分布的应用CHAPTER正态分布与医学参考值范围定义计算医学参考值范围的定义与计算正态分布是统计学中常用的概率分布,它描述了许多医学指标的分布特征。
正态分布的曲线呈钟形,中间高,两侧低,左右对称。
在医学参考值范围的制定中,正态分布被用来确定正常范围。
一般来说,如果一个指标的分布接近正态分布,则认为其医学参考值范围是合理的。
正态分布在医学参考值范围中的应用医学参考值范围的解读与使用解读医学参考值范围是一个重要的临床工具,它可以帮助医生判断患者的某一指标是否正常。
同时,它也提供了对临床实验结果的解读和比较的基础。
使用在使用医学参考值范围时,医生应注意其局限性,并结合患者的具体情况进行综合考虑。
例如,不同年龄、性别、种族等人群的医学参考值范围可能存在差异。
因此,医生应根据患者的具体情况选择适用的参考值范围。
CHAPTER正态分布的图形展示正态分布的直方图直方图显示了正态分布的概率密度函数,可以直观地观察到正态分布的形状和特征。
直方图中的横轴表示变量值,纵轴表示在该变量值下的概率密度。
正态分布的直方图呈现出钟形曲线,左右对称,最高点出现在均值处,且在均值附近概率密度较大。
箱线图由箱子、中线、耳朵等组成,其中箱子代表四分位数范围,中线代表均值,耳朵代表标准差。
箱子的高度表示数据的相对波动程度,箱子越窄表示数据越集中。
箱线图展示了正态分布的四分位数和异常值,可以直观地判断数据的集中趋势和离散程度。
合正态分布。
QQ图中的横轴和纵轴分别表示数据的累计概率和标准化的变量值。
如果数据符合正态分布,那么QQ图上的点应该大致沿着参考线(45度直线)分布。
医学统计学第3讲正态分布
正态分布的标准化
1
Z-分数
2
通过计算标准差的倍数来表示某个观测
值相对于均值的位置。
3
标准化公式
将非标准正态分布转化为标准正态分布, 使得均值为0,标准差为1。
标准正态分布表
通过查表可以得到标准正态分布下的累 积概率、百分位数等信息态分布用于描述人群中的身高 分布,帮助我们了解平均身高、 身高偏差等统计特征。
考试成绩
正态分布可以帮助我们分析考试 成绩,确定合理的分数划分和评 估标准。
药物疗效
正态分布在医药领域中应用广泛, 如药物疗效的评估和剂量的确定。
正态分布与置信区间
置信区间的计算
使用正态分布的特性来估计样本均值的真实范围,提供统计推断的依据。
置信水平
置信区间的可信程度,常用的置信水平有95%和99%。
医学统计学第3讲:正态分布
探索正态分布的特征、应用和优缺点以及在医学研究中的重要性。让我们一 起开始这个令人兴奋的主题!
什么是正态分布?
正态分布是一种连续概率分布,常用于描述自然界中的许多现象,如身高、 体重等。其特征是钟形曲线,均值和标准差能够完全定义分布。
正态分布的形状和密度曲线
正态分布的密度曲线呈现出典型的钟形形状,其峰值出现在均值处。均值、标准差和曲线的形态密切相关,构 成了正态分布的基本特征。
标准误差是测量样本均值与总体均值之间的差异的指标,用于衡量样本均值的精确性。
正态分布在线性回归中的应用
正态分布在线性回归模型中的误差项满足正态分布的假设,确保回归结果的 准确性和可信度。
样本大小
影响置信区间的宽度,样本大小越大,置信区间越窄。
正态分布与假设检验
1
零假设与备择假设
正态分布ppt精品课件
根据检验结果,解释两组数据 是否存在显著差异,并结合实
际背景进行讨论。
06
正态分布在生活中的应用举例
质量控制领域应用举例
01
产品规格设定
在制造业中,正态分布用于设定产品规格。通过对产品特性进行统计分
析,可以确定产品特性的均值和标准差,进而设定合理的上下规格限。
02 03
过程能力分析
正态分布也用于评估生产过程的能力。通过计算过程能力指数(如Cp 和Cpk),可以了解生产过程是否稳定,并确定是否需要采取改进措施 。
多元方差分析(MANOVA)与多元回归分析( Multiple Regression Analysis):当涉及多个自 变量或多个因变量时,可以使用多元方差分析或 多元回归分析来探究它们之间的关系。
回归分析(Regression Analysis):用于探究自 变量与因变量之间的线性或非线性关系,通过拟 合回归方程来预测因变量的取值。
概率密度函数性质 f(x)≥0,对于所有x∈R。
02
正态分布在统计学中应用
描述性统计量计算
均值(Mean):表示数据的“中心 ”或“平均”水平,计算方法是所有 数值之和除以数值个数。
偏度(Skewness):描述数据分布 形态的偏斜程度,正偏态表示数据向 右偏,负偏态表示数据向左偏。
标准差(Standard Deviation):衡 量数据分布的离散程度,即数据偏离 均值的程度,计算方法是方差的平方 根。
实例分析:两组数据是否存在显著差异
数据描述
给出两组数据的描述性统计量, 如均值、标准差等。
假设检验步骤
按照上述假设检验步骤,对两组 数据进行假设检验。
结果解释
根据检验结果,判断两组数据是 否存在显著差异,并给出相应的
医学统计学.正态分布及应用PPT医学课件
u
0
28
关于正态分布总结
正态分布是描述个体变异的重要分布之一,也 是统计学理论中的重要分布之一;
正态分布的优良性质-函数的分布
正态分布是由两个参数决定的一簇分布 正态分布曲线下的面积是有规律的,且与标准
正态分布曲线下的面积对应(以标准正态离差为 单位)。
29
正态分布的应用
二次大战期间们,英国生物学家peter blacket t 向海军部建议组建科研小组协助解决战略, 战术问题.运筹学(operational research) 诞生.
正态分布及其应用
1
一个问题
一个1.72米的男生和一个1.72米的女生哪个高?
2
该直方图给了我们什么信息?
120名7岁男童的身高分布的频率分布图
身高低于116厘米的儿童累计频率为多少?
25
身高大于1 24厘米的儿童累计频率 为多少? 20
15
10
5
0 108 110 112 114 116 118 120 122 124 126 128 130 132
1-S(-32, ,++32)=0)=.301.0704256
-3 -2 - + +2 +3
-4 -3 -2 -1 0 1 2 3 4
17
正态曲线下的面积规律
S(-, -)=3210.)5=0.01025128387
S(-, +)=3211)=0.969758772
0.017 0.025 0.058 0.117 0.158 0.20 0.15 0.125 0.075 0.042 0.025 0.008
累计频数 (4) 2 5 12 26 45 69 87 102 111 116 119 120
医学统计学 第三讲 正态分布及其应用
体的③分当布时越x集中m.,曲线上升;当时 x m,曲线下降.并且当
曲线向左µ、为右正两态边无曲限线延的伸时位,置以参x轴数为渐近线,向它无限靠
(一)估计频数分布
例题2.20 某项研究显示,某地婴儿出生体重均数 为3100g,标准差为300g,试估计该地当年出生低体 重儿(≤2500g)所占比例。
解:已知婴儿出生体重服从正态分布。记做变
量X, 则当X ≤2500时,其对应于标准正态分布的u
值为:
u X m 2500 3100 2.00
异常
单侧上限
双侧下限
双侧上限
1.正态分布法估计参考值范围公式为:
X us
如制定95%参考值范围,双侧界值 u=1.96,单侧界值u=1.645。 双侧界值:x1.96s 单侧上界:x+1.645s 单侧下界:x-1.645s
[例2.21]某地调查正常成年男子200人的红细胞 数近似正态分布,得均数=5.526(1012/L), 标准差s=0.38(1012/L),试估计该地成年男 子红细胞数的95%参考值范围。
2、百分位数法:适合偏态分布资料
步骤:
1. 从“正常人”总体中抽样:明确研究总体 2. 统一测定方法以控制系统误差。 3. 判断是否需要分组(如性别、年龄)确定。 4. 根据专业知识决定单侧还是双侧。 5. 确定绝大多数的比例;最常用95% 6. 选择适合的计算方法
异常
正常
单侧下限
正常
异常 异常
正常
医学统计学课件 正态分布
12
正态分布的位置参数
2 1 3
3 1 2
13
正态分布的形状参数
2 3 1 2
1 3
正态分布的特征 (II)
• 有些指标本身不服从正态分布,但通过适当的变换(transformation )后服从正态分布; Ø 例:对数正态分布(log-normal distribution)
• 参考值范围应为双侧范围。用正态分布法求95%参考值范围的上、下界限: • 此范围可用以判断该地区成年女性血清总蛋白正常与否。
X 1.96s 73.5 1.96 3.9 65.9 ~ 81.1(g/L)
39
小结
• 正态分布是医学研究中最重要的分布之一。正态分布 N(,2) 以 为中心,左右对称, 决定了正态分布的形状。 • 正态分布的曲线下面积可以通过标准正态分布曲线下面积表得到。 • 绝大多数正常人某项指标的波动范围称为参考值范围。参考值范围的计算方法包括正态分布法和百分位数法,可根据
-1.0 0.1587 0.1539 0.1492 0.1446 0.1401
-0.5 0.3085 0.3015 0.2946 0.2877 0.2810
0
0.5000 0.4920 0.4840 0.4761 0.4681
u0
25
常用正态分布的曲线下面积及界值
2.5%
95%
2.5%
-1.96
+1.96
• 根据标准正态离差公式
• 查表得其对应的下侧尾部面积为2.28%。即该地低出生体重儿占所有出生婴儿的2.28%。
u X 2500 3200 2
350
30
应用:估计参考值范围
• 参考值范围(reference interval )又称正常值范围(normal range ),是指绝大多数正常人某项指标的波动范围。 • 参考值范围是临床医生判断正常与异常的参考依据 。
医学统计学(课件)正态分布
CV舒张压
10.7 100% 77.5
13.8%
17.1
CV收缩压
100% 122.9
13.9%
第三章 正态分布及应用
一、正态分布(Normal Distribution)
f (X) 1.2 1
0.8
f (X) 1.2 1
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
3.8 4.2 4.6 5.0 5.4 5.8 X
异常
正常
异常
单侧上限
双侧下限 双侧上限
单侧上限---过高异常 双侧---过高、过低均异常
(b)24小时尿糖参考值范围 (c)白细胞数参考值范围
(五)选择适当的百分范围
参考值的百分范围应根据资料的性质和研究目的选 择,它与诊断阈值有确定的关系。百分范围的不同将导 致不同的假阳性率和假阴性率。
图3-6 正常人和病人数据分布重叠
图3-2 正态分布曲线下的面积
1 2
3
-4 -3 -2 -1 01 1 22 3 43 5 6 7
1 2 3
图3-3 三种不同均值的正态分布
-5 -4 -3 -2 -1 0 1 2 3 4 5
1 2 3 图3-4 三种不同标准差的正态分布
0.6
f (X )
0.5
上限: X 1.96S 4.78 1.96 0.38 5.52(1012 / L)
例3.5 见第二章表2-4资料。为该地区50岁~60岁女性高 血脂诊断与治疗提供参考依据,试估计血清甘油三脂含量的 95%单侧参考值范围。
(630 0.95 580)
P 1.90
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正常人与病人的数据分布重叠示意图(单侧)
假阴性率
正常人
病人
假阳性率
41
正常人与病人的数据分布重叠示意图(单侧)
假阴性率
正常人
病人
假阳性率
42
正常人与病人的数据分布重叠示意图(双侧)
假阴性率 病人
正常人
假阳性率
病人
43
参考值范围的估计方法:正态分布法
2.5%
-1.96
95%
2.5%
+1.96
等;
-1.64~ +1.64内面积为90%; -1.96~ +1.96内面积为95%; -2.58~ +2.58内面积为99%。
23
标准正态分布
标准正态分布(standard normal distribution)是均 数为0,标准差为1的正态分布。
记为N(0,1)。 标准正态分布是一条曲线。 概率密度函数:
(u) 1 eu2 2 2
(-∞< u <+∞)
24
正态分布转换为标准正态分布 若 X~N(,2),作变换:
u X
则u服从标准正态分布。 u称为标准正态离差(standard normal deviation)
25
μ-2σ μ-σ μ μ+σ μ+2σ
X~N(,2)
μ-2σ μ-σ μ μ+σ μ+2σ
Medical statistic 医学统计学
正态分布
Normal Distribution and it’s Applications
正态分布的重要性
❖ 医学上某些指标服从或近似服从正态分布; ❖ 很多统计方法是建立在正态分布基础上的; ❖ 很多其他分布的极限为正态分布。
2
主要内容(Content)
正态分布的概念及图形 正态分布的特征 正态分布曲线下面积的规律 标准正态分布 正态分布的应用 总结
3
频数分布图
4
正态分布的概念及图形
(a)
(b)
(c)
(d)
5
正态分布的概念及图形
Normal distribution Gauss发现 最早用于物理学、天文学 Gaussian distribution
(均数)和变异度参数(标准差)。 有些指标本身不服从正态分布,但经过变换之
后可以服从正态分布。 正态曲线下的面积分布有一定的规律。
12
பைடு நூலகம்
正态曲线下的面积规律
X轴与正态曲线所夹面积恒等于1 。 对称区域面积相等。
S(-, -X)
S( +X,)=S(-, -X)
13
正态曲线下的面积规律
对称区域面积相等。
33
参考值范围确定的原则
选定足够例数的同质的正常人作为研究对象 控制检测误差 判断是否分组(性别,年龄组) 单、双侧问题 (one sided or two sided) 选择百分界值(90%,95%) 确定可疑范围
34
选定同质的正常人作为研究对象
➢ 同质 ➢ 正常 ➢ “足够数量”
44
参考值范围的估计方法:百分位数法
P2.5
P97.5
45
参考值范围的估计方法
标准正态分布的u界值表
百分比(%) 单侧
80
0.8424
双侧
1.2816
90
1.2816 1.6449
95
1.6449 1.9600
99
2.3263 2.5758
46
参考值范围的估计方法
方法
双侧 单侧下限 单侧上限
正态分布法 X u / 2 s X u s X u s
✓ 例数过少,代表性差;例数过多增加成本,且易导 致正常标准把握不严,影响数据的可靠性。
✓ 一般认为每组100例以上 ;有人认为确定临床生化指 标的正常值应取300~500例。
35
控制检测误差
➢ 通过人员培训、控制检测条件、重复测定等措 施,严格控制检测误差。
36
判断是否分组
➢ 组间差别是否有统计学意义并有临床意义? ➢ 各组的分布范围、高峰位置等是否基本一致?
-3 -2 - + +2 +3
-4 -3 -2 -1 0 1 2 3 4
15
正态曲线下的面积规律
1-S(- , +)=0.3174 1-S(-2 , +2)=0.0456 1-S(-3 , +3)=0.0026
-3 -2 - + +2 +3
-4 -3 -2 -1 0 1 2 3 4
16
正态曲线下的面积规律
u0
27
正态分布的应用
估计频数分布 确定临床参考值范围
28
估计频数分布
出生体重低于2500g为低体重儿,某市婴儿出 生体重均数3200g,标准差为s=350g。设该资 料服从正态分布,试求该地低体重儿占该地所 有出生婴儿的比例。
29
首先计算标准离差:
u 2500 3200 2 350
此可作为判断该地区成年女子血清总蛋白含量 正常与否的参考值。
48
总结
正态分布是描述个体变异的重要分布之一,也 是统计学理论中的重要分布之一;
正态分布是由两个参数决定:均数和标准差; 正态分布曲线下的面积是有规律的,且与标准
正态分布曲线下的面积对应(以标准正态离差 为单位)。
49
19
正态曲线下的面积规律
2.5%
95%
2.5%
-1.96
+1.96
20
正态曲线下的面积规律
90%
5%
5%
-1.64
+1.64
21
正态曲线下的面积规律
0.5%
-2.58
99%
0.5%
+2.58
22
正态曲线下的面积规律
正态曲线下面积总和为1; 正态曲线关于均数对称;对称的区域内面积相等; 对任意正态曲线,按标准差为单位,对应的面积相
37
单侧与双侧参考值范围
根据医学专业知识确定!
双侧:白细胞计数,血清总胆固醇, 单侧:上限: 转氨酶,尿铅,发汞 ……
下限: 肺活量,IQ,
单侧下限---过低异常 单侧上限---过高异常 双侧---过高、过低均异常
异常 正常 单侧下限
正常 异常 单侧上限
异常
正常
异常
双侧下限 双侧上限
38
选择百分界值
17
X2=-σ2 X1=-σ1 X3=-σ3
2 1
0.1587 0.1587 0.1587
3
X3 X1 X2
18
正态曲线下的面积规律
正态分布的一个显著特点
其曲线下面积完全决定于以标准差为单位 从点X到µ的离差。
X 1 1 1
1
2 2 2
2
3 3 3 1
3
S(-, )=0.5 S(-, -1)=0.1587 S(-, -2)=0.0228 S(-, -3)=0.0013
S(-, )=1
S(-, +1)=0.8413 S(-, +2)=0.9772 S(-, +3)=0.9987
-3 -2 - + +2 +3
-4 -3 -2 -1 0 1 2 3 4
➢ 参考值范围的涵义:绝大多数的正常人在该范围内
习惯上将“绝大多数”定义为80%、90%、95%或99% 。 应根据研究目的、研究指标的性质、数据分布特征等情
况综合考虑百分界值的选择。
39
确定可疑范围
➢ 若病人与正常人的数据重叠较多的情况下,为避 免较大的假阳性和假阴性错误率,可设定可疑范 围。
查标准正态分布表: (-2)=0.0228
结果:估计低体重儿的比例为2.28%.
30
思考题
✓ 标准正态分布曲线下-2~2范围内的面积? ✓ 标准正态分布曲线下-2~1范围内的面积?
31
➢ P(-2<u<2)=1-2×P(u≤-2) =1-2 × 0.0228=0.9544
➢ P(-2<u<1)=1-P(u≤-2)-P(u≥1) =1- P(u≤-2)-P(u ≤-1) =1-0.0228-0.1587=0.8185
百分位数法 P2.5~P97.5
>P5
<P95
47
例:参考值范围的计算
某地调查了200名成年女子的平均血清总蛋白为 73.5(g/L),标准差3.9 (g/L),试估计该地成年女子血 清总蛋白95%的参考值范围。
95%参考值范围: 下限:X -1.96s=73.5-1.96×3.9=65.9(g/L) 上限:X +1.96s=73.5+1.96×3.9=81.1(g/L)
6
7
正态分布的概率密度函数
如果随机变量X的概率密度函数
f (X)
1
e
(
X 2 2
)2
2
为总体均数,为总体标准差
π为圆周率,e为自然对数的底
(-∞< X <+∞)
X为变量,代表横轴的数值,f(X)为纵轴数值。
则称X服从正态分布,记作X~N(,2),其中, 为分布 的均数, 为分布的标准差。
32
参考值范围(reference interval)
参考值范围又称正常值范围(normal range)。 什么是参考值范围:
是绝大多数正常人的某观察指标所在的范围。 绝大多数:90%,95%,99%等等。
确定参考值范围的意义:
用于判断正常与异常。
“正常人”的定义:
排除了影响所研究的指标的疾病和有关因素的同质 的人群。