第一课正态分布22

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-∞<X<+∞
上式中:π 为圆周率,e为自然对数的底,µ(总体均
数)和σ (总体标准差)为正态分布的参数。 如果连续型随机变量X具有如上式的概率密度函数,
则称随机变量X服从参数为µ和σ 2的正态分布,记为 X~N(µ,σ 2 )。
• 标准正态分布:均数为0,标准差为1的正态分 布,这种正态分布称为标准正态分布。
3.曲线下对称于0的区间,面积相等。
4.曲线下横轴上的面积为100%或1。
正态分布是一种对称分布,其对称轴为直线X=µ, 即均数位置,理论上:
µ±1σ范围内曲线下的面积占总面积的68.27% µ±1.96σ范围内曲线下的面积占总面积的95% µ±2.58σ范围内曲线下的面积占总面积的99% 实际应用中:
本例由于是大样本,可用样本均数和样本 标准差分别作为总体 和 的估计值,即将该 地18岁女孩的身高(记作X)近似看作服从 N(1638,3.82)的正态分布。做如下标准化变 换:
先做标准化变化: 查标准正态分布表得:
五、 正态分布的应用
(一)制定医学参考值范围 医学参考值范围:又称正常值范围,指包括了绝
值上限为 x +1.64s=11.77 moL/kg。
【问题2—5】 (1)该资料是正态分布资料还是偏态分
布资料? (2)应当选用什么方法计算正常值范围?
【分析】 从频数表2-7可以看出,该样本资 料呈偏态分布,故不能用正态分布法计算正常
值 范围,而应该用适合偏态分布的百分位数法, 计算P95=12.64 mol/kg,故估计该地居民发
以外的概率几乎为O,可以认为是不可能事件。若一测量 值落在控制限以外,则有理由认为数据的波动不仅仅是由 随机测量误差引起的,可能存在某种非随机的系统误差。
(三)正态分布是许多统计方法的理论基础
•统计描述中计算算术平均数、标准差均要求指标服 从正态分布;统计推断中进行总体均数置信区间估 计、t检验、F检验、相关与回归等分析也都是在正 态分布的基础上推演而来的。 •对于非正态分布的资料,实施统计处理的一个重要 途径就是对其进行变量变换,使其转换后的资料近 似服从正态分布,然后按照正态分布的方法进行统 计学处理。
(2)位于 ( 1.96 , 1.96 ) 内的面积为0.95 ,即正态变量在 1.96范围内取值的概率为0. 95,在该区间以外取值的概率(两侧的阴影面积之 和)为O.05。
(3)位于 ( 2.58 , 2.58 )内的面积为0.99,
即正态变量在 2.58 范围内取值的概率为0.
-1.9 0.0287 0.0274 0.0262 0.0250 0.0239
-1.6 0.0548 0.0526 0.0505 0.0485 0.0465
-1.0 0.1587 0.1539 0.1492 0.1446 0.1401
-0.5 0.3085 0.3015 0.2946 0.2877 0.2810
• 对于任意一个服从正态分布N(μ,σ2)的随机变量,
可作如下的标准化变换,也称u变换。
u

X
二、正态分布的特征
1. 关于
对称。即正态分布以均数为中
心,左右对称。
2. 在
处取得概率密度函数的最大值,

处有拐点,表现为钟形曲线。即正
态曲线在横轴上方均数处最高。
3. 正态分布有两个参数,即均数µ和标准差σ。 µ是位置参数,σ是变异度参数(形状参数)。常用 N(µ,σ2)表示均数为μ ,标准差为σ的正态分布;用 N(0,1)表示标准正态分布。
0
0.5000 0.4920 0.4840 0.4761 0.4681
u0
利用标准正态分布,可以计算出正态分布曲线 下常用的几个面积:
(1)位于( 1.64 , 1.64 ) 内的面积为O.90, 即正态变量在 1.64 范围内取值的概率为O. 90,在该区间以外取值的概率(两侧的阴影面积之 和)为0.10。
标准正态分布曲线下面积(u) 附表1
u
0.00 0.02 0.04 0.06 0.08
-3.0 0.0013 0.0013 0.0012 0.0011 0.0010
-2.5 0.0062 0.0059 0.0055 0.0052 0.0049
-2.0 0.0228 0.0217 0.0207 0.0197 0.0188
大多数的特定的“正常”人群的解剖、生理、生化、 免疫等各种数据的波动范围,这里所谓“正常”并非 指没有任何疾病的人,而是指排除了影响研究指标的 疾病和有关因素的同质人群,“绝大多数”习惯上包 括正常人的90%、95%、99%等,如无特殊说明一般 默认为95%。
制定参考值范围的步骤: 1.依据观察指标的特点、背景和已知的影响因 素,确定抽样的入选标准。
分析:正常人的血清总蛋白过高过低均为异常,要 制定双侧95%正常值范围。
该指标的95%医学参考值范围为
【例2-17】某地调查120名正常成年男子的第一秒 肺通气量,得均数为4.2 L,标准差为0.7 L ,试估计该 地正常成年男子第一秒肺通气量的95%参考值范围。
分析:正常人的第一秒肺通气量近似正态分布,且 只以过低为异常,要制定单侧下限。
汞值的95%正常值不高于12.64mol/kg。
(二)质量控制
若实验误差仅由随机误差引起,不存在系统误差,则
指标的波动应服从正态分布。根据这一原理,可以实现测 量过程的质量控制。
为控制检验误差,通常以 x ±2s作为上下警戒限, 以 x±3s作为上下控制限。
根据正态分布曲线下的面积规律,落在( x-2s,x+2s) 区域的概率约为95%,而落在( x -3s, x+3s)区域的概 率约为99%,从而在一次测量中落在( x-3s,x+3s)区域
(如在制定正常成年女子血红蛋白含量的参考值范围研究中,要 排除贫血的成年女子。)
2.根据指标特点及专业知识决定单侧还是双侧。 3. 确定置信度(选择适当的百分界限)。 4. 按资料分布特征选取不同方法计算正常值范 围。
估计医学参考值范围的方法:
1. 正态近似法:适用于正态分布或近似正态分布的资
料。
±1 S范围内曲线下的面积占总面积的68.27% ±1.96 S范围内曲线下的面积占总面积的95% ±2.58 S范围内曲线下的面积占总面积的99%
【例2—15】 在例2-1中,已求得某市100名 18岁女孩身高均数为163.8cm,标准差为3.8 cm,试估计该地18岁女孩身高介于166~170cm 的比例及人数。
99,在该区间以外取值的概率(两侧的阴影面积之 和)为0.01
四、标准正态分布表
1.表中曲线下面积为-∞到u的面积。
2.当µ,σ和X已知时,先求出u值, u X

再用u值查表,得所求区间占总面积的比例。当µ和σ
未知时,要用样本均数和样本标准差S来估计u值。
u X X S
2. 百分位数法:适用于偏态分布资料。
过低异常 过高异常
过低异常过高异常
单侧下限---过低异常 单侧上限---过高异常 双侧---过高、过低均异常
异常
正常
单侧下限
如肺活量
正常 异常 单侧上限
如尿铅值
异常
正常
异常
双侧下限
双侧上限
如体重
【例2—16】 已知某地正常成年女子的血清总蛋白数 近似服从正态分布。调查Fra Baidu bibliotek该地110名正常成年女子, 得样本血清总蛋白均数为72.8(g/L),标准差为3.8(g /L),试估计该地正常成年女子血清总蛋白的95%参 考值范围。
4. 正态曲线下面积分布有一定规律。横轴上 正态曲线下的面积等于100%或1。
三、正态曲线下面积的分布规律
正态方程的积分式(分布函数):
F(X)为正态变量X的累计分布函数,反映正态曲线下,横 轴尺度自-∞到X的面积,即下侧累计面积 。
标准正态分布方程积分式(分布函数):
Φ(u)为标准正态变量 u的累计分布函数,反映标准正态曲 线下,横轴尺度自-∞到u的面积,即下侧累计面积 。
• 图形:正态分布曲线是一条高峰位于中 央,均数处最高,两侧逐渐下降并完全 对称,曲线两端永远不与横轴相交的钟 形曲线。
• 特征:正态分布的频数分布高峰在中间, 两端完全对称,并逐步减少,这种分布 即为正态分布。
• 面积:正态曲线与横轴所夹的面积为1。
正态分布的密度函数,即正态曲线的函数表达方程为
精品课件!
精品课件!


• 重点
• 描述计量资料集中趋势、 离散趋势统计指标的概念、 计算方法及适用条件;
• 正态分布的概念与特征、 正态曲线的概念和曲线下 面积分布规律;
• 医学参考值范围的计算及 应用。
• 难点
• 不同资料集中趋势 和离散趋势指标的 选择。
该地正常成年男子第一秒肺通气量的95%参考 值范围为:不低于3.05L。
【例2-18】 为估计某地居民发汞值的参考值范 围,测得某地284名正常成人的发汞值如表2-7
(P15)。计算得该样本资料的均数为7.1l mol /kg,标准差s=2.84 moL/kg,由于发汞仅过
高为异常,于是估计该地居民发汞值的95%正常
相关文档
最新文档