4[1].第三章 正态分布及其应用(第3次课)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布及其应用
课件下载
Email:yixuetjx@ 密码:000000
变异指标小结
1.极差较粗,适合于任何分布;
2.四分位间距比极差稳定,但仍未考虑每个观察值的变异。
常用于:①偏态分布资料; ②分布不明;③分布末端无确切值;
3.标准差与均数的单位相同,最常用,适合于近似正态分布;
4.变异系数主要用于单位不同或均数相差悬殊资料;5.平均指标和变异指标分别反映资料的不同特征,常配套使用。
如正态分布:均数、标准差;
偏态分布:中位数、四分位间距
正态分布及其应用
(Normal distribution)
一. 正态分布的概念和特征
二. 正态曲线下面积的分布规律
三. 标准正态分布的性质
四. 正态分布的应用
【学习要求】
¾掌握正态分布的概念、图形特征、
¾掌握u转换的思想及方法,其图形的面积规律及求法。
¾掌握医学参考值范围的求法。
在医学卫生领域中,许多变量的频数分布是中间(靠近均数处)频数多,两边频数少,且左右对称。
如人体的尺寸、许多生化指标等。
等。
这种变量的频数分布规律可用概率论中的一种重要的随机变量分布—正态分布(Normal distribution)加以描述。
一.正态分布的概念和特征
1.正态分布的概念
正态曲线( normal curve):是一条高峰位
于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线。
若变量x 的频率曲线对应于数学上的正
态分布曲线,则称该变量服从正态分布。
二.正态密度函数曲线下的面积规律
③曲线下在区间(μ-σ,μ+σ)的面积为
68.27%,
曲线下在区间(μ-1.96σ,μ+1.96σ)的面积为95.00%,
曲线下在区间(μ-2.58σ,μ+2.58σ)的面积为99.00%。
三、标准正态分布
实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。
对于不同的参数μ和σ会产生不同位置、不同形状正态分布,(x1,x2)范围内的面积也不同,计算起来很麻烦。
为了计算方便,对于正态或近似正态分布的资料,只要得出均数和标准差,可通过标准转化,转化成求标准正态曲线下横轴自-∞到u的面积。
为了便于应用,统计学家按Φ(u)编制了标准正态分布曲线下的面积表,由此表可查出曲线下某区间的面积,这样就可对符合正态分布资料的频数分布作出估计。
¾统计学家按标准正态分布的累积概率分布函数Φ(u)编制了附表1,标准正态分布
曲线下的面积,由表可查出曲线下某区
间的面积。
-2.62
计算正态曲线下面积实例
例
=-1.76,u2=-0.25,欲求标准正态下(-1.76 -已知u
1
0.25)范围的面积。
查表φ(-1.76)=0.0392 ;φ(-0.25)=0.4013则:
D=φ(-0.25)-φ(-1.76)=0.361
例3.14
某地1986年120名8岁男孩身高均数为123.02cm,标准差为4.79cm,试估计
(1)该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比;
(2)身高在120~128cm者占该地8岁男孩总数的百分比;
(3)该地80%的男孩身高集中在哪个范围?
四、正态分布的应用
1.估计频数分布
2.制定医学参考值范围
3.是许多统计方法的理论基础
1. 估计频数分布
例1.某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。
若以2500g作为低体重儿,试估计低体重儿的比例。
查附表1得
Φ(u
)=Φ(-1.05)=0.1469,
1
Φ(u
)=Φ(-0.37)=0.3557
2
D=Φ(u2)-(u1)=0.3557 -0.1469=0.2088
=20.88%
故估计该市城区某年身高界于104.0~108.0㎝范围内的5岁女孩所占比例为20.88%,估计120名5岁女孩中身高界于104.0~108.0㎝范围内的人数为120×20.88% =25(名)。
2. 制定医学参考值范围( medical reference interval) 又称正常值范围(normal range):特定的正常人群中大多数个体的解剖、生理、生化
等指标的取值范围,“大多数个体”习惯上
指95%的个体。
“正常人”是指排除了影响所研究的指标的疾病和有关因素的同质人
群。
确定医学参考值范围的意义:
作为判断正常与异常的参考标准。
(1)步骤:
1.从“正常人”总体中抽样:明确研究总体;
2.统一测定方法以控制系统误差;
3.根据专业知识决定单侧还是双侧;
4.根据资料特点,选用恰当方法估计参考值
范围
(2)方法:
1.正态分布法:
资料呈正态或近似正态分布
2. 百分位数法:
资料呈偏态分布
例7. 测得某年某地282名正常人的尿汞值如下表所示,试制定正常人尿汞的95%参考值范围。