正态分布及其应用ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布及其应用
(normal distribution)
第一节 正态分布的概念和特征
➢一.概念 正态分布又称高斯(Gauss)分布,
是最常见、最重要的一种连续型分布, 医学资料中有许多指标的频数分布都呈 正态分布,如身高、体重、脉搏、血红 蛋白、血清总胆固醇等。
➢二.图形 正态分布密度函数
f (X)
如白细胞总数,无论过高或过低均属
异常,故正常值范围需要分别确定下
限和上限,即双侧界值;有些指标如
肺活量通常只以过低为异常,血铅以
过高为异常,只需要确定下限或上限, 即单侧界值。
依据资料的分布类型有以下两种计 算医学参考值范围的常用方法。
➢正态近似法 适用于服从正态分布或近 似正态分布的资料
➢双侧1 参考值范围
x u 2s
➢单侧 1 参考值范围
x u s 或 x u s
➢百分位数法 适用于偏态分布资料、分 布型未知的资料以及分布末端有不确定 值的资料。
➢双侧95%参考值范围 P2.5 ~ P97.5
➢单侧95%参考值范围
P5 或 P95
➢医学参考值范围Reference Range 指某 群体“正常人”的解剖、生理、生化等 各种指标大多数个体值的波动范围。
➢这里“正常人”不是指机体任何器官、 组织的形态和功能都正常的人,而是排 除了对研究指标有影响的疾病或因素之 后的同质人群。
➢通常使用的医学参考值范围有90%、 95%、99%等,最常用的为95%。另外, 还应根据专业知识确定单、双侧,例
定, 增大,曲线沿 X 轴向右平移。因此,不
同的 ,不同的 ,对应不同的正态分布。
不同均值正态分布示意图
1.5 1
不同标准差的正态分布示意图
➢ 正态曲线下面积的分布规律
通过对密度函数积分我们可以知道正态曲线下, 横轴上所夹的面积为1。理论上:
范围内曲线下的面积占总面积的68.27%; 1.645 范围内曲线下的面积占总面积的90%; 1.96 范围内曲线下的面积占总面积的95%;
或称 变换u 。
uHale Waihona Puke Baidux
•
实际应用中,经u 变换后,就可把
求解任意一个正态分布曲线下面积的问
题,转化成标准正态分布曲线下相应的
面积问题。附表1给出了标准正态分布
曲线下从 到 u的面积,根据正态分布
的对称性,我们可以求出任何一个区间
内标准正态分布曲线下的面积,也就是
u 落在任何一个区间内的概率。
• 例3-1 在例2-1中求得150名12岁健 康男童体重的均数 x 36.3(kg),标准 差 s 6.19(kg),试估计该150名12岁 健康男童所代表的总体中,体重在50kg 以上的儿童所占的比例。
1
2
exp(
(X )2 2 2
)
其中参数为均值, 为标准差,由此
决定的正态分布记作 N (, 2 ) 。
正态分布概率密度曲线示意图
➢ 三.特征
➢ 正态分布是单峰曲线,形状呈钟型,中间高,两
端低,以 X 为对称轴,左右完全对称。
➢ 在 X 处,f (X ) 取得最大值。
➢ 有两个参数:位置参数 和变异度参数 。 一定, 越大,数据越分散,曲线越平坦; 一
• 将 x 50 ,x 36.3 ,s 6.19 代入公 式 u x ,得 u 2.21 。
• 根据正态 分布的对称性知,外侧尾部面
积 u 2.21与外侧尾部面积 u 2.21
相同,查附表1,得对应的概率为0.0136, 体重在50kg以上的12岁儿童占1.36%。
第三节 医学参考值范围的制定
2.58 范围内曲线下的面积占总面积的99%。
➢四、正态分布的应用
➢估计频数分布。
➢制定医学参考值范围。
➢正态分布是许多统计方法的理论基础。
今后要讨论到的 分布t 、 分布F 与
分布 2等都是在正态分布的基础上推导 出来的。
第二节 标准正态分布及其应用
只要变量 X ~ N(, 2 ) ,就可经下式 转换为 0、 1的标准正态分布,记 作 u ~ N(0,1) 。此变换也称为标准化变换,
(normal distribution)
第一节 正态分布的概念和特征
➢一.概念 正态分布又称高斯(Gauss)分布,
是最常见、最重要的一种连续型分布, 医学资料中有许多指标的频数分布都呈 正态分布,如身高、体重、脉搏、血红 蛋白、血清总胆固醇等。
➢二.图形 正态分布密度函数
f (X)
如白细胞总数,无论过高或过低均属
异常,故正常值范围需要分别确定下
限和上限,即双侧界值;有些指标如
肺活量通常只以过低为异常,血铅以
过高为异常,只需要确定下限或上限, 即单侧界值。
依据资料的分布类型有以下两种计 算医学参考值范围的常用方法。
➢正态近似法 适用于服从正态分布或近 似正态分布的资料
➢双侧1 参考值范围
x u 2s
➢单侧 1 参考值范围
x u s 或 x u s
➢百分位数法 适用于偏态分布资料、分 布型未知的资料以及分布末端有不确定 值的资料。
➢双侧95%参考值范围 P2.5 ~ P97.5
➢单侧95%参考值范围
P5 或 P95
➢医学参考值范围Reference Range 指某 群体“正常人”的解剖、生理、生化等 各种指标大多数个体值的波动范围。
➢这里“正常人”不是指机体任何器官、 组织的形态和功能都正常的人,而是排 除了对研究指标有影响的疾病或因素之 后的同质人群。
➢通常使用的医学参考值范围有90%、 95%、99%等,最常用的为95%。另外, 还应根据专业知识确定单、双侧,例
定, 增大,曲线沿 X 轴向右平移。因此,不
同的 ,不同的 ,对应不同的正态分布。
不同均值正态分布示意图
1.5 1
不同标准差的正态分布示意图
➢ 正态曲线下面积的分布规律
通过对密度函数积分我们可以知道正态曲线下, 横轴上所夹的面积为1。理论上:
范围内曲线下的面积占总面积的68.27%; 1.645 范围内曲线下的面积占总面积的90%; 1.96 范围内曲线下的面积占总面积的95%;
或称 变换u 。
uHale Waihona Puke Baidux
•
实际应用中,经u 变换后,就可把
求解任意一个正态分布曲线下面积的问
题,转化成标准正态分布曲线下相应的
面积问题。附表1给出了标准正态分布
曲线下从 到 u的面积,根据正态分布
的对称性,我们可以求出任何一个区间
内标准正态分布曲线下的面积,也就是
u 落在任何一个区间内的概率。
• 例3-1 在例2-1中求得150名12岁健 康男童体重的均数 x 36.3(kg),标准 差 s 6.19(kg),试估计该150名12岁 健康男童所代表的总体中,体重在50kg 以上的儿童所占的比例。
1
2
exp(
(X )2 2 2
)
其中参数为均值, 为标准差,由此
决定的正态分布记作 N (, 2 ) 。
正态分布概率密度曲线示意图
➢ 三.特征
➢ 正态分布是单峰曲线,形状呈钟型,中间高,两
端低,以 X 为对称轴,左右完全对称。
➢ 在 X 处,f (X ) 取得最大值。
➢ 有两个参数:位置参数 和变异度参数 。 一定, 越大,数据越分散,曲线越平坦; 一
• 将 x 50 ,x 36.3 ,s 6.19 代入公 式 u x ,得 u 2.21 。
• 根据正态 分布的对称性知,外侧尾部面
积 u 2.21与外侧尾部面积 u 2.21
相同,查附表1,得对应的概率为0.0136, 体重在50kg以上的12岁儿童占1.36%。
第三节 医学参考值范围的制定
2.58 范围内曲线下的面积占总面积的99%。
➢四、正态分布的应用
➢估计频数分布。
➢制定医学参考值范围。
➢正态分布是许多统计方法的理论基础。
今后要讨论到的 分布t 、 分布F 与
分布 2等都是在正态分布的基础上推导 出来的。
第二节 标准正态分布及其应用
只要变量 X ~ N(, 2 ) ,就可经下式 转换为 0、 1的标准正态分布,记 作 u ~ N(0,1) 。此变换也称为标准化变换,