预防医学统计学课件(正态分布及其应用)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Байду номын сангаас
肺活量仅过低异常,应采用单侧制定下侧界值。
通常使用的医学参考值范围有90%,95%, 99%;最常用为95%。
补充习题
抽样调查某市45-55岁健康男性居民的血脂水平, 184名45-55岁健康男性居民的血清总胆固醇的 X=4.84mmol/L,S=0.96mmol/L,已知健康人 的血清总胆固醇服从正态分布。 (1)估计该市45-55岁健康男性居民的血清总胆 固醇的95%参考值范围; (2)估计该市45-55岁健康男性居民中,血清总 胆固醇低于3.80 mmol/L所占的比例。
二、正态分布图形特征
1、高峰位于中央,两侧逐渐下降并对称,
曲线两端不与横轴相交
2、以均数为中心,左右对称
f ( x)
3、正态分布有两个参数:
(1)位置参数 μ (2)形态参数σ
4、正态分布曲线下的面积有
一定的分布规律
0
x
3、正态分布的两个参数
(1) μ-位置参数:决定高峰的位置 当σ一定时, μ越大,曲线沿横轴向右移; μ越小,曲线沿横轴向左移。 (2) σ-形态参数:决定曲线的形态 当μ一定时, 越大,曲线越平坦; 越小,曲线越陡峻。
附表1
Φ(u)
-∞ -3 -2 -1 0 +1 +2 +3 + ∞
查表确定标准正态分布曲线下的 面积时必须注意:
(1)当μ,σ和X已知时,先按u变 换公式求得u值,再用u值查表;
x u
当μ,σ和X未知时,用样本均数 和样本标准差代替求u值。
u
x x
s
( 2 )查表时,可以利用标准正态分 布的两个特征:
即血清总胆固醇低于3.80 mmol/L所占的 比例为14.01%。
参数=0,2=1的正态分布称为标准正态 分布,记作X~N(0, 1)。 ( x) 其密度函数为
1 ( x) 2 ( x )
x2 e 2
4 2 0
2
4
2、标准正态分布曲表
Φ(u):表示标准正态分布曲线下区间( -∞ ,u) 之间的面积,即对应u值左侧标准正态分布曲线 下面积。
2
f ( x)
μ3 > μ1 > μ2
N (4,3 / 5)
N (4,1)
N (4,7 / 5)
0
2
4
6 x
三、正态曲线下面积的分布规律
正态曲线与X轴所夹的面积恒等于1或100%
面积总 等于1
已知:X服从均数为μ ,标准差为σ的正态分 布,试估计X取值在μ± σ, μ±1.96 σ, μ±2.58σ区间上的概率 ( x )2
x
2、百分位数法
(1)适用范围:
适用任何分布 类型的资料
(2)计算公式: 双侧:
95%:P2.5~P97.5 99%:P0.5~P99.5
单侧:
上限 95%: 99%: 下限 95%: 99%: <P95 <P99 > P5 > P1
通常依据医学专业知识确定单双侧,例如: 血清总胆固醇无论过低或过高均属异常,应采 用双侧制定上下侧界值; 血清转氨酶仅过高异常,应采用单侧制定上侧 界值;
正常人:排除了对所研究指标有影响 的疾病和有关因素的同质的人群
1、正态分布法
(1)适用范围:(近似)正态分布或对数正
态分布资料
(2)计算公式:
双侧
95%: 99%:
单侧
上限
x
x ±1.96S
±2.58S
下限
95%:x +1.645S 99%: x +2.326S 95%:x -1.645S 99%: -2.326S
1 2 2 f ( x) e 2 其中 x
95.00% 2.5% 2.5%
μ -1.96 σ
μ + 1.96σ
1 2 3
μ±σ的区间占总面积的68.27%
μμμ + σ 95% ±σ 1.96σ的区间占总面积的
μ±2.58σ的区间占总面积的99%
四、
标准正态分布
预防医学(医学统计学)实习
实习二:正态分布及其应用
实习纲要
正态分布的概念
正态分布的图形特征
正态曲线下面积的分布规律
标准正态转换与标准正态分布的特征
正态分布的应用
一、正态分布的概念
在医学卫生领域中,许多变量的频数分布是中 间频数多,两边频数少,且左右对称。比如,考察一 群人的身高,个体的身高是一个随机变量,其取值特点 是:在平均身高附近的人较多,特别高和特别矮的人较 少。一个班的一次考试成绩、测量误差等均有类似 的特征.高斯在研究误差理论时曾用它来刻画误差,因 此很多文献中亦称之为高斯分布(Gaussian distribution)。
一. 一般正态分布
1. 定义 若随机变量X的密度函数为
1 2 2 f ( x) e 2 其中 x ( x )2
f ( x)
0
x
式中 为实数, >0 .则称X服从参数为 ,2的正态分 布,记为N(, 2).可表为X~N(, 2). 图象见右上角
a.
曲线下对称 于0的区间, 面积相等;
b.
曲线下横轴 上的总面积 为100%或1。
Φ(u)=1- Φ(-u)
五、正态分布的应用
1、估计频数分布 2、制定医学参考值范围 3、质量控制 4、统计处理方法的基础
2、医学参考值范围的制定
医学参考值:指绝大多数正常人的人 体形态、功能和代谢产物等各种生理 及生化指标所在范围。
(1)血清胆固醇95%参考值范围: x±1.96s=4.84±1.96×0.96= (2.96,6.72)(mmol/L)
即该市45-55岁健康男性居民的血清总胆固醇的 95%参考值范围为(2.96,6.72)(mmol/L)
(2)
u=
3.80-4.84
0.96
= - 1.08
Ф(u) =Ф(-1.08)=0.1401
肺活量仅过低异常,应采用单侧制定下侧界值。
通常使用的医学参考值范围有90%,95%, 99%;最常用为95%。
补充习题
抽样调查某市45-55岁健康男性居民的血脂水平, 184名45-55岁健康男性居民的血清总胆固醇的 X=4.84mmol/L,S=0.96mmol/L,已知健康人 的血清总胆固醇服从正态分布。 (1)估计该市45-55岁健康男性居民的血清总胆 固醇的95%参考值范围; (2)估计该市45-55岁健康男性居民中,血清总 胆固醇低于3.80 mmol/L所占的比例。
二、正态分布图形特征
1、高峰位于中央,两侧逐渐下降并对称,
曲线两端不与横轴相交
2、以均数为中心,左右对称
f ( x)
3、正态分布有两个参数:
(1)位置参数 μ (2)形态参数σ
4、正态分布曲线下的面积有
一定的分布规律
0
x
3、正态分布的两个参数
(1) μ-位置参数:决定高峰的位置 当σ一定时, μ越大,曲线沿横轴向右移; μ越小,曲线沿横轴向左移。 (2) σ-形态参数:决定曲线的形态 当μ一定时, 越大,曲线越平坦; 越小,曲线越陡峻。
附表1
Φ(u)
-∞ -3 -2 -1 0 +1 +2 +3 + ∞
查表确定标准正态分布曲线下的 面积时必须注意:
(1)当μ,σ和X已知时,先按u变 换公式求得u值,再用u值查表;
x u
当μ,σ和X未知时,用样本均数 和样本标准差代替求u值。
u
x x
s
( 2 )查表时,可以利用标准正态分 布的两个特征:
即血清总胆固醇低于3.80 mmol/L所占的 比例为14.01%。
参数=0,2=1的正态分布称为标准正态 分布,记作X~N(0, 1)。 ( x) 其密度函数为
1 ( x) 2 ( x )
x2 e 2
4 2 0
2
4
2、标准正态分布曲表
Φ(u):表示标准正态分布曲线下区间( -∞ ,u) 之间的面积,即对应u值左侧标准正态分布曲线 下面积。
2
f ( x)
μ3 > μ1 > μ2
N (4,3 / 5)
N (4,1)
N (4,7 / 5)
0
2
4
6 x
三、正态曲线下面积的分布规律
正态曲线与X轴所夹的面积恒等于1或100%
面积总 等于1
已知:X服从均数为μ ,标准差为σ的正态分 布,试估计X取值在μ± σ, μ±1.96 σ, μ±2.58σ区间上的概率 ( x )2
x
2、百分位数法
(1)适用范围:
适用任何分布 类型的资料
(2)计算公式: 双侧:
95%:P2.5~P97.5 99%:P0.5~P99.5
单侧:
上限 95%: 99%: 下限 95%: 99%: <P95 <P99 > P5 > P1
通常依据医学专业知识确定单双侧,例如: 血清总胆固醇无论过低或过高均属异常,应采 用双侧制定上下侧界值; 血清转氨酶仅过高异常,应采用单侧制定上侧 界值;
正常人:排除了对所研究指标有影响 的疾病和有关因素的同质的人群
1、正态分布法
(1)适用范围:(近似)正态分布或对数正
态分布资料
(2)计算公式:
双侧
95%: 99%:
单侧
上限
x
x ±1.96S
±2.58S
下限
95%:x +1.645S 99%: x +2.326S 95%:x -1.645S 99%: -2.326S
1 2 2 f ( x) e 2 其中 x
95.00% 2.5% 2.5%
μ -1.96 σ
μ + 1.96σ
1 2 3
μ±σ的区间占总面积的68.27%
μμμ + σ 95% ±σ 1.96σ的区间占总面积的
μ±2.58σ的区间占总面积的99%
四、
标准正态分布
预防医学(医学统计学)实习
实习二:正态分布及其应用
实习纲要
正态分布的概念
正态分布的图形特征
正态曲线下面积的分布规律
标准正态转换与标准正态分布的特征
正态分布的应用
一、正态分布的概念
在医学卫生领域中,许多变量的频数分布是中 间频数多,两边频数少,且左右对称。比如,考察一 群人的身高,个体的身高是一个随机变量,其取值特点 是:在平均身高附近的人较多,特别高和特别矮的人较 少。一个班的一次考试成绩、测量误差等均有类似 的特征.高斯在研究误差理论时曾用它来刻画误差,因 此很多文献中亦称之为高斯分布(Gaussian distribution)。
一. 一般正态分布
1. 定义 若随机变量X的密度函数为
1 2 2 f ( x) e 2 其中 x ( x )2
f ( x)
0
x
式中 为实数, >0 .则称X服从参数为 ,2的正态分 布,记为N(, 2).可表为X~N(, 2). 图象见右上角
a.
曲线下对称 于0的区间, 面积相等;
b.
曲线下横轴 上的总面积 为100%或1。
Φ(u)=1- Φ(-u)
五、正态分布的应用
1、估计频数分布 2、制定医学参考值范围 3、质量控制 4、统计处理方法的基础
2、医学参考值范围的制定
医学参考值:指绝大多数正常人的人 体形态、功能和代谢产物等各种生理 及生化指标所在范围。
(1)血清胆固醇95%参考值范围: x±1.96s=4.84±1.96×0.96= (2.96,6.72)(mmol/L)
即该市45-55岁健康男性居民的血清总胆固醇的 95%参考值范围为(2.96,6.72)(mmol/L)
(2)
u=
3.80-4.84
0.96
= - 1.08
Ф(u) =Ф(-1.08)=0.1401