经典:医学统计学.-正态分布及其应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由此可知:如果一个区间由若干组段构成,计算肺活量落在 某个区间的概率等于计算这个区间的中各个直方条图的面 积之和. 只能计算给定区间概率,不能计算任意区间概率. 对于上述直方图,组距越小,组段越多,能够计算的概率区 间就越多,当组距逐渐减小,上述计算方法仍然成立.
5
随人数逐渐增多,组段不断分 细,则频数分布图中的直条逐渐变 窄,就会逐渐形成一条高峰位于中 央(均数所在处)、两侧逐渐降低且 左右对称、不与横轴相交的光滑曲 线,近似于数学上的正态分布曲线。
(X ) 1 eZ2 2 2
26
➢ 对上式求积分可得到标准正态变量Z的分布函 数。
➢ 由于积分计算繁琐,统计学家按标准正态分布
的累积概率分布函数(-Z)编制了附表2
(P315),标准正态分布曲线下的面积,由 表可查出曲线下某区间的面积。
27
标准正态分布曲线下面积(Z)
Z
0.00 -0.02 -0.04 -0.06 -0.08
9
正态分布曲线呈对称的钟形, 在均数处最高,两侧逐渐低下,两 端在无穷远处与横轴无限接近。
若变量 x 的频率曲线对应于数 学上的正态分布曲线,则称该变量 服从正态分布。
10
2.正态分布的特征
正态分布曲线的密度函数为:
f (X)
1
(X)2
e 22
-∞<X<+∞
2
则称X服从正态分布,记作x~N(, 2)
相等, 2不等的正态分布图示
1
2 3
1 < 2 < 3 14
二.正态密度函数曲线下的面积规律
①正态密度函数曲线与横轴间的面积恒等于1或100%; ②正态分布是一种对称分布,其对称轴为直线X=μ,X>μ与
X<μ范围内曲线下的面积相等,各占50%;
S(X,)=S(-,-X)
S(-,-X)
S(X,)
-3.0 0.0013 0.0013 0.0012 0.0011 0.0010
-2.5 0.0062 0.0059 0.0055 0.0052 0.0049
7
一.正态分布的概念和特征
1.正态分布的概念
在医学卫生领域中,许多变量的频 数分布是中间(靠近均数处)频数多,两边 频数少,且左右对称。如人体的许多生 理、生化指标等。这种变量的频数分布 规律可用概率论中的一种重要的随机变 量分布—正态分布(Normal distribution)加 以描述。
8
医学资料中有许多指标的频数分布都呈正态分布: 身高 体重 脉搏 血红蛋白 血清总胆固醇 ……
正态分布的参数 :μ为总体均数,σ为总体标准差, 固定常数: π为圆周率,e为自然对数的底变量:X
11
2.正态分布的特征
图形特点:
f(X)
1. 钟型、均数处最高
2. 均数为中心的左右对称
3. 正态分布有两个参数
4. 曲线下面积分布有规律
X
2相等, 不等的正态分布图示
1 2
3
1< 2 < 3
13
数值变量统计描述小结
原始资料
对称
算术均数与标准差
分组划计
对数转换
频数分布表、图
分布 类型
不对称
几何均数与对数值 标准差的反对数
中位数与四分位数间距 1
第四章 第四节 正态分布及其应用
流行病与卫生统计学系 何保昌
正态分布及其应用
(Normal distribution)
一. 正态分布的概念和特征 二. 正态曲线下面积的分布规律 三. 标准正态分布的性质 四. 正态分布的应用
3
此图的纵坐标为频率,横坐标为肺活量,称此图为频率直方图 每一个直方条的面积=频率,各组段的频率之和=1,所以这个直方 图的面积为1 如果样本量越大,每个组段的频率就越稳定,也就趋向概率。 由此我们可得到:随机抽一个9岁男孩,其肺活量落在各个组段的概率
4
假定各组段的概率如下
P(0.98 L肺活 1 量 .1L 1)0.0417 P(肺活 2 量 .15 L)0.033 0 3.033 3 0.0666 P(1.89 L肺活 2 量 .15 L)0.10 0.05 0.15
2.5%
95%
2.5%
-1.96
+1.96
19
■μ士2.58σ范围内的面积占正态曲线下面积的99%, 也就是说有99%的变量值分布在此范围内。
0.5%
-2.58
99%
0.5%
+2.58
20
曲线下的面积的计算
对于任意一个区间的曲线下面积,在知道变 量值x对应的概率密度函数f (x)后,都可以根 据微积分的方法求出其面积的大小
-X X
X轴
正态分布对称性 15
二.正态密度函数曲线下的面积规律
③曲线下在区间(μ-σ,μ+σ)的面积为68.27%, 曲线下在区间(μ-1.64σ,μ+1.64σ)的面积为90%, 曲线下在区间(μ-1.96σ,μ+1.96σ)的面积为95%, 曲线下在区间(μ-2.58σ,μ+2.58σ)的面积为99%。
f(x)
F
x
P(a
x
b)
b
a
f
(x)dx
?
x ab
21
实际工作中,常需要了解正态曲
线下横轴上某一区间的面积占总
面积的百分数,以便估计该区间
的ຫໍສະໝຸດ Baidu数占总例数的百分数(频数
分布)或观察值落在该区间的概
率。对于不同的参数μ和σ会产
生不同位置、不同形状正态分布,
(x1,x2)范围内的面积也不同,
计算起来很麻烦。
23
1. 标准化变换
Z x
若 x 服从正态分布 N (,2) ,则 z就
服从均数为0、标准差为1的正态分布, 这种正态分布称为标准正态分布或 z 分
布,记为 N (0,12),这一变换也称为标
准化变换。
24
N(μ,σ2)
N(0,1)
从一般的正态分布转变为标准的正态分布
标准正态分布的密度函数为
16
■μ士σ范围内的面积占正态曲线下面积的68.27%,也 就是说有68.27%的变量值分布在此范围内。
68.27%
- +
17
μ士1.64σ范围内的面积占正态曲线下面积的90%,也就是 说有90%的变量值分布在此范围内。
90%
5%
5%
-1.64
+1.64
18
■μ士1.96σ范围内的面积占正态曲线下面积的95%, 也就是说有95%的变量值分布在此范围内。
22
三、标准正态分布
为了计算方便,对于正态或近似正态 分布的资料,只要得出均数和标准 差,可通过标准转化,转化成求标 准正态曲线下横轴自-∞到z的面积。 为了便于应用,统计学家按Φ(z)编 制了标准正态分布曲线下的面积表, 由此表可查出曲线下某区间的面积, 这样就可对符合正态分布资料的频 数分布作出估计。
5
随人数逐渐增多,组段不断分 细,则频数分布图中的直条逐渐变 窄,就会逐渐形成一条高峰位于中 央(均数所在处)、两侧逐渐降低且 左右对称、不与横轴相交的光滑曲 线,近似于数学上的正态分布曲线。
(X ) 1 eZ2 2 2
26
➢ 对上式求积分可得到标准正态变量Z的分布函 数。
➢ 由于积分计算繁琐,统计学家按标准正态分布
的累积概率分布函数(-Z)编制了附表2
(P315),标准正态分布曲线下的面积,由 表可查出曲线下某区间的面积。
27
标准正态分布曲线下面积(Z)
Z
0.00 -0.02 -0.04 -0.06 -0.08
9
正态分布曲线呈对称的钟形, 在均数处最高,两侧逐渐低下,两 端在无穷远处与横轴无限接近。
若变量 x 的频率曲线对应于数 学上的正态分布曲线,则称该变量 服从正态分布。
10
2.正态分布的特征
正态分布曲线的密度函数为:
f (X)
1
(X)2
e 22
-∞<X<+∞
2
则称X服从正态分布,记作x~N(, 2)
相等, 2不等的正态分布图示
1
2 3
1 < 2 < 3 14
二.正态密度函数曲线下的面积规律
①正态密度函数曲线与横轴间的面积恒等于1或100%; ②正态分布是一种对称分布,其对称轴为直线X=μ,X>μ与
X<μ范围内曲线下的面积相等,各占50%;
S(X,)=S(-,-X)
S(-,-X)
S(X,)
-3.0 0.0013 0.0013 0.0012 0.0011 0.0010
-2.5 0.0062 0.0059 0.0055 0.0052 0.0049
7
一.正态分布的概念和特征
1.正态分布的概念
在医学卫生领域中,许多变量的频 数分布是中间(靠近均数处)频数多,两边 频数少,且左右对称。如人体的许多生 理、生化指标等。这种变量的频数分布 规律可用概率论中的一种重要的随机变 量分布—正态分布(Normal distribution)加 以描述。
8
医学资料中有许多指标的频数分布都呈正态分布: 身高 体重 脉搏 血红蛋白 血清总胆固醇 ……
正态分布的参数 :μ为总体均数,σ为总体标准差, 固定常数: π为圆周率,e为自然对数的底变量:X
11
2.正态分布的特征
图形特点:
f(X)
1. 钟型、均数处最高
2. 均数为中心的左右对称
3. 正态分布有两个参数
4. 曲线下面积分布有规律
X
2相等, 不等的正态分布图示
1 2
3
1< 2 < 3
13
数值变量统计描述小结
原始资料
对称
算术均数与标准差
分组划计
对数转换
频数分布表、图
分布 类型
不对称
几何均数与对数值 标准差的反对数
中位数与四分位数间距 1
第四章 第四节 正态分布及其应用
流行病与卫生统计学系 何保昌
正态分布及其应用
(Normal distribution)
一. 正态分布的概念和特征 二. 正态曲线下面积的分布规律 三. 标准正态分布的性质 四. 正态分布的应用
3
此图的纵坐标为频率,横坐标为肺活量,称此图为频率直方图 每一个直方条的面积=频率,各组段的频率之和=1,所以这个直方 图的面积为1 如果样本量越大,每个组段的频率就越稳定,也就趋向概率。 由此我们可得到:随机抽一个9岁男孩,其肺活量落在各个组段的概率
4
假定各组段的概率如下
P(0.98 L肺活 1 量 .1L 1)0.0417 P(肺活 2 量 .15 L)0.033 0 3.033 3 0.0666 P(1.89 L肺活 2 量 .15 L)0.10 0.05 0.15
2.5%
95%
2.5%
-1.96
+1.96
19
■μ士2.58σ范围内的面积占正态曲线下面积的99%, 也就是说有99%的变量值分布在此范围内。
0.5%
-2.58
99%
0.5%
+2.58
20
曲线下的面积的计算
对于任意一个区间的曲线下面积,在知道变 量值x对应的概率密度函数f (x)后,都可以根 据微积分的方法求出其面积的大小
-X X
X轴
正态分布对称性 15
二.正态密度函数曲线下的面积规律
③曲线下在区间(μ-σ,μ+σ)的面积为68.27%, 曲线下在区间(μ-1.64σ,μ+1.64σ)的面积为90%, 曲线下在区间(μ-1.96σ,μ+1.96σ)的面积为95%, 曲线下在区间(μ-2.58σ,μ+2.58σ)的面积为99%。
f(x)
F
x
P(a
x
b)
b
a
f
(x)dx
?
x ab
21
实际工作中,常需要了解正态曲
线下横轴上某一区间的面积占总
面积的百分数,以便估计该区间
的ຫໍສະໝຸດ Baidu数占总例数的百分数(频数
分布)或观察值落在该区间的概
率。对于不同的参数μ和σ会产
生不同位置、不同形状正态分布,
(x1,x2)范围内的面积也不同,
计算起来很麻烦。
23
1. 标准化变换
Z x
若 x 服从正态分布 N (,2) ,则 z就
服从均数为0、标准差为1的正态分布, 这种正态分布称为标准正态分布或 z 分
布,记为 N (0,12),这一变换也称为标
准化变换。
24
N(μ,σ2)
N(0,1)
从一般的正态分布转变为标准的正态分布
标准正态分布的密度函数为
16
■μ士σ范围内的面积占正态曲线下面积的68.27%,也 就是说有68.27%的变量值分布在此范围内。
68.27%
- +
17
μ士1.64σ范围内的面积占正态曲线下面积的90%,也就是 说有90%的变量值分布在此范围内。
90%
5%
5%
-1.64
+1.64
18
■μ士1.96σ范围内的面积占正态曲线下面积的95%, 也就是说有95%的变量值分布在此范围内。
22
三、标准正态分布
为了计算方便,对于正态或近似正态 分布的资料,只要得出均数和标准 差,可通过标准转化,转化成求标 准正态曲线下横轴自-∞到z的面积。 为了便于应用,统计学家按Φ(z)编 制了标准正态分布曲线下的面积表, 由此表可查出曲线下某区间的面积, 这样就可对符合正态分布资料的频 数分布作出估计。