医学统计学.正态分布及其应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生不同位置、不同形状正态分布, (x1,x2)范围内的面积也不同, 计算起来很麻烦。
22
三、标准正态分布 为了计算方便,对于正态或近似正态 分布的资料,只要得出均数和标准 差,可通过标准转化,转化成求标 准正态曲线下横轴自-∞到z的面积。 为了便于应用,统计学家按Φ(z)编 制了标准正态分布曲线下的面积表, 由此表可查出曲线下某区间的面积, 这样就可对符合正态分布资料的频 数分布作出估计。
5%
-1.64
+1.64
18
■μ士1.96σ范围内的面积占正态曲线下面积的95%,
也就是说有95%的变量值分布在此范围内。
95%
2.5%
2.5%
-1.96
+1.96
19
■μ士2.58σ范围内的面积占正态曲线下面积的99%,
也就是说有99%的变量值分布在此范围内。
99%
0.5%
3. 正态分布有两个参数
4. 曲线下面积分布有规律
X
2相等, 不等的正态分布图示
1
2
3
13
1< 2 < 3
相等, 2不等的正态分布图示
1 2
3
1 < 2 < 3
14
二.正态密度函数曲线下的面积规律
①正态密度函数曲线与横轴间的面积恒等于1或100%; ②正态分布是一种对称分布,其对称轴为直线 X=μ, X>μ与 X<μ范围内曲线下的面积相等,各占50%;
线,近似于数学上的正态分布曲线。
7
一.正态分布的概念和特征
1.正态分布的概念
在医学卫生领域中,许多变量的频 数分布是中间(靠近均数处)频数多,两边 频数少,且左右对称。如人体的许多生 理、生化指标等。这种变量的频数分布 规律可用概率论中的一种重要的随机变 量分布—正态分布(Normal distribution)加 以描述。
0.5%
-2.58
+2.58
20
曲线下的面积的计算
对于任意一个区间的曲线下面积,在知道变 量值x对应的概率密度函数f (x)后,都可以根 据微积分的方法求出其面积的大小
f(x )
F x P (a x b )
b a
f ( x )d x ?
a
21
b
x
实际工作中,常需要了解正态曲 线下横轴上某一区间的面积占总 面积的百分数,以便估计该区间 的例数占总例数的百分数(频数 分布)或观察值落在该区间的概 率。对于不同的参数μ和σ会产
曲线下在区间(μ-2.58σ,μ+2.58σ)的面积为99%。
16
■μ士σ范围内的面积占正态曲线下面积的68.27%,也
就是说有68.27%的变量值分布在此范围内。
68.27%
-
+
17
μ士1.64σ范围内的面积占正态曲线下面积的90%,也就是 说有90%的变量值分布在此范围内。
90%
5%
(X )
1 2
e
Z2 2
26
对上式求积分可得到标准正态变量Z的分布函
数。
由于积分计算繁琐,统计学家按标准正态分布
的累积概率分布函数(-Z)编制了附表2
(P315),标准正态分布曲线下的面积,由 表可查出曲线下某区间的面积。
27
数值变量统计描述小结
原始资料
对称 算术均数与标准差
频数分布表、图
分布 类型
不对称
对数转换
分组划计
几何均数与对数值 标准差的反对数
中位数与四分位数间距
1
第四章 第四节 正态分布及其应用
流行病与卫生统计学系 何保昌
正态分布及其应用
(Normal distribution)
一. 正态分布的概念和特征 二. 正态曲线下面积的分布规律 三. 标准正态分布的性质 四. 正态分布的应用
S(X,)=S(-,-X)
S(-,-X)
-X
S(X,)
X
X轴
正态分布对称性
15
二.正态密度函数曲线下的面积规律
③曲线下在区间(μ-σ,μ+σ)的面积为68.27%, 曲线下在区间(μ-1.64σ,μ+1.64σ)的面积为90%,
曲线下在区间(μ-1.96σ,μ+1.96σ)的面积为95%,
8
医学资料中有许多指标的频数分布都呈正态分布:
身高
体重 脉搏 血红蛋白 血清总胆固醇 ……
9
Leabharlann Baidu
正态分布曲线呈对称的钟形, 在均数处最高,两侧逐渐低下,两 端在无穷远处与横轴无限接近。 若变量 x 的频率曲线对应于数 学上的正态分布曲线,则称该变量 服从正态分布。
10
2.正态分布的特征
正态分布曲线的密度函数为:
由此可知:如果一个区间由若干组段构成,计算肺活量落在 某个区间的概率等于计算这个区间的中各个直方条图的面 积之和. 只能计算给定区间概率,不能计算任意区间概率. 对于上述直方图,组距越小,组段越多,能够计算的概率区 间就越多,当组距逐渐减小,上述计算方法仍然成立. 5
随人数逐渐增多,组段不断分 细,则频数分布图中的直条逐渐变 窄,就会逐渐形成一条高峰位于中 央(均数所在处)、两侧逐渐降低且 左右对称、不与横轴相交的光滑曲
1 f (X ) e 2
( X )2 2 2
-∞<X<+∞
则称X服从正态分布,记作x~N(, 2)
正态分布的参数 :μ为总体均数,σ为总体标准差, 固定常数: π为圆周率,e为自然对数的底变量:X
11
2.正态分布的特征
图形特点:
1. 钟型、均数处最高 f(X)
2. 均数为中心的左右对称
3
此图的纵坐标为频率,横坐标为肺活量,称此图为频率直方图 每一个直方条的面积=频率,各组段的频率之和=1,所以这个直方 图的面积为1 如果样本量越大,每个组段的频率就越稳定,也就趋向概率。 由此我们可得到:随机抽一个9岁男孩,其肺活量落在各个组段的概率
4
假定各组段的概率如下
P(0.98L 肺活量 1.11L) 0.0417 P(肺活量 2.15L) 0.0333 0.0333 0.0666 P(1.89L 肺活量 2.15L) 0.10 0.05 0.15
23
1. 标准化变换
Z
x
若 x 服从正态分布 N (,2) ,则 z就 服从均数为0、标准差为1的正态分布, 这种正态分布称为标准正态分布或 z 分 布,记为 N (0,12),这一变换也称为标 准化变换。
24
N(μ,σ2)
N(0,1)
从一般的正态分布转变为标准的正态分布
25
标准正态分布的密度函数为