2 正态分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
90
P5~P95
P10
P90
95
P2.5~P97.5
P5
P95
99
P0.5~P99.5
P1
P99
(二)质量控制图
X±2S作为上、下Байду номын сангаас戒值。 X±3S作为上、下控制值
质量控制的重要工具------控制图:7条水平线组成。
中心线 上下警戒线 上下控制线
2条位于μ ±σ 处的水平线
根据质量控制图,判断异常的8种情况: (1)有一个点位于控制线以外。 (2)在中心线的一侧连续有9个点。 (3)连续6个点稳定地增加或减少。 (4)连续14个点交替上下。
中间高,左右对称,对应
于数学上的正态分布曲线,
则称该变量服从正态分布。
2.正态分布密度函数:
正态曲线(normal curve)是一条高峰位于中 央,两端逐渐下降并完全对称,曲线两端永远不 与横轴相交的钟型曲线。其密度函数为:
f (X)
1
(X )2
e 2 2
2
π和e分别为圆周率和自然对数的底;μ和σ分别是 正态总体的均数和标准差。
正态分布
正态分布的概念 正态曲线下面积的分布规律 正态分布的应用
一、正态分布的概念
1.正态分布 正态分布是应用最广泛的一种连续型 分布。正态分布在十九世纪前叶由高 斯(Gauss)加以推广,所以通常称为高 斯分布。
Gauss
2.5
2
1.5
1
0.5
0
-3 -1.8 -0.6 0.6 1.8
3
(5)连续3个点位于警戒线以外。 (6)连续5个点中4个点距中心线距离在1个标
准差以外。 (7)中心线一侧或两侧连续15个点距中心线距
离都在1个标准差范围。 (8)中心线一侧或两侧连续8个点距中心线距
离都超出1个标准差范围。
记作: Z ~ N (0, 1)
统计学家编制了标准正态分 布曲线下面积分布表,正态 分布两边对称,表中只给出 了Z取负值的情况。表内所 Φ(z) 列数相当于Z值左侧标准正 态分布曲线下面积,记作 Φ(z)。
z
0
查附表(-∞,-1.96),( -∞ ,-2.58), (-1.96,1.96)(-1,1)( -∞ ,0.00) 曲线下的面积。
3、正态曲线的特点
(1)关于X= μ对称。 (2)在X= μ处取得该概率密度函数的最大值,
在X= μ±σ 处有拐点,表现为钟型曲线。 (3)曲线下面积为1。 (4) μ决定曲线在横轴上的位置, μ ↑曲线沿
横轴右移; μ ↓ 曲线沿横轴向左移。
2<1
1
-2 - + +2 -2 -1 0 1 2
注意:
1.标准正态曲线以0为中心,左右对称,故附表1仅列 出(-∞,z)区间内的累计面积(累计概率)。 2.横轴上、曲线下总面积等于1,区间( -z,z)内面 积为:1 -2 × (-∞, -z)。
例4-11 某地1986年120名8岁男孩身高均数为123.02cm, 标准差为4.79cm,试估计: (1)该地8岁男孩身高在130cm以上者占的百分比; (2)身高在120-128cm者占的百分比; (3)该地80%的男孩身高集中在哪个范围?
(二)标准正态分布
随机变量X服从正态分布N(μ ,σ2),可做如下的
标准化变换,也称Z变换。
Z X
经标准化变换后,原正态分布密度函数变为:
e f (z)
1
2
z2
2
z
经标准化变换后,原变量X变为Z,Z服从总体 均数为0,总体标准差为1的正态分布,即标准 正态分布(standard normal distribution)。
(一)正态分布曲线下面积 正态曲线下面积的分布规律由μ 及σ所决定。 一般正态分布曲线下面积分布状况:
µ± σ µ±1.64 σ µ±1.96 σ µ±2.58 σ
0.6827 0.9090 0.9500 0.9900
95% 2.5%
2.5%
-1.96
+1.96
正态曲线下的面积分布示意图
★双侧参考值范围:若一个指标过大过小均属 异常,则相应的参考值范围既有上限又有下 限,则参考值范围为双侧。
★单侧参考值范围:若一个指标仅过大属异 常,则此指标的参考值范围只有上限,是单 侧参考值范围;若一个指标仅过小属异常, 则此指标的参考值范围只有下限,亦是单侧 参考值范围。
2.参考值范围的制定方法
x
z
1 2
(a)
(b)
图2.3 正态概率密度图 (a)一般形状 (b)与和关系
(5) σ决定曲线的形状,当μ恒定时,
σ↓,数据越集中,曲线形状“瘦高”,
σ↑,数据越离散,曲线越“矮胖”。
习惯上用N (μ ,σ2)表示均数为μ 、标准差为σ
的正态分布。记作:
X ~ N(, 2)
二、正态曲线下面积的分布规律
(1)正态分布法
正态分布法制定参考值范围
单侧
%
双侧
只有下限 只有上限
90
X 1.64S X 1.28S X 1.28S
95
X 1.96S X 1.64S X 1.64S
99
X 2.58S X 2.33S X 2.33S
(2)百分位数法
百分位数法制定参考值范围
单侧
%
双侧
只有下限 只有上限
直方图
系列2
-3 -2.4 -1.8 -1.2 -0.6
0 0.6 1.2 1.8 2.4
3
0.45 0.4
0.35 0.3
0.25 0.2
0.15 0.1
0.05 0
正态分布图
系列2
若连续型定量变量的频数
分布在靠近均数处频数多,
两边频数少,且左右对称,
反映在频数曲线(频率直
方图)上呈钟型,两头低
(1) (2)
Z 130 123.02 1.46 4.79
(-1.46)=0.0721
z1
120
123.02 4.79
0.63
z2
128 123.02 4.79
1.04
(0.63) 0.2643
(1.04) 1 (1.04) 1 0.1492 0.8508
(0.63,1.04)区间内的面积为:
(1.04)-(-0.63)=0.8508 0.2643 0.5865
(3)
(z) 0.8 z 1.28 80%的8岁男孩身高范围是X 1.28S, 即123.02 1.28 4.79 (116.9cm,129.2cm)
三、正态分布的应用
确定参考值范围 质量控制
(一)确定参考值范围
1.概念:参考值范围也称正常值范围。常把大多数 正常人的指标值等所在的范围称为该指标的正常值 范围。一般以包含90%、95%或99%的个体所在的 范围称正常值范围。
根据专业知识确定该指标是否过大或过 小均属异常,决定该指标的参考值范围 是双侧范围还是单侧范围。