概率分布-正态分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总面积的百分比,以便估计该区间的频数占总频数的百
分比(即频数分布情况)。这就需要采用定积分的办法,
对函数式 (1) 或 (2) 定积分,算得从 -∞ 到 x,或从 -∞ 到
Z 的累计面积(概率)。
.
F (x) 1
e dx x ( x )2 /( 2 2 )
2
j(Z)
1
Z e Z 2 / 2 dZ
j ( Z ) 1 e u 2 / 2 , u 2
相对于正态变量 x,Z 没有度量单位。根据 u 的不同取值,可绘出标准正态分布的图形。
将一般正态分布曲线的 μ 的位置平移到原点,再 以标准差σ为横轴单位,这样就把原来个别的正态分布 转换为一般的标准正态分布 N(0,1),亦称为Z分布
(或 u分布)。
μ 增大曲线沿横轴向右移, μ 减小曲线沿横轴向左移。
5.σ是正态曲线的形状参数,σ越大数据越分散,曲线越 “矮胖”,σ越小数据越集中,曲线越“瘦高” 。
三、正态曲线的标准化
为了应用方便,常将正态概率函数中的 x 作如 下变量代换,令:
Z
x
Z称为标准正态变量。把u代入概率密度函数 , 得标准正态分布的概率密度函数:
0.004 3 0.038 5 0.115 5 0.209 0 0.256 1 0.212 6 0.099 9 0.049 9 0.012 1 0.002 1 1.000 0
④
累积频率
0.004 3 0.042 8 0.158 3 0.367 3 0.623 4 0.835 9 0.935 8 0.985 7 0.997 9 1.000 0
状参数。
0.9
0.8
σ=1
0.7
0.6
f(X)
0.5
0.4
σ=1.5
0.3
0.2 0.1
σ=2
0 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
X
图5-6 正态分布形态随参数σ变换示意图
(二)正态分布图形的特征:
1. 对称性:关于x=μ对称 2. 集中性: 正态曲线在横轴上方,
当x=μ时, f (x)取最大值,即均数位于曲线的最高处。 3. 对频率密度正态分布图,横轴上曲线下的面积为1。 4. μ是正态曲线的位置参数,决定曲线在横轴上的位置;
任意正态分布曲线 X~N(μ,σ2)
标准正态分布曲线 X~N(0,1)
四、正态曲线下面积的 Байду номын сангаас布规律
正态曲线下的面积分布有一定的规律性:
因正态曲线下累计频数的总和等于 100% 或 1,则:
✓横轴上曲线下的面积(概率)就等于 100% 或 1; ✓均数两侧的面积(概率)各占 50%。
实际工作中常需了解横轴上某一区间曲线下面积占
一、正态分布的概念和 密度函数
正态分布( normal distribution):是描述连续型
随机变量最重要的分布。其分布曲线叫正态分布 曲线,呈中间高,两边低,左右基本对称的“钟 型”曲线,近似于数学上的正态分布,又称高斯 分布(Gauss distribution)。
正态分布(normal distribution)
当x确定后, f(x)为X相应的纵坐标高度,则X服从参数 为μ和σ2的正态分布( normal distribution),记作X~N( μ, σ2 )。
当给定不同的 x 值后,就可以根据此方程求得相应的 纵坐标高度(频数),并可绘制出正态曲线的图形,记 作X~N(μ,σ2) :
正态分布曲线:高峰位于中间,两侧逐渐下降并完全对 称,曲线两端永远不与横轴相交的“钟型”曲线。
⑤
频率密度 (频率/组距)
0.001 1 0.009 6 0.028 9 0.052 2 0.064 0 0.053 1 0.025 0 0.012 5 0.003 0 0.000 5
若将各直条顶端的中点顺次连接起来,得一条折线。当样
本量n越来越大时,折线就越来越接近一条光滑的曲线。
体重频率密度
0.08
➢德莫佛最早发现了二项概率
的一个近似公式,这一公式被 认为是正态分布的首次露面。
高斯
德莫佛
➢正态分布在十九世纪前叶由
高斯加以推广,所以通常称为 高斯分布(Gauss distribution)。
10马克的钱币
正医态学分研布究在中医:学研究中的重要作用:
➢医学研究中许多正常人的生理,生化指标、测
量误差等多呈正态分布或近似正态分布。
➢许多非正态分布资料,当样本含量足够大时,
也可以用正态分布作为它的极限分布形式。
➢有时也可将非正态分布资料转化为正态分布来
处理。
正态分布的密度函数,即正态曲线的函数表达式:
f ( X ) 1 e( X )2 / 2 2 , X
2
式中,μ为总体均数,σ为总体标准差,π为圆周率,e为 自然对数的底,仅x为变量。
2
x
Z
图 6 正态分布(左)及标准正态曲线下(右)的累计面积
由于引入了标准正态变量 Z 值,只需对标准正 态公式求定积分,求其曲线下从 -∞到任意Z 值的累 计面积,并制成专用的 Z 值表(见附表);这样对 于其它任意的正态分布N(μ, σ2) ,都可以通过变量 代换转化为标准正态分布,通过查表就完成其概率 计算问题。
1. 位置参数: μ
当σ固定不变时,μ越大,曲线沿横轴 越向右移动;反之, μ越小,则曲线沿横轴越向左移 动,所以μ叫正态曲线N(μ, σ2)的位置参数, 。
图5-4 正态分布位置随参数μ变换示意图
2. 形状参数:σ
当μ固定不变时,σ越大,曲线越平阔;
σ越小,曲线越尖峭,σ 叫正态曲线N(μ, σ2)的形
0.06
0.04
0.02
0.00 48- 56- 64- 72- 80体重(kg)
图5-1 体重频率密度图
图5-2 概率密度曲线示意图
故对连续性随机变量而言: 变量某区间取值的概率 = 正态曲线该变量区间的面积
推 断:
➢测得一个孕妇体重在54-68kg的概率有多大? ➢孕妇体重在哪个范围内算是正常的呢?
引子:
【典型案例分析】
举例: 随机调查某医院1402例待分娩孕
妇,测得她们的体重,试述其体重频数分 布的特征。
表5-1 某医院1402例分娩孕妇体重频数分布
①
体重组段
48525660646872768084合计
②
频数
6 54 162 293 359 298 140 70 17
3 1402
③
频率 (频数/总频数)