附表二标准正态分布函数表
附表临界值表
附表1 符号检验界域表附表2 二项分布表()∑=---=≤xk kn k p p k n k n x X P 01)!(!!)(附表3 标准正态分布表[])(1)(21)(22Z z dweZ W ZΦ-=-Φ-Φ-∞-⎰π附表4 威尔科克森带符号的秩和检验临界值(T值)表这里T是最大整数,即P(T≤t/n)≤a累积的单尾概率附表5 秩和检验临界值表括号数值表示样本容量(n1,n2)附表6 曼.怀特尼检验(U的临界值)单尾或双尾单尾或双尾附表7 游程检验的临界值表r下表 (a/2=r上表 (a/2=附表8 关于最长游程检验的临界值表当n1,n2≤25时,Wa的值P(W≥Wa)≤aⅠ a=Ⅱ a=附表9 游程长度平方和检验的临界值表当n=3---15时,使P(W ≥W a )≤a 的W a 的值附表10 X2分布表本表对自由度 n的X2分布给出上侧分位数(X2a)表,P(X2n>X2a)=α附表11 Kolmogorov—Smirnov拟合优度检验临界值D表n附表12 Kolmogorov----Smirnov双样本检验中D的分子KD的临界值表(小样本) n1=n2≤30附表12续 Kolmogorov----Smirnov双样本检验中D的临界值表(大样本: n1+n2>35, 双尾检验)附表13 Spearman检验统计量的临界值近似右尾临界值rs *;P(rs>rs*)≤a;n=4--30注意:r s *的相应左尾临界值为-r s *附表14 Kendall检验统计量的临界值当n>60时,T的近似数可以由下式得到:W p ≌Xp18)52)(1(+-nnn式中Xp的值可以从标准正态分布中得到。
上表中只给出肯达尔统计检验量T的数值Wp,即T的数值的上界,而下界数可由以下关系式得出:Wp =-Wp临界域为:T>Wp 或T<-Wp附表15 Kendall协和系数中S的临界值表a=a=附表16 Cruskall---Wallis检验统计量的临界值附表17 上、下游程分布的数目附表18 多重比较的临界值Z。
正态分布及参考值范围的制定
THE END
━━━━━━━━━━━━━━━━━━━
体 重(kg)
人数
━━━━━━━━━━━━━━━━━━━ 问: (1) 理论上95%男孩
2.02.2-
1 2
出生体重在什么范围?
2.4-
5
2.6-
10
(2) 某男孩出生体
2.83.0-
12 24
重为4.51kg,如何评价?
3.2-
23
3.4-
22
3.6-
17
3.8-
95%
-2.58 -1.96 -1 +1 +1.96 +2.58 x
-2.58 -1.96 -1
95%
0 +1 +1.96 +2.58 u
- 1.96 u x 1.96 , 95.00%
- 1.96 x 1.96 , 95.00%
或大样本时:
正态分布
标准正态分布
面 积 (或 概 率 )
μ– 1σ~ μ+1σ μ– 1.96σ~ +1.96σ μ– 2.58σ~ μ+2.58σ
-1~ +1 -1.96~ +1.96 -2.58~ +2.58
68.27% 95.00% 99.00%
若为大样本,则μ可用x 代替,σ用 s 代替。
x 图9-6 正态分布和标准正态分布的曲线下面积分布规律
白细胞计数? 肺活量? 血铅浓度? 5)选定适当的百分界限;
如80%、90%、95%和99%,常用为95%。 6)选定适当的计算方法。
(三)参考值范围的估计方法
1、正态分布法 若取95%界限,
正态分布讲解(含标准表)
2.4正态分布复习引入:总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线. 总体密度曲线b 单位O 频率/组距a它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a ,b )内取值的概率等于总体密度曲线,直线x =a ,x =b 及x 轴所围图形的面积.观察总体密度曲线的形状,它具有“两头低,中间高,左右对称”的特征,具有这种特征的总体密度曲线一般可用下面函数的图象来表示或近似表示:22()2,1(),(,)2x x e x μσμσϕπσ--=∈-∞+∞ 式中的实数μ、)0(>σσ是参数,分别表示总体的平均数与标准差,,()x μσϕ的图象为正态分布密度曲线,简称正态曲线.讲解新课:一般地,如果对于任何实数a b <,随机变量X 满足,()()b aP a X B x dx μσϕ<≤=⎰, 则称 X 的分布为正态分布(normal distribution ) .正态分布完全由参数μ和σ确定,因此正态分布常记作),(2σμN .如果随机变量 X 服从正态分布,则记为X ~),(2σμN .经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.例如,高尔顿板试验中,小球在下落过程中要与众多小木块发生碰撞,每次碰撞的结果使得小球随机地向左或向右下落,因此小球第1次与高尔顿板底部接触时的坐标 X 是众多随机碰撞的结果,所以它近似服从正态分布.在现实生活中,很多随机变量都服从或近似地服从正态分布.例如长度测量误差;某一地区同年龄人群的身高、体重、肺活量等;一定条件下生长的小麦的株高、穗长、单位面积产量等;正常生产条件下各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容量、电子管的使用寿命等);某地每年七月份的平均气温、平均湿度、降雨量等;一般都服从正态分布.因此,正态分布广泛存在于自然现象、生产和生活实际之中.正态分布在概率和统计中占有重要的地位.说明:1参数μ是反映随机变量取值的平均水平的特征数,可以用样本均值去佑计;σ是衡量随机变量总体波动大小的特征数,可以用样本标准差去估计.2.早在 1733 年,法国数学家棣莫弗就用n !的近似公式得到了正态分布.之后,德国数学家高斯在研究测量误差时从另一个角度导出了它,并研究了它的性质,因此,人们也称正态分布为高斯分布.2.正态分布),(2σμN )是由均值μ和标准差σ唯一决定的分布 通过固定其中一个值,讨论均值与标准差对于正态曲线的影响3.通过对三组正态曲线分析,得出正态曲线具有的基本特征是两头底、中间高、左右对称 正态曲线的作图,书中没有做要求,教师也不必补上 讲课时教师可以应用几何画板,形象、美观地画出三条正态曲线的图形,结合前面均值与标准差对图形的影响,引导学生观察总结正态曲线的性质4.正态曲线的性质:(1)曲线在x 轴的上方,与x 轴不相交(2)曲线关于直线x=μ对称(3)当x=μ时,曲线位于最高点(4)当x <μ时,曲线上升(增函数);当x >μ时,曲线下降(减函数) 并且当曲线向左、右两边无限延伸时,以x 轴为渐近线,向它无限靠近(5)μ一定时,曲线的形状由σ确定σ越大,曲线越“矮胖”,总体分布越分散;σ越小.曲线越“瘦高”.总体分布越集中:五条性质中前三条学生较易掌握,后两条较难理解,因此在讲授时应运用数形结合的原则,采用对比教学5.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其相应的函数表示式是2221)(x e x f -=π,(-∞<x <+∞)其相应的曲线称为标准正态曲线标准正态总体N (0,1)在正态总体的研究中占有重要的地位 任何正态分布的概率问题均可转化成标准正态分布的概率问题讲解范例:例1.给出下列三个正态总体的函数表达式,请找出其均值μ和标准差σ (1)),(,21)(22+∞-∞∈=-x e x f x π(2)),(,221)(8)1(2+∞-∞∈=--x e x f x π (3)22(1)2(),(,)2x f x e x π-+=∈-∞+∞ 答案:(1)0,1;(2)1,2;(3)-1,0.5例2求标准正态总体在(-1,2)内取值的概率.解:利用等式)()(12x x p Φ-Φ=有)([]}{11)2()1()2(--Φ--Φ=-Φ-Φ=p=1)1()2(-Φ+Φ=0.9772+0.8413-1=0.8151.1.标准正态总体的概率问题: xy对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率,即 )()(00x x P x <=Φ, 其中00>x ,图中阴影部分的面积表示为概率0()P x x < 只要有标准正态分布表即可查表解决.从图中不难发现:当00<x 时,)(1)(00x x -Φ-=Φ;而当00=x 时,Φ(0)=0.5 2.标准正态分布表标准正态总体)1,0(N 在正态总体的研究中有非常重要的地位,为此专门制作了“标准正态分布表”.在这个表中,对应于0x 的值)(0x Φ是指总体取值小于0x 的概率,即)()(00x x P x <=Φ,)0(0≥x .若00<x ,则)(1)(00x x -Φ-=Φ.利用标准正态分布表,可以求出标准正态总体在任意区间),(21x x 内取值的概率,即直线1x x =,2x x =与正态曲线、x 轴所围成的曲边梯形的面积1221()()()P x x x x x <<=Φ-Φ. 3.非标准正态总体在某区间内取值的概率:可以通过)()(σμ-Φ=x x F 转化成标准正态总体,然后查标准正态分布表即可 在这里重点掌握如何转化 首先要掌握正态总体的均值和标准差,然后进行相应的转化4.小概率事件的含义发生概率一般不超过5%的事件,即事件在一次试验中几乎不可能发生假设检验方法的基本思想:首先,假设总体应是或近似为正态总体,然后,依照小概率事件几乎不可能在一次试验中发生的原理对试验结果进行分析假设检验方法的操作程序,即“三步曲”一是提出统计假设,教科书中的统计假设总体是正态总体;二是确定一次试验中的a 值是否落入(μ-3σ,μ+3σ);三是作出判断讲解范例:例1. 若x ~N (0,1),求(l)P (-2.32<x <1.2);(2)P (x >2).解:(1)P (-2.32<x <1.2)=Φ(1.2)-Φ(-2.32)=Φ(1.2)-[1-Φ(2.32)]=0.8849-(1-0.9898)=0.8747.(2)P (x >2)=1-P (x <2)=1-Φ(2)=l-0.9772=0.0228.例2.利用标准正态分布表,求标准正态总体在下面区间取值的概率:(1)在N(1,4)下,求)3(F(2)在N (μ,σ2)下,求F(μ-σ,μ+σ);F(μ-1.84σ,μ+1.84σ);F(μ-2σ,μ+2σ);F(μ-3σ,μ+3σ) 解:(1))3(F =)213(-Φ=Φ(1)=0.8413 (2)F(μ+σ)=)(σμσμ-+Φ=Φ(1)=0.8413 F(μ-σ)=)(σμσμ--Φ=Φ(-1)=1-Φ(1)=1-0.8413=0.1587 F(μ-σ,μ+σ)=F(μ+σ)-F(μ-σ)=0.8413-0.1587=0.6826F(μ-1.84σ,μ+1.84σ)=F(μ+1.84σ)-F(μ-1.84σ)=0.9342F(μ-2σ,μ+2σ)=F(μ+2σ)-F(μ-2σ)=0.954F(μ-3σ,μ+3σ)=F(μ+3σ)-F(μ-3σ)=0.997对于正态总体),(2σμN 取值的概率:68.3%2σx 95.4%4σx 99.7%6σx在区间(μ-σ,μ+σ)、(μ-2σ,μ+2σ)、(μ-3σ,μ+3σ)内取值的概率分别为68.3%、95.4%、99.7% 因此我们时常只在区间(μ-3σ,μ+3σ)内研究正态总体分布情况,而忽略其中很小的一部分 例3.某正态总体函数的概率密度函数是偶函数,而且该函数的最大值为π21,求总体落入区间(-1.2,0.2)之间的概率解:正态分布的概率密度函数是),(,21)(222)(+∞-∞∈=--x e x f x σμσπ,它是偶函数,说明μ=0,)(x f 的最大值为)(μf =σπ21,所以σ=1,这个正态分布就是标准正态分布( 1.20.2)(0.2)( 1.2)(0.2)[1(1.2)](0.2)(1.2)1P x -<<=Φ-Φ-=Φ--Φ=Φ+Φ- 教学反思:1.在实际遇到的许多随机现象都服从或近似服从正态分布 在上一节课我们研究了当样本容量无限增大时,频率分布直方图就无限接近于一条总体密度曲线,总体密度曲线较科学地反映了总体分布 但总体密度曲线的相关知识较为抽象,学生不易理解,因此在总体分布研究中我们选择正态分布作为研究的突破口 正态分布在统计学中是最基本、最重要的一种分布 2.正态分布是可以用函数形式来表述的 其密度函数可写成:22()21(),(,)2x f x e x μσπσ--=∈-∞+∞, (σ>0)由此可见,正态分布是由它的平均数μ和标准差σ唯一决定的 常把它记为),(2σμN 3.从形态上看,正态分布是一条单峰、对称呈钟形的曲线,其对称轴为x=μ,并在x=μ时取最大值 从x=μ点开始,曲线向正负两个方向递减延伸,不断逼近x 轴,但永不与x 轴相交,因此说曲线在正负两个方向都是以x 轴为渐近线的4.通过三组正态分布的曲线,可知正态曲线具有两头低、中间高、左右对称的基本特征。
标准正态函数
标准正态函数标准正态函数(Standard Normal Distribution)是统计学中常用的一种概率分布函数,也称为正态分布函数(Normal Distribution)。
它是数学家高斯(Gauss)在自然科学和社会科学中的研究中首次提出的。
标准正态函数在各个领域都有着广泛的应用,特别是在自然科学、社会科学和工程技术领域中,被广泛地应用于数据分析、模型拟合、风险评估等方面。
标准正态函数的概率密度函数(Probability Density Function,简称PDF)是一个关于随机变量的函数,用来描述随机变量落在某个区间内的概率。
它的数学表达式为:\[f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}\]其中,\(x\) 是随机变量,\(\pi\) 是圆周率,\(e\) 是自然对数的底。
标准正态函数的特点之一是其均值为0,标准差为1。
这意味着标准正态函数的曲线关于均值对称,且其形状由标准差决定。
当标准差较小时,曲线较为陡峭;当标准差较大时,曲线较为平缓。
在实际应用中,我们经常需要计算标准正态函数在某个区间内的概率值。
这时,我们可以利用标准正态分布表来进行计算。
标准正态分布表是一个预先计算好的表格,其中包含了标准正态函数在不同区间内的概率值。
通过查表,我们可以方便地获取所需的概率值,从而进行相应的数据分析和决策。
除了概率密度函数和概率分布表之外,标准正态函数还有一些重要的性质和应用。
例如,标准正态函数与正态分布函数之间存在着一定的数学关系,通过线性变换,我们可以将任意正态分布转化为标准正态分布,从而简化问题的求解过程。
此外,标准正态函数还与中心极限定理密切相关,中心极限定理指出,大量独立同分布的随机变量的均值近似服从正态分布,而标准正态函数则是中心极限定理的一个重要特例。
在实际应用中,我们经常需要利用标准正态函数进行数据分析和模型拟合。
例如,在金融领域中,我们可以利用标准正态函数来对股票价格的波动进行建模,从而进行风险评估和投资决策。
标准正态分布示意图
lgG = lg(12571032040)=lg(571032040)1/12=1/1 2(7lg5+3lg10+lg20+lg40)=0.89966
为简化计算, 可两边取对数
G = lg-1(lgG)= lg-10.89966 = 7.94
加权法: G=lg-1( lgx/ ), 当变量值个数 较多或变量值为频数表资料时
(3) (4)=(2)(3) (5)=(2)(4)
1 127
16129
• 129 131
4 524
68644
• 133 135
9 1215
164025
• 137 139
28 3829
540988
• 141 143
35 5005
715715
• 145 147
27 3969
583443
• 149 151
11 1661
250811
• 153 155
4 620
96100
• 157161 159 • 合计 •
1 159
120 17172
(ƒ)( ƒx)
25181
2461136
( ƒx2)
•
2461136 - (17172)2/120
• s=
•
120 - 1
•
• 三、变异系数: 又称离散系数。代号为CV。
甲的变异程度>乙组
一、极差和四分位间距
• (一)全距: R(range), 亦称极差。即一组变量 值中最大值与最小值之差。
• R甲=4.0 - 2.8 = 1.2 • R乙=3.8 - 3.0 = 0.8 • 优点: 简单明了 • 缺点: 仅考虑了资料的最大值与最小值, 不能反
正态分布
第三节 正态分布概率分布是指对随机变量各取值的概率用图表或函数式进行的描述。
正态分布又叫做常态分布,是一种连续型随机变量的概率分布。
正态分布的特点是:1.形态上很像古代的大钟,中间大两头小,左右最称,所以有人把它叫做钟形分布。
如:人的许多生理和心理特征、学生的学习成绩分布。
2.与二项分布比较:同:正态分布也是一个理论分布,有函数式。
异:正态分布是连续分布,而二项分布是离散形的;函数式也不同。
一、正态曲线1.正态曲线函数正态曲线的其他特点:参考教科书90页的图5.3(1)当平均数相等时,标准差越大,峰越低,覆盖范围越广,即峰越宽;反之,标准差越小时,峰越高,覆盖范围越小。
即峰越窄。
(2)当标准差相等时,峰的形状不变,但中心不同。
平均数越大,峰越靠近右;平均数越小,峰越靠近左。
把各种不同形态的正态分布都变成一种统一的、固定形态的正态分布,即标准正态分布。
通常我们所说的正态分布就是指这种标准正态分布。
222)(2σμπσ--=X e N Y N 表示总频数表示此分布的标准差表示平均数e 表示常数2.71828μσσμ-=X Z 其中 Y 表示变量X 的高度或横坐标X 表示连续变量的任何一点2221Z e Y -=π例如:某个分布的平均数是86,标准差是10,某个原是分数是80,则这个分数就可以转换为:表明这个数据在整个分布中低于平均数0.6个标准差,2.标准正态曲线函数的特点(2)曲线以Z=0处为中心,双侧对称(对称轴)。
(3)曲线从最高点向左右缓慢下降,并无限延伸,但永远不与基线相交。
(4)标准正态分布上的平均数为0,标准差为1。
(5)曲线从最高点向左右延伸时,在正负1个标准差之内,既向下又向内弯。
(6)曲线下方到基线的面积为1。
此外,标准差与曲线还有一定的关系。
在Z 等于正负1之间,它所包含的累积概率(即面积)是0.6826。
在Z 等于正负1.96之间,所包含的面积是0.95。
在Z 等于正负1.98之间,所包含的面积是0.99。
附表(临界值表)
附表1 符号检验界域表附表2 二项分布表()∑=---=≤xk kn k p p k n k n x X P 01)!(!!)(附表3 标准正态分布表[])(1)(21)(22Z z dweZ W ZΦ-=-Φ-Φ-∞-⎰π附表4 威尔科克森带符号的秩和检验临界值(T值)表这里T是最大整数,即P(T≤t/n)≤a累积的单尾概率附表5 秩和检验临界值表括号数值表示样本容量(n1,n2)附表6 曼.怀特尼检验(U的临界值)单尾或双尾单尾或双尾附表7 游程检验的临界值表r下表 (a/2=r上表 (a/2=附表8 关于最长游程检验的临界值表当n1,n2≤25时,W a的值P(W≥W a)≤a Ⅰ a=Ⅱ a=附表9 游程长度平方和检验的临界值表当n=3---15时,使P(W≥W a)≤a的W a的值附表10 X2分布表本表对自由度n的X2分布给出上侧分位数(X2a)表,P(X2n>X2a)=α附表11 Kolmogorov—Smirnov拟合优度检验临界值D n表附表12 Kolmogorov----Smirnov双样本检验中D的分子K D的临界值表(小样本) n1=n2≤30附表12续 Kolmogorov----Smirnov双样本检验中D的临界值表(大样本: n1+n2>35, 双尾检验)附表13 Spearman检验统计量的临界值近似右尾临界值r s*;P(r s>r s*)≤a;n=4--30注意:r s*的相应左尾临界值为-r s*附表14 Kendall检验统计量的临界值当n>60时,T的近似数可以由下式得到:W p≌X p18)52)(1(+-nnn式中X p的值可以从标准正态分布中得到。
上表中只给出肯达尔统计检验量T的数值W p,即T的数值的上界,而下界数可由以下关系式得出:W p=-W p临界域为:T>W p或T<-W p附表15 Kendall协和系数中S的临界值表a=a=附表16 Cruskall---Wallis检验统计量的临界值附表17 上、下游程分布的数目附表18 多重比较的临界值Z。
第三节 正态分布
主要内容: 主要内容: 一、正态分布概念 二、正态分布的特点 三、应用
一、正态分布概念
正态分布又称高斯分布,常态分布,是一种数据的 波动规律的表达,主要反映了试验的随机误差。
强度分组为横坐标,以频数为纵坐标,绘成强 度—频数直方图
12 10 8 6 4 2 0 18 20 22 24 26 3 7 5 2 10
应用
1.可疑数据的舍弃; A. 莱 特 准 则 ( 3σ 原 则 ) : 由 于 落 在 (u3σ,u+3σ)的概率为99.73%,处在3σ之外的 概率(即误差概率)仅为0.27%,接近0,对于 常规一般仅进行几十次的测量,如处在3σ之 外则说明属于随机误差,应剔除。 由于次判据是建立在n趋向于无穷得基础上得, 所以当n有限时,尤其是n较小时这一判据并不 十分可靠。但是由于其使用方便,故常常被使 用。
(一)正交设计的基本方法
试验设计包括三方面的内容: 1. 因素和水平选择 2. 误差控制:试验方案的制定 3. 数据处理:分析试验结果
一般来说,为保证结论的可靠性,在选取因素时 应把所有影响较大的因素选入试验,某些因素 之间可能还有交互作用,所谓交互作用,就是 这些因素在同时改变水平时,其效果会超过单 独改变某一因素水平时的效果。影响较大的因 素还应包括那些单独变化水平时效果可能不太, 大与其他因素同时变化时交互作用较大的因素, 这样才能保证试验的代表性。因素变化越多越 好,取值不能少于3个,这样才能看出曲线,看 出其变化的趋势。某一因素取值变化的次数即 水平数,为了减少试验次数,往往取两水平(现 行工艺水平和新工艺水平)或三水平(低于现行 工艺水平或理论值、现行工艺水平、高于现行 工艺水平)。 水平变化的范围不宜太大。
且从图12-2还可以看出,按趋势,增加 水分与碾压料重、抗折强度,还有可能 提高,因此还应扩大试验范围,试探其 强度趋势。
正态分布的概念及表和查表方法
正态分布概念及图表正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A·棣莫弗在求二项分布的渐近公式中得到。
C.F.高斯在研究测量误差时从另一个角度导出了它。
P·S·拉普拉斯和高斯研究了它的性质。
是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布。
目录1历史发展2定理3定义▪一维正态分布▪标准正态分布4性质5分布曲线▪图形特征▪参数含义6研究过程7曲线应用▪综述▪频数分布▪综合素质研究▪医学参考值历史发展正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。
但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。
这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。
在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。
这要到20世纪正态小样本理论充分发展起来以后。
拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。
第四章:正态分布
P { 1 .3 (X 1 )/2 0 .7 } (0.7) ( 1.3)
( 0 . 7 ) [ 1 ( 1 . 3 ) 0 ] . 7 5 [ 1 0 . 8 9] 0 0 . 6 3 . 6 2
例2. 设 XN(,2),求P{-3<X<+3}
(二)标准正态分布N(0, 1)
X~f(x)
1
x2
e 2,
x
2
E(X) x(fx)d x
2 xex2 2d x0(奇函 ) 数
D(X)E{X [ E(X)]2}[xE(X)2 ]f(x)dx
x2 2 1ex22dx1
0.3(x)0.7(x1)
22
于 E 是 X x ( x ) f d x x [ 0 .3 ( x ) 0 .7( x 1 )d ]x
22
0 .3 x(x)d x 0 .7 x(x 1 )dx
求 P { X 0 } .
解 P { 2 X 4 } P { 0 ( X 2 ) / 2 /}
随机变量 标准化
(2 /) (0 ) 0 .3 , (2 /) 0 .3 (0 ) 0 .8
P { X 0 } P { X ( 2 )/ 2 /}
图象见右上角
正态分布有两个特性: (1) 单峰对称
1
2 f (x)
密度曲线关于直线x=对称
f()=maxf(x)= 1
2
0
(2) 的大小直接影响概的分布
越大,曲线越平坦;
f (x)
越小,曲线越陡峻.
正态分布也称为
正态分布
高斯与正态分布1809年,高斯(Carl Friedrich Gauss,1777—1855)发表了其数学和天体力学的名著《绕日天体运动的理论》。
在此书末尾,他写了一节有关“数据结合”(data combination)的问题,实际涉及的就是这个误差分布的确定问题。
他的做法与拉普拉斯相同。
但在往下进行时,他提出了两个创新的想法。
一是他不采取贝叶斯式的推理方式,测量误差是由诸多因素形成,每种因素影响都不大。
按中心极限定理,其分布近似于正态分布是势所必然。
其实,早在1780年左右,拉普拉斯就推广了狄莫佛的结果,得到了中心极限定理的比较一般的形式。
可惜的是,他未能把这一成果用到确定误差分布的问题上来。
高斯的第二点创新的想法是:他把问题倒过来,先承认算术平均是应取的估计,然后去找误差密度函数条件下才能成立,这就是正态分布。
一种概率分布。
正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。
遵从正态分布的随机变量的概率规律为取μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。
正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。
它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。
当μ=0,σ2=1时,称为标准正态分布,记为N(0,1)。
μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。
多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。
C.F.高斯在研究测量误差时从另一个角度导出了它。
P.S.拉普拉斯和高斯研究了它的性质。
高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。
正态分布及其应用 (normal distribution)
➢二.图形 正态分布密度函数
f(X) 21 exp((X 2 2)2)
其中参数 为均值, 为标准差,由此
决定的正态分布记作 N(三.特征
➢ 正态分布是单峰曲线,形状呈钟型,中间高,两
端低,以 X 为对称轴,左右完全对称。
➢ 在 X 处,f (X) 取得最大值。
➢ 有两个参数:位置参数 和变异度参数 。 一定, 越大,数据越分散,曲线越平坦; 一
定, 增大,曲线沿 X 轴向右平移。因此,不
同的 ,不同的 ,对应不同的正态分布。
不同均值正态分布示意图
1.5 1
不同标准差的正态分布示意图
➢ 正态曲线下面积的分布规律
通过对密度函数积分我们可以知道正态曲线下, 横轴上所夹的面积为1。理论上:
• 根据正态 分布的对称性知,外侧尾部面 积 u2.21与外侧尾部面积 u2.21 相同,查附表1,得对应的概率为0.0136, 体重在50kg以上的12岁儿童占1.36%。
第三节 医学参考值范围的制定
➢医学参考值范围Reference Range 指某 群体“正常人”的解剖、生理、生化等 各种指标大多数个体值的波动范围。
附表1给出了标准正态分布曲线下从的面积根据正态分布的对称性我们可以求出任何一个区间内标准正态分布曲线下的面积也就是落在任何一个区间内的概率
正态分布及其应用
(normal distribution)
第一节 正态分布的概念和特征
➢一.概念 正态分布又称高斯(Gauss)分布,
是最常见、最重要的一种连续型分布, 医学资料中有许多指标的频数分布都呈 正态分布,如身高、体重、脉搏、血红 蛋白、血清总胆固醇等。
限和上限,即双侧界值;有些指标如
肺活量通常只以过低为异常,血铅以
正态分布概率公式(部分)
图 6-2 正态分布概率密度函数的曲线正态曲线可用方程式表示。
当n→∞时,可由二项分布概率函数方程推导出正态分布曲线的方程:f(x)= (6.16 )式中: x —所研究的变数; f(x) —某一定值 x 出现的函数值,一般称为概率密度函数(由于间断性分布已转变成连续性分布,因而我们只能计算变量落在某一区间的概率,不能计算变量取某一值,即某一点时的概率,所以用“概率密度”一词以与概率相区分),相当于曲线 x 值的纵轴高度; p —常数,等于 3.14 159 ……; e —常数,等于 2.71828 ……;μ为总体参数,是所研究总体的平均数,不同的正态总体具有不同的μ ,但对某一定总体的μ 是一个常数;δ 也为总体参数,表示所研究总体的标准差,不同的正态总体具有不同的δ ,但对某一定总体的δ 是一个常数。
上述公式表示随机变数 x 的分布叫作正态分布,记作N( μ , δ2 ) ,读作“具平均数为μ,方差为δ2 的正态分布”。
正态分布概率密度函数的曲线叫正态曲线,形状见图 6-2 。
(二)正态分布的特性1 、正态分布曲线是以x= μ 为对称轴,向左右两侧作对称分布。
因的数值无论正负,只要其绝对值相等,代入公式( 6.16 )所得的 f(x) 是相等的,即在平均数μ 的左方或右方,只要距离相等,其 f(x) 就相等,因此其分布是对称的。
在正态分布下,算术平均数、中位数、众数三者合一位于μ点上。
2 、正态分布曲线有一个高峰。
随机变数 x 的取值范围为( - ∞,+ ∞ ),在( - ∞ ,μ )正态曲线随 x 的增大而上升,;当 x= μ 时, f(x) 最大;在(μ ,+ ∞ )曲线随 x 的增大而下降。
3 、正态曲线在︱x-μ︱=1 δ 处有拐点。
曲线向左右两侧伸展,当x →± ∞ 时,f(x) →0 ,但 f(x) 值恒不等于零,曲线是以 x 轴为渐进线,所以曲线全距从 -∞到+ ∞。