论正态分布的重要地位和应用2要点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学校代码13651
编号0320150016
本科毕业论文(设计)
题目:论正态分布的重要地位和应用
学部:工学部
学生姓名:王梅影
学号:2011070102021
年级:2011级
专业班级:信息与计算科学
指导教师:赵姣珍职称:讲师
完成时间:2015/5/15
中国·贵州·贵阳
成果声明
本人的毕业论文是在贵州民族大学人文科技学院赵姣珍老师的指导下独立撰写并完成的。
毕业论文没有剽窃、抄袭、造假等违反学术道德、学术规范和侵权行为,除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。
对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本声明的法律结果由本人承担。
论文作者签名:
日期年月日
目录
摘要 (1)
Abstract (2)
1绪论 (3)
1.1研究背景 (3)
1.2研究目的 (3)
1.3研究现状 (4)
1.4研究意义 (4)
2 正态分布相关知识介绍 (5)
2.1正态分布的概念 (5)
2.2正态分布曲线特性 (5)
2.3 标准正态分布 (8)
3 正态分布的应用 (9)
3.1 正态分布应用实例 (9)
3.1.1 正态分布在生产中的应用 (9)
3.1.2正态分布在日常生活中的应用 (10)
3.1.3正态分布在销售分类中的应用 (11)
3.1.4正态分布在工作学习中的应用 (12)
3.1.5 正态分布在仪器测量中的应用 (12)
3.2 正态分布的应用价值 (14)
总结 (15)
参考文献 (16)
致谢 (17)
摘要:正态分布是一种最常见的连续型随机变量的分布,是概率论中最重要的一中分布.在理论上和实际生活中正态分布具有重要地位,数理统计中的正态分布是很多重要问题的解决的基础,在理论研究中占有举足轻重的地位.本文首先针对正态分布这一理论研究与实际应用都占有重要地位的概率分布展开分析研究,从其基本概念出发,然后分析其特性以及各种应用价值,最后通过一系列研究给出正态分布具有重大作用的理论依据.
关键词:正态分布标准正态分布方差标准差
Abstract: The normal distribution is the most common distribution of a continuous random variable whether in theoretical research or practical application. It occupies pride of place in that it has a wide application in the field . It can solve many important problems in the mathematical statistics which based on the normal distribution for the normal distribution, so in theory to study the normal distribution.This paper analysis the normal probability distribution according to the theoretical research and practical application which occupy an important position in many science fields from the basic concept, analysis and application value of its characteristics. The theoretical basis is given through a series of studies on the normal distribution has a significant role.
Key words: The normal distribution Standard distribution The curve Standard deviation
1绪论
1.1研究背景
随机现象存在于自然界和人类生活中的每一个角落,因此概率论在现实中的应用非常之广泛,而在概率论中的最主要的一个分支就是正态分布(Normal distribution),正态分布不仅在金融、精算以及保险等新型领域中占有重要地位,而且对于医学、物理学、生物学等领域的影响也是不可忽略的.
正态分布又被称为高斯分布,正态分布在统计学科、数学领域、自然生物领域都有着极其关键作用的概率分布.我们假设连续性随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2).μ决定了正态分布的期望值,其标准差σ决定了分布的幅度.由于正态分布的曲线也称为钟形曲线.在日常的学习研究之中,标准正态分布,它是μ =0,σ = 1的正态分布.
正态分布是我们生活中不可或缺的一部分,如果能够充分理解它,它能够带来的利益也是无法估量的.作为新时代的大学生,很好地掌握正态分布的原理并能够将其运用于社会生活中,是我们的一个任务,为此对正态分布进行系统的学习和研究.
1.2研究目的
正态分布是统计方法的理论中最为基础的部分,是不以人类的意志而转移的统计规律,具有统一的函数表达式.
正态分布在实际生活中,存在着很多服从正态分布的例子,.比如测量产品的误差、产品质量的测量,农业作物的产量等.
服从正态分布的随机变量应用非常之广.没有任何一种随机变量可以相比较.所以,我们需要对正态分布进行深入广泛的研究.为了能够更好地掌握正态分布,让其能够更好地被应用生活之中,为人类谋取更多的福利,对其在理论和应用方面进行了系统的研究以求进一步的了解正态分布的奥秘.
1.3研究现状
正态分布概念首先由数学家De Moivre发现引入并提出,然后直到1809年,德国数学家Gauss将其应用于自然科学的广泛研究,因此又被称作高斯分布.正态分布最早是通过进行误差分析而发现的.进入近代统计时代,拉普拉斯首次提出了概率论的古典定义,把概率论的理论作为基本理论,再次进行了中心极限定理的证明,进一步完善了观测误差论,在前人的基础上进行了一次伟大的改革.19世纪50年代凯特莱运用大量的概率论原理对自然和社会现象进行测量,然后统计出大数据,这些数据反映出来的规律可以体现事物的变化,甚至可以预测未来事件发生的可能性.随后凯特莱有对正态曲线进行了拓展,高尔顿对正态分布进行了创新.
19世纪起,以马尔可夫和切比雪夫为代表的数学家通过引入随机变量的盖帘,建立了随机变量的独立性和非独立性的标准,提出了收敛到正态分布的充要条件.到达20世纪,通过哥赛特,费歇尔等人的努力,小样本理论诞生了,正态分布的地位得到了进一步的巩固.20世纪后,统计学家在实验中获得的数据越来越精确,由统计分析得到的结论得到了普遍认可.
1.4研究意义
正态分布具有极其广泛的实际应用背景,在人们的各种生产生活以及科学实验当中,有大量的随机变量的概率分布特性都可以近似的用正态分布来描述.当我们描述某一件事或者某一个要达到的目标时,大部分的个体所发挥出来的特性都能够很好地服从正态分布.这也就是说,对于大量的个体的特性统计分析,可以尝试利用正态分布来估量.
除此之外,正态分布也可应用到解决现实生活问题,产品质量管理、人体生理的特征及学生的综合素质等多领域都可以用正态分布进行研究.
因此,正态分布作为一种最常见的连续型随机变量的分布,不仅在概率论和数理统计的理论研究中有重要地位,而且在实际应用上也有着重要研究价值.充分研究正态分布在理论和应用中的重要定位,可以让我们充分学习到正态分布的理论知识,站在前人的肩膀上获得最好的研究成果.有利于在今后的研究中少走弯路,为今后研究打好基石.
2 正态分布相关知识介绍
2.1正态分布的概念
正态分布又被称作高斯(Gauss )分布或常态分布.正态分布曲线的两边低,中央是高峰,逐渐下降至两侧,左右呈现对称的,曲线不与横轴相交.
设连续型随机变量ξ的密度函数为:
()()22
221
σμπσϕ--=x e x ()x -∞<<+∞ (2.1)
(其中μσ、是常数,且 0σ>,μ为所研究的正太总体平均值,σ为标准差,x 为随机抽
取得正态分布中的样本值).则称随机变量ξ服从参数为μσ、的正态分布,记作()2,~σμξN ,正态分布密度函数的图形如下图所示,这条曲线应称作“正态分布曲线”.
图2-1 正态密度曲线分布图
2.2正态分布曲线特性
对上式(2.1)进行一定的数学计算处理:
对式(2.1)求导,可得:
)(21
)(22
2)(3μπσϕσμ-⋅-='--x e x x (2.2)
令()0='x ϕ,则有x μ=,即当x μ=时, ()x ϕ有极大值max ()2x ϕσπ=
对式(2.2)求导有: ()()()[]22252221σμπσϕσμ--⋅=
''--x e x x (2.3) 令()0=''x ϕ,则有()22x μσ-= ,即曲线在:x μσ=±可以看到拐点,而且有两个.
表2-1 正态曲线的特性表 x (,)μσ-∞- σμ-
(,)μσμ- μ (,)μμσ+ σμ+ (,)μσ++∞()x ϕ' + +
+ 0 - - - ()x ϕ' + 0
- - - 0 + ()x ϕ ↑ e πσ21 ↓
πσ21 ↑ e πσ21 ↓ 曲线 凹 拐点 凸 极大值 凸 拐点
凹 对正态分布整体特性做了一定的介绍之后,下面对参数当μ和σ的意义进行阐释,当它们确定后,正态曲线就几乎能够得到了完全的确定.μ和σ 不同,μ的大小决定曲线的“高”、“矮”、“胖”、“瘦”,如果μ不变,改变σ,则曲线在x 轴上的位置不变,形状会变化,σ愈小,曲线愈“高瘦”;σ越大,曲线越“矮胖”,如图2-3所示; 如果σ不变,改变μ,那么曲线形状不变,只在x 轴上平行移动如图2-2所示:
图2-2 正态曲线的特性图
图2-3 正态曲线的密度函数图
我们从几何的角度对上图进行分析,在上图中,μ是高斯曲线取得极大值的横坐标、σ是曲线中拐点横坐标与极大值坐标μ间的距离,也能够说σ是凸、凹曲线的连接点在横坐标轴的位置;
从物理的角度对上图进行分析,在上图中,μ是正态曲线与x轴之间所构成的平面图形重心的横坐标.在计量学科中,μ是被测量的随机变量的真值,σ是表征随机变量对象测量值分散特性的一个评价尺度因素.在数理统计学科中,μ被称为数学期望也就是平均值,σ是随机变量的标准偏差.当σ的值越小,说明观测值落在μ所在横坐标左右范围的概率越大,观测值较集中,测量精度相对较高;σ的值越大,说明观测值落在μ所在横坐标左右范围内的概率越小,观测值较分散,测量精度偏低.
综上所述,正态分布的参数μ代表着随机变量样本观测值的集中的趋势,参数σ反映了随机变量样本观测值的分散程度.
2.3 标准正态分布
称1,0==σμ的正态分布为标准正态分布,将1,0==σμ代入(2.1)式可以得到:
()2
221x e
x -
=
π
ϕ ()x -∞<<+∞ (2.4)
式(2.4)为标准正态分布的密度函数,服从标准正态分布的随机变量()2,~σμξN
通过对概率论的学习告诉我们,标准正态分布的分布函数(也叫概率分布函数)为:
()()()()dt e
dt t x P x P x F t x x 2
2
21-
∞
-∞
-⎰
⎰==<<∞-=<=π
ϕξξ (2.5)
通常用()x Φ表示标准正态分布的分布函数,即:
()()()()dt e
dt t x P x P x t x x
2
2
21
-
∞
-∞
-⎰⎰=
=<<∞-=<=Φπ
ϕξξ (2.6)
取不同的x 的值,式(2.6)的几何意义是在区间(),x -∞内正态曲线与x 轴之间所围曲边梯形的面积,如图所示,
图2-4 标准正态分布的分布函数图
这也是将“正态分布表”称作“正态概率曲线下的面积”的道理.
由于密度函数()x ϕ可以在整个x 轴上取值,密度函数性质得:
1212
2=-
∞+∞
-⎰
dt e
t π
即迎合了正态曲线的一个性质:线与x 轴所围面积为l.
3 正态分布的应用
3.1 正态分布应用实例 3.1.1 正态分布在生产中的应用
正态分布实际应用很广,在很多产品生产及科学实验中,随机变量的概率分布特性都可以近似的用正态分布来描述.对于大量的个体的特性统计分析,可以尝试利用正态分布来估量.
例3.1 有一种螺纹量规平均可使用5年,其标准差为0.8年.假设螺纹量规的使用寿命服从正态分布,试求以下概率:1)使用期不到4年;2)使用期超过6年.
解 设量规使用期为随机变量ξ,由题意知()28.0,5~N ξ,本题求()()46P P ξξ<>和 1) 根据公式有:
()()()44544 1.250.10560.8P P μξξσ--⎛⎫⎛⎫
<=-∞<<=Φ=Φ=Φ-= ⎪ ⎪⎝⎭⎝⎭
,
或由公式可得
()()()()4045054040.80.81.25 6.250.105600.1056P P μμξξσσ----⎛⎫⎛⎫⎛⎫⎛⎫
<=<<=Φ-Φ=Φ-Φ ⎪ ⎪ ⎪ ⎪
⎝⎭⎝⎭⎝⎭⎝⎭=Φ--Φ-=-=,
2) 根据公式有
()()()6561611 1.2510.89440.10560.8P P ξξ-⎛⎫
>=-≤=-Φ=-Φ=-= ⎪⎝⎭
.
例3.2 某车间加工一批轴,其直径服从正态分布,平均直径μ=l0mm ,标准差σ=0.015mm .规定直径在(10±0.03)mm 范围内为合格品.求:1)不合格品的概率;2)合格品的概率.
解 设这批轴的直径为随机变量ξ,由题意知()015.0,10~N ξ.03.10>ξ和97.9<ξ为不合格品.
1) ()()()9.97109.9710.03110.030.015不合格P P P P ξξξ-⎛⎫
=<+>=Φ+-≤⎡⎤ ⎪⎣⎦⎝⎭ ()()()()()()10.031021212[12]120.015222220.977250.0455
-⎛⎫
=Φ-+-Φ=Φ-+-Φ=-Φ+-Φ ⎪⎝⎭
=-Φ=-⨯= 2) ()10.03109.97109.9710.030.0150.015合格P P ξ--⎛⎫⎛⎫
=<<=Φ-Φ ⎪ ⎪⎝⎭⎝⎭
()()()2222120.9772510.9545=Φ-Φ-=Φ-=⨯-=,
或 110.04550.9545P P =-=-=合格不合格. 即
975.002.0=⎪⎭
⎫ ⎝⎛Φd .
3.1.2正态分布在日常生活中的应用
在自然界以及人类自然生活中,很多的实践经验证实,正态分布这种随机变量的概率分布的应用是十分广泛的,十分常见.例如:人的身高、体重、生物的生理尺寸等外观评估指标.随机测量误差指标等,都能够看作是近似服从的正态分布. (1)已知某条件下的概率,求参数μ 和σ
例3.3 有一群男子,4%的身高在m 608.1以下,有52%在m 608.1到m 753.1之间.若身高成正态分布,求这一分布的平均值和标准差.
解 由题意得:
()()⎪⎪⎩
⎪⎪⎨
⎧=+=⎪⎭⎫ ⎝⎛-Φ=<=⎪⎭⎫ ⎝⎛-Φ=<56
.052.004.0753.1753.104.0608..1608.1σμξσμξP P ,
由概率值0.04和0.56反查正态分布表得: ⎪⎩
⎪⎨⎧=--=-15
.0753.175.1608.1σμσμ
,
化为:
⎩⎨
⎧=--=+-0
15.0753.10
75.1608.1σμσμ, 解得:
()()⎩
⎨
⎧==m m 742.1076.0μσ, 即这群男子平均身高为m 742.1,标准差为mm 076.0.
(2)已知 μ,σ 和区问(a,b)内的变量数,求总变量数
例3.4 某天中午一餐厅所有顾客吃饭用的钱服从正态分布,平均数为8.74元,标准差为1.2元.这天中午有420人吃午饭用了8.5元或更多,问一共来了多少顾客?
解 ()()()5793.04207.012.012.174.85.815.815.8=-=-Φ-=⎪⎭
⎫
⎝⎛-Φ-=≤-=>ξξP P
故总顾客数为: 7255793.0420=÷=ξ(人).
3.1.3正态分布在销售分类中的应用
例3.5 某水果重量成正态分布,现进行分级,20%为小的,55%为中等,15%为大,10%为特大.所有水果平均重量为241.5g ,标准差为60g ,求中等水果的下限与上限的重量.
解 由题意知,中等水果下限下x 以下的概率为0.20,上限为上x 以下的概率为 (0.20+0.55)=0.75,于是有:
()75.0605.241=⎪⎪⎭
⎫
⎝⎛-Φ=⎪⎪⎭⎫ ⎝⎛-Φ=<下下下x x x P σμξ
()75.0605.241=⎪⎪⎭
⎫
⎝⎛-Φ=⎪⎪⎭⎫ ⎝⎛-Φ=<上上上x x x P σμξ 84.0605.241-=-下x 675.060
5
.241=-上x
反查正态分布表得:
g x 1.19184.0605.241=⨯-=下 g x 282675.0605.241=⨯+=上
即中等水果下限重量为191g ,上限为282g .
3.1.4正态分布在工作学习中的应用
正态分布不仅是概率论与数理统计的一种基本研究工具,也可以将它应用到解决考试成绩与学生综合素质研究的现实生活问题当中.
例3.6 某公司对职工进行基本理论考试,决定给14% 的人以优.由以往经验知考试成绩成正态分布,平均分数为80分,标准差为14分,问职工至少考多少分方能得优?
解 设至少考x 分方能得优,由题意:
()()14.0148011=⎪⎭
⎫ ⎝⎛-Φ-=<-=≥x x P x P ξξ,
86.014.011480=-=⎪⎭
⎫ ⎝⎛-Φx . 反查正态分布表得:
08.114
80
=-x , 故
9508.11780=⨯+=x (分)
即考生至少得95分方能得优.
3.1.5 正态分布在仪器测量中的应用
正常情况下测量(或实验)误差服从正态分布(或近似正态)分布指标以及可以
通过转换后服从正态分布的指标. 可以制定参考值范围. (1)已知μ ,σ及各范围内的概率,求某范围的上、下限
例3.7 用某量具测量(5.26±d)mm 这一尺寸.已知测量值平均数为5.26mm ,标准差为0.02mm ,测量值服从正态分布.要使测量值的95%都在公差范围内,问d 值应定为多少?
解 本题是求概率为0.95的尺寸范围.设测得的值为随机变量ξ,则()202.0,26.5~N ξ.由题意得
() 5.26 5.26 5.26 5.265.26 5.260.020.02210.95
0.020.020.02d d P d d d d d ξ+---⎛⎫⎛⎫-<<+=Φ-Φ ⎪ ⎪
⎝⎭⎝⎭
⎛⎫⎛⎫⎛⎫=Φ-Φ-=Φ-= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭
,
反查正态分布表得:
96.102
.0=d
, 故有
mm 0392.002.096.1=⨯=σ.
(2)用标堆差确定所需测量次教
例3.8 用某仪器测一尺寸L,已知该仪器标准差 m μδ1=,尺寸允许的测量极限误差m μδ4.1±=,问测量一次能否达到要求?
解 因δ=1.4<3σ=3,故测量一次达不到精度要求,应进行多次测量, 由式
2
3⎪⎭
⎫ ⎝⎛>δσn
得
559.44.1332
2≈=⎪⎭
⎫
⎝⎛=⎪⎭⎫ ⎝⎛≥δσn ,
可见,至少要测量5次.
3.2 正态分布的应用价值
正态分布理论有很多重要的理论和应用价值:
(1)估计频数分布,一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例.
(2)制定参考值范围.
(3)质量控制.
(4)制定医学参考值范围:医学现象中,如同质群体的身高、红细胞数,及实验中的随机误差,呈现为正态或近似正态分布;有些指标虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理.
总结
正态分布不仅是概率论与数理统计的一种基本研究工具,也可以将它应用到解决一些现实生活问题当中.医学遗传分析、考试成绩与学生综合素质研究以及质量管理和控制等诸多领域都可以利用正态分布进行研究.
正态分布是统计方法的理论中最为基础的部分,具有统一的函数表达式.正态分布在实际应用中也扮演着不可或缺的角色.在自然界和社会中,存在着很多服从或近似服从正态分布的例子,如测量产品的误差、各类质量指标的测量,经济学中的股票价格走向的估计,生物学中农业作物收获量的猜测等等.
服从正态分布的随机变量应用之广是任何一种随机变量不可比拟的.为此,对正态分布进行更深入更广泛的研究也是必不可少的.为了能够更好地掌握正态分布,让其能够更好地被应用生活之中,为人类谋取更多的福利,对其在理论和应用方面进行了系统的研究以求进一步的了解正态分布的奥秘.
参考文献
[1] 概率论与数理统计(第三版)高等教育出版社.
[2] 龚光鲁.概率论与数理统计.清华大学出版社.
[3] 胡细宝.概率论与数理统计与随机过程.北京邮电大学出版社.
[4] 上海交大应用数学系.概率论与数理统计初步.上海交太出版社,1989.1.
[5] 沈恒范.概率论讲义[M].第2版.人民教育出版社,1983.4.
[6] 盛骤等.概率论与数理统计[M].第3版.高等教育出版社,2001.12.
[7] 范金城等.概率论与数理统计[M].西安交大出版社,2001.10月.
[8] 周富臣等.机械制造计量检测技术手册[J].机槭工业出版社. 2000.10.
[9] 王梓坤著.概率论基础及其应用[M].北京师范大学出版社,1996.
[10] 李逢高著.概率统计应用与提高[M].科学出版社,2005.
[11] 朱燕堂等著.应用概率统计方法[M].西北工业大学出版社,1997.
致谢
在历时三个月时间的努力下,我终于顺利写完了毕业论文.在这篇充满奋斗的历程中,带给我的学习生涯无限的激情和收获.
在我的论文的写作的过程中,虽然遇到了一些困难和阻碍,不过感谢在同学和老师的帮助下我都度过了.不管是在图书馆收集查找资料还是借阅书籍文献的时候,图书馆的老师都给了我许许多多的帮助.
在此,我要特别感谢我的论文指导老师——赵姣珍老师,感谢她在论文写作这三个月期间对我进行了无微不至的帮助,一次一次不厌其烦的为我进行论文的修正与改进,如果没有赵老师的悉心指导,我想我也将不会顺利的完成我的论文.同样我向所有指导过以及帮助过我的老师们表示最由衷的感谢!同时,我也要感谢本论文所引用的众多学者的著作,若没有这些学者的研究成果的启发和引导帮助,我也将无法完成我的论文.我还要感谢我的同学和朋友们,是你们给我打气给我鼓励,还给予我有价值的论文相关资料,在论文的排版及撰写过程中给予我的支持与热情的帮助!最后,由于我的专业学术水平有限,所写论文也许有些许不足,诚恳殷切地希望老师们和同学们能够给予我批评与指正!谢谢!。