概率论课程期末论文大作业

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《概率论与数理统计》论文题目:正态分布及其应用

学院:航天学院

专业:空间科学与技术

姓名:黄海京

学号:1131850108

正态分布及其应用

摘要:正态分布(normal distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。正态分布有极其广泛的实际背景, 例如测量误差, 人的生理特征尺寸如身高、体重等 ,正常情况下生产的产品尺寸:直径、长度、重量高度,炮弹的弹落点的分布等, 都服从或近似服从正态分布,以及确定医学参考值范围,药品规格,用量等。可以说,正态分布是自然界和社会现象中最为常见的一种分布, 一个变量如果受到大量微小的、独立的随机因素的影响, 那么这个变量一般是一个正态随机变量。

关键词:正态分布,

一、正态分布的由来

正态分布(normal distribution)又名高斯分布(Gaussian distribution)。正态分布概念是由德国的数学家和天文学家Moivre于1733年受次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。

正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是μ= 0,σ= 1的正态分布。

二、正态分布的特性

1. 正太分布的曲线特征

正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。

(1)集中性:正态曲线的高峰位于正中央,即均数所在的位置。

(2)对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

(3)均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

(4)正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。

(5)u变换:为了便于描述和应用,常将正态变量作数据转换。

2. 正态曲线下面积分布

(1)实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数

的百分比,或变量值落在该区间的概率(概率分布)。不同范围内正态曲线下的面积可用公式计算。

(2)几个重要的面积比例轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.268949%,横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%。

3. 正态分布函数特征

若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号~。其中μ、σ2 是两个不确定常数,是正态分布的参数,不同的μ、不同的σ2对应不同的正态分布。

(1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。

(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

4. 标准正态曲线

(1)标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ2为0和1,

通常用ξ(或Z)表示服从标准正态分布的变量,记为 Z~N(0,1)。

(2)标准化变换:此变换有特性:若原分布服从正态分布,则Z=(x-μ)/σ~ N(0,1) 就可从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。

(3)标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。

5. 一般正态分布与标准正态分布的转化

由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值

小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。

三、正态分布的应用

正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。其主要应用如下:

1. 估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公

式即可估计任意取值范围内频数比例。

2. 制定参考值范围

(1)正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后

服从正态分布的指标。

(2)百分位数法常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。

3. 质量控制:为了控制实验中的测量(或实验)误差,常以作为上、下警戒

值,以作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

4. 正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等

多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。

5. 制定医学参考值范围:某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及

相关文档
最新文档