正态分布在实际生活中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布在实际生活中
的应用
Document number:NOCG-YUNOO-BUYTT-UU986-1986UT
《概率论与数理统计》
论文
正态分布在实际生活中的应用
正态分布在实际生活中的应用
摘要:
正态分布是一个在数学、物理及工程等领域都非常重要的分布,在的许多方面有着重大的影响力。其密度函数为:)2/()(2221)(σμπ
σ--=x e x f ,由μ、σ决定其性质。生产与实验中很多的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗度、口径、长度等指标;还有智力测试、填报志愿等问题。
关键词:正态分布 实际应用 预测
正文:
正态分布(normal distribution )又名(Gaussian distribution ),是一个在数学、物理及工程等领域都非常重要的分布,在的许多方面有着重大的影响力。则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其呈钟形,因此人们又经常称之为钟形曲线。
正态分布的密度函数 :)2/()(2221)(σμπ
σ--=x e x f • f(x)为与x 对应的正态曲线的纵坐标高度;
• μ为总体均数即数学期望决定了其图像位置
• σ为总体标准差决定了分布的幅度;
• π为圆周率,即;
• e 为自然对数的底,即。
我们通常所说的是μ = 0,σ = 1的正态分布。
服从正态分布的变量的频数分布由μ、σ完全决定,他还具有如下特征:
1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。
2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。
5、u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为,左右完全对称。正态分布的均数、、相同,均等于μ。
6、σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
7、3σ原则:P(μ-σ 3σ 正态分布随处可见,处处显现着他神秘的身影。对于某一件事或者某个要达到的目标,很多很多的个体发挥出来的水平大致上服从正态分布。也就是说,对于大量个体的发挥统计,常常能看到正态分布“冥冥之中”束缚着整体的状态。 对于某个单独的单位,一般来说,对于“发挥出来的水平”这件事,也往往有波动的效果,不管是机器、工具还是我们人本身:有的时候,超水平发挥了;有的时候正常发挥;有的时候又会发挥失常。这种东西应该也可以抽象为围绕期望水平的正态分布。 而对于若干数据,包括发挥水平、排位情况,但是没有整体数据的时候,如果能推测是正态分布的情形,就可以近似计算出分布函数来,然后去估计其他的分布情况。这是反向推导的过程。 生产与实验中很多的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的;以及气体的速度分量,等等。 例如测试智力问题: 学家]和默瑞(Charles Murray)合着《正态》一书而闻名,在该书中他们指出人们的智力呈正态分布。以某校的入学新生的智力测试为例: 假设某校入学新生的智力测验平均分数与方差分别为100与12。那么随机抽取50个学生,他们智力测验平均分数大于105的概率小于90的概率 本例没有常态分配的假设,还好中心极限定理提供一个可行解,那就是当随机样本长度超过30,样本平均数x近似于一个常态变量,因此标准常态变量Z = (x–μ) /σ/ √n。 平均分数大于105的概率p = p(Z> (105 – 100) / (12 /√50))= p(Z> 5/ = p( Z > = . 平均分数小于90的概率p = p(Z< (90 – 100) / (12 /√50))= p(Z < = . 理查德·赫恩斯坦和默瑞他们利用应募入伍者的测试结果证明,黑人青年的智力低于白人和;而且,这些人的智力已经定型,对他们进行培训收效甚微。因此,政府应该放弃对这部分人的教育,把钱用于包括所有种族在内的启蒙教育,因为孩子的智力尚未定型,开发潜力大。由于此书涉及黑人的智力问题,一经出版便受到来自四面八方的围攻。 例如高考填报志愿的问题: 高考后,考生填报志愿时,下列两个问题就显得很重要:(1)高考后(或前)希望能准确估计自己的标准分和“百分位”(百人中所处的位置);(2)希望从考生手册中。往年高校第一志愿实际录取的最高、最低、平均分三个数据获取更多更准确的信息。不以人们意志而转移的统计规律——正态分布理论,就可以帮助我们估计,实现这两个目的。 一个学校在正常情况下,同类考生都有一、二百人以上规模,这已经算大样本容量了。一个学校、二百个以上考生成绩在全省里面有较高相对稳定性。所以只有把每一个考生考后所估比较真实的成绩放在整个学,以大样本来分析才能保证用总体正态的特征来判断考生绩所处位置的科学性。 这里以1998年西安电子科大在福建实录第一志愿40名考生为例,当时最低、最高、平均分分别是634、714、660分,现计算分析如下: (1)把[634,714]隔10分分为8个段.把分点换算为实际标准分; X0=(634—500)/100=1.34.Xl=1.44……x8= (2)查标准正态分布表算出大“曲边梯形”面积: S=Φ-Φ= (3)查标准正态分布表算出8个小“曲边梯形”面积: S=Φ一Φ= S1=,S2=.S3=, S4=, S6=. S7=, S8=