浅谈正态分布在现实生活中的应用论文doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈正态分布在现实生活中的应用
摘要:无论从理论和实际应用的观点来看,正态分布毫无疑问是概率论和数理统计中的重要分布。它的重要性质是由于实际中遇到的随机变量有许多服从正态分布或近似服从正态分布的。(例如,气象学中的温度、湿度、降雨量,有机体的长度、重量,智能测度的评分,实验中的测量误差,经济学中的众多度量等等)正态分布是许多重要分布的极限分布;许多非正态分布变量是正态分布变量的函数;正态分布的概率密度和分布函数具有各种优良性质等。本文总结分析了正态分布和标准正态分布的性质和特点,然后着重分析了正态分布在医学,岗位测评,试卷命题难度评价,天气预报等实际问题中的应用。
关键词:正态分布;标准正态分布;统计量
一、 正态分布的有关知识
1、正态分布的定义
设连续型随机变量X 具有概率
2()(2)()
x f x μσ--=,x -∞<<∞ (1.1)
其中μ(-∞<μ<∞),(0)σσ>为常数,则称x 服从以,μσ为参数的正态分布,正态分布又称高斯分布,记为2(,)X
N μσ。 2、 正态分布的图形特点
为了画出正态分布的图形,先对概率密度做几点讨论:
(1)()0f x >,即整个概率密度曲线都在x 轴的上方;
(2)令x c μ=+,(0)x c c μ=->,分别代入()f x ,由(1.1)式可得
()()f c f c μμ+=- 且()()f c f μμ+≤ ()()f c f μμ-≤
故()f x 以x μ=为对称轴,并在x μ=处达到最大值()
f μ=
(3)当x →±∞时,()0f x →,这说明曲线()f x 向左右伸展时越来越贴近以x 轴,即()f x 以x 轴为渐近线。
(4)用求导的方法可以证明x μσ=±为,为()f x 的两个拐点的横坐标。
综上,即可画出正态分布的概率密度曲线如图1,它是一条关于x μ=对称的钟形曲线。
图1 为了说明参数,μσ对曲线位置形状的影响,请看图2
图2 可以看出:μ决定了图形的中心位置,σ决定了图形中峰的陡峭程度,当σ较大时,图形趋于平缓,当σ较小时,图形趋于陡峭。也就是说,μ决定了分布的中心位置,σ反映了分布的分散或集中程度。
由(1.1)式得x 的分布函数为
22()2()2t x F x e dt μσδπ---∞=⋅⎰ (1.2)
3、标准正态分布
当0,1μσ==时,相应的正态分布(0,1)N 叫做标准正态分布。对标准正态分布,通常用()x ϕ表示概率密度函数,用()x φ表示分布函数,即
2
2
()()
t
x x
x t dt e dt
φϕ-
-∞
==
⎰⎰(1.3) 标准正态分布的重要性质在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。
定理1 设2
(,)
X Nμσ,则(0,1)
X
Y N
μ
σ
-
=。
根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题。
至此,我们对正态分布的性质、特点有了初步的了解。从密度函数的图形看,它是一条关于xμ
=对称的钟形曲线。可以形象地用“两头小,中间大,左右对称”来描述。在自然界和社会领域常见的变量中,很多都有这种性质。
4、正态分布的几个定义:
①设
1,2
,
n
X X X
⋅⋅⋅是来自总体X的一个样本,
1,2,n
x x x
⋅⋅⋅是相应的样本值,1,2,
(,)
n
g X X X
⋅⋅⋅是样本
1,2
,
n
X X X
⋅⋅⋅的函数,若g中不包含任何未知参数,则称1,2,
(,)
n
g X X X
⋅⋅⋅是一个统计量。
②下面是几个常用的统计量,设
1,2
,
n
X X X
⋅⋅⋅是来自总体X的一个样本,
1,2,n
x x x
⋅⋅⋅是相应的样本值,定义
样本均值
1
1n
i
i
X X
n=
=∑;
样本方差
2
22
11
11
()()
11
n n
i i
i i
S X X X nX
n n
==
=-=-
--
∑∑;
样本标准差(样本均方差)
S==;
样本k阶(原点)矩
1
1
,1,2,;
n
k
k i
i
A X k
n=
==⋅⋅⋅
∑
样本k阶中心矩
1
1
(),1,2,;
k
n
k i
i
B X X k
n=
=-=⋅⋅⋅
∑
二、正态分布在现实生活中的应用
1、在医学方面的应用
某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。
(1)估计正态分布资料的频数分布
例 1.10 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求、、范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。
本例,、未知但样本含量n较大,按式(3.1)用样本均数和标准差S分别代替和,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见表1。
100名18岁男大学生身高的实际分布与理论分布
身高范围(cm)
实际分
布理
论分布
(%)
人
数
百
分数
(%)
168. 69~176.71
6
7
6
7.00
68.
27
164. 84~180.56
9
5
9
5.00
95.
00
162. 35~183.05
9
9
9
9.00
99.
00