高斯分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高斯分布
正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
若随机变量服从一个位置参数、尺度参数的概率分布,记为:则其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于尺度参数,决定了分布的幅度。
正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。
我们通常所说的标准正态分布是位置参数为0, 尺度参数为1的正态分布(见右图中绿色曲线)。
正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。
附:这种分布的概率密度函数为:
⒈正态分布:若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号~。
其中μ、σ^2 是两个不确定常数,是正态分布的参数,不同的μ、不同的σ^2对应不同的正态分布。
正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。
2.正态分布的特征:服从正态分布的变量的频数分布由μ、σ完全决定。
集中性:正态曲线的高峰位于正中央,即均数所在的位置。
对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ²):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。
σ越小,曲线越陡峭;σ越大,曲线越扁平。
u变换:为了便于描述和应用,常将正态变量作数据转换。
μ是正态分布的位置参数,描述正态分布的集中趋势位置。
正态分布以
X=μ为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于μ。
σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。
也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
标准正态曲线
标准正态曲线N(0,1)是一种特殊的正态分布曲线,以及标准正态总体在任一区间(a,b)内取值概率。
“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。
这种认识便是进行推断的出发点。
关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。
面积分布
1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。
不同范围内正态曲线下的面积可用公式计算。
⒉几个重要的面积比例轴与正态曲线之间的面积恒等于1。
正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.27%,横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.00%,横轴区间(μ-2σ,μ+2σ)内的面积为95.44%,横轴区间[0,μ+2σ)内的面积为97.72%,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.00%,横轴区间(μ-3σ,μ+3σ)内的面积为99.73%。
标准正态曲线
1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ^2为0和1,通常用ξ(或Z)表示服从标准正态分布的变量,记为 Z~N(0,1)。
2.标准化变换:此变换有特性:若原分布服从正态分布,则Z=(x-μ)/σ~ N(0,1)就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。
故该变换被称为标准化变换。
⒊标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。
两种正态分布
一般正态分布与标准正态分布的转化
由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。
只要会用它求正态总体在某个特定区间的概率即可。
“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。
这种认识便是进行推断的出发点。
关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。
一般正态分布与标准正态分布的区别与联系
正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力
的高低,学生成绩的好坏等都属于正态分布。
标准正态分布是正态分布的一种,具有正态分布的所有特征。
所有正态分布都可以通过Z分数公式转换成标准正态分布。
两者特点比较:
⑴正态分布的形式是对称的,对称轴是经过平均数点的垂线。
⑵中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,再向外弯。
⑶正态曲线下的面积为1。
正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。
标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。
⑷正态分布曲线下标准差与概率面积有固定数量关系。
所有正态分布都可以通过Z分数公式转换成标准正态分布。
主要特征
1.集中性:正态曲线的高峰位于正中央,即均数所在的位置。
2.对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
3.均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
4.正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ²):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。
σ越小,曲线越陡峭;σ越大,曲线越扁平。
5.u变换:为了便于描述和应用,常将正态变量作数据转换。
3σ原则
正态分布曲线性质:
1、当x<μ时,曲线单调上升;当x>μ时,曲线单调下降,当曲线向左右两边无限延伸时,以x轴为渐近线;
2、正态曲线关于直线x=μ对称;
3、σ越大,曲线最大值越小,正态曲线越扁平;σ越小,曲线最大值越大,正态曲线越尖陡;
4、在正态曲线下方和x轴上方范围内区域面积为1(概率分布函数性质);
5、当x=μ时,曲线取最大值1/√﹙2π﹚σ。
3σ原则:P(μ-σ<X≤μ+σ)=68.26%;P(μ-2σ<X≤μ+2σ)=95.44%;P(μ-3σ<X≤μ+3σ)=99.74%。