统计学三大分布与正态分布的差异
三大分布和正态分布的关系
三大分布和正态分布的关系三大分布是指均匀分布、正态分布和泊松分布。
在统计学中,这三个分布都是非常重要的基本概率分布之一。
正态分布是最为常见的一种概率分布,也被称为高斯分布或钟形曲线,因其形状呈钟形而得名。
均匀分布则是一种平均分布的概率分布,泊松分布则是一种描述稀有事件发生次数的概率分布。
首先,我们来探讨一下正态分布和均匀分布的关系。
首先需要了解的是,均匀分布是一种最简单的概率分布,它在给定区间内的各个取值概率相等,也就是说每个取值都是等可能发生的。
而正态分布则是一种近似正常分布的概率分布,它的概率密度在均值处达到最大值,两侧逐渐减小。
在正态分布中,大部分的值都集中在均值附近,并且对称分布。
均匀分布和正态分布在形状上有明显的区别。
均匀分布的概率密度函数是一个矩形,在给定区间内的取值概率是相等的,因此其形状是平坦的。
而正态分布的概率密度函数呈现钟形曲线,形状相对较高且对称。
在正态分布中,均值和标准差控制了曲线的位置和形状。
对于均匀分布,通过区间的长度可以控制分布的形状。
另外,均匀分布和正态分布在数学性质上也有一些区别。
对于均匀分布,其期望值和方差均可以通过区间的长度来计算。
例如,在[0,1]区间上的均匀分布的期望值为0.5,方差为1/12。
而对于正态分布,其期望值恒为均值μ,方差为标准差的平方σ^2。
在正态分布中,许多常见的统计推理方法都是基于正态分布的假设,这也是正态分布被广泛应用的原因之一。
此外,正态分布和均匀分布在实际应用中也有着不同的特点和用途。
正态分布广泛应用于实际测量的误差分布、自然现象的变异分布等。
在统计学中,许多假设检验和参数估计方法都是基于正态分布的推论,因此正态分布在统计学中具有重要作用。
而均匀分布常常用于随机数生成、模拟实验中,以及一些特定的情况下,如等可能事件的建模等。
最后,我们来讨论一下正态分布和泊松分布的关系。
正态分布和泊松分布是两种完全不同的概率分布。
正态分布是描述连续型随机变量的概率分布,而泊松分布则是描述离散型随机变量的概率分布。
三大分布及其分位数
泊松分布的均值和方差相等,且随着均值 的增大,泊松分布逐渐趋近于正态分布。 此外,泊松分布具有可加性,即两个独立 泊松分布的和仍然服从泊松分布。
泊松分布的分位数计算
分位数定义
分位数是指将一个随机变量的概率分 布划分为几个等份的数值点,如中位 数就是50%分位数。
泊松分布分位数计算
泊松分布的分位数可以通过查表或使用 统计软件进行计算。对于给定的泊松分 布参数λ和概率p,可以计算出对应的分分位数的概念
分布
分布是指一组数据在各个取值范围内的频数或频率。在统计 学中,分布通常用概率密度函数或累积分布函数来描述。
分位数
分位数是指将一个随机变量的概率分布范围分为几个等份的 数值点。常用的分位数有四分位数、百分位数等。例如,中 位数就是50%分位数,表示有一半的数据小于或等于该值, 另一半的数据大于该值。
和优化提供理论支持。
生物学和医学
在生物学和医学研究中,泊松分布 可以用来描述放射性物质的衰变次 数、基因突变数等随机事件的发生
次数。
04 指数分布及其分位数
指数分布的定义和性质
定义
01
指数分布是一种连续概率分布,通常用于描述事件之间的时间
间隔。
性质
02
指数分布具有无记忆性,即事件发生的概率与自上次事件发生
排队论
在排队系统中,指数分布可用于描述顾客到达和 服务时间的概率分布,从而分析系统的性能指标 。
金融风险管理
指数分布可用于评估金融风险,如信用风险和市 场风险等,帮助金融机构制定风险管理策略。
05 三大分布的比较与联系
三大分布的特征比较
正态分布
呈钟形曲线,两侧对称,均值、 中位数、众数相等,标准差决定
统计学三大分布的应用
统计学三大分布的应用
统计学三大分布是指正态分布、t分布和卡方分布。
这些分布在统计学中应用广泛,下面将分别介绍其应用。
正态分布是自然界中最常见的分布之一,常用于描述连续性变量。
例如,身高、体重、智商等连续性变量都可以用正态分布来描述。
在假设检验、置信区间估计和回归分析等统计学方法中,正态分布也是一个非常重要的理论基础。
t分布是由威廉·塞德威克·高斯特(W.S.Gosset)于1908年提
出的,用来解决小样本量的问题。
t分布的形状与正态分布非常接近,但是在样本量较小的情况下,t分布的尾部更宽一些,因此在小样本量的情况下,使用t分布进行假设检验和置信区间估计更为合适。
卡方分布是概率论中一个重要的分布,通常应用于描述计数数据。
例如,在卡方检验中,卡方分布常常用来处理分类数据,如调查中统计“喜欢”或“不喜欢”某种产品或服务的人数。
卡方分布也常用于多项式回归和逻辑回归等模型中。
综上所述,正态分布、t分布和卡方分布在统计学中应用非常广泛,是统计学的重要组成部分。
对于从事统计学研究或相关领域的人员来说,深入理解和熟练运用这些分布是非常重要的。
- 1 -。
概率论三大分布四大定理
概率论三大分布四大定理概率论是统计学的一个分支,它讨论和研究一些随机事件发生的概率。
它的研究对于进行统计分析和做出经验推断都非常重要。
概率论主要分为三大分布及四大定理。
首先来谈谈三大分布:正态分布、泊松分布和二项式分布。
正态分布又称高斯分布,是一种表征连续随机变量的概率分布,由其特殊的曲线形式,常可以清楚直观地反映出总体中随机变量分布的特点。
它具有平均值、标准差和期望值等参数,常用于描述一般性普适性状。
泊松分布也称为指数分布,这种分布可以用来描述一定时间内发生某类事件的次数。
它具有概率分布函数及期望值、方差等参数,主要应用于线性回归模型中,广泛应用于抽样检验、可靠性分析。
二项式分布是离散随机变量的概率分布,它可以描述试验重复完成某类事情的次数。
它反映的是一系列重复实验中成功次数的概率,具有概率函数及期望值、方差等参数,主要应用于网络设计中,广泛应用于效率分析及统计检验。
接下来让我们来谈谈四大定理:大数定律、中心极限定理、方差定理和期望定理。
大数定律规定,一系列的实验结果的均值越多越接近期望值,它解释了总体均值和样本均值的关系,是概率论中最重要的定理。
中心极限定理指出,在进行大量独立重复实验时,总体随机变量的分布接近正态分布,即随着实验次数的增加,实验结果越来越接近期望值。
方差定理规定,当做一系列实验时,总体方差应越来越小,而样本方差则越来越接近总体方差,这表明样本变量的方差可以代表总体方差。
期望定理定义了实验的期望值的关系,表明总体期望值可以由样本期望值准确估计。
概率论中的三大分布及四大定理是概率研究的基础知识,也是统计分析的基础。
掌握这些基本概念和定理,可以帮助我们理解和深入探讨更多有关概率和统计的主题,从而更好地应用于各种实际领域。
均值 标准差 正态分布
均值标准差正态分布在统计学中,均值、标准差和正态分布是非常重要的概念,它们在描述和分析数据分布特征方面起着关键作用。
本文将分别介绍这三个概念,并探讨它们之间的关系。
首先,我们来谈谈均值。
均值是一组数据的平均值,通常用来代表整体数据的集中趋势。
计算均值的方法是将所有数据相加,然后除以数据的个数。
例如,如果我们有一组数据{3, 5, 7, 9, 11},那么它们的均值为(3+5+7+9+11)/5=7。
均值的计算可以帮助我们更好地理解数据的集中程度,以及数据整体的特征。
接下来,我们谈谈标准差。
标准差是衡量数据分散程度的指标,它可以告诉我们数据点相对于均值的偏离程度。
标准差越大,表示数据点越分散;标准差越小,表示数据点越集中。
标准差的计算方法是先计算每个数据点与均值的差值,然后将这些差值平方,再求平均数,最后取平方根。
标准差的计算可以帮助我们更好地理解数据的分布情况,以及数据的稳定性和可靠性。
最后,让我们来探讨正态分布。
正态分布又称为高斯分布,是一种连续概率分布,其特点是呈钟型曲线,均值处于中心位置,标准差决定了曲线的宽窄。
正态分布在自然界和社会现象中广泛存在,例如身高、体重、考试成绩等。
正态分布具有许多重要的性质,例如68%的数据落在均值加减一个标准差的范围内,95%的数据落在均值加减两个标准差的范围内,99.7%的数据落在均值加减三个标准差的范围内。
因此,正态分布在统计学和科学研究中具有重要意义。
在实际应用中,均值、标准差和正态分布经常同时出现,并相互影响。
例如,当我们得知一组数据呈正态分布时,我们可以利用均值和标准差来描述和分析这组数据的特征。
均值和标准差还可以用来比较不同数据集之间的差异,帮助我们进行科学研究和决策分析。
总之,均值、标准差和正态分布是统计学中的重要概念,它们相互联系,共同帮助我们理解和分析数据的特征。
通过对这三个概念的深入理解,我们可以更好地应用统计学方法来解决实际问题,促进科学研究和社会发展。
统计学三大分布的应用
统计学三大分布的应用统计学是一门重要的学科,它通过收集、整理和分析数据来揭示事物之间的潜在规律和关系。
在统计学中,分布是一种揭示数据特征的重要工具。
在统计学中,有三大常见的分布,它们分别是正态分布、均匀分布和指数分布。
这些分布在各个领域都有广泛的应用,能够帮助我们更好地理解和解释现象。
首先,正态分布是统计学的核心概念之一。
正态分布也被称为高斯分布,它的形状近似为一个钟形曲线。
正态分布在自然界中广泛存在,例如人的身高、体重等,也在许多地方出现,如测试成绩、产品质量等。
统计学家常常使用正态分布来研究和描述各种现象,并通过计算均值和标准差来分析数据的集中度和离散程度。
正态分布也是许多假设检验和参数估计方法的基础,为我们进行科学研究和决策提供了强有力的工具。
其次,均匀分布是一种简单且常见的分布形式。
在均匀分布中,所有的取值都具有相同的概率。
这种分布可以用来模拟随机实验的结果,例如抛硬币的正反面、掷骰子的点数等。
均匀分布还在随机数生成、概率推断等方面发挥着重要作用。
在实际应用中,均匀分布也可以用来描述一些特定的自然现象,如某些地区的降雨量、温度等。
通过研究和理解均匀分布,我们可以更好地预测和解释这些现象。
最后,指数分布是描述事件发生时间的一种重要分布。
在指数分布中,事件发生的概率密度函数随时间指数级衰减。
这种分布常常用于研究和模拟一些连续系统的寿命、等待时间等。
指数分布也在信号处理、通信理论、生物学等领域中得到广泛应用。
通过对指数分布的研究,我们能够更好地理解和预测事件的发生模式,为我们提供关键信息,以便做出合理的决策。
总而言之,正态分布、均匀分布和指数分布是统计学中三大重要分布。
它们在各个领域都有广泛的应用,帮助我们更好地理解和解释现象,提供科学依据和决策支持。
通过对分布的研究和应用,统计学可以发挥重要作用,推动科学发展和社会进步。
概率论与数理统计中的三种重要分布
概率论与数理统计中的三种重要分布摘要:在概率论与数理统计课程中,我们研究了随机变量的分布,具体地研究了离散型随机变量的分布和连续型随机变量的分布,并简单的介绍了常见的离散型分布和连续型分布,其中二项分布、Poisson 分布、正态分布是概率论中三大重要的分布。
因此,在这篇文章中重点介绍二项分布、Poisson 分布和正态分布以及它们的性质、数学期望与方差,以此来进行一次比较完整的概率论分布的学习。
关键词:二项分布;Poisson 分布;正态分布;定义;性质一、二项分布二项分布是重要的离散型分布之一,它在理论上和应用上都占有很重要的地位,产生这种分布的重要现实源泉是所谓的伯努利试验。
(一)泊努利分布[Bernoulli distribution ] (两点分布、0-1分布)1.泊努利试验在许多实际问题中,我们感兴趣的是某事件A 是否发生。
例如在产品抽样检验中,关心的是抽到正品还是废品;掷硬币时,关心的是出现正面还是反面,等。
在这一类随机试验中,只有两个基本事件A 与A ,这种只有两种可能结果的随机试验称为伯努利试验。
为方便起见,在一次试验中,把出现A 称为“成功”,出现A 称为“失败” 通常记(),p A P = ()q p A P =-=1。
2.泊努利分布定义:在一次试验中,设p A P =)(,p q A P -==1)(,若以ξ记事件A 发生的次数,则⎪⎪⎭⎫⎝⎛ξp q 10~,称ξ服从参数为)10(<<p p 的Bernoulli 分布或两点分布,记为:),1(~p B ξ。
(二)二项分布[Binomial distribution]把一重Bernoulli 试验E 独立地重复地进行n 次得到n 重Bernoulli 试验。
定义:在n 重Bernoulli 试验中,设(),()1P A p P A q p ===-若以ξ记事件A 发生的次数,则ξ为一随机变量,且其可能取值为n ,,2,1,0 ,其对应的概率由二项分布给出:{}k n kk n p p C k P --==)1(ξ,n k ,,3,2,1,0 =,则称ξ服从参数为)10(,<<p p n 的二项分布,记为),(~p n B ξ。
统计学三大分布与正态分布的关系
统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班摘要:本文首先将介绍2χ分布,t 分布,F 分布与正态分布的定义及基本性质,然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之、1、 三大分布函数[2]1、12χ分布2()n χ分布就是一种连续型随机变量的概率分布。
这个分布就是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它就是由正态分布派生出来的,主要用于列联表检验。
定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,),则称统计量222212n =+X X χ++…X 为服从自由度为n 的2χ分布,记为22~()n χχ、2χ分布的概率密度函数为122210(;),2()200n xn x e x nf x n x --⎧≥⎪⎪=Γ⎨⎪⎪<⎩ 其中伽玛函数1(),0t x x et dt x +∞--Γ=>⎰,2χ分布的密度函数图形就是一个只取非负值的偏态分布,如下图、卡方分布具有如下基本性质:性质1:22(()),(())2E n n D n n χχ==;性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++;性质3:2n χ→∞→时,(n )正态分布; 性质4:设)(~22n αχχ,对给定的实数),10(<<αα称满足条件:αχχαχα==>⎰+∞)(222)()}({n dx x f n P 的点)(2n αχ为)(2n χ分布的水平α的上侧分位数、 简称为上侧α分位数、 对不同的α与n , 分位数的值已经编制成表供查用、2()n χ分布的上α分位数 1、2t 分布t 分布也称为学生分布,就是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置、定义:设2~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/XT Y n=服从自由度为n 的t 分布,记为~()T t n 、t 分布的密度函数为1221()2(;)(1),.()2n n x t x n t n n n π+-+Γ=+-∞<<+∞Γt 分布的密度函数图t 分布具有如下一些性质:性质1:()n f t 就是偶函数,221,()()2t n n f t t e ϕπ-→∞→=;性质2:设)(~n t T α,对给定的实数),10(<<αα 称满足条件;ααα==>⎰+∞)()()}({n tdx x f n t T P 的点)(n t α为)(n t 分布的水平α的上侧分位数、 由密度函数)(x f 的对称性,可得 ).()(1n t n t αα-=-类似地,我们可以给出t 分布的双侧分位数,)()()}(|{|)()(2/2/2/αααα=+=>⎰⎰+∞-∞-n t n t dx x f dx x f n t T P 显然有.2)}({;2)}({2/2/αααα=-<=>n t T P n t T P对不同的α与n , t 分布的双侧分位数可从附表查得、t 分布的上α分位数 1、3F 分布F 分布就是随机变量的另一种重要的小样本分布,应用也相当广泛、 它可用来检验两个总体的方差就是否相等,多个总体的均值就是否相等、 F 分布还就是方差分析与正交设计的理论基础、定义:设22~(),~()X n Y m χχ,,X Y 相互独立,令则称统计量//X nF Y m=服从为第一自由度为n ,第二自由度为m 的F 分布、F 分布的密度函数图F 分布具有如下一些性质:性质1:若~(,),1/~(,)F F n m F F m n 则; 性质2:若)(~n t X ,则2~(1,)X F n ; 性质3:设),(~m n F F α,对给定的实数),10(<<αα称满足条件;ααα==>⎰+∞),()()},({m n F dx x f m n F F P的点),(m n F α为),(m n F 分布的水平α的上侧分位数、F分布的上α分位数F 分布的上侧分位数的可自附表查得、性质4:.),(1),(1m n F n m F αα-=此式常常用来求F 分布表中没有列出的某些上侧分位数、 1、4正态分布正态分布就是数理统计中的一种重要的理论分布 ,就是许多统计方法的理论基础、 高斯(Gauss)在研究误差理论时首先用正态分布来刻画误差的分布,所以正态分布又称为高斯分布、 正态分布有两个参数,μ与σ,决定了正态分布的位置与形态、 为了应用方便,常将一般的正态变量X 通过u 变换转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布N (0,1)、 正态分布的密度函数与分布函数若连续型随机变量X 具有概率密度()f x 为22()21(),,2x f x ex μσπσ--=-∞<<+∞其中,(0)μσσ>为常数,则称X 服从参数为μσ,的正态分布,记为2~()X N μσ,、正态分布的密度函数图特征1:正态曲线(normal curve)在横轴上方均数处最高; 特征2:正态分布以均数为中心,左右对称;特征3:正态分布有两个参数,即均数μ与标准差σ、 μ就是位置参数,σ固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动、 σ就是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭、 通常用2N μσ(,)表示均数为μ,方差为2σ的正态分布、 用N (0,1)表示标准正态分布、 特征4:正态曲线下面积的分布有一定规律。
统计学 三大分布-经典案例全集
结论:当n<<N(n<=0.05N)超几何分布→二项分布
0.6
0.5
0.4
0.3
0.2
0.1
0
1
2
3
4
0.5
0.45
0.4
0.35
0.3
超几何分布 0.25 二项分布 0.2
0.15
0.1
0.05
0
1
2
3
4
超几何分布 二项分布
10=3次+7正,任取3件, 有放回 无放回
100=30次+70正,任取3件, 有放回 无放回
例220 某商店根据过去的销售记录知道某种商品每月的 销售量可以用参数为10的泊松分布来描述 为了以95%以 上的概率保证不脱销 问商店在月底应存多少件该种商品(设 只在月底进货)?大卖场的顾客数n很大,买商品概率P很少/多
解 设该商店每月销售该 商品的件数为X 月底存货为a 则当Xa时就不会脱销 据题 意 要求a使得
泊松分布
0.06
二项正态
0.04
二项泊松分离
0.02
二项正态重合
0
1 4 7 10 13 16 19 22 25 28 31
二项分布→泊松分布/正态分布 n=100,p=0.2,np=20
0.12
0.1
N=2000产品
次品NA=400
0.08 二项分布
0.06
泊松分布
二项正态 0.04
二项泊松分离
理论基础
数据:N=总体个数,N1=总体中A的个数, n=样本个数,k=样本中A的个数;
逼近关系:
N件产品,其中N1件次品 n<=0.05NN件产品,次品率N1/N
概率习题
1. 设A, B, C 为三个事件, 则这三个事件恰好有一个发生可表示为 . 则这三个事件恰好有两个发生可表示为 .2. 已知()()0.5,0.6P A P B ==,()0.8P B A =,则()P A B ⋃= .3. 已知()()0.5,0.6P A P B ==, 且事件A, B 相互独立,则()P AB = .4.假设()0.4P A =,()0.7P A B = ,那么 (1)若A 与B 互不相容,则()P B =___ _ _;(2)若A 与B 相互独立,则()______P B =,()|P A B = ,()P AB = .5.若,A B 相互独立,且()()0.5P A P B ==,则 ()P A B = ___ _.6.已知5.0)(=A P ,6.0)(=B P ,8.0)(=A B P ,则=-)(A B P 。
7设事件A 与B 为对立事件,且P (A )>0,P (B )>0,则下列结论正确的是( )。
(A )P (A|B )=P (A ); (B )P (A|B )=0;(C )P (A|B )>0; (D )P (AB )=P (A )P (B )。
8*.甲乙两人独立地投射飞镖各一次,命中率分别为0.4和0.8,已知靶子被击中,则它是甲射中的概率是( ) (A)25(B) 511(C) 45(D) 139.袋中有2个白球,4个红球,从中任取3个球,则恰好取到1个白球和2个红球的概率为 .10.已知在10只产品中有2只次品,在其中取两次,每次任取一只,作不放回抽样,求下列事件的概率: (1)两只都是正品;(2)第二次取出的是次品.11.设N 件产品中有D 件是不合格品,从这N 件产品中任取2件产品。
则2件都是不合格品的概率为 ,2件中有1件合格品、1件不合格品的概率为 。
12*. 有两只口袋,甲袋中装有3只白球, 2只黑球, 乙袋中装有2只白球, 5只黑球.任选一袋,并从中任取一球,问此球为白球的概率是多少?13.在n 件产品里有m 件次品,从中任取k 件()k n ≤,则其中恰有(),j j k j m ≤≤件次品的概率为 . 14*.有一批零件,其中12从甲厂进货,13从乙厂进货,16从丙厂进货.已知甲、乙、丙三厂的次品率分别为0.020.060.03、、.求这批混合零件的次品率.1. 设随机变量X 的分布列为()23iP X i C ⎛⎫==⋅ ⎪⎝⎭.1,2,3i =,则C = .2*设连续型随机变量ξ的概率密度为()()22,10,x x πϕ⎧⎪+=⎨⎪⎩a x <<+∞其他,且已知()0.5P a b ξ<<=求常数a, b 的值.3.下面分布中,概率密度是偶函数的是( )(A ) 泊松分布 (B )指数分布 (C )(1,1)N (D )(0,4)N4.离散型随机变量X 的分布律为()14kP X k b ⎛⎫== ⎪⎝⎭,1,2,k = , 则未知数b = .5.设随机变量ξ服从泊松分布,且)2()1(===ξξP P ,则(3)P ξ==6.设随机变量X 服从参数为λ的泊松分布,即有()X πλ :(),0,1,2!keP X k k k λλ-=== ,且已知()()12P X P X ===,则λ= ,()2E X= .7.设随机变量()1,4X N ,则其概率密度()f x = . 8.设随机变量X 的概率密度为(),01;0,A x x f x <<⎧=⎨⎩其他,试求:(1) 常数A, (2) 112P X ⎛⎫-<<⎪⎝⎭, (3) 分布函数()X F x .9.设(5,4)X N ,要使()()P X c P X c >=<,则c =___10.设随机变量2(200,20)X N ,已知(0.5)0.6915Φ=,则(190210)____P X <<= 11.设随机变量2(,)X N μσ ,则概率(1)P ξμ≤+ ( ).A. 随μ增大而增大B. 随μ增大而减小C. 随σ增大而增大D. 随σ增大而减小12.每次试验成功的概率为p ()01p <<,则在3次独立重复试验中至少失败一次的概率为( ).(A) ()31P - (B) 31p - (C) ()31p - (D) ()()()322111p p p p p -+-+-13.设随机变量X 有以下分布律,试求随机变量()21Y X =-的分布律.X -1 0 1 2 P0.20.30.10.414.设连续型随机变量X 的概率密度为()8Xx f x ⎧⎪=⎨⎪⎩ 04,x <<其他,则随机变量26Y X =+的概率密度表达式()Yf y = .15.设()0,1X N ,则X Y e =的概率密度函数为 .16.设随机变量2(,)X μσN ,X Y e =,则Y 的概率密度函数为 17.设X 的概率密度函数是()f x ,则21Y X =+的概率密度函数为( )A.()22y fB.()2y fC. 1()22y f - D. 1)2y f -( 18.设有10件产品,其中有两件次品,今从中连取三次,每次任取一件不放回,以X 表示所取得的次品数,试求: (1)X 的分布列; (2)122+=X Y 的分布列。
统计三大分布
根据独立随机变量商的密度公式(3-32),
可以证明(过程从略):(6-13)中的
Tn
概率密度函数为
根据独立随机变量商的密度公式(3-32),可
以证明(过程从略):(6-13)中 Tn 的概率
密度函数为
, x . fn(x)
Γ(
n1 2
)
n
Γ(
n 2
)
1
x2 n
n1 2
(6-14)
另外,t -分布具有以下性质:
变量不小于该数的概率为 . 比如,若记 2-
变量
2 n
的
-上侧分位数为,则满足(见图
6.2).
fn (x)
2 (n)
x
图 6.2
对不太大的n,如
n
60,可用附表3查
2
(n)
的
值,而对较大的n,则可用(6-11)近似计
算
2 (n) n 2n U , (6-12)
其中U 是标准正态分布N(0,1)的 -上侧分位
数,可通过附表2查出.
二、t -分布
定则 自义称由6.2度T为设n nX的Y~XtN/ -n(0分,1)布,Y,(6~记-123作()n)所,Tn 服X~ t与从(n)Y的.独t分-立分布,布是
也称为学生分布,是英国统计学家戈塞特 (Goset,1876-1937)在1908年“Student”
的笔名首次发表的,这个分布在数理统计 中也占有重要的地位.
,则
顺便指出,自由度为1的t -分布也称为柯西
(Cauchy)分布,它以其数学期望和方差
均不存在而闻名(见例4.3).
记t -分布t(n) 的 -上侧分位数为t (n),附表4
给出了不同n和 所对应的t (n) 数值. 另外,
常见统计分布及其特点
附录一常见分布汇总一、二项分布二项分布Binomial Distribution,即重复n次的伯努利试验Bernoulli Experiment,用ξ表示随机试验的结果, 如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率是;二、泊松poisson分布1、概念当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np;通常当n≧10,p≦时,就可以用泊松公式近似得计算;2、特点——期望和方差均为λ;3、应用固定速率出现的事物;——在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均瞬时速率λ或称密度随机且独立地出现时,那么这个事件在单位时间面积或体积内出现的次数或个数就近似地服从泊松分布三、均匀分布uniform设连续型随机变量X的分布函数Fx=x-a/b-a,a≤x≤b则称随机变量X服从a,b上的均匀分布,记为X~Ua,b;四、指数分布Exponential Distribution1、概念2、特点——无记忆性1这种分布表现为均值越小,分布偏斜的越厉害;2无记忆性当s,t≥0时有PT>s+t|T>t=PT>s 即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s 小时的概率相等;3、应用在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果五、正态分布Normal distribution1、概念2、中心极限定理与正态分布说明了正态分布的广泛存在,是统计分析的基础中心极限定理:设从均值为μ、方差为σ^2;有限的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布;3、特点——在总体的随机抽样中广泛存在;4、应用——正态分布是假设检验以及极大似然估计法ML的理论基础定理一:设X1,X2,X3.;;Xn是来自正态总体Nμ,δ2的样本,则有样本均值X~Nμ,δ2/n——总体方差常常未知,用t分布较多六、χ2卡方分布与方差有关chi-square distribution1、概念若n个相互独立的随机变量ξ、ξ、……、ξn ,均服从标准正态分布也称独立同分布于标准正态分布,则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布chi-squaredistribution,其中参数n称为注意假设随机干扰项呈正态分布;因此,卡方分布可以和RSS残差平方和联系起来;用RSS/δ2,所得的变量就是标准正态分布,就服从卡方分布;2、卡方分布的特点1分布的为自由度 n,记为 E = n;这个容易证明2分布的为2倍的自由度2n,记为 D = 2n;3如果互相独立,则:独立可加减服从分布,自由度;服从分布,自由度为3、图形特点4、应用定理二,设X1,X2,X3.;;Xn是来自正态总体Nμ,δ2的样本,则有样本均值X~Nμ,δ2/n1正态分布以及卡方分布是F检验的基础;大量的检验用到了F检验:F检验、三大检验;七、t学生分布用样本方差s来标准化——Student'st-distribution1、概念适用于δ2未知理解把样本标准正态化的U变换前提是方差已知,但总体方差是未知的,所以用样本方差来代替总体方差;根据中心极限定理,抽样服从方差为总体方差除以n 的正态分布;由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布u变换指把变量转换为标准正态分布思考为什么样本方差比总体方差要小因为一个是总体方差,一个是样本均值的方差;不同2、特点1与标准正态分布曲线相比,自由度v 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v 愈大,t 分布曲线愈接近正态分布曲线,当自由度v=∞时,t 分布曲线为标准正态分布曲线;定理三:设X1,X2,X3.;;Xn 是来自正态总体N μ,δ2的样本,则有样本均值X~N μ,δ2/n,S 为样本方差 )(μ1-n t ~n /S X 注意S 是样本方差;中心极限定理说的是样本均值的方差;八、F 分布F-distribution1、概念F 分布定义为:设X 、Y 为两个独立的随机变量,X 服从自由度为k1的卡方分布,Y 服从自由度为k2的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布2、特点1它是一种非对称分布;2它有两个自由度,即n1 -1和n2-1,相应的分布记为F n1 –1, n2-1, n1 –1通常称为分子自由度, n2-1通常称为分母自由度;3F 分布是一个以自由度和为参数的分布族,不同的自由度决定了F 分布的形状;4F 分布的性质:5残差平方和之比通常与F分布有关;九、逻辑分布logistic分类评定模型——最早应用最广的离散选择模型1、概念2、特点用作增长曲线并为二进制响应建模;在生物统计和经济领域使用;Logistic 分布由尺度和位置参数描述;Logistic 分布没有形状参数,也就是说其概率密度函数只有一个形状;下列图形显示了不同参数值对 Logistic 分布的效应;尺度参数的效应位置参数的效应Logistic 分布的形状与正态分布的形状相似,但 Logistic 分布的尾部更长;十、伽马分布1、概念——伽玛分布Gamma Distribution是统计学的一种连续概率函数;Gamma分布中的参数α称为形状参数shape parameter,β称为scale parameter;假设随机变量X为等到第α件事发生所需之等候时间, 密度函数为特征函数为伽马分布的可加性当两随机变量服从Gamma分布,且单位时间内频率相同时,Gamma数学表达式若随机变量X具有概率密度其中α>0,β>0,则称随机变量X服从参数α,β的伽马分布,记作Gα,β.九、extreme value distribution 极值分布十、DF分布与ADF分布——用于时间序列平稳性的单位根检验;八、pareto分布十、weibull分布。
三大分布及构造原理
三大分布及构造原理在自然界中,存在着很多种类的分布规律,其中最常见的就是三大分布。
它们分别是均匀分布、正态分布和偏态分布。
均匀分布是指在一定范围内,各个数值的出现频率基本相同,没有明显的集中倾向。
可以用一个例子来说明,假设有一个果园,里面种植了100棵苹果树,每棵树上结出的苹果数量基本相同,这就是均匀分布。
均匀分布在很多领域都有应用,比如随机数生成、样本选择等。
正态分布是指在一定范围内,数值的出现频率呈现出钟形曲线的分布规律。
这个分布规律在自然界中非常常见,比如人的身高、体重等。
正态分布有一个重要的特点,就是均值、中位数和众数都是相等的,这意味着大部分的数据都集中在均值附近,而离均值越远的数据出现的概率越低。
偏态分布是指在一定范围内,数值的出现频率呈现出一侧高峰或两侧高峰的分布规律。
这种分布在自然界中也很常见,比如人的收入分布、物种的数量分布等。
偏态分布有两种情况,一种是正偏态分布,即右侧高峰,另一种是负偏态分布,即左侧高峰。
偏态分布的出现原因可能是由于外部环境的影响,比如资源分配的不均衡等。
这三种分布规律的存在,可以解释很多自然现象。
同时,它们也是统计学中的重要概念,可以用来描述和分析数据。
在实际应用中,我们可以根据不同的场景选择合适的分布模型,从而更好地理解和解释数据。
对于分析师来说,掌握这些分布规律的构造原理,可以帮助他们更准确地进行数据分析和预测,为决策提供科学依据。
三大分布及其构造原理是统计学中非常重要的概念,它们描述了自然界中的一些普遍规律。
通过研究和应用这些分布规律,我们可以更好地理解和解释数据,为科学研究和决策提供有力支持。
在实际应用中,我们应该根据具体情况选择合适的分布模型,并结合实际情况进行数据分析和预测。
三种分布
1.分布若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution),其中参数n称为自由度,正如正态分布中均值或方差不同就是另一个正态分布一样,自由度不同就是另一个分布。
记为或者卡方分布是由正态分布构造而成的一个新的分布,当自由度n很大时,分布近似为正态分布。
对于任意正整数k, 自由度为k的卡方分布是一个随机变量X的机率分布。
[1]2.特点概率密度函数其中,是伽玛函数。
期望和方差分布的均值为自由度n,记为E() = n。
分布的方差为2倍的自由度(2n),记为D() = 2n。
3. 性质1)分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数n 的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1.2) 分布的均值与方差可以看出,随着自由度n的增大,χ2分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。
3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
4) 若互相独立,则:服从分布,自由度为;服从分布,自由度为3概率表分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在χ2分布中得对每个分布定制相应的概率值,这通过χ2分布表中列出不同的自由度来表示,在χ2分布表中还需要如标准正态分布表中给出不同P 值一样,列出概率值,只不过这里的概率值是χ2值以上χ2分布曲线以下的概率。
由于χ2分布概率表中要列出很多χ2分布的概率值,所以χ2分布中所给出的P 值就不象标准正态分布中那样给出了400个不同的P 值,而只给出了有代表性的13个值,因此χ2分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。
查χ2分布概率表时,按自由度及相应的概率去找到对应的χ2值。
统计学三大分布的应用
统计学三大分布的应用
统计学三大分布的应用着实多,这三大分布是正态分布、`t`分布
和χ2分布,在其各自领域都扮演着十分重要的角色。
首先正态分布可以用来描述很多自然事物,比如人体身高,体重,智力测试等等,它也是描述数据量很大的连续型变量,例如说回报率
等等,也可以用来作抽样采集,比如实施一个全国性的抽样调查,可
以用正态分布来对所有可能的值,一路分布一路抽样,进行百分比抽样。
`t`分布的应用也相当广泛,它和正态分布很相似,但它的尾部更
加隆起,所以会更集中在中间,它主要用于描述样本数量较小、但又
有很多衡量指标的情况,比如实验数据或者是调查数据,这样可以让
每一个样本数据都能有很好的效果,而不会产生太多偏差。
χ2分布在统计学上最常见的应用之一就是通过定性预测进行验证,它可以用来测量两个独立事件之间的相关性,也可以用来检验某一用
例的假设是否正确,比如说,当你想检验一个癌症患者是否会改善的
时候,你可以使用一个χ2分布来计算出变化的概率,看看改善的可
能性有多大。
另外,χ2分布也可以用来进行多元统计分析,其实就是
对多个变量之间的关系进行分析,比如说他们之间存在着多大的相关性。
总而言之,统计学三大分布都很重要,他们都有各自不同的应用
场景,并且有多种方式可以用来分析数据,比如简单的相关性分析,
多元统计分析,模型检验等等。
希望这些信息能够帮助大家更好的理
解这三大分布的应用,以充分发挥他们的优势。
概率论三大分布
概率论三大分布
概率论中,三大分布指的是正态分布、泊松分布和指数分布。
这些分布都有自己独特的性质和应用。
正态分布是一种连续分布,也被称为高斯分布。
它是自然界中最常见的分布之一,例如人类身高、智力测试分数和环境因素等。
正态分布的特点是呈钟形曲线,它的中心是对称的,平均值和标准差可以用来描述它的形状。
泊松分布是一种离散分布,它通常用于描述事件发生的次数。
例如,在一段时间内到达某个地点的车辆数量或在一天内接收到的电子邮件数量。
泊松分布的特点是事件的发生是独立的,且所有事件发生的概率相等。
指数分布是一种连续分布,它通常用于描述时间间隔或持续时间。
例如,两个人之间的通话时间或两次地震之间的时间间隔。
指数分布的特点是它的概率密度函数呈指数形式衰减,即随着时间的增加,事件发生的概率逐渐减少。
这三种分布在统计学和数据分析中都有广泛的应用,特别是在模型构建和预测分析中。
因此,熟悉它们的性质和应用是非常重要的。
- 1 -。
三大分布及正态总体统计量的分布
泊松分布在统计学中的应用
01
在计数数据分析和可靠性工程中,泊松分布在预测和解释随机 事件发生的频率方面非常有用。
02
在生物统计学中,泊松分布用于描述遗传变异和基因突变的频
率。
在物理学中,泊松分布用于描述放射性衰变和粒子碰撞的次数。
03
泊松分布的参数
λ
事件的平均发生率,决定了泊 松分布的形状和规模。
p
每次试验成功的概率,是一 个0到1之间的实数。
k
成功的次数,是一个0到n之 间的非负整数。
04
正态总体统计量的分布
样本均值的分布
1
样本均值是总体均值的无偏估计,其分布近似于 正态分布,当样本量足够大时,样本均值的分布具有对称性,即均值点是其对称 轴,标准差越小,分布越集中,对称性越好。
3
样本均值的标准误是衡量样本均值与总体均值差 异的指标,其计算公式为标准差除以样本量的平 方根。
样本方差的分布
01
样本方差是总体方差的估计量,其分布并不服从正 态分布,而是卡方分布。
02
样本方差的大小与样本量有关,样本量越大,方差 越小;样本量越小,方差越大。
03
样本方差的自由度等于样本量减去1。
二项分布在统计学中的应用
01
可靠性分析
在可靠性工程中,二项分布用于 描述产品在多次试验中失败的次 数。
遗传学
02
03
统计学
在遗传学中,二项分布用于描述 在n次独立重复的遗传试验中某 基因出现的次数。
在统计学中,二项分布用于描述 在n次独立重复的伯努利试验中 成功的次数。
二项分布的参数
n
试验次数,是一个非负整数 。
正态分布的性质
三大抽样分布的定义及应用
三大抽样分布的定义及应用三大抽样分布是指正态分布、t分布和卡方分布。
它们在统计学中具有重要的应用,并且广泛地被用于估计和推断总体参数。
正态分布是指具有钟形曲线的连续概率分布,其概率密度函数的形状由均值和标准差决定。
在实际应用中,正态分布广泛用于描述许多自然现象,例如人的智力分布、心脏跳动的间隔时间等等。
对于大样本量的情况下,根据中心极限定理,样本均值的分布可以近似服从正态分布。
因此,正态分布在统计推断中起到了至关重要的作用,例如用于构建置信区间、假设检验、回归分析等。
t分布是由英国统计学家威廉·戴韦提出的,是用来处理小样本量情况下的统计推断问题的一种概率分布。
t分布与正态分布相似,但是其概率密度函数的形状更加平坦,有更宽的尾部。
t分布的自由度是影响其形状的一个参数,自由度越小,尾部越厚重。
在小样本量的情况下,使用t分布进行统计推断可以更准确地估计总体参数。
例如,当样本量较小时,使用t分布来计算置信区间或进行假设检验,可以避免过度自信导致错误的推断结果。
卡方分布是由皮尔逊提出的,是应用在统计推断中的一种概率分布。
卡方分布常用于分析分类数据的相关性以及拟合度。
在这两个统计问题中,卡方分布提供了一个用于检验观察值与期望值之间的差异程度的方法。
卡方分布的自由度取决于数据的维度。
在统计推断中,卡方分布被广泛用于拟合度检验,例如用于检验样本的观察频数与理论频数是否有显著差异。
正态分布、t分布和卡方分布的应用在各个领域和学科中都非常广泛。
在医学研究中,这些分布被用于分析临床试验的数据,进行数据建模以及推断总体参数。
在市场研究中,这些分布被用于对市场数据进行概率分析和预测。
在财务管理中,这些分布被用于分析股价的波动性和风险评估。
在工程领域中,这些分布被用于分析产品的可靠性和质量控制。
总之,正态分布、t分布和卡方分布是统计学中的三大抽样分布,它们在统计推断中具有重要的应用价值。
通过使用这些分布进行数据分析和推断,我们可以准确地估计总体参数,进行假设检验,以及进行优化和决策制定等重要统计任务。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
申请大学学士学位论文大学学士学位论文统计学三大分布与正态分布的差异年级专业:学生:指导教师:统计学三大分布与正态分布的差异中文摘要统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策者提供依据和参考。
它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。
而对数据的分析过程中就需要利用到数据的分布来研究分类。
在实际遇到的许多随机现象都服从或近似服从正态分布。
而由正态分布构造的三大分布在实际中有广泛的应用,因为这三大分布不仅有明确的背景,而且其抽样分布的密度函数有明显表达式,研究三大分布与正态分布有助于研究实际事例,比如经济安全与金融保险领域、人口统计等。
本文讨论了三大分布与正态分布,并将它们之间的密度函数进行比较说明.第二章介绍了正态分布的定义、性质,三大分布的定义、性质。
第三章介绍了正态分布与三大分布的密度函数,并将它们之间的密度函数进行比较关键词:正态分布;三大分布;密度函数The Difference between the Three Statistical Distributions andthe Normal DistributionAbstractStatistics is a branch of applied mathematics, the mathematical models are mainly established by the probability and statistics theory based on the collectingthe data, so as to conduct the quantitative analysis, and obtain the correct inference. It is widely used in the subjects, such as physical, social science, industrial and commercial field, and government intelligence decision. The process of the data analysis will need to use the data distributions to study.In practice, many random phenomena are obedient for the normal distributions, or approximately. And the three statistical distributions structured by the normal distributions have extensive applications, because these three distributions is explicitly background, and the sampling distribution density function have obvious expressions. Research on the distributions and normal distributions is useful for the study of economic security and financial insurance fields, population statistics, etc.This paper discusses the three statistical distributions and normal distributions, their density functions are compared.The second chapter presents the definition of the normal distribution, the distribution of nature, three definitions and properties.The third chapter covers a normal distribution and the density functions of the three distributions, and then the density functions are compared. Keywords: the normal distribution; Three distribution; Density function目录中文摘要 (2)英文摘要 (2)1 绪论 (5)1.1 问题的提出 (5)1.2 国外研究现状 (5)1.3 本文的主要工作 (6)2 基础知识介绍 (7)2.1 正态分布 (7)2.2 三大统计分布 (8)3 三大分布与正态分布的比较 (12)3.1 三大分布与正态分布的密度函数 (12)3.2 三大分布与正态分布的密度函数比较 (12)3.3 本章小结 (16)4 进一步工作 (16)参考文献 (17)致 (17)1 绪论统计学,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。
18世纪末至19世纪末是统计学的发展时期。
在这时期,各种学派的学术观点已经形成,并且形成了两主要学派,即数理统计学派和社会统计学派。
统计分布分为离散型分布和连续型分布。
正态分布又叫高斯分布,最早由A.棣莫弗在求二项分布的渐近公式中得到。
C.F.高斯在研究测量误差时从另一个角度导出了它。
P.S.拉普拉斯和高斯研究了它的性质。
而三大分布是基于正态分布的基础上提出来的。
统计学被广泛应用在各个领域中,本章第一节阐述统计学的实际背景知识;第二节简述近些年的国外研究现状;第三节说明本文的主要研究工作.1.1 问题的提出取得总体的样本后,通常是借助样本的统计量对未知的总体分布进行推断,为此须进一步确定相应的统计量所服从的分布,常用的统计分布包括正态分布,2()n分布,t分布,F分布,所以我们要准确的分类就必须先弄清楚这四种分类之间的相同点及不同点,所以本论文的目的就是详细阐述四种分布的差异。
1.2 国外研究现状现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。
数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。
在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。
在20世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。
随着社会、经济和科学技术的发展,到今天,统计的畴已覆盖了社会生活的一切领域,几乎无所不包,成为通用的方法论科学。
它被广泛用于研究社会和自然界的各个方面,并发展成为有着许多分支学科的科学,比如经济统计学,管理统计学,卫生统计学等。
就最近几年来看,国家连续资助了一系列涉及统计学及其应用的重大科研项目,其中包括数学和计算机在癌症生物学中的应用、振荡积分学与高阶schdodinger方程的L_p-L_q估计、卫生统计学中t检验应用的几点注记、宏观经济统计数据的国际可比性研究等。
国际上已对统计学的应用进行研究,例如在医学方面的Microscintigraphy with high resolution collimators and radio graphicdetectors,在物理学方面的Determination of grain size distributions in thin films等。
1.3本文的主要工作基于以上的论述,本文的主要研究工作为:首先详细介绍正态分布以及三大分布的定义、性质以及它们的密度函数,然后利用中心极限定理证明2()nχ分布的极限分布是正态分布,然后用两种方法(Stirling和特征函数)证明t分布的极限分布也是正态分布,最后利用中心极限定理证明F分布当n无穷大的时候接近正态分布,从而得出证明的结论,还在进一步的工作中可以继续证明2()nχ分布的密度函数与正态分布的密度函数差值的绝对值会小于某个具体的数字,也可以进一步研究F分布当m和n都不趋于无穷大的时候是否还是接近于正态分布,这就是本文研究的主要工作。
2 基础知识介绍2.1 正态分布正态分布(normal distribution )是数理统计中的一种重要的理论分布 ,是许多统计方法的理论基础。
正态分布有两个参数,μ和σ,决定了正态分布的位置和形态。
为了应用方便,常将一般的正态变量X 通过u 变换转化成标准正态变量u ,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布N (0,1)(standard normal distribution ),亦称u 分布。
定义:若X 1,X 2,……,X n 相互独立,X i ~N(μi ,2i σ),则22111~()n n ni i i i i i i i i a X N a a μσ===∑∑∑,特别地,若X 1,X 2,……,X n ..~i i d 2(,)N μσ则211~(,)n i i X X N n n σμ==∑ ()~(0,1)n X N μ-图1:标准正态分布的密度函数图特征1:正态曲线(normal curve )在横轴上方均数处最高。
特征2:正态分布以均数为中心,左右对称。
特征3:正态分布有两个参数,即均数μ和标准差σ。
μ是位置参数,σ固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动。
σ是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭。
通常用N~(μ,σ2)表示均数为μ,方差为σ2的正态分布。
用N (0,1)表示标准正态分布。
特征4:正态曲线下面积的分布有一定规律。
实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。
正态曲线下一定区间的面积可以通过标准正态分布函数表求得。
对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。
2.2 三大统计分布一、2()n χ分布(n 为自由度)2()n χ分布是一种连续型随机变量的概率分布。
这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。