常用统计分布
63常用统计量的分布
§6.3常用统计量的分布一、样本均值的分布1、单个正态总体下的样本均值的分布2、两个正态总体下的样本均值的分布3、非正态总体下的样本均值的近似分布二、-分布1、分布定义2、分布的性质3、分布的典型模式4、分布的上α分位点2χ2χ2χ2χ2χ三、t-分布1、t 分布的定义2、t(n)的性质3、t(n)的典型模式4、t(n)分布的上α分位点四、F-分布1、F分布的定义2、F分布的性质3、F分布的典型模式4、F分布的上α分位点五、正态总体样本均值与样本方差的分布1、单个正态总体下样本均值与样本方差的分布2、两个正态总体下样本均值差与样本方差比的分布)2.3(1)(1)1()(1)(1)1()(,,,2,1,)(,)(,,,1)1.3(),(~11,,,,),,(1.31222121112212121212n n nX D n X n D X D n nX E n X n E X E n i X D X E X X X X nN X n X nX n X X X X X N X n i i n i i n i i n i i i i n ni i ni i n σσµµσµσµσµσµ=⋅====⋅========∑∑∑∑∑∑======于是有相互独立同分布,故与:由于注的正态分布,即,方差为服从均值为值的一个样本,则样本均为来自服从正态总体设总体定理本均值的分布、单个正态总体下的样一、样本均值的分布"""这点处。
望取值几乎集中在数学期时且当高的集中程度远比总体要的取值于即倍的方差的的方差却只是但有相同的数学期望与由上述可知注µµX n X nX X X X ,,,1,,:2∞→212(1,0.2),,,,,{0.9 1.1}0.95?n X N n X X X X P X n ≤<≥"例 设总体服从正态分布从中抽取容量为的样本欲使样本均值满足不等式试求样本容量最小应为取多大2110.2:~(1,)1.110.910.95{0.9 1.1}0.20.2()()2()1222ni i X X N nnP X n n n n n==⎛⎞⎛⎞−−≤≤<=Φ−Φ⎜⎟⎜⎟⎝⎠⎝⎠=Φ−Φ−=Φ−∑解由题设知故0.951()0.975; 1.96,15.3664222,16n n n n +Φ≥=≥≥即查表得故因此样本容量最少应取。
常用统计分布
4
F分布的上侧分位数 Fα ( n1 , n2 )
对于给定的 α, 0 < α < 1, 称满足条件 P { F > Fα ( n1 , n2 )} = α
的点 Fα ( n1 , n2 ) 为 F ( n1 , n2 ) 分布的上 α 分位数 .
− uα
2.t分布的上侧分位数 t α ( n )
对于给定的 α, 0 < α < 1, 称满足条件 P{t > t α ( n)} = α 的点 t α ( n) 为 t ( n) 分布的上 α 分位数(或分位点).
可以通过查表求 得上α分位数的值 .
由分布的对称性知 t1−α ( n) = − tα ( n).
F分布的概率密度曲线如 图
F分布有以下性质
(1) 若F ~ F ( n1 , n2 ),
1 则 ~ F ( n2 , n1 ). F n2 E(F) = , (n2 > 2), n2 − 2
(2)
演示
2 2n2 (n1 + n2 − 2) D(F) = , (n2 > 4) 2 n1(n2 − 2) (n2 − 4)
2 2
自由度 : 指χ
2 2 2 = X 12 + X 2 + L + X n 中右端包含独立
变量的个数 .
5 定理 .4 χ (n)分布的概率密度为
2
n x −1 − 1 x2 e 2 x>0 n 2 n p( x ) = 2 Γ( ) 2 0 其它 χ 2 (n)分布的概率密度曲线如图 .
α
对于不同的 α , n, 可以通过查表求 得上α 分位点的值 .
[课件]概率与统计 6.2 常用统计分布
2 Y = ∑ Xi 2 i =n +1 1
电子科技大学
n +n2 1
常用统计分布
则
Y +Y = ∑ 1 2
n +n2 1 i =1
2 Xi
相互独立, 且Xi , i=1,2,…,n1+n2 相互独立,Xi~N(0,1), 从而 Y1+Y2~ χ2 (n1+n2).
电子科技大学
常用统计分布
总体, 总体,个体 简单随机样本 正态总体的 2个抽样定理 个抽样定理
统计量
样本均值 样本方差 样本矩(样本相关系数) 样本矩(样本相关系数)
统计量的分布
χ2分布
t 分布 F分布 分布
分位数 结构定理
电子科技大学
常用统计分布
设随机变量X 服从正态分布N(0,1), 对给 例6.2.1 设随机变量 服从正态分布 定的α(0<α<1),数uα满足 , 定的 , P{X > uα} = α
电子科技大学
T~t(n) ~
又称学生氏分布--第一个研究者以 又称学生氏分布--第一个研究者以Student --第一个研究者
常用统计分布
定理6.2.2 设随机变量 Y 相互独立 X 设随机变量X, 相互独立, 定理 ~N(0,1),Y~ χ2(n),则 , ~ ,
X T= ~ t(n) Yn
即随机变量 T 服从自由度为 n 的 t 分布 服从自由度为 分布.
电子科技大学
常用统计分布
χ2分布的三条性质: 分布的三条性质 三条性质:
性质1. 数字特征 数字特征) 性质 (数字特征 设 χ2 ~ χ2(n) ,则有 E( χ2 ) = n , 证明 D( χ2 ) = 2n
13种常见的统计分布
为常数,故首选威布尔分布
理解
是指数分布的一种推广形式
在药学和生存率研究中,常出现一些变量不符合正态、对
数正态及其它常用模型分布
例如能力的高低,学生成绩的好坏等都属于正态分布
集中性:正态曲线的高峰位于正中央,即均数所在的位置
理解
对称性:正态曲线以均数为中心,左右对称,曲线两端永远 不与横轴相交 均匀变动性:正态曲线由均数所在处开始,分别向左右两侧 逐渐均匀下降 正态分布有两个参数,即均数μ 和标准差σ,可记作N(μ ,σ)
7
属性
Chi-square Distribution
连续型分布 检验资料的实际频数与理论频数是否相等
若n个相互独立的随机变量ξ ₁、ξ ₂、……、ξ n ,均服从标准
理解
正态分布则这 n 个服从标准正态分布的随机变量的平方和构 成一新的随机变量,其分布规律称为卡方分布 卡方分布是由正态分布构造而成的一个新的分布,当自由度 n很大时, 分布近似为正态分布
9
属性
F分布 F Distribution
连续型分布 用于方差的齐性检验和方差分析
理解
10
属性
Γ分布 Γ Distrቤተ መጻሕፍቲ ባይዱbution or Gamma Distribution
连续型分布 正偏态分布,常用于正偏态分布的拟合
11
属性
圆形分布 Circular Distribution
连续型分布 用于描述以方向、位置、周期性(环形)时间、角度等为测度
单位的数字特征
应用
医学领域内一些现象是以方向或时间度量,具有周期性特点, 如某疾病在一年内各月份的发生数、胎儿在一昼夜间各时点 分娩的频度 有些数据本身就是以角度来表示:如脑电阴图的上升角,气 象环境的风向玫瑰图 这些数据不能用通常的均数、标准差描述
4.3常用的统计分布
一、分位数 定义4.4 给定随机变量X,对给定的实数α, ( 0 1), 如果实数 F 满足条件 P{ X F } 则称 F 为X的分布的 水平α的上侧分位数. P X F 1 P{ X F }
X 当X是连续型随机变量时, ~ f ( x )
X i ~ N 0, 0.52 , 解
7
i 1
X 1 , X 2 ,..., X 7 相互独立,
Xi 0 ~ N ( 0, 1 ) 0.5
X1 0 X 2 0 X7 0 也相互独立. , , ..., 0.5 0.5 0.5 7 7 X 0 2 2 2 Xi i 4 ~ (7) i 1 i 1 0.5
的F分布, 记为 X ~ F ( m, n )
m 称为第一自由度, n 称为第二自由度.
X ~ F ( m , n ), 即 X ~ f ( x; m, n)
1 m m m , n n n x 2 2 f ( x; m , n) 0,
给定的
2
2 1
( n ) ( n)
2
2
( n )
2
2
2 分布 可用正态分布近似. 当n较大时,
当n≤45时, 分布 的上侧分位数 有表可查.
2
例 设 X ~ 2 (13),
P282
2 0.05 (13) 22.362 P X 1 0.05, 1
1 推论 若随机变量 X ~ F ( m, n ), 则 ~ F ( n, m ) X
3. F分布的 水平α的上侧分位数
常用的统计分布
(419)
则Z的密度函数为
f
(x;
m,
n)
1 B(m,
n)
(m)(m nn
m
x) 2
1(1
m
n
x) 1(mn) 2
x0
(420)
22
其中
B(
p,
q)
1
0x
p1(1
x)q1dx
(
p
0,
q
0)
是
B(贝塔)函数
如果随机变量X的密度函数由(420)给出 则称X服从第
一自由度为m 第二自由度为n的F分布 记作X~F(m n)
n
22
1 ( n )
n 1 1 x
x2 e 2 ,
2
(x 0)
则称X服从以n为自由度的2分布 记作X~2(n)
说明
根据命题41 若X1 X2 Xn是n个相互独立的标准 正态随机变量 则
X
X12
X
2 2
X
2 n
~
2(n)
9
定义46(2分布)
如果随机变量X的密度函数为
2 (x; n)
n
22
n)
1 B(1 ,
n)
1
(1
x2 )
n1 2
x
nn
22
则称X服从自由度为n的t分布 记作X~t(n)
当自由度n很大时 t分布接
近于标准正态分布 这是因为
lim(1
x2
)
n1 2
e
1 x2 2
n n
19
t分布的分位数
附表5对于一些充分小的值给出了t分布的水平的上
侧分位数t(n)之值 当X~t(n)时 有
常见统计分布及其特点
常见统计分布及其特点统计分布是描述数据集合中数据分布情况的一种方法。
统计学中存在着很多常见的统计分布,每个分布都具有其独特的特点和应用领域。
以下是一些常见的统计分布及其特点的介绍。
1. 正态分布(Normal Distribution)正态分布是最常见的分布之一,也被称为高斯分布。
它的特点是呈钟形曲线,对称分布,均值和标准差完全决定了其形状。
正态分布有广泛的应用,尤其在自然科学和社会科学中。
2. 二项分布(Binomial Distribution)二项分布是指在一系列独立的试验中,每次试验只有两个可能的结果:成功或失败。
每次试验的成功概率由固定的参数p确定。
二项分布的特点是具有两个参数n和p,其中n为试验的次数,p为每次试验的成功概率。
二项分布在生物学、医学、工程等领域中经常被使用。
3. 泊松分布(Poisson Distribution)泊松分布用于描述单位时间内事件发生的次数的概率分布。
这个分布有一个参数λ,表示单位时间内事件的平均发生率。
泊松分布的特点是时间间隔内事件的数量是不确定的,但平均发生率λ是已知的。
泊松分布在物理学、生物学、通信技术等领域中被广泛应用。
4. 均匀分布(Uniform Distribution)均匀分布是指在一个有限的区间内,每个数出现的概率相等。
均匀分布的特点是概率密度函数在区间内是常数。
均匀分布在模拟、随机数生成等领域中经常被使用。
5. 指数分布(Exponential Distribution)指数分布用于描述一个事件发生之间的时间间隔的概率分布。
指数分布的特点是具有一个参数λ,表示事件的平均发生率。
指数分布在可靠性工程、生物学、等领域中被广泛应用。
6. t分布(t Distribution)t分布是用于小样本情况下的假设检验和置信区间估计的重要分布。
与正态分布相比,t分布的尾部更厚,更适合于小样本情况的推断。
t分布在统计学中常用于处理样本容量较小的情况。
7. F分布(F Distribution)F分布是用于分组之间方差的比较的一种分布。
统计学分布类型
统计学分布类型
统计学分布是根据数据分析所有可能的可能的量的范围,把它们分类成多个分组,并建立相应的概率函数,以描述这些变量出现的可能性。
统计学分布由以下几种类型:
1、正态分布:正态分布是最常见的统计学分布,又称钟形曲线。
它具有两个参数:平均值μ和标准差σ,针对一些机器运行正态分布可以用来模拟变量的分布情况;
2、均匀分布:均匀分布是指变量的概率分布在一个给定的范围内是均匀的,它由两个参数:最小值a和最大值b决定;
3、伽马分布:伽马分布又称卡方分布,是描述连续随机变量采样期望值与其标准差之比的分布。
它包含一个参数,即期望值与标准差之比γ;
4、负指数分布:负指数分布也称指数分布,是一个经典的概率分布,它可以解释一系列以负指数或非负指数的累积概率分布,它包含一个参数λ,它是和具体分布有关的常数;
5、卡方分布:卡方分布是一种统计分布,又称伽马分布,是描述连续随机变量采样期望值与其标准差之比的分布。
卡方分布由一个参数ν决定,变量ν是采样期望与标准差之比;。
统计学常用分布
统计学常用分布一、引言在统计学中,分布是描述数据变化规律和概率的重要工具。
不同的数据类型和问题背景需要采用不同的分布来描述。
本篇文章将介绍统计学中常用的几种分布,包括正态分布、二项分布与泊松分布、指数分布与对数正态分布、卡方分布与t分布等。
二、正态分布正态分布是最常见的连续概率分布之一,它在自然现象、工程技术和社会科学等领域都有广泛的应用。
正态分布的曲线呈钟形,数据值集中在均值附近,随着远离均值,概率逐渐减小。
正态分布在统计学中具有重要地位,许多统计方法和模型都以正态分布为基础。
三、二项分布与泊松分布1.二项分布:二项分布是用来描述伯努利试验中的随机事件的概率分布,其中每次试验只有两种可能的结果,并且每次试验都是独立的。
二项分布适用于计数数据,尤其在生物实验和可靠性工程等领域有广泛应用。
2.泊松分布:泊松分布是二项分布在伯努利试验次数趋于无穷时的极限形式,常用于描述单位时间内随机事件的次数。
泊松分布在概率论和统计学中具有重要地位,广泛应用于保险、通信和生物医学等领域。
四、指数分布与对数正态分布1.指数分布:指数分布描述的是随机事件之间的独立间隔时间或者随机变量的概率分布。
指数分布常用于描述寿命测试和等待时间等问题,例如电话呼叫的间隔时间和电子元件的寿命等。
2.对数正态分布:对数正态分布在统计学中用于描述那些其自然对数呈正态分布的随机变量。
许多生物学、经济学和社会科学中的数据都服从对数正态分布,例如人的身高、体重以及股票价格等。
五、卡方分布与t分布1.卡方分布:卡方分布在统计学中主要用于描述离散型概率分布。
卡方分布是通过对两个独立的随机变量进行平方和运算得到的,常用于拟合检验和置信区间的计算。
2.t分布:t分布在统计学中广泛应用于样本数据的参数估计和假设检验。
相比于正态分布,t分布在数据量较小或参数偏离正态性时具有更好的稳定性。
t分布在金融、生物医学和可靠性工程等领域有广泛应用。
六、结论在统计学中,不同的数据类型和问题背景需要采用不同的分布来描述。
概率论 常用统计分布
由中心极限定理得
n
lim P {
n
2 n n
2n
x}
x
lim P{ i 1
n
2 X i n
n
x}
1 2
t2 e 2 dt
即 2分布的极限分布是正态 分布,也即当 n
很大时,
2 n n
2n
2 服从N (0,1), 进而 n N ( n,2n).
Y12
Y22
~ 2 ( 2)
则C1 1 2 , C2 1 4 .
2. t 分布 历史上,正态分布由于其广泛的应用背景 和良好的性质,曾一度被看作是“万能分布”, 在这样的背景下,十九世纪初英国一位年轻 的酿酒化学技师Cosset. WS, 他在酒厂从事试验 数据分析工作,对数据误差有着大量感性的认 识,我们知道在总体均值和方差已知情况下, 样本均值的分布将随样本量 增大而接近正态分布,
n
x
1 2
e dt .
t2
2
2 证 由假设和定义5.6, n X i2 , 其中X 1 , X 2 ,, X n i 1
2 2 2 独立且每个X i ~ N (0,1),因而X1 , X2 ,, X n 独立同分布,
且
E( X i2 ) 1, D( X i2 ) 2 (i 1,2,, n)
(3) T的数字特征
E (T ) 0,
n D(T ) n2
( n 2).
例3 设总体X和Y相互独立, 且都服从N(0,9)
X 1 , X 2 ,, X 9和Y1 ,Y2 ,,Y9来自总体X ,Y的样本,
求统计量T的分布,其中
T Xi /
第3节 常用统计分布(三个常用分布)
例2
设X
~
N
(
,
2
),
Y
2
~
2 (n),且X ,Y相互独立,
试求 T X 的概率分布.
Yn
解 因为X ~ N(, 2),所以 X ~ N(0,1)
又Y
2
~
2 (n),且X ,Y独立,则
X
与Y
2
独立,
由定理得
T (X ) / X ~ t(n) (Y / 2) / n Y n
n
事实上,它们受到一个条件的约束:
Xi nX
i 1
n
i 1
Xi
X
1
n
(
i 1
Xi
nX )
1
0
0.
例1
设X1 ,
X 2 ,
,
X
为
6
来
自
正
态
总
体N
(0,1)的
一
组
样
本,
求C1
,
C
使
2
得
Y C1( X1 X 2 )2 C2( X 3 X4 X5 X6 )2
服 从 2分 布.
解
X1
2
4
则C1 1 2 ,C2 1 4 .
3. t 分布 定义 设 X ~ N (0, 1), Y ~ 2 (n), 且 X , Y
独立,则称随机变量 T X 服从自由度为 n Y /n
的 t 分布, 记为T ~ t(n).
t 分布又称学生氏(Student)分布. t(n) 分布的概率密度函数为
2. 2分布(卡方分布)
定义、设 X1, X 2 ,L , X n 相互独立,同服从 N (0, 1)
常见统计分布及其特点
附录一常见分布汇总一、二项分布二项分布Binomial Distribution,即重复n次的伯努利试验Bernoulli Experiment,用ξ表示随机试验的结果, 如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率是;二、泊松poisson分布1、概念当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np;通常当n≧10,p≦时,就可以用泊松公式近似得计算;2、特点——期望和方差均为λ;3、应用固定速率出现的事物;——在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均瞬时速率λ或称密度随机且独立地出现时,那么这个事件在单位时间面积或体积内出现的次数或个数就近似地服从泊松分布三、均匀分布uniform设连续型随机变量X的分布函数Fx=x-a/b-a,a≤x≤b则称随机变量X服从a,b上的均匀分布,记为X~Ua,b;四、指数分布Exponential Distribution1、概念2、特点——无记忆性1这种分布表现为均值越小,分布偏斜的越厉害;2无记忆性当s,t≥0时有PT>s+t|T>t=PT>s 即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s 小时的概率相等;3、应用在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果五、正态分布Normal distribution1、概念2、中心极限定理与正态分布说明了正态分布的广泛存在,是统计分析的基础中心极限定理:设从均值为μ、方差为σ^2;有限的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布;3、特点——在总体的随机抽样中广泛存在;4、应用——正态分布是假设检验以及极大似然估计法ML的理论基础定理一:设X1,X2,X3.;;Xn是来自正态总体Nμ,δ2的样本,则有样本均值X~Nμ,δ2/n——总体方差常常未知,用t分布较多六、χ2卡方分布与方差有关chi-square distribution1、概念若n个相互独立的随机变量ξ、ξ、……、ξn ,均服从标准正态分布也称独立同分布于标准正态分布,则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布chi-squaredistribution,其中参数n称为注意假设随机干扰项呈正态分布;因此,卡方分布可以和RSS残差平方和联系起来;用RSS/δ2,所得的变量就是标准正态分布,就服从卡方分布;2、卡方分布的特点1分布的为自由度 n,记为 E = n;这个容易证明2分布的为2倍的自由度2n,记为 D = 2n;3如果互相独立,则:独立可加减服从分布,自由度;服从分布,自由度为3、图形特点4、应用定理二,设X1,X2,X3.;;Xn是来自正态总体Nμ,δ2的样本,则有样本均值X~Nμ,δ2/n1正态分布以及卡方分布是F检验的基础;大量的检验用到了F检验:F检验、三大检验;七、t学生分布用样本方差s来标准化——Student'st-distribution1、概念适用于δ2未知理解把样本标准正态化的U变换前提是方差已知,但总体方差是未知的,所以用样本方差来代替总体方差;根据中心极限定理,抽样服从方差为总体方差除以n 的正态分布;由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布u变换指把变量转换为标准正态分布思考为什么样本方差比总体方差要小因为一个是总体方差,一个是样本均值的方差;不同2、特点1与标准正态分布曲线相比,自由度v 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v 愈大,t 分布曲线愈接近正态分布曲线,当自由度v=∞时,t 分布曲线为标准正态分布曲线;定理三:设X1,X2,X3.;;Xn 是来自正态总体N μ,δ2的样本,则有样本均值X~N μ,δ2/n,S 为样本方差 )(μ1-n t ~n /S X 注意S 是样本方差;中心极限定理说的是样本均值的方差;八、F 分布F-distribution1、概念F 分布定义为:设X 、Y 为两个独立的随机变量,X 服从自由度为k1的卡方分布,Y 服从自由度为k2的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布2、特点1它是一种非对称分布;2它有两个自由度,即n1 -1和n2-1,相应的分布记为F n1 –1, n2-1, n1 –1通常称为分子自由度, n2-1通常称为分母自由度;3F 分布是一个以自由度和为参数的分布族,不同的自由度决定了F 分布的形状;4F 分布的性质:5残差平方和之比通常与F分布有关;九、逻辑分布logistic分类评定模型——最早应用最广的离散选择模型1、概念2、特点用作增长曲线并为二进制响应建模;在生物统计和经济领域使用;Logistic 分布由尺度和位置参数描述;Logistic 分布没有形状参数,也就是说其概率密度函数只有一个形状;下列图形显示了不同参数值对 Logistic 分布的效应;尺度参数的效应位置参数的效应Logistic 分布的形状与正态分布的形状相似,但 Logistic 分布的尾部更长;十、伽马分布1、概念——伽玛分布Gamma Distribution是统计学的一种连续概率函数;Gamma分布中的参数α称为形状参数shape parameter,β称为scale parameter;假设随机变量X为等到第α件事发生所需之等候时间, 密度函数为特征函数为伽马分布的可加性当两随机变量服从Gamma分布,且单位时间内频率相同时,Gamma数学表达式若随机变量X具有概率密度其中α>0,β>0,则称随机变量X服从参数α,β的伽马分布,记作Gα,β.九、extreme value distribution 极值分布十、DF分布与ADF分布——用于时间序列平稳性的单位根检验;八、pareto分布十、weibull分布。
常见统计分布及其特点
常见统计分布及其特点常见的统计分布有:正态分布、均匀分布、二项分布、泊松分布、指数分布等。
1.正态分布:正态分布又称为高斯分布或钟形曲线分布,是最为常见的一种分布。
正态分布具有以下特点:-均值和中位数相等,分布的对称轴对称;-在均值处取得最大值,随着离均值的距离增大,分布的概率逐渐减小;-标准差决定了曲线的宽窄,标准差越大,曲线越宽;-68%的数据落在均值的一个标准差范围内,95%的数据落在均值的两个标准差范围内,99.7%的数据落在均值的三个标准差范围内。
2.均匀分布:均匀分布又称为矩形分布,是最简单的分布之一、均匀分布具有以下特点:-在一个有限的区间内,所有取值的概率相等;-分布曲线呈矩形,具有等宽;-在整个区间上积分等于13.二项分布:二项分布描述了在n次独立的重复实验中,成功的次数的分布情况。
二项分布具有以下特点:-每次实验只有两个可能的结果,成功或失败;-实验之间是独立的;-成功的概率和失败的概率保持不变;-成功的次数符合二项分布。
4.泊松分布:泊松分布描述了一个时间段或区域内随机事件发生的次数的分布情况。
泊松分布具有以下特点:-事件在一个固定时间段或区域内按独立的随机过程发生;-事件在一个极短时间段内发生的概率极低,即发生频率很低;-事件的平均发生次数相对较低。
5.指数分布:指数分布描述了连续发生独立随机事件的时间间隔的分布情况。
指数分布具有以下特点:-事件的发生时间间隔是独立的,事件间的时间间隔符合指数分布;-时间间隔的概率密度递减;-指数分布在实际应用中常用于描述等待时间、生命周期等。
这些统计分布常用于描述和分析随机事件的分布情况。
在实际应用中,我们可以根据样本数据的特点,选择合适的统计分布进行建模和分析。
在统计学中,概率分布函数可以帮助我们理解随机事件的分布规律,有助于对数据进行建模、预测和推断。
常用21个统计分布总结
● Bernoulli ( p ) 伯努利分布说明与例:x 为伯努利试验的结果,当试验成功,则x=1,试验失败则x=0。
可以把伯努利试验理解为抛硬币,x=1为出现正面● Binomial ( n, p ) 二项分布(图以p=0.4,n=5为例)说明与例:x 是重复n 次的伯努利试验结果,即x=试验成功的次数,可以理解为抛n 次硬币,正面出现的次数。
P X x p | ()p x 1p ()1x ; x 01 , ; 0p1EXp , Var Xp 1p ()M X t ()1p ()pe t P X x n | p , ()n x ()p x1p ()nxx 012...n , , , , ; 0p 1EX np , Var X np 1p ()M x t ()pe t1p ()[]n● Multinomial ( m, p 1, ..., p n ) 多项分布图略(因为是联合分布的多维分布)说明与例:多项分布是二项分布的推广,二项分布结果只有两个,而多项分布结果可以有多个,比如仍骰子,x1表示n 次试验点数1出现的次数…x6表示点数6出现的次数。
● Geometric ( p ) 几何分布(图以p=0.4为例)说明与例:得到一次成功而进行的伯努利试验次数n ,即前面失败了n-1次,第n 次成功。
比如x 可以理解为抛硬币,出现正面所抛的次数f x 1...x n , , ()m !x 1!...x n !p 1x1...p nxnm !i 1np i x ix i !ÕP X x p | ()p 1p ()x 1 ; x 12... , , ; 0p 1EX1p, Var X1pp 2M X t ()pe t11p ()et, t log 1p ()-● Hypergeometric超几何分布(以N=10,m=5,n=4为例)说明与例:已知N 个总体中有m 个不合格的产品,现在抽取n 个,出现不合格产品的数量。
几种常用统计量的分布
P{
χ2
χ
2 a
(n)
}
f
a2 (n)
x dx a
的点χa 2(n)称为 χ2 分布单侧 分位点或双侧临界值,如图11-5 所示 .
图11-5
几种常用统计量的分布
定义4
设X ~ N ( , 2 ) ,样本方差为S 2,则统计量χ2
(n
1)S 2
2
服从自由度为n
1
的χ 2分布,记作
χ2
n
/ n
几种常用统计量的分布
证明
X ~ N ( , 2 ) ,( X1.,X 2 , ,X n )是来自总体 X 的样本 ,
X
~
N ( , 2 )(i 1,2 ,
,n) ,其线性函数 X
1 n
n i 1
Xi
也服从正态分布,即
E X
E1 n
n i 1
Xi
1n E
n i1
Xi
1 n n
(
EX i i 1,2
n) ,
1 n
1
DX
D n
i 1
Xi
n2
n
D Xi
i 1
1 n2 2 (
n2
n
X1 ,X 2 , X n相互独立) ,
则X ~ N ( , 2 ) ,故 X ~ N (0 ,1) .
n
/ n
几种常用统计量的分布
例1
解
因为总体 X 服从正态分布N 5 ,9 ,所以 X 服从正态分布N (5 ,9 ) ,故
图11-2
几种常用统计量的分布
显然,f x随着n不同而不同,且f x为偶函数 . 当n 时,有
lim f x
大学数学统计篇之数理统计的基本概念——常用统计分布
例1 设 0.05, 求标准正态分布的水平 0.05 的上 侧分位数和双侧分位数.
解 由于
( u0.05 ) 1 0.05 0.95,
查标准正态分布函数值表可得
u0.05 1.645, 而水平 0.05 的双侧分位数为 u0.025 , 它满足: ( u0.025 ) 1 0.025 ቤተ መጻሕፍቲ ባይዱ.975,
正态分布, 故有
t ( n) u , t / 2 ( n) u / 2 .
一般当 n 45 时, t 分布 的位数可用正态近似. ② 设 t ( n ) 为 t ( n) 的上侧 分位数,则
P{T t ( n)} 1 , P {T t ( n)} ,
分布
2
t 分布
F 分布
一、分位数
设随机变量 X 的分布函数为 F ( x ), 对给定的实数
(0 1), 若实数 F 满足不等式
P { X F }
位数. (1)
则称 F 为随机变量 X 的分布的水平为 的上侧分 若实数 T / 2 满足不等式 P{ X T / 2 } 分位数. (2)
, x
(1)
f ( x ) 的图形关于 y 轴对称,且
lim f ( x ) 0 ; x
(2) 即有
当 n 充分大时,t 分布近似于标准正态分布,
1 lim f ( x ) e n 2
t 分布的分位数
2 x 2
,
但 n 较小时,两者相差较大;
(3) 对给定的实数 (0 1), 称满足条件
2 1 2 2
X X X X
2 1 2 2 2 m
几种常见的分布
应用
指数分布经常用于描述可靠性工 程、生存分析和排队理论。
正态混合分布
1 定义
正态混合分布是多个正态分布的混合。
2 特征
正态混合分布的概率密度函数是多个正态分布的线性组合。
3 应用
正态混合分布在统计建模中常用于处理复杂的数据分布。
负二项分布
定义
负二项分布描述了在重复的 独立实验中,达到一定数量 的成功之前的失败次数。
几种常见的分布
统计学中有许多不同的分布。其中包括正态分布、二项分布、泊松分布、均 匀分布、指数分布等多种分布。
正态分布
1
定义
正态分布也被称为高斯分布,是自然界
特征
2
中最常见的分布。
正态分布呈钟形曲线,其均值和方差决
定了曲线的位置和形状。
3
应用
正态分布广泛用于统计学和自然科学领 域,具有许多重要的性质。
特征
负二项分布取决于两个参数, 失败的概率和达到成功所需 的次数。
应用
负二项分布用于模拟撞车次 数、机器失效次数以及其他 计数数据。F分布1 Nhomakorabea定义
F分布是两个独立的卡方分布的比值。
特征
2
F分布具有两个自由度参数,用于描述其
形状和尾部重量。
3
应用
F分布经常用于方差分析、回归分析和统 计推断。
二项分布
定义
二项分布描述在重复的独立实验 中,成功和失败的次数。
特征
二项分布取决于两个参数,试验 的次数和成功的概率。
应用
二项分布用于模拟二分类问题和 风险评估。
泊松分布
定义
泊松分布描述了在给定时间内发生事件的次数。
特征
泊松分布是一种离散分布,其均值和方差相等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章常用统计分布第一节超几何分布超几何分布的数学形式・超几何分布的数学期望和方差・超几何分布的近似第二节泊松分布泊松分布的数学形式•泊松分布的性质、数学期望和方差・泊松分布的近似2第三节卡方分布(分布)2分布的数学形式,彳分布的性质、数学期望和方差•样本方差的抽样分布第四节F分布F分布的数学形式・F分布的性质、数学期望和方差• F分布的近似一、填空1 •对于超几何分布,随着群体的规模逐渐增大,一般当—<()时,可采用二N项分布来近似。
2•泊松分布只有一个参数(),只要知道了这个参数的值,泊松分布就确定了。
3 •卡方分布是一种()型随机变量的概率分布,它是由()分布派生出来的。
4•如果第一自由度k i或第二自由度k2的F分布没有列在表中,但邻近的第一自由度或第二自由度的F分布已列在表中,对于F a( & , k2)的值可以用()插值法得到。
5. ( )分布具有一定程度的反对称性。
6. ( )分布主要用于列联表的检验。
7. ( 分布用于解决连续体中的孤立事件。
& 2分布的图形随着自由度的增加而渐趋()。
9•当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时(可采用二项分布来近似。
10. ()事件是满足泊松分布的。
二、单项选择1 •已知离散性随机变量X服从参数为2=2的泊松分布,则概率P (3;入)=(A 4/3e 2B 3/3e 2C 4/3e 3D 3/3e 32.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时, ( ) 分布可以用二项分布来近似。
2A t 分布B F 分布C 2 分布D 超几何分布3.研究连续体中的孤立事件发生次数的分布,如某时间段内电话机被呼叫的次数的概 率分布,应选择( )。
A 二项分布B 超几何分布C 泊松分布D F 分布 4.对于一个样本容量 n 较大及成功事件概率 p 较小的二项分布,都可以用( )来 近似。
A 二项分布 B 超几何分布 C 泊松分布DF 分布。
5.与 F a ( k 1, k 2)的值等价的是()。
A F 1-a( k 1 ,k 2)BF 1-a (k 2 , k 1)C 1/F a ( k 1, k 2)D 1/F 1-a (k 2 , k 1 )6、只与一个自由度有关的是( )A22分布 B 超几何分布C 泊松分布DF 分布三、多项选择1.属于离散性变量概率分布的是()。
A 二项分布B 超几何分布C 泊松分布D F 分布 2.属于连续性变量的概率分布的是( )。
2A 分布B 超几何分布C 泊松分布D F 分布 3.下列近似计算概率的正确方法是()。
A 用二项分布的概率近似计算超几何分布的概率B 用二项分布的概率近似计算泊松分布的概率C 用泊松分布的概率近似计算超二项分布的概率D 用正态分布的概率近似计算超二项分布的概率E 用正态分布的概率近似计算F 分布的概率6.一般地,用泊松分布近似二项式分布有较好的效果是(24. 2 分布具有的性质是(A 恒为正值 C 反对称性 E 可加性5.F 分布具有的性质是(A 恒为正值 C 反对称性 E 可加性)。
B 非对称性 D 随机变量非负性 )。
B 非对称性 D 随机变量非负性)。
A n/N < 0.1B n》10C p w 0.1D k>30E k2>2四、名词解释1.超几何分布2.泊松分布3.卡方分布4.F 分布五、判断题1.在研究对象为小群体时,二项式分布和超几何分布的基本条件都能得到满足。
()2. 成功次数的期望值入是决定泊松分布的关键因素。
()3.泊松分布的数学期望和方差是相等的。
()4. 在计算F 分布的概率时,只需要知道分子的自由度和分母的自由度两个因素就可以了。
()5. k 个独立标准正态变量的平方和被定义为卡方分布。
()6. 卡方分布的随机变量是若干个独立标准正态变量的平方和。
()7. 相互独立的两个卡方变量与其自由度的商的比值为 F 分布的变量。
()8. 当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时泊松分布可采用二项分布来近似。
()9. 泊松分布用于解决连续体中的孤立事件。
()10. F分布具有一定程度的反对称性。
()六、计算题1 .某社区要选派8 名积极申请参加公益活动的居民从事一项宣传活动。
申请者为12名女性居民和8 名男性居民。
社区宣传活动的组织者把他们的名字完全混合后放在一个盒子里,并从中抽取8 个。
试问,抽出 4 名女性居民的概率是多少?2. 有16 名二年级学生和14 名三年级学生选修了社区管理课。
假设所有学生都会来教室上课,而且是随机进入教室的。
试问,当一名学生进入教室时,恰逢已在教室就坐的5位都是三年级的概率是多少?3. 某区进行卫生大检查,现对区内全部40 个单位进行卫生合格验收。
检查团随机抽查4 个单位,只要有 1 个单位不合格就取消该区的卫生评先资格。
如果该区确有10%的单位卫生不合格,试问:(1)抽查的 4 个单位中有 1 个单位是不合格单位的概率是多少?(2)经抽查,该区没被取消评先资格的概率是多少?(3)计算分布的期望值和方差。
4. 设在填写选民证时,1 000个选民证中共有300个错字被发现。
问在一张选民证上有一个错字的概率是多少?5. 某社区对失业者进行某项培训,参加培训的共有100人。
根据以前的培训经验,项目负责人估计有4%的培训者不能掌握这门技术。
问在参加培训的100名失业者中至少有5人为未掌握这项技术的概率是多少?6. 每小时有30个老人穿过一条人行道。
在5分钟内,没有老人穿过该人行道的概率是多少?7. 从一正态总体中抽出一个容量为20的样本。
已知总体的方差为5。
求样本的方差在3.5至U 7.5之间的概率。
&查表求F0.95 (15 , 7)的值。
29 .已知Z0.i=1.64。
求0.1 (1)的值。
10. 已知F o。
01(120 . 12) = 1 . 88, 01( 12) = 1 . 85。
求F o。
1(150 . 12)的值。
11. 一页书上印刷错误的个数X是一个离散型随机变量,它服从参数为(>0)的泊松分布,一本书共400页,有20个印刷错误,求:(1 )任取I页书上没有印刷错误的概率;(2)任取4页书上都没有印刷错误的概率.312. 某种产品表面上疵点的个数X是一个离散型随机变量,它服从参数为=-的泊2松分布,规定表面上疵点的个数不超过2个为合格品,求产品的合格率。
13. 每10分钟内电话交换台收到呼唤的次数X是一个离散型随机变量,它从参数为(>0)的泊松分布,已知每10分钟内收到3次呼唤与收到4次呼唤的可能性相同,求:(1 )平均每10分钟内电话交换台收到呼唤的次数;(2)任意10分钟内电话交换台收到2次呼唤的概率.14. 设离散型随机变量X服从参数为(>0)的泊松分布,且已知概率P{X 1}= 2,求:e(1) 参数值;(2) 概率P{1< X < 3};(3) 数学期望E(3X);⑷方差D(3X).七、问答题1. 简述卡方分布的性质。
2 .简述F分布的性质。
参考答案一、填空21. 0.12.入3.连续,正态4.调和5. F6. 7 .泊松 8.对称 9.超几何分布 10. 稀有二、单项选择1. A2. D3. C4. C5. D6. A三、 多项选择1. ABC2.. AF3. ACDE4. ABE5. ABC6. BC四、 名词解释1.超几何分布超几何分布以样本内的成功事件的个数x 为随机变量。
共有K 个,设从中抽取n 个为一样本,则样本中成功类个数式中:x < K , 0< x < n,0 < K < N 。
超几何分布的数学期望 厂巴,方差宀n(N n)(N宝NN(N 1)2. 泊松分布泊松分布为离散型随机变量的概率分布,随机变量为样本内成功事件的次数。
若 口为成功次数的期望值, 假定它为已知。
而且在某一时空中成功的次数很少, 超过5次的成功概 率可忽不计,那么稀有事件出现的次数 x 的泊松概率分布为xP (x )= P (x ;入)= ex!泊松分布的期望值和方差均等于它的唯一参数入。
3. 卡方分布设随机变量X 1, X 2,…X k ,相互独立,且都服从同一的正态分布 N ( 口,er 2)。
那么,我们可以先把它们变为标准正态变量Z 1, Z 2,…Z k , k 个独立标准正态变量的平方和被定义2 2为卡方分布( 分布)的随机变量若总体单位数为N ,其中成功类 x 的超几何概率分布为P (x )= H (x : N , n , K )x n XC K C N KC N的自由度k2叫做第二自由度。
五、判断题(X ii 1)2k乙2i 1其中k为卡方分布的自由度,它表示定义式中独立变量的个数。
2分布的期望值是自由度k,方差值为自由度的2倍。
4. F分布F分布是连续型随机变量的另一种重要的小样本分布。
设2 ( k1)和2 ( k2)相互独立,那么随机变量F ( k1, k2)= 22(kJ/k1 2服从自由度为(& , k2)的F分布。
其中, 分子上的自由度 &叫做第一自由度,分母上1. ( X ) 6. ( V )3. ( V )8. ( X )4. ( X )9. ( V )5. ( V )10. ( V )六、计算题1. 0.2752. 0.01403. 解:抽到不合格单位数量x服从N= 40、n= 4的超几何分布(1)K= 1时P (x= 1)1C4C36 4 7140 n91390336C4C403125(2)K= 0时P (x= 0) c:c36c:。
1 58905 = 0.913906445(3) K= 4 , N= 40、n= 4= E( x)= nK 440=0.1d 2= D (x) n(N n )(NN (N 1)K)K 4 (40 4)240 (40 1)凹一红‘ =0.33231 4. 入= 0.3, P ( 1;入)=0.22225•提示:用泊松分布近似二项分布; (3;入)一P (4;入)=0.3716. 0.08217. 〜0.758. 0.369 9.2.6910. 1.874七、问答题1•答:(1) 2恒为正值,且(2;k)d 2= 12 2(2) 分布的期望值是自由度k ,方差值为自由度的 2倍,即对 (k )有2 2E( )=k , D( ) = 2k对k v 2,2分布呈L 形。
2分布随自由度k 的增加而渐趋对称。
当 k —R 时,2分布以正态分布为极限。
2•答:2(1) 随机变量F 和随机变量 一样,恒取正值,F 分布密度曲线下总面积亦为 1。
(2) F 分布也是一个连续的非对称分布。