常用统计分布
63常用统计量的分布
§6.3常用统计量的分布一、样本均值的分布1、单个正态总体下的样本均值的分布2、两个正态总体下的样本均值的分布3、非正态总体下的样本均值的近似分布二、-分布1、分布定义2、分布的性质3、分布的典型模式4、分布的上α分位点2χ2χ2χ2χ2χ三、t-分布1、t 分布的定义2、t(n)的性质3、t(n)的典型模式4、t(n)分布的上α分位点四、F-分布1、F分布的定义2、F分布的性质3、F分布的典型模式4、F分布的上α分位点五、正态总体样本均值与样本方差的分布1、单个正态总体下样本均值与样本方差的分布2、两个正态总体下样本均值差与样本方差比的分布)2.3(1)(1)1()(1)(1)1()(,,,2,1,)(,)(,,,1)1.3(),(~11,,,,),,(1.31222121112212121212n n nX D n X n D X D n nX E n X n E X E n i X D X E X X X X nN X n X nX n X X X X X N X n i i n i i n i i n i i i i n ni i ni i n σσµµσµσµσµσµ=⋅====⋅========∑∑∑∑∑∑======于是有相互独立同分布,故与:由于注的正态分布,即,方差为服从均值为值的一个样本,则样本均为来自服从正态总体设总体定理本均值的分布、单个正态总体下的样一、样本均值的分布"""这点处。
望取值几乎集中在数学期时且当高的集中程度远比总体要的取值于即倍的方差的的方差却只是但有相同的数学期望与由上述可知注µµX n X nX X X X ,,,1,,:2∞→212(1,0.2),,,,,{0.9 1.1}0.95?n X N n X X X X P X n ≤<≥"例 设总体服从正态分布从中抽取容量为的样本欲使样本均值满足不等式试求样本容量最小应为取多大2110.2:~(1,)1.110.910.95{0.9 1.1}0.20.2()()2()1222ni i X X N nnP X n n n n n==⎛⎞⎛⎞−−≤≤<=Φ−Φ⎜⎟⎜⎟⎝⎠⎝⎠=Φ−Φ−=Φ−∑解由题设知故0.951()0.975; 1.96,15.3664222,16n n n n +Φ≥=≥≥即查表得故因此样本容量最少应取。
统计学常见分布、概念
统计学常见分布、概念⾮常有必要搞清楚统计学种⼀些常⽤的分布离散型随机变量分布1.两点分布/伯努利分布伯努利分布是⼆项分布在n=1时的特例。
⼀次随机试验,成功概率为p,失败概率为q=1-p。
2.⼆项分布⼆项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布。
⼆项分布的典型例⼦是扔硬币,硬币正⾯朝上概率为p, 重复扔n次硬币,k次为正⾯的概率即为⼀个⼆项分布概率。
3.超⼏何分布对N件产品(其中M件次品)进⾏不放回抽样,在n次抽样种抽到次品数X,服从超⼏何分布。
4.⼏何分布X记⾸次成功的概率,服从⼏何分布。
5.负⼆项分布X记第k次成功时总的实验次数,当k=1时,为⼏何分布。
“⼆项分布”是固定试验总次数N的独⽴试验中,成功次数k的分布;⽽“负⼆项分布”是所有到成功r次时即终⽌的独⽴试验中,失败次数k的分布。
例⼦:Pat is required to sell candy bars to raise money for the 6th grade field trip. There are thirty houses in the neighborhood, and Pat is not supposed to return home until five candy bars have been sold. So the child goes door to door, selling candy bars. At each house, there is a 0.4 probability of selling one candy bar and a 0.6 probability of selling nothing.What's the probability of selling the last candy bar at the nth house?6.泊松分布有些事件,我们可以预估这些事件的总数,但是没法知道具体的发⽣时间。
13种常见的统计分布
为常数,故首选威布尔分布
理解
是指数分布的一种推广形式
在药学和生存率研究中,常出现一些变量不符合正态、对
数正态及其它常用模型分布
例如能力的高低,学生成绩的好坏等都属于正态分布
集中性:正态曲线的高峰位于正中央,即均数所在的位置
理解
对称性:正态曲线以均数为中心,左右对称,曲线两端永远 不与横轴相交 均匀变动性:正态曲线由均数所在处开始,分别向左右两侧 逐渐均匀下降 正态分布有两个参数,即均数μ 和标准差σ,可记作N(μ ,σ)
7
属性
Chi-square Distribution
连续型分布 检验资料的实际频数与理论频数是否相等
若n个相互独立的随机变量ξ ₁、ξ ₂、……、ξ n ,均服从标准
理解
正态分布则这 n 个服从标准正态分布的随机变量的平方和构 成一新的随机变量,其分布规律称为卡方分布 卡方分布是由正态分布构造而成的一个新的分布,当自由度 n很大时, 分布近似为正态分布
9
属性
F分布 F Distribution
连续型分布 用于方差的齐性检验和方差分析
理解
10
属性
Γ分布 Γ Distrቤተ መጻሕፍቲ ባይዱbution or Gamma Distribution
连续型分布 正偏态分布,常用于正偏态分布的拟合
11
属性
圆形分布 Circular Distribution
连续型分布 用于描述以方向、位置、周期性(环形)时间、角度等为测度
单位的数字特征
应用
医学领域内一些现象是以方向或时间度量,具有周期性特点, 如某疾病在一年内各月份的发生数、胎儿在一昼夜间各时点 分娩的频度 有些数据本身就是以角度来表示:如脑电阴图的上升角,气 象环境的风向玫瑰图 这些数据不能用通常的均数、标准差描述
4.3常用的统计分布
一、分位数 定义4.4 给定随机变量X,对给定的实数α, ( 0 1), 如果实数 F 满足条件 P{ X F } 则称 F 为X的分布的 水平α的上侧分位数. P X F 1 P{ X F }
X 当X是连续型随机变量时, ~ f ( x )
X i ~ N 0, 0.52 , 解
7
i 1
X 1 , X 2 ,..., X 7 相互独立,
Xi 0 ~ N ( 0, 1 ) 0.5
X1 0 X 2 0 X7 0 也相互独立. , , ..., 0.5 0.5 0.5 7 7 X 0 2 2 2 Xi i 4 ~ (7) i 1 i 1 0.5
的F分布, 记为 X ~ F ( m, n )
m 称为第一自由度, n 称为第二自由度.
X ~ F ( m , n ), 即 X ~ f ( x; m, n)
1 m m m , n n n x 2 2 f ( x; m , n) 0,
给定的
2
2 1
( n ) ( n)
2
2
( n )
2
2
2 分布 可用正态分布近似. 当n较大时,
当n≤45时, 分布 的上侧分位数 有表可查.
2
例 设 X ~ 2 (13),
P282
2 0.05 (13) 22.362 P X 1 0.05, 1
1 推论 若随机变量 X ~ F ( m, n ), 则 ~ F ( n, m ) X
3. F分布的 水平α的上侧分位数
常用的统计分布
(419)
则Z的密度函数为
f
(x;
m,
n)
1 B(m,
n)
(m)(m nn
m
x) 2
1(1
m
n
x) 1(mn) 2
x0
(420)
22
其中
B(
p,
q)
1
0x
p1(1
x)q1dx
(
p
0,
q
0)
是
B(贝塔)函数
如果随机变量X的密度函数由(420)给出 则称X服从第
一自由度为m 第二自由度为n的F分布 记作X~F(m n)
n
22
1 ( n )
n 1 1 x
x2 e 2 ,
2
(x 0)
则称X服从以n为自由度的2分布 记作X~2(n)
说明
根据命题41 若X1 X2 Xn是n个相互独立的标准 正态随机变量 则
X
X12
X
2 2
X
2 n
~
2(n)
9
定义46(2分布)
如果随机变量X的密度函数为
2 (x; n)
n
22
n)
1 B(1 ,
n)
1
(1
x2 )
n1 2
x
nn
22
则称X服从自由度为n的t分布 记作X~t(n)
当自由度n很大时 t分布接
近于标准正态分布 这是因为
lim(1
x2
)
n1 2
e
1 x2 2
n n
19
t分布的分位数
附表5对于一些充分小的值给出了t分布的水平的上
侧分位数t(n)之值 当X~t(n)时 有
常见统计分布及其特点
常见统计分布及其特点统计分布是描述数据集合中数据分布情况的一种方法。
统计学中存在着很多常见的统计分布,每个分布都具有其独特的特点和应用领域。
以下是一些常见的统计分布及其特点的介绍。
1. 正态分布(Normal Distribution)正态分布是最常见的分布之一,也被称为高斯分布。
它的特点是呈钟形曲线,对称分布,均值和标准差完全决定了其形状。
正态分布有广泛的应用,尤其在自然科学和社会科学中。
2. 二项分布(Binomial Distribution)二项分布是指在一系列独立的试验中,每次试验只有两个可能的结果:成功或失败。
每次试验的成功概率由固定的参数p确定。
二项分布的特点是具有两个参数n和p,其中n为试验的次数,p为每次试验的成功概率。
二项分布在生物学、医学、工程等领域中经常被使用。
3. 泊松分布(Poisson Distribution)泊松分布用于描述单位时间内事件发生的次数的概率分布。
这个分布有一个参数λ,表示单位时间内事件的平均发生率。
泊松分布的特点是时间间隔内事件的数量是不确定的,但平均发生率λ是已知的。
泊松分布在物理学、生物学、通信技术等领域中被广泛应用。
4. 均匀分布(Uniform Distribution)均匀分布是指在一个有限的区间内,每个数出现的概率相等。
均匀分布的特点是概率密度函数在区间内是常数。
均匀分布在模拟、随机数生成等领域中经常被使用。
5. 指数分布(Exponential Distribution)指数分布用于描述一个事件发生之间的时间间隔的概率分布。
指数分布的特点是具有一个参数λ,表示事件的平均发生率。
指数分布在可靠性工程、生物学、等领域中被广泛应用。
6. t分布(t Distribution)t分布是用于小样本情况下的假设检验和置信区间估计的重要分布。
与正态分布相比,t分布的尾部更厚,更适合于小样本情况的推断。
t分布在统计学中常用于处理样本容量较小的情况。
7. F分布(F Distribution)F分布是用于分组之间方差的比较的一种分布。
统计学分布类型
统计学分布类型
统计学分布是根据数据分析所有可能的可能的量的范围,把它们分类成多个分组,并建立相应的概率函数,以描述这些变量出现的可能性。
统计学分布由以下几种类型:
1、正态分布:正态分布是最常见的统计学分布,又称钟形曲线。
它具有两个参数:平均值μ和标准差σ,针对一些机器运行正态分布可以用来模拟变量的分布情况;
2、均匀分布:均匀分布是指变量的概率分布在一个给定的范围内是均匀的,它由两个参数:最小值a和最大值b决定;
3、伽马分布:伽马分布又称卡方分布,是描述连续随机变量采样期望值与其标准差之比的分布。
它包含一个参数,即期望值与标准差之比γ;
4、负指数分布:负指数分布也称指数分布,是一个经典的概率分布,它可以解释一系列以负指数或非负指数的累积概率分布,它包含一个参数λ,它是和具体分布有关的常数;
5、卡方分布:卡方分布是一种统计分布,又称伽马分布,是描述连续随机变量采样期望值与其标准差之比的分布。
卡方分布由一个参数ν决定,变量ν是采样期望与标准差之比;。
统计学常用分布
统计学常用分布一、引言在统计学中,分布是描述数据变化规律和概率的重要工具。
不同的数据类型和问题背景需要采用不同的分布来描述。
本篇文章将介绍统计学中常用的几种分布,包括正态分布、二项分布与泊松分布、指数分布与对数正态分布、卡方分布与t分布等。
二、正态分布正态分布是最常见的连续概率分布之一,它在自然现象、工程技术和社会科学等领域都有广泛的应用。
正态分布的曲线呈钟形,数据值集中在均值附近,随着远离均值,概率逐渐减小。
正态分布在统计学中具有重要地位,许多统计方法和模型都以正态分布为基础。
三、二项分布与泊松分布1.二项分布:二项分布是用来描述伯努利试验中的随机事件的概率分布,其中每次试验只有两种可能的结果,并且每次试验都是独立的。
二项分布适用于计数数据,尤其在生物实验和可靠性工程等领域有广泛应用。
2.泊松分布:泊松分布是二项分布在伯努利试验次数趋于无穷时的极限形式,常用于描述单位时间内随机事件的次数。
泊松分布在概率论和统计学中具有重要地位,广泛应用于保险、通信和生物医学等领域。
四、指数分布与对数正态分布1.指数分布:指数分布描述的是随机事件之间的独立间隔时间或者随机变量的概率分布。
指数分布常用于描述寿命测试和等待时间等问题,例如电话呼叫的间隔时间和电子元件的寿命等。
2.对数正态分布:对数正态分布在统计学中用于描述那些其自然对数呈正态分布的随机变量。
许多生物学、经济学和社会科学中的数据都服从对数正态分布,例如人的身高、体重以及股票价格等。
五、卡方分布与t分布1.卡方分布:卡方分布在统计学中主要用于描述离散型概率分布。
卡方分布是通过对两个独立的随机变量进行平方和运算得到的,常用于拟合检验和置信区间的计算。
2.t分布:t分布在统计学中广泛应用于样本数据的参数估计和假设检验。
相比于正态分布,t分布在数据量较小或参数偏离正态性时具有更好的稳定性。
t分布在金融、生物医学和可靠性工程等领域有广泛应用。
六、结论在统计学中,不同的数据类型和问题背景需要采用不同的分布来描述。
第3节 常用统计分布(三个常用分布)
例2
设X
~
N
(
,
2
),
Y
2
~
2 (n),且X ,Y相互独立,
试求 T X 的概率分布.
Yn
解 因为X ~ N(, 2),所以 X ~ N(0,1)
又Y
2
~
2 (n),且X ,Y独立,则
X
与Y
2
独立,
由定理得
T (X ) / X ~ t(n) (Y / 2) / n Y n
n
事实上,它们受到一个条件的约束:
Xi nX
i 1
n
i 1
Xi
X
1
n
(
i 1
Xi
nX )
1
0
0.
例1
设X1 ,
X 2 ,
,
X
为
6
来
自
正
态
总
体N
(0,1)的
一
组
样
本,
求C1
,
C
使
2
得
Y C1( X1 X 2 )2 C2( X 3 X4 X5 X6 )2
服 从 2分 布.
解
X1
2
4
则C1 1 2 ,C2 1 4 .
3. t 分布 定义 设 X ~ N (0, 1), Y ~ 2 (n), 且 X , Y
独立,则称随机变量 T X 服从自由度为 n Y /n
的 t 分布, 记为T ~ t(n).
t 分布又称学生氏(Student)分布. t(n) 分布的概率密度函数为
2. 2分布(卡方分布)
定义、设 X1, X 2 ,L , X n 相互独立,同服从 N (0, 1)
常见统计分布及其特点
【附录一】常见分布汇总一、二项分布二项分布(Binomial Distribution),即重复n次的伯努利试验(Bernoulli Experiment),用ξ表示随机试验的结果, 如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率是。
二、泊松poisson分布1、概念当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。
通常当n≧10,p≦0.1时,就可以用泊松公式近似得计算。
2、特点——期望和方差均为λ。
3、应用(固定速率出现的事物。
)——在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布三、均匀分布uniform设连续型随机变量X的分布函数F(x)=(x-a)/(b-a),a≤x≤b则称随机变量X服从[a,b]上的均匀分布,记为X~U[a,b]。
四、指数分布Exponential Distribution1、概念2、特点——无记忆性(1)这种分布表现为均值越小,分布偏斜的越厉害。
(2)无记忆性当s,t≥0时有P(T>s+t|T>t)=P(T>s) 即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。
3、应用在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果五、正态分布Normal distribution1、概念2、中心极限定理与正态分布(说明了正态分布的广泛存在,是统计分析的基础)中心极限定理:设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布。
3、特点——在总体的随机抽样中广泛存在。
常见统计分布及其特点
常见统计分布及其特点常见的统计分布有:正态分布、均匀分布、二项分布、泊松分布、指数分布等。
1.正态分布:正态分布又称为高斯分布或钟形曲线分布,是最为常见的一种分布。
正态分布具有以下特点:-均值和中位数相等,分布的对称轴对称;-在均值处取得最大值,随着离均值的距离增大,分布的概率逐渐减小;-标准差决定了曲线的宽窄,标准差越大,曲线越宽;-68%的数据落在均值的一个标准差范围内,95%的数据落在均值的两个标准差范围内,99.7%的数据落在均值的三个标准差范围内。
2.均匀分布:均匀分布又称为矩形分布,是最简单的分布之一、均匀分布具有以下特点:-在一个有限的区间内,所有取值的概率相等;-分布曲线呈矩形,具有等宽;-在整个区间上积分等于13.二项分布:二项分布描述了在n次独立的重复实验中,成功的次数的分布情况。
二项分布具有以下特点:-每次实验只有两个可能的结果,成功或失败;-实验之间是独立的;-成功的概率和失败的概率保持不变;-成功的次数符合二项分布。
4.泊松分布:泊松分布描述了一个时间段或区域内随机事件发生的次数的分布情况。
泊松分布具有以下特点:-事件在一个固定时间段或区域内按独立的随机过程发生;-事件在一个极短时间段内发生的概率极低,即发生频率很低;-事件的平均发生次数相对较低。
5.指数分布:指数分布描述了连续发生独立随机事件的时间间隔的分布情况。
指数分布具有以下特点:-事件的发生时间间隔是独立的,事件间的时间间隔符合指数分布;-时间间隔的概率密度递减;-指数分布在实际应用中常用于描述等待时间、生命周期等。
这些统计分布常用于描述和分析随机事件的分布情况。
在实际应用中,我们可以根据样本数据的特点,选择合适的统计分布进行建模和分析。
在统计学中,概率分布函数可以帮助我们理解随机事件的分布规律,有助于对数据进行建模、预测和推断。
概率论与数理统计:常用统计分布
0,
x 0, 其它.
F-分布的性质 由F分布定义可得:
F
~
F(n1, n2 )
1 F
~
F(n2, n1)
五、F-分布与t分布的关系
定理3 若X~t(n),则Y=X2~F(1,n)。
证明:X~t(n),X的分布密度p(x)= n 1 2 nπ n 2
1
x2 n
n 1 2
Y=X2的分布函数F(y) =P{Y<y}=P{X<y}。当y≤0时,FY(y)=0,
② X 与 S2相互独立。
二、χ2-分布(卡方分布)
定义 设X1,X2,…,Xn是来自标准正态总体 N(0,1)的样本,称统计量
2
X
2 1
X
2 2
X
2 n
服从自由度为n的 χ2-分布 ,记为 2 ~ 2( n ).
2 (n)-分布的概率密度为
f
(
y
)
2n /
1
2 (
n
/
2
)
y
n 1
2e
服从正态分布,且
i 1
i 1
一、正态分布
定理2 若( X1, X 2 ,, X n )是来自总体X ~ N(,2) 的一个
样本,X 为样本均值,则 (1) X ~ N (, 2 ) ,(由上述结论可知:X 的期望与 X 的期望相同,而 X
n
的方差却比 X 的方差小的多,即 X 的取值将更向 集中.)
p(y)=0;当y>0时,FY(y) =P{-
,
y
y
n
n 2 1 n
Y=X的分布密度p(y)= 2,•
1 n
2 2
<X<
常用21个统计分布总结
● Bernoulli ( p ) 伯努利分布说明与例:x 为伯努利试验的结果,当试验成功,则x=1,试验失败则x=0。
可以把伯努利试验理解为抛硬币,x=1为出现正面● Binomial ( n, p ) 二项分布(图以p=0.4,n=5为例)说明与例:x 是重复n 次的伯努利试验结果,即x=试验成功的次数,可以理解为抛n 次硬币,正面出现的次数。
P X x p | ()p x 1p ()1x ; x 01 , ; 0p1EXp , Var Xp 1p ()M X t ()1p ()pe t P X x n | p , ()n x ()p x1p ()nxx 012...n , , , , ; 0p 1EX np , Var X np 1p ()M x t ()pe t1p ()[]n● Multinomial ( m, p 1, ..., p n ) 多项分布图略(因为是联合分布的多维分布)说明与例:多项分布是二项分布的推广,二项分布结果只有两个,而多项分布结果可以有多个,比如仍骰子,x1表示n 次试验点数1出现的次数…x6表示点数6出现的次数。
● Geometric ( p ) 几何分布(图以p=0.4为例)说明与例:得到一次成功而进行的伯努利试验次数n ,即前面失败了n-1次,第n 次成功。
比如x 可以理解为抛硬币,出现正面所抛的次数f x 1...x n , , ()m !x 1!...x n !p 1x1...p nxnm !i 1np i x ix i !ÕP X x p | ()p 1p ()x 1 ; x 12... , , ; 0p 1EX1p, Var X1pp 2M X t ()pe t11p ()et, t log 1p ()-● Hypergeometric超几何分布(以N=10,m=5,n=4为例)说明与例:已知N 个总体中有m 个不合格的产品,现在抽取n 个,出现不合格产品的数量。
几种常用统计量的分布
P{
χ2
χ
2 a
(n)
}
f
a2 (n)
x dx a
的点χa 2(n)称为 χ2 分布单侧 分位点或双侧临界值,如图11-5 所示 .
图11-5
几种常用统计量的分布
定义4
设X ~ N ( , 2 ) ,样本方差为S 2,则统计量χ2
(n
1)S 2
2
服从自由度为n
1
的χ 2分布,记作
χ2
n
/ n
几种常用统计量的分布
证明
X ~ N ( , 2 ) ,( X1.,X 2 , ,X n )是来自总体 X 的样本 ,
X
~
N ( , 2 )(i 1,2 ,
,n) ,其线性函数 X
1 n
n i 1
Xi
也服从正态分布,即
E X
E1 n
n i 1
Xi
1n E
n i1
Xi
1 n n
(
EX i i 1,2
n) ,
1 n
1
DX
D n
i 1
Xi
n2
n
D Xi
i 1
1 n2 2 (
n2
n
X1 ,X 2 , X n相互独立) ,
则X ~ N ( , 2 ) ,故 X ~ N (0 ,1) .
n
/ n
几种常用统计量的分布
例1
解
因为总体 X 服从正态分布N 5 ,9 ,所以 X 服从正态分布N (5 ,9 ) ,故
图11-2
几种常用统计量的分布
显然,f x随着n不同而不同,且f x为偶函数 . 当n 时,有
lim f x
数学中的统计分布
数学中的统计分布统计分布是数学中一个极为重要和广泛应用的概念,它描述了一组数据在取值上的特征和分布规律。
在统计学中,常用的统计分布包括正态分布、二项分布、泊松分布等等。
这些分布模型有助于我们理解和分析数据的特性,提供了数学工具来支持我们对数据的解读和预测。
一、正态分布正态分布(又称高斯分布)是最经典的统计分布之一,它的概率密度函数是一个钟形曲线。
正态分布的特点是对称、均值与中位数相等、标准差决定曲线的宽窄程度。
正态分布广泛应用于自然科学、社会科学、工程技术等领域,被广泛认为是描述随机变量的理想模型。
二、二项分布二项分布描述了在一系列独立的伯努利试验中,成功事件发生的次数的概率分布。
它的概率质量函数在取值为整数的非负范围内有定义,形成了一个离散分布。
二项分布的特点是每次试验成功的概率相同,且各次试验之间互相独立。
三、泊松分布泊松分布描述了在一段时间或空间内,某个确定区域内随机事件发生的次数的概率分布。
泊松分布的概率质量函数在取值为非负整数的范围内有定义,形成了一个离散分布。
泊松分布的特点是事件的发生是独立的且随机的,平均发生率在一段时间或空间内是固定的。
四、其他常见统计分布除了正态分布、二项分布和泊松分布之外,还有很多其他常见的统计分布模型,如均匀分布、指数分布、伽玛分布等等。
这些分布模型在不同的场景中应用广泛,有助于我们对各类数据的分析和处理。
五、统计分布的应用统计分布在实际应用中有广泛的用途。
在数据分析和统计推断中,我们可以利用不同的统计分布进行假设检验、置信区间估计以及参数估计等。
在风险评估和预测模型构建中,统计分布可以帮助我们建立合适的模型来预测未来的风险和事件发生的概率。
另外,统计分布也在财务管理、工业生产、市场调研等领域起着重要的作用。
例如,在金融领域中,利用正态分布描述资产和收益的分布情况,对风险进行度量和控制。
在工业生产中,可以利用泊松分布对产品的缺陷或故障进行统计建模,从而提高质量和效率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
八章 常用统计分布第一节 超几何分布超几何分布的数学形式·超几何分布的数学期望和方差·超几何分布的近似 第二节 泊松分布泊松分布的数学形式·泊松分布的性质、数学期望和方差·泊松分布的近似 第三节 卡方分布(2χ分布)2χ分布的数学形式·2χ分布的性质、数学期望和方差· 样本方差的抽样分布第四节 F 分布F 分布的数学形式·F 分布的性质、数学期望和方差·F 分布的近似一、填空1.对于超几何分布,随着群体的规模逐渐增大,一般当Nn ≤( )时,可采用二项分布来近似。
2.泊松分布只有一个参数( ),只要知道了这个参数的值,泊松分布就确定了。
3.卡方分布是一种( )型随机变量的概率分布,它是由( )分布派生出来的。
4.如果第一自由度1k 或第二自由度2k 的F 分布没有列在表中,但邻近的第一自由度或第二自由度的F 分布已列在表中,对于F α(1k ,2k )的值可以用( )插值法得到。
5.( )分布具有一定程度的反对称性。
6.( )分布主要用于列联表的检验。
7.( )分布用于解决连续体中的孤立事件。
8.2χ分布的图形随着自由度的增加而渐趋( )。
9.当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时( )可采用二项分布来近似。
10.( )事件是满足泊松分布的。
二、单项选择1.已知离散性随机变量x 服从参数为λ=2的泊松分布,则概率P (3;λ)=( )。
A 4/3e 2B 3/3e 2C 4/3e 3D 3/3e 32.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时,( )分布可以用二项分布来近似。
A t 分布B F 分布C 2χ分布D 超几何分布3.研究连续体中的孤立事件发生次数的分布,如某时间段内电话机被呼叫的次数的概率分布,应选择( )。
A 二项分布 B 超几何分布 C 泊松分布 D F 分布4.对于一个样本容量n 较大及成功事件概率p 较小的二项分布,都可以用( )来近似。
A 二项分布B 超几何分布C 泊松分布D F 分布。
5.与F α(1k ,2k )的值等价的是( )。
A F 1-α(1k ,2k )B F 1-α(2k ,1k )C 1/F α(1k ,2k )D 1/F 1-α(2k ,1k ) 6、只与一个自由度有关的是( )A 2χ分布B 超几何分布C 泊松分布D F 分布三、多项选择1.属于离散性变量概率分布的是( )。
A 二项分布B 超几何分布C 泊松分布D F 分布 2.属于连续性变量的概率分布的是( )。
A 2χ分布B 超几何分布C 泊松分布D F 分布 3.下列近似计算概率的正确方法是( )。
A 用二项分布的概率近似计算超几何分布的概率B 用二项分布的概率近似计算泊松分布的概率C 用泊松分布的概率近似计算超二项分布的概率D 用正态分布的概率近似计算超二项分布的概率E 用正态分布的概率近似计算F 分布的概率 4.2χ分布具有的性质是( )。
A 恒为正值B 非对称性C 反对称性D 随机变量非负性E 可加性5.F 分布具有的性质是( )。
A 恒为正值B 非对称性C 反对称性D 随机变量非负性E 可加性6.一般地,用泊松分布近似二项式分布有较好的效果是( )。
A n/N ≤0.1B n≥10C p≤0.1D k≥30E k2>2四、名词解释1.超几何分布2.泊松分布3.卡方分布4.F分布五、判断题1.在研究对象为小群体时,二项式分布和超几何分布的基本条件都能得到满足。
()2.成功次数的期望值λ是决定泊松分布的关键因素。
()3.泊松分布的数学期望和方差是相等的。
()4.在计算F分布的概率时,只需要知道分子的自由度和分母的自由度两个因素就可以了。
()5.k个独立标准正态变量的平方和被定义为卡方分布。
()6.卡方分布的随机变量是若干个独立标准正态变量的平方和。
()7.相互独立的两个卡方变量与其自由度的商的比值为F分布的变量。
()8. 当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时泊松分布可采用二项分布来近似。
()9. 泊松分布用于解决连续体中的孤立事件。
()10. F分布具有一定程度的反对称性。
()六、计算题1.某社区要选派8名积极申请参加公益活动的居民从事一项宣传活动。
申请者为12名女性居民和8名男性居民。
社区宣传活动的组织者把他们的名字完全混合后放在一个盒子里,并从中抽取8个。
试问,抽出4名女性居民的概率是多少?2.有16名二年级学生和14名三年级学生选修了社区管理课。
假设所有学生都会来教室上课,而且是随机进入教室的。
试问,当一名学生进入教室时,恰逢已在教室就坐的5位都是三年级的概率是多少?3.某区进行卫生大检查,现对区内全部40个单位进行卫生合格验收。
检查团随机抽查4个单位,只要有1个单位不合格就取消该区的卫生评先资格。
如果该区确有10%的单位卫生不合格,试问:(1)抽查的4个单位中有1个单位是不合格单位的概率是多少?(2)经抽查,该区没被取消评先资格的概率是多少?(3)计算分布的期望值和方差。
4.设在填写选民证时,1000个选民证中共有300个错字被发现。
问在一张选民证上有一个错字的概率是多少?5.某社区对失业者进行某项培训,参加培训的共有100人。
根据以前的培训经验,项目负责人估计有4%的培训者不能掌握这门技术。
问在参加培训的100名失业者中至少有5人为未掌握这项技术的概率是多少?6.每小时有30个老人穿过一条人行道。
在5分钟内,没有老人穿过该人行道的概率是多少?7.从一正态总体中抽出一个容量为20的样本。
已知总体的方差为5。
求样本的方差在3.5到7.5之间的概率。
8.查表求F 0.95(15,7)的值。
9.已知Z 0.1=1.64。
求21.0χ (1)的值 。
10.已知F 0。
01(120.12)=1.88,F 0。
01(∞,12)=1.85。
求F 0。
01(150.12)的值 。
11. 一页书上印刷错误的个数X 是一个离散型随机变量,它服从参数为λ(λ>0)的泊松分布,一本书共400页,有20个印刷错误,求:(l )任取l 页书上没有印刷错误的概率; (2)任取4页书上都没有印刷错误的概率.12. 某种产品表面上疵点的个数X 是一个离散型随机变量,它服从参数为λ=23的泊松分布,规定表面上疵点的个数不超过2个为合格品,求产品的合格率。
13. 每10分钟内电话交换台收到呼唤的次数X 是一个离散型随机变量,它从参数为λ(λ>0)的泊松分布,已知每10分钟内收到3次呼唤与收到4次呼唤的可能性相同,求:(1)平均每10分钟内电话交换台收到呼唤的次数;(2)任意10分钟内电话交换台收到2次呼唤的概率.14. 设离散型随机变量X 服从参数为λ(λ>0)的泊松分布,且已知概率}1{=X P =33e,求:(l)参数λ值;(2)概率P {1<X ≤3}; (3)数学期望)3(X E ; (4)方差)3(X D .七、问答题1.简述卡方分布的性质。
2.简述F 分布的性质。
参考答案一、填空1. 0.1 2.λ 3.连续 ,正态 4.调和 5. F 6.2χ 7.泊松 8. 对称 9. 超几何分布 10. 稀有二、单项选择1.A 2.D 3.C 4.C 5.D 6.A三、多项选择1.ABC 2..AF 3.ACDE 4.ABE 5.ABC 6.BC四、名词解释1.超几何分布超几何分布以样本内的成功事件的个数x 为随机变量。
若总体单位数为N ,其中成功类共有K 个,设从中抽取n 个为一样本,则样本中成功类个数x 的超几何概率分布为P (x )=H (x :N ,n ,K )=n N xn KN xK CC C --式中:x ≤K ,0≤x ≤n ,0≤K ≤N 。
超几何分布的数学期望μ=NnK ,方差σ2=)1())((---N N KK N n N n2.泊松分布泊松分布为离散型随机变量的概率分布,随机变量为样本内成功事件的次数。
若μ为成功次数的期望值,假定它为已知。
而且在某一时空中成功的次数很少,超过5次的成功概率可忽不计,那么稀有事件出现的次数x 的泊松概率分布为P (x )=P (x ;λ)=λλ-ex x!泊松分布的期望值和方差均等于它的唯一参数λ。
3.卡方分布设随机变量X 1,X 2,…X k ,相互独立,且都服从同一的正态分布N (μ,σ2)。
那么,我们可以先把它们变为标准正态变量Z 1,Z 2,…Z k ,k 个独立标准正态变量的平方和被定义为卡方分布(2χ分布)的随机变量2χ2χ(k )=(σμ-1X )2+(σμ-2X )2+…+(σμ-k X )2=∑=-k i iX122)(1μσ=∑=ki i Z 12其中k 为卡方分布的自由度,它表示定义式中独立变量的个数。
2χ分布的期望值是自由度k ,方差值为自由度的2倍。
4.F 分布F 分布是连续型随机变量的另一种重要的小样本分布。
设2χ(1k )和2χ(2k )相互独立,那么随机变量F (1k ,2k )=222112/)(/)(k k k k χχ服从自由度为(1k ,2k )的F 分布。
其中,分子上的自由度1k 叫做第一自由度,分母上的自由度2k 叫做第二自由度。
五、判断题1.( × ) 2.( √ ) 3.( √ ) 4.( × ) 5.( √ ) 6.( √ ) 7.( √ ) 8.( × ) 9.( √ ) 10.( √ )六、计算题1.0.2752.0.01403.解:抽到不合格单位数量x 服从N =40、n =4的超几何分布 (1) K =1时 P (x =1)=44033614CC C =9139071404⨯=0.3125(2) K =0时 P (x =0)=44043604C C C =91390589051⨯=0.6445(3)K =4,N =40、n =4μ=E (x )=NnK =4044⨯ = 0.1σ2=D (x )=)1())((2---N N KK N n N n =)140(404)440()440(42-⨯⨯-⨯-⨯ = 0.33234.λ= 0.3,P (1;λ)=0.22225.提示:用泊松分布近似二项分布;P (x ≥5;λ)=1—P (1;λ)—P (2;λ)—P (3;λ)—P (4;λ)=0.3716. 0.0821 7. ≈0.758. 0.369 9. 2.69 10.1.874七、问答题1.答:(1)2χ恒为正值,且 ⎰+∞22);(χχϕd k =1(2) 2χ分布的期望值是自由度k ,方差值为自由度的2倍,即对2χ(k )有E (2χ)=k , D (2χ)=2 k对k <2,2χ分布呈L 形。