第三章 几种常见的概率分布率资料讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
μ= N
n k (N-K)(N-n)
S2 = N2(N-1) ^ nk N= x
N------^群体大小的估计. K------加有标记的个体数. n------第二次抽样抽中的个体数. x------在含有为n的样本中加有标记的个体数.
例:某野外实习队用网捕捉到金丝燕100只,做好标记后仍放回大自然,一月后
注意:第二项和第三项的和约等于第一项,故从总体分布中减去这两项.
2020/10/16
七 . 正态分布(常态分布 , 高斯分布) normal distribution 1).高斯公式(高斯定理)
设:空间二维单连通区域v的边界曲面是光滑的,则函数P( x, y, z); Q( x, y, z); R( x, y, z)在v及s上具有关于x, y, z的连续偏导数:
∫∫∫( + ∂P V ∂x
+∂Q ∂y
) d∂∂Rzx d y d z
= ∫∫[P c o s ( n, x) +Q c o s (n, y) +R c o s (n, z) ]d s S
= ∫∫[P d y d z + Q d z d x + R d x d y] S
这个公式具有立体感,意思是:P Q R函数的累计积分为V的空间区域. z
b. μ不论是向正方远离或是向负方远离,e 的指数都变成一个绝对值愈来愈大
的负数因此, φ (μ) 减小
c.曲线纵坐标两侧对称 φ (μ) = φ (-μ)
d.曲线在μ=-1 μ= 1 处有两个拐点.
e.曲线和横坐标轴所夹的面积是1.
f. 分布函数曲线旋转180度仍然对称
g. u=-1 到 +1
面积=0.6827
以上的计算已列成表格,应用时可根据需要由t值,自由度查 概率;也可以由概率,自由度查t值.
2020/10/16
重新捕捉到500只金丝燕,其中有24只带有标记.问:该山区金丝燕的群体数目?
解: K = 100 n = 500 x = 24
^ n k 100×500
.
N = x = 24 = 2083
2020/10/16
5. 负二项分布:negative binomial distribution
P (x) =CK-1x-1 p k q x-k 六、 核心分布----以某一中心作放射状分布,中央概率 p大,外围概率p逐渐减小
3).μ = n p 大小适中,恰好为e-μ.即:与自然数e的负指数为宜.
4).样本平均数就是总体平均数.X = μ.
5).平均数等于方差.X = δ2
6).偏斜度: γ1 = 1/√ n
7).峭度: γ2 = 1/μ
4.Poisson 分布的应用:
例:麦田内杂草的分布:调查已知每10平方米有一株杂草.
3). U1= 4.82 =1.20 U2= 4.82 =-0.87 P(152<x<162) =φ(U1)-φ(U2) =φ(1.2)-φ(-0.87) =0.88493-0.19215 =0.69278
2020/10/16
2020/10/16
∑f x 22110
X = N = 140 = 157.93 (g)
的分布,称为核心分布.
{ 可分为两种类型
大小相等的核心分布
大小不均等的核心分布
大小均等
大小不均等
由于这类分布具有明显的核心,故各核心的边缘,事件成功的概率极小, 而位于核心中央,事件成功的概率极大,因此,计算理论分布时,第0项以及第 一项以上的概率所采用的公式不一样.
2020/10/16
P (0) = e –m1 ( 1 –e –m2)
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2. 普阿松分布:----小概率事件( p≦ 0.1)符合普阿松式分布.
∑(x-x)2
∑( x-x)2
=√ n-1 = √ n(n-1)
n
2020/10/16
t分布与t值
2 [(r-1)/2]!
1
Y c =√γ . [(r-2)/2]! . (1+t2/r)[(r+1)/2] 式中:Y c……对应于t值的概率.
t …… t值.
γ……自由度:单个样本γ=n-1.
k个等大的样本γ=k(n-1)
u=-2 到+2
面积=0.9543
u=-3 到+3
面积=0.9973
u=-1.96到+1.96 面积=0.95
u=-2.576到+2.576 面积=0.99
2020/10/16
X±1δ=68.27%
X±1.96δ=95%
X±2.576δ=99% ±
h. γ1=0
γ2=0
例: 高粱”三尺三”的株高服成正态分布N(X =156.2,δ=4.82).
求: 1).X<161厘米的概率.
2). X>164厘米的概率.
3).X在152厘米到162厘米之间的概率.
2020/10/16
x-μ 161-156.2 解:1). U= δ = 4.82 =1
P (x<161) =φ(u) =φ(1) =0.84134
2). x-μ 164-156.2 U= δ = 4.82 =1.62 P (x>164) =1-φ(u) =1-φ(1.62) =1-0.94738=0.05262 162-156.2 152-156.2
当总体标准差已知时: x - μ U= δ/√n
当总体标准差未知时: x-μ t= s /√n
(df=n-1)
2020/10/16
十.t分布(学生式分布.1808
• t= (x-μ)/ sx
w.s.Gosset首先提出)
式中:x ……样本平均数
μ……理论平均数
sx =s /√n ……样本标准误 =√s2/√n =√s2/n
=0.533
第二项:
[ m1.m2.e-m2 ] ∑[ mk2 .P(x-k-1)]
P (x) =
x
k!
=[(0.8943×1.2161×2.7183-1.2161)1]×(1.2161)0/0!×p0
=0.3090
第三项:
[ m1.m2.e-m2 ] ∑[ mk2 .P(x-k-1)]
P (x) =
P (x) =[
m1.m2.e-m2 x
]. ∑[
mk2 k!
.P(x-k-1)]
式中:
X2
m1= S2-X
S2-X m2= X
x------第x项 k------第x-1项 n------总项数(即实验次数)
例:茶葶子属植物在林地上的分布:
2020/10/16
2020/10/16
第一项: P (0) = e –m1 ( 1 –e –m2) = 2.7183-0.8943×(1-2.7183-1.2161)
2. X±2δ 是否占样本频率的95.43%.
X±2δ=95.71%
• X±3δ 是否占样本频率的99.738%.
X±3δ=100%)
2020/10/16
2020/10/16
九.样本统计量的分布
• 样本平均数的分布 设:μx = μ δ δx =√n ……称为标准误
(standard error of mean)
∑f x2 -(∑f x)2/N
δ= √
N-1
3676500-(22110)2/140
=√
140-1
X – u x -157.93
U = δ = 36.4
然后查表,计算区间概率。
36.4(g)
5).正态分布的单侧分位数:
注意:检查资料是否符合正态分布,只要检查三个数据:
1. X± 1δ 是否占样本频率的68.27%. (如:上例: X±1δ=70.71%
x
k!
m1.m2.e-m2
=[
x
][
m0!k2. P1 +
m12 1!
.P0
]
=0.5797/2 ×(1/1×0.3090 +1.2161/1×0.533)
=0.2775
第四项:=0.2024 第五项:=0.1345 第六项:=0.0843
第七项:=0.0503 第八项:=0.0288 第九项:=0.0178
问:100平方米有0株,1株,2株,3株…10株杂草的概率?
2020/10/16
2020/10/16
2020/10/16
五、 超几何分布: P (x) =
nk
C x n C n -x N-K C nN
x------- 0, 1, 2, 3, …n N------总体中的个体数. K------两种类型中某一种类型的个体数. n------非放回式抽样的次数. x------在n次抽样中某一种类型的个体数.
同样:把样本看作一个整体, 则: ∑f (x) =1
故: 式中任一项出现的概率为:
μx
μ----平均数
P (x) = e-μ x!
x ----第x项为自然数 :1,2,3,…
e ----常数 =2.718281…
3.Poisson分布的特征:
1).小概率事件.P ≦ 0.1.
2).n
∞,越大越好,但事实上不可能,因此,所得的分布是个近似分布.
3). 标准正态分布 a. 平均数μ与正态分布的关系:
(μ的负正与x轴的左右摆动)
μ<0
0
b. 标准差与正态分布的关系:
0μ=0
标准差越小,曲线越陡,数据越集中 标准差越大,曲线越平坦,数据越分散
2020/10/16
0
μ>0
定义: 当μ =0 δ =1 时的正态分布称为标准正态分布.
代入公式:
1
n s2
Z = z2 ( x, y)
2020/10/16
y n s1
Z =z1 (x, y) x
既然一个空间是各个位点函数的累计积分,那么,一个曲面也必然是各个微
分区间函数的积分.
即: S
S1 + S2 + S3 +…….S x
∫ 则:
S=
x
-∞
(函数)
பைடு நூலகம்S1 S2
S
S3
Sx
2020/10/16
2020/10/16
第三章:几种常见的概率分布率
一 随机变量(random variable) ----随机试验中被测定的量称为随机变量. 观察值(observation)----随机变量所取的值.
{ 随机变量 离散型随机变量(discret random variable) 连续型随机变量(continuous random variable)
连续型随机变量(continuous random variable)—取值为 某一区间内有限或无限的任何值.
离散型随机变量(discret random variable)—取值为有限, 或可数无穷个孤立的数值.
2020/10/16
2020/10/16
2020/10/16
2020/10/16
1
则: φ (μ) = √2л×1 e-(μ-0)2/2×12 = √2л . e-μ2/2 (μ=0 , <μ <∞,δ=1)
表示 μ 变量区间范围内事件发生的概率. 而整个u分布的概率为:
1 φ (u) = √2п ∫u-∞ e-u2/2 d u
4). 正态分布的性质:
a.在μ=0 时,分布函数 φ (μ) 值最大.