顺序统计量与样本极差PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
N! n1!n2!nk
!
p n1 1
p n2 2
p nk k
这就是多项分布的概率公式。
第5页/共30页
下面我们仅就总体的分布为连续情况下,讨论次 序 统计量的抽样分布。
二、单个次序统计量的分 布
定理1:设总体X的密度函数为f ( x),分布函数为F ( x),
X1 , X 2 ,, X n为样本,则第k个次序统计量X(k)
k 1
1
nk
x
x x
样本的每一个分量小于等于x的概率为F ( x),
第7页/共30页
落入区间( x, x x]的概率为F( x x) F( x),
大于x x的概率为1 F(x x),
而将n个分量分成这样三组,共有
n!
种。
(k 1)!(n k)!
于是若以Fk
(
x)记X(
k
的分布函数,则由多项分布可得
(k 1)!(n k)!
推论1:在定理1的假定下,最小最大次序统计量X(1) ,
X
(
n
的概率密度函数为
)
f1( x) n1 F ( x) n1 f ( x)
fn ( x) nF ( x ) n1 f ( x).
第9页/共30页
例1:设总体分布为U
(0,1),X1
,
X
2
,,
X
为样本,则
n
0 x 0
说明上面结论的正确性。
第1页/共30页
23 19 P( X(1) 0) 1 33 27
X(1)的概率分布列为
P( X(1)
1)
23 33
1 27
7 27
1 P( X(1) 2) 27
X (1)
0
1
2
P
19
7
1
27 27
27
P( X(2)
0)
1
C
2 3
C 32
33
7 27
(0,0,0),(0,0,1),(0,0,2)
第15页/共30页
四、样本极差及其分布
定义2:设X
1
,
X
2
,,
X
n是总体X的样本,X
(1)
,
X
(
2)
,
,
X
(
n
是
)
其次序统计量,称统计量Rn X(n) X(1)为X的样本
极差。
样本极差:反映了观测值波动的最大幅度。
定理4:设总体X为连续型随机变量,其分布函数为F( x),
密度函数为f ( x),则样本极差Rn的密度函数为
i1
n
i 1
P( Xi t)
i 1
n1
n1
n1
n1
xi
(n1) xi t xi
1t xi
i1 (1 )
i1 i1 (1 )
Cnt t (1 )nt
i 1
1
C
t n
与无关
第24页/共30页
若令S X1 X2,(n 2),在给定S的取值S s后,对任意 一组x1,, xn,( x1 x2 s),有
“容量为n的样本X1, X2,, Xn中有i 1个观测值小于等于y
第11页/共30页
一个落入区间( y, y y],j i 1个落入区间( y y, z], 一个落入区间(z, z z],而余下n j个大于z z”
1
j i 1
1
i 1
n j
y
y y
z
z z
于是由多项分布可得
P(X(i) ( y, y y], X( j) (z, z z])
,
X
,
n
每个X
j取值非0即1,命中为1,不命中为0。
令T X1 X n,T为观测到的命中次数。在这 种场合仅记录使用T不会丢失任何与命中率有关
的信息。
第21页/共30页
样本X (X1,, Xn )有一个样本分布F(X ),这个分布 包含了样本中一切有关的信息;统计量T T( X1,, Xn ) 也有一个抽样分布FT (t)。
P( X(2)
2)
1
C
2 3
C
2 3
33
7 27
(0,2,2),(1,2,2),(2,2,2)
7 7 13
P( X (2)
1)
1
27
2 7第2页2/共730页
X(2)的概率分布列为 X(2)
0
1
2
P
7 13
7
27 27
27
1 P( X(3) 0) 27
X
的概率分布列为
(3)
23 1 7 P( X(3) 1) 27 27 27
n!
F( y) i1 f ( y)y F(z) F( y y) ji1
(i 1)!1!( j i 1)!1!(n j)!
f (z) z 1 F(z z) n j
第12页/共30页
考虑到F(x)的连续性,当y 0,z 0时,有
f ij (
y,
z)
lim
y0
P(
X(i)
我们期望用统计量T代替原始样本X并且不损失任何 有关的信息,也就是期望抽样分布FT (t)像F( X ) 一样概括了有关的一切信息。
考察在统计量T的取值为t的情况下样本X的条件分布 F( X | T t),可能有两种情况:
(1) F (X | T t)依赖于参数,此条件分布仍含有的信息;
第22页/共30页
X (3)
0
1
2
P
1
7
19
27 27
27
1 7 19 P( X(3) 2) 1 27 27 27
第3页/共30页
X(1)与X(2)的联合分布列为
X (2)
X (1)
0
1
2
7
9
3
0
27
27
27
1
4
0
27
3 27
1
2
0
0
27
第4页/共30页
补充内容
设 每 次 试 验 有k个 可 能 的 结 果 , 记 为A1, A2 ,, Ak , 相 应 发 生 的 概 率 分 别p为1, p2 ,, pk, 并 且 满 足 p1 p2 pk 1。 进 行 了N次 独 立 重 复 的 试 验 , 设Ai发 生 了ni次 ,i 1,2,, k,(即n1 n2 nk N ) 则此事件发生的概率为
1 m0.5 ~ N ( x0.5 , 4n f 2 ( x0.5 )).
第19页/共30页
充分统计量
一、充分性的概念
统计量是把样本中的信息进行加工处理的结果, 可简化数据,便于统计推断。自然希望这种加工处理 不损失原样本中的信息。简单地说,不损失信息的统 计量就是充分统计量。
例1:为研究某个运动员的打靶命中率 ,我们对该
(2) F (X | T t)不依赖于参数,此条件分布已不含的信息。
后者表明,条件“T t”的出现使得从样本分布F( X )到 条件分布F( X | T t),有关的信息消失了,这说明有关 的信息都含在统计量T之中。
例2:设总体为二点分布b(1,
),X
1
,,
X
为样本,
n
令T X1 X n,则在给定T的取值后,对
运动员测试。观测其10次射击,发现除第三、 六次未命中外,其余8次都命中,这样的观测结 果包括两种信息:
第20页/共30页
(1) 打靶10次命中8次; (2) 2次不命中分别出现在第三次和第六次上. 第二种信息对了解运动员的命中率是没什么帮助的.
一般地, 设对该运动员进行了n次观测,得到X 1 ,
f
(x
z)
f
( x)dx
当0 x z 1, 0 x 1,z 0时, 即0 x 1 z,
n(n 1)[F(x z) F(x)]n2 f (x z) f (x) n(n 1)zn2
可得Rn的密度函数
fRn (z)
n(n 1)
1 z 0
n2
z dx
n(n 1)zn2(1
C
s 2
与有关
第25页/共30页
定义1:
设X
1
,
X
2
,
,
X
是
n
来
自某个总体
的样本,
总体
分布函数为F ( x, ),统计量T T ( X1,, X n )称
为的充分统计量,如果在给定T的取值后,X 1 ,
X
2
,,
X
的条件分
n
布与无关。
注: 充分统计量的一对一变换仍是充分统计量
下面我们来介绍不用求复杂的条件分布直接找到 充分统计量的方法。
n
任意的一组x1,, xn ,( xi t),有 i 1
第23页/共30页
P( X1
x1,, Xn
xn
|T
t )
P( X1
x1,, Xn P(T t)
xn ,T
t)
n1
P( X1 x1 ,, X n1 xn1 , X n t xi )
i 1 n
P( Xi t)
n1
i 1
n1
P( X i xi ) P( X n t xi )
的联合概率密度函数为
fij (
y, z)
(i
1)!(
j
n! i 1)!(n
F( y)i1F(z)
j)!
F ( y) ji1 1
F (z) n j
f
( y)
f
(z),
y z.
证明:对增量y, z,以及y z,事件“X(i) ( y, y y],
X( j) (z, z z]”
(
y,
y
y], X( y z
j)
(z,
z
z])
z0
n!
F( y)i1F(z) F( y)ji1
(i 1)!( j i 1)!(n j)!
1 F(z) n j f ( y) f (z).
证毕。
第13页/共30页
推论2:设总体X的分布函数为F
(
x),X
1
,
X
2
,,
X
是容量
n
为n的样本,则X
定理3:前r个次序统计量X(1)
,
X(
2)
,,
X(
r
的联合密度函数为
)
g( y1,,
yr
)
n! 1
(n r)!
F(
yr
) nr
f
(
y1 )
f
( yr
)
y1 y2 yr r n.
特别地,当r n时,X(1) ,, X(n)的联合密度函数为
g( y1,, yn ) n! f ( y1) f ( yn ) y1 y2 yn.
的密度函数为
fk (x)
(k
n! 1)!(n
F ( x)k11
k)!
F ( x) nk
f
( x).
第6页/共30页
证明:对任意的实数x,考虑下面的事件 “次序统计量X(k)取值落在区间( x, x x]内”
“样本容量为n的样本中有1个观测值落在 ( x, x x]之间,而有k 1个观测值小于等 于x,有n k个观测值大于x x”
)
Fk (x x) Fk (x)
n!
F ( x)k1F ( x x) F ( x)1 F ( x x ) nk
(k 1)!1!(n k)!
第8页/共30页
两边除以x,并令x 0,
fk
(
x)
lim
x0
Fk
(
x
x) x
Fk
(
x)
n!
F( x)k11 F( x) nk f ( x). 证毕。
X (np )
X (np 1)
np不是整数 np是整数
第18页/共30页
定理5: 设总体密度函数为f ( x),x p为其p分位数,f ( x)在
x p处连续且f ( x p ) 0,则当n 时,样本p分位
数m
的渐近分布为
p
p(1 p)
mp
~
N(xp,
n
f
2(xp
); )
特别地,样本中位数m0.5的渐近分布为
F
(
x)
x
0 x1
1 x 1
f
(
x)
1 0
0 x1 其它
其第k个次序统计量的密度函数为
fk ( x)
(k
n! 1)!(n
k)!
xk1(1
x)nk
0 x1
为贝塔分布Be (k, n k 1)。
第10页/共30页
三、多个次序统计量的联合分布
下面我们讨论任意两个次序统计量的联合分布。
定理2:在定理1的假定下,次序统计量( X(i) , X( j) ),i j
P( X1
x1 ,,
Xn
xn
|
S
s)
P( X1
x1,, Xn P(S s)
xn, S
s)
P( X1 x1, X2 s x1, X3 x3 ,, Xn xn ) P(X1 X2 s)
n
n
s xi
n s xi
i3 (1 ) i3
C
s 2
s
(1
)2
s
n
n
xi
n2 xi
i3 (1 ) i3
z)
为参数(n-1, 2)的贝塔分布。
第17页/共30页
0 z 1
五、样本分位数与样本中位数
定义3:设X(1) ,, X(n)是有序样本,则样本中位数m0.5定义为
m0.5
X
n1 2
1 2
X
n 2
X
n 2
1
n为奇数 n为偶数
样本p分位数m
定义为
p
mp
X [np 1]
1 2
fRn (z)
n(n 1) 0
F(x
z)
n2
F ( x)
f
(x
z)
f
( x)dx
z0 z0
第16页/共30页
练习:
设总体的分布为U
(0,1),X
1
,
X
2
,,
X
为样本,
n
求样本极差Rn的密度函数。
解:由定理4可知,样本极差的密度函数为,当z 0时,
fRn (z)
n(n 1)
F
(
x
n2
z) F(x)
(1)
,
X
(
的联合密度函数为
n)
f1n (
y,
z)
n(n 0
1)F (z)
F(
y) n2
f
(
y)
f
(z)
yz 其它
Байду номын сангаас
练习
设总体X服从区间[0,1]上的均匀分布,求容量为2的
样本X
1
,
X
所确定的次序统
2
计量X
(1)
,
X
(
的联合密度
2)
函数
,并讨论X
(1)
,
X
(
是否独立?
2)
第14页/共30页
下面我们给出任意三个或更多个次序统计量的联合 密度函数。