3-次序统计量

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

F ( z ) F ( y )
j i 1
n k
( X (1) , X ( 2 ) ,, X ( n ) )的联合密度函数为
p( n ) ( y1 , y2 ,, yn ) n! p( y1 ) p( y2 ) p( yn ), y1 y2 yn
二、与次序统计量相关的常用统计量
样本中位数m0.5的渐近分布为
m0.5
1 ~ N x , 0 . 5 2 4 n p ( x ) 0.5
例5 设总体分布为柯西分布 ,密度函数为
1 p( x; ) , x 2 (1 ( x ) )
若X 1 , X 2 ,, X n 来自该总体的样本,求 样本中位数 的渐近分布.
1、样本均值 X 总体均值
估计
2、样本中位数 估计 总体中位数
样本均值容易受离群值 的干扰,离群值会把样 本 均值拉向自己一侧,而 样本中位数不受此害 .
若有离群值时,可用截 尾均值代替样本均值 . 何为截尾均值? 把样本排序,并截去两 端一定比例的样本后求 得的 其余值的平均 .
m0.25 x([290.251]) x(8) 60
m0.5 x(15) 67 m0.75 x([290.751]) x(22) 73
五值 18 , 60 , ,67 , ,73 , 97
箱线图
18
60 67 73
97
1、样本中位数 设x(1) ,x(2) , , x( n) 是有序样本,则样本中 位数m0 .5为
m0 .5 x n 1 , n为奇数; ( ) 2 1 ( x n x n ), n为偶数. ( 1) 2 2 (2)
描述样本的中心位置
注:中心位置的描述 m0 .5具有稳健性 常用来描述总体分布的 中心位置的两个量 :
2 ~ N , 4n
2、五数概括与箱线图 五值 xmin , Q1 , , m0.5 , , Q3 , xmax
xmin x(1) 注: xmax x( n ) m0 .5
Q1 m0 .25 Q3 m0 .75
样本最小观察值 样本最大观察值 样本中位数 第一四分位数
j i 1
解:X ( n ),X (1) 的联合密度函数为 p1n ( y , z ) n( n 1)( z y )n 2 , 0 y z 1


p( z ) 1 F ( z )
n k
由公式可知
pR ( r ) p1n ( y, y r )dy 0 n(n 1)( y r y )n2 dy
例2
0 68 72 89
成绩表1
0 69 73 90 66 70 75 96 66 72 76 100 67 72 82 100
求x , m0.5 .
解:x 70.15
x
m0.5
n ( ) 2
x 2
(
n1 ) 2

x(10) x(11) 2
72
若去掉最低分 0,最高分100,则截尾均值 66 96 79.3 16
第三四分位数
箱线图 利用上述统计量来反映 总体特征的简单图形 . 方法简单易行,但比较 粗糙.
例6
18 60 64 68 72 89
四班成绩
18 60 65 69 73 90 32 60 66 70 75 96 46 60 66 72 76 97 50 60 67 72 82
xmax 97
xmin 18
pn ( x ) nF ( x )n1 p( x )
例1 设总体分布为 U (0,1), 现从中抽取一个容量为 5 1 的样本,试求 X ( k )的密度并计算 P ( X (2) ). 2 解: X ( k )的密度函数为 n! k 1 n k F ( x ) p( x )1 F ( x ) pk ( x ) ( k 1)! ( n k )! 5! 5 k k 1 0 x 1 x 1 x ( k 1)! (5 k )! X (2)的密度函数为
2、样本分位数
样本p分位数m p为
若np不是整数; x([ np 1]) , m p 1 ( x( np ) x( np 1) ), 若np是整数. 2
样本极差 R X ( n ) X (1)
表明了观测值的范围 , 易受离群值的影响 .
样本四分位点间距 R m0.75 m0.25
1
2
y j 2 y j 2

1
y jr
n j y j r y j r
( X ( i ) , X ( j ) )的联合密度函数为 注:
n! i 1 F ( y ) p( y ) pij ( y , z ) ( i 1)! ( j i 1)! ( n j )!
p( z ) 1 F ( z )
例4 设X 1 , X 2 ,, X n 来自总体分布为 U (0,1)的样本, 求极差R X ( n ) X (1)的密度函数.
n! i 1 F ( y ) p( y ) pij ( y , z ) ( i 1)! ( j i 1)! ( n j )!
F ( z ) F ( y )
n! k 1 n k F ( x ) p( x )1 F ( x ) pk ( x ) ( k 1)! ( n k )!
注:最小次序统计量 X (1)的密度函数为
p1 ( x ) n1 F ( x )
n 1
p( x )
最大次序统计量 X ( n )的密度函数为
1 1 解:分布函数为 F ( x; ) arctan( x ) 2 1 1 F ( ; ) 0 2 2 为该总体的中位数,即 x0 .5
m0.5
1 ~ N x0.5 , 4n p 2 ( x ) 0.5
m0.5
次序统计量和经验分布 函数
一、次序统计量(或称顺序统计量)及其分布 定义 设X 1 ,X 2 , ,X n是来自总体X的样本,将X 1 ,
X 2 , ,X n按从小到大的顺序排列 为 X (1) X ( 2 ) X ( n ) 则X ( i ) 称为该样本的第 i个次序统计量,
X (1)称为该样本的最小次序 统计量
表明样本去掉两端各四 分之一数据后,样本中 部 一半数据的极差 , 反映了样本取值的分散 情况.
注:样本方差和样本的 四分位数间距都可描述 总体 的变异性.
1、样本方差 总体方差
估计
2、样本的四分位数间距 估计 总体0.75分位数 与0.25分位数距离
说明:作为总体变异性 的度量,两者的角度不 同: 四分位数间距是从样本 比例的角度,样本方差 是 从变量数值大小的角度 看变异性的; 前者不易受离群值的影 响,但由于两端各去掉 四 分之一的数据,有时会 低估总体的变异性。后 者易受 离群值的影响 .
证明:
x x x P ( x X ( k ) x x ) Fk ( x x ) Fk ( x ) n! k 1 F ( x ) F ( x x ) F ( x ) ( k 1)!1! ( n k )! n k 1 F ( x x )
pk ( x ) 20 x 1 x 3
P ( X (2)
0 x 1
1/ 2 1 13 3 ) 20 x(1 x ) dx 0 2 320
2、多个次序统计量的联合分布 定理2 设X 1 ,X 2 , ,X n 是来自总体X的样本,且X的
密度函数为p( x ), 分布函数F ( x ), 则次序统计量
n! p ( y j1 , y j2 , , y jr ) ( F ( y j1 )) j1-1 ( j1 -1)! ( j2 - j1 -1)!( n-jr )!
r
( X ( j1 ) , X ( j2 ) , , X ( jr ) )的联合密度函数为
[ F ( y j2 ) - F ( y j1 )]
k 1
1
nk
Fk ( x x ) Fk ( x ) n! k 1 F ( x ) F ( x x ) F ( x ) ( k 1)!1! ( n k )!
1 F ( x x )
n k
x 0 则 Fk ( x x ) Fk ( x ) 令 pk ( x ) x n! k 1 F ( x x ) F ( x ) F ( x ) ( k 1)! ( n k )! x 令x 0 p( x ) n k n k x 0 1 F ( x ) 1 F ( x x )
j2 -j1 1
[ F ( y jr ) - F ( y jr 1 )]
jr jr 1 1
1 F ( y )
jr
n jr
p( y j1 ) p( y j2 ) p( y jr ),
y j1 y j2 y jr
证明:
j1 1
1
y j1
j1 j2 1 y j1 y j1 yj
例3
0 68 72 89
成绩表1
0 69 73 90 66 70 75 96 66 72 76 100 67 72 82 100
求m0.75 .
解:
若np不是整数; x([ np 1]) , m p 1 ( x( np ) x( np 1) ), 若np是整数. 2
m0.75 x([ np 1]) x(16) 89
X ( n ,X 1 ,X 2 , ,X n独立同分布, 注:
次序统计量X (1),X (2), ,X ( n )既不独立,分布也不相 同.
而且任何两个次序统计 量分布也不相同 .
1、单个次序统计量的分布 定理1 设X 1 ,X 2 , ,X n 是来自总体X的样本,且X的 密度函数为p( x ), 分布函数F ( x ), 则第k个次序统计 量x( k )的密度函数为 n! pk ( x ) ( F ( x )) k-1 (1 - F ( x )) n-k p( x ) ( k-1)! ( n-k )!

1 r
n( n 1)r n 2 (1 r )
Be( n 1,2)
样本分位数的抽样分布
p( x ), x p为其p分位数, p( x ) 定理3 设总体密度函数为 在x p处连续且p( x p ) 0, 则当n 时样本p分位数 m p的渐近分布为
p ( 1 -p ) mp ~ N xp , 2 n p ( x ) p
相关文档
最新文档