次序统计量及其分布课件
3-次序统计量
F ( z ) F ( y )
j i 1
n k
( X (1) , X ( 2 ) ,, X ( n ) )的联合密度函数为
p( n ) ( y1 , y2 ,, yn ) n! p( y1 ) p( y2 ) p( yn ), y1 y2 yn
二、与次序统计量相关的常用统计量
样本中位数m0.5的渐近分布为
m0.5
1 ~ N x , 0 . 5 2 4 n p ( x ) 0.5
例5 设总体分布为柯西分布 ,密度函数为
1 p( x; ) , x 2 (1 ( x ) )
若X 1 , X 2 ,, X n 来自该总体的样本,求 样本中位数 的渐近分布.
1、样本均值 X 总体均值
估计
2、样本中位数 估计 总体中位数
样本均值容易受离群值 的干扰,离群值会把样 本 均值拉向自己一侧,而 样本中位数不受此害 .
若有离群值时,可用截 尾均值代替样本均值 . 何为截尾均值? 把样本排序,并截去两 端一定比例的样本后求 得的 其余值的平均 .
m0.25 x([290.251]) x(8) 60
m0.5 x(15) 67 m0.75 x([290.751]) x(22) 73
五值 18 , 60 , ,67 , ,73 , 97
箱线图
18
60 67 73
97
1、样本中位数 设x(1) ,x(2) , , x( n) 是有序样本,则样本中 位数m0 .5为
m0 .5 x n 1 , n为奇数; ( ) 2 1 ( x n x n ), n为偶数. ( 1) 2 2 (2)
次序统计量统计课件
j ! F y F zn j
i1
f y
f
z
,
0
a yzb 其他
例 设总体Xห้องสมุดไป่ตู้密度函数
f
x
2x
0
0 x 1 其他
X 1 X 2 X 3 X 4为从X取出的容量为4的样本
的次序统计量.求X 3的密度函数g3x,分布函数G3x,
及P
X 3
1 2
.
解
X的分布函数为
0
F x x2
y
y y
z z z
每个分量落入
a, y的概率为F( y),
y, y y 的概率为f yy
y y, z 的概率为F(z) F( y y)
z, z z 的概率为f (z)z
z z, b 的概率为1 F(z z)
X i Xj
y, z,
y z
y z
的概率为gij
y,
zyz
gij y, z
z
z
y
y
当a y z b时,
gij
y,
z yz
i
1!1!
j
n!
i 1!1!n
j!F yi1
F z F y yji 1 1 F z zn j f y f zyz
当y 0, z 0时, Fy y Fy, Fz z Fz.
则
gij
y,
z
i 1! j
Fz F
n!
i
y j
1!n
0 0 0 0 0 0 0 0 0 0
X 2
0 0 0 0 0 0 0 1 1 1
X 3
0 1 1 1 2 2 2 1 1 1
次序统计量及其分布ppt课件
2
0
0
1/27
易于看出
P( x(1)
0)
P( x( 2)
0)
19 27
7 27
不等于
P( x(1)
0,
x(2)
0)
7 27
即 x(1) 和 x(2) 是不独立的。
3
次序统计量的分布
(一)单个次序统计量的分布
定理 5-3-1:设总体X的密度函数为 p (x) ,分布函数
为 F (x) ,x1, x2, …, xn 为样本,则第 k 个次序统计 量 x (k) 的密度函数为
X
(
n1 2
)
,
1
2
(
X
(
n 2
)
X
(
n 2
1)
),
n 为奇数;
(5-3-12)
n为偶数
17
对多数总体而言,要给出样本 p 分位数的精确分布 通常不是一件容易的事,但当 n→+∞ 时,样本 p 分 位数的渐近分布有比较简单的表达式,我们这里不 加证明地给出如下定理。
定理 5-3-4:设总体密度函数为 f (x) , xp 为其 p 分位 数, f (x) 在 xp 处连续且 f (x) > 0 , 则当 n→+∞ 时, 样本 p 分位数 mp 的渐近分布为
10
考虑到 F (x) 的连续性,当 y 0, z 0 有 F ( y y) F ( y), F (z z) F (z)
于是
pij
(
y,
z
)
lim
y0,z0
次序统计量及其分布
种,于是,若以 Fk (x) 记 x (k) 的分布函数,则由多 项分布可得
F k(x x ) F k(x )
n ! [F (x )]k 1 [F x x F (x )][1 F (x x )]n k
(k 1 )!(n k)!
.
两边同除以 x , 并令 x→0 , 即有
pk(x) lixm 0F k(x xx )F k(x) n ! [ F ( x ) ] k 1 p ( x ) [ 1 F ( x ) ] n k ( k 1 ) ! ( n k ) !
p ij(y,z)(i 1 )!(jin ! (y)]j i 1
[1F (z)]njf(y)f(z), ayzb
(5-3-6) 证明:对增量 y, z 以及 y < z , 事件
x ( i ) ( y ,y y ] ,x ( j .) ( z ,z z ]
§5.3 次序统计量及其分布
定义
定义 5-3-1: 设 X1,X2,L,Xn 为取自总体X的样本, 将其按大小顺序排序 X (1 ) X (2 ) L X (n )
则称 X(k) 为第 k 个次序统计量( No.k Order Statistic)
特别地,称
X(1) m 1iinnXi
(5-3-1)
为最小顺序统计量(Minimum order Statistic)
称
X(n) m 1iaxn Xi
(5-3-2)
为最大顺序统计量(Maximum order Statistic) 。
.
例5-3-1:设总体X的分布为仅取 0, 1, 2 的离散均
匀分布,其分布列为
x0 1 2
p
1 3
1 3
1 3
次序统计量及其分布共26页
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·ቤተ መጻሕፍቲ ባይዱ 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
拉
60、生活的道路一旦选定,就要勇敢地 走到底 ,决不 回头。 ——左
40、人类法律,事物有规律,这是不 容忽视 的。— —爱献 生
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿
次序统计量及其分布通用课件
3. 健康状况评估:通过 对个体的多项生理指标 进行监测,并利用次序 统计量进行分析,可以 对个体的健康状况进行 综合评估。
环境科学领域应用案例
总结词:环境科学领 域中,次序统计量可 用于环境监测、污染 物排放评估、气候变 化研究等。
详细描述
1. 环境监测:通过在 环境中布置传感器, 并利用次序统计量分 析传感器数据,可以 实时监测环境的空气 质量、水质等情况。
次序统计量的特点
次序统计量具有简单直观、可操 作性强、易于理解等优点,是统 计分析中常用的一种方法。
次序统计量的种类
简单次序统计量
只对总体或样本的视察值进行排序, 不涉及其他数据处理。
加权次序统计量
将总体或样本的视察值进行加权处理 后再进行排序,可以更准确地反应数 据的散布特征。
次序统计量的应用场景
统计模型
参数统计模型
在这种模型中,次序统计量被视为一个随机变量,并假定其 具有某种已知或可估计的散布情势(例如正态散布、泊疏松 布等)。然后通过参数估计和假设检验等方法对总体参数进 行推断。
非参数统计模型
在这种模型中,总体被视为非参数的,并不假定其具有某种 特定的散布情势。然后通过核密度估计、分位数回归等方法 对总体散布进行推断。
未来应用前景展望
金融风险管理
次序统计量在金融风险管理领域有着广泛的应用。例如,可以利用次序统计量分析股票市场的波动性 ,为投资决策提供支持。未来,随着金融数据的日益复杂化,次序统计量的应用将更加重要。
环境监测与保护
次序统计量可以用于环境监测和保护领域。例如,可以利用次序统计量分析空气质量、水质等环境指 标的变化趋势,为制定环境保护政策提供根据。
07
参考文献
参考文献
2.5 次序统计量
,,
x n
时,定义
X (k )
取
值 为 x(k) (k 1, 2, , n), 由 此 得 到 的 ( X (1), X (2) , , X (n) ) 称 为
样本X1 , X 2 ,, X n 的次序统计量。
1
显然有
X(1) X(2) X(n)
其中
X (1)
min
1in
Xi
称为最小次序统计量,它的值
9
样本分布函数Fn(x)不仅与样本容量n有关,还与所
得到的样本观察值有关,故它是随机变量.Fn(x)的
图形呈跳跃上升的台阶状, 在x(1), x(2), …, x(n)中的不
重复的值处,跳跃高度为
1 n
;在重复l次的值处,跳
跃高度为 l .图中的曲线是总体X的理论分布函数
n
F(x)的图形.
图
10
对任意实数 x, Fn x就是事件X x
0,
则经验分布函数 F3( x)的观察值为
1 ,
F3
(
x
)
3 2
,
3
1,
x 1, 1 x 2,
2 x 3, x 3.
7
实例3 设总体 F 具有一个样本值 1, 1, 2, 则经验分布函数F3( x)的观察值为
0,
F3
(
x
)
2 3
,
1,
x 1, 1 x 2, x 2.
8
一般地, 设 x1, x2,, xn 是总体F的一个容量为n 样本值, 先将 x1, x2,, xn 按自小到大的次序排列, 并重新编号, x(1) x(2) x(n) , 则经验分布函数Fn( x)的观察值为
x(1)
顺序统计量的分布
顺序统计量的特点
顺序性
顺序统计量按照数据的大小顺序排列,具有明确的顺 序关系。
唯一性
对于一组数据,其顺序统计量是唯一的,不会因数据 排列顺序的改变而改变。
简单易得
顺序统计量计算简单,容易获取,不需要复杂的数学 模型和计算过程。
顺序统计量的应用场景
独立样本假设检验
顺序统计量可以用于独立样本假设检验中, 通过比较两组独立样本的差异,判断两组样 本是否来自同一总体。
在决策分析中的应用
风险决策分析
顺序统计量可以用于风险决策分析中,通过比较不同方案的风险 和收益,选择最优方案。
贝叶斯决策分析
顺序统计量可以用于贝叶斯决策分析中,通过比较不同方案的期 望收益和风险,选择最优方案。
3
应用场景
顺序统计量分布广泛应用于统计学、数据分析、 风险管理和可靠性工程等领域,用于描述和分析 数据的概率分布特征。
03
CHAPTER
常见顺序统计量的分布
正态分布下的顺序统计量
总结词
正态分布下的顺序统计量呈现钟形曲 线,其概率密度函数为正态分布。
详细描述
在正态分布中,所有数据都围绕均值 对称分布,顺序统计量也不例外。随 着数据点在均值附近的增加,其出现 的概率也相应增加。
顺序统计量与参数和统计量的比较
顺序统计量是根据数据大小排列的数值,而参数和统计量则是基于数据计算得出的数值。
与其他统计量的联系与区别
联系
顺序统计量和总体及样本统计量都是描 述数据特征的数值,它们都可以用来描 述数据的分布情况、中心趋势和离散程 度等。
VS
区别
顺序统计量只关注数据的大小排列,不涉 及数据的具体数值;而总体和样本统计量 则更注重数据的具体数值和分布情况。
2.5 次序统计量
图
9
例 设总体F具有一个样本值1, 1, 2,则经验分布函数 F3 ( x )的观察值为 0, 若 x 1 2 F3 ( x ) , 若1 x 2 3 若x 2 1,
10
经验分布函数Fn(x)从样本直观得到描述性分布.
样本直方图可以描述. (2). 经验分布函数的性质 10. 具有通常分布函数的三个性质,图形呈跳跃上升; 20. Fn(x)是一个随机变量;
4
定理
设总体 X 的分布密度为 f(x)(分布函数为 F(x)),
, X ( n ) ) 的联合分布密度为
X 1 , X 2 ,, X n 为其样本,则次序统计量的分布密度为
( X (1) , X (2) ,
n n! f ( yi ), y1 y2 f ( y1 , y2 , , yn ) i 1 0, 其他
这件事情是否是一个玩笑?
14
中位数定义
设 ( X 1 , X 2 , , X n ) 是总体 X 中的样本 , ( X (1) , X (2) , , X ( n ) ) 为其次序统计量,则样本中位数定义为
X n 1 ,n奇 ( ) 2 X 1 [ X n X n 1 ],n偶 ( ) ( ) 2 2 2
vn ( x) Fn ( x) n
为子样的为经验分布函数.
7
设总体 X 的分布函数 F(x)未知, x1 , x2 , , xn 为总体 X 的一个样本观察值,将它们按大小 排列为: x1 x 2
x n ,令
0, 如果x x(1) , k Fn x , 如果x( k ) x x( k 1) , k 1, 2,..., n 1, n 1, 如果x( n ) x .
次序统计量及其分布通用课件
适用范围:适用于样 本量较大、数据分布 较为复杂的情况。
步骤
1. 根据数据的分布特 性,选择合适的近似 公式或经验分布函数。
2. 利用近似公式或经 验分布函数,计算次 序统计量的概率分布。
数值积分法
定义:数值积分法是通过数值计算的方法,将积分运算 转化为求和运算,从而计算次序统计量的概率分布。 步骤
在数据异常值检测中的应用
总结词
次序统计量在异常值检测中具有重要应用,能够识别出离群 点,帮助分析者了解数据分布和潜在问题。
详细描述
通过比较数据点与次序统计量的关系,可以快速识别出异常 值或离群点。例如,可以利用次序统计量来检测数据中的极 端值、缺失值或不符合预期的观察值,从而对数据进行清洗 和修正。
2. 利用数值积分方法,将积分运算转化为求和运算。
适用范围:适用于数据量较大、数据分布较为复杂且无 法找到近似公式或经验分布函数的情况。
1. 根据数据的分布特性,选择合适的数值积分方法, 如蒙特卡洛模拟或高斯积分。
3. 计算次序统计量的概率分布。
05
次序统计量与其他统计量 的关系
次序统计量与中心极限定理的关系
性质
$f_n(x)$是非负的,且在 $x$的取值范围内积分等 于1。
计算方法
通过概率密度函数的导数 得到。
次序统计量的累积分布函数
定义
次序统计量的累积分布函数是描 述次序统计量取值小于或等于某
个值的概率的函数,表示为 $F_n(x)$。
性质
$F_n(x)$是关于$x$的单调不减 函数,且$F_n(x)$的值域为 $[0,1]$。
次序统计量及其分 布通用课件
• 次序统计量的定义与性质 • 次序统计量的分布 • 次序统计量的应用场景 • 次序统计量的计算方法 • 次序统计量与其他统计量的关系 • 次序统计量在数据分析中的应用
1.4 次序统计量及其分布
1 , n!
二、单个次序统计量的分布
定理2 设总体X的密度函数为f(x), 分布函数为F(x), X1, X2,…, Xn为样本, 则第k个次序统计量X(k)的密度函 数为
n! k 1 n k fk ( x) ( F ( x )) (1 F ( x )) f ( x ) ( k 1)!( n k )!
F1n ( x , y ) P { X (1) x , X ( n ) y } P{ X ( n ) y } P{ x X (1) X ( n ) y } ( F ( y )) P{ x X i y } ( F ( y ))n ( F ( y ) F ( x ))n
1.4 次序统计量及其分布
一、次序统计量。
定义 设 ) 称为
该样本的第i 个次序统计量,它的取值是将样本观测
值由小到大排列后得到的第 i 个观测值。其中 X(1)=minX1, X2, …, Xn 称为该样本的最小次序统计量, X(n)=maxX1, X2, …, Xn
可给出的 X(1) , X(2), X(3) 分布列如下:
X (1)
0
19 27
1
7 27
2
1 27
X (2)
0
7 27
1
13 27
2
7 27
p
X (3)
p
0
1 27
1
7 27
2
19 27
p
这三个次序统计量的分布是不相同的。
进一步, 给出两个次序统计量的联合分布, 如:
X(1) 和X(2) 的联合分布列为
证明:k 1,n时,直接可得 F1 ( x ) P ( X (1) x ) 1 P (min( X i ) x ) 1 (1 F ( x ))n Fn ( x ) P ( X ( n ) x ) P (max( X i ) x ) ( F ( x ))
次序统计量
由于次序统计量的每一个分量X(k) 都是样本
X,X,, 12
X n
的函数,所以X(1),X(2),L
,X(n)
也都是随机
变量。样本X1,X2,,Xn是相互独立的,但其次序统
计量(X(1),X(2),L,X(n))一般不是独立的。
2
定义 样本X1,X2,,Xn按由小到大的顺序重排为 X(1) X(2) L X(n)
{ 1,1,3,3,4,2,3,8 } 3
11
Remark (1). 中位数比样本均值更为稳健,当二者相差不大时
常采用样本均值表示数据平均,否则应该用中位数。 (2). 样本的众数适用于离散的总体
12
2. 表示“变差”的统计量: 样本方差(或标准差)、极差
样本极差定义为
R X (n ) X ( 1 ) m 1 i a x nX i m 1 ii n nX i,
f(X (1 ),X (2 ))(x ,y )
0 ,x y ,
7
1. 表示“平均”的统计量: 样本均值、中位数、众数
例 关于平均值的理解 样本均值是人们采用最多的一种描述数据的方法,
它反映了一组数据整体上的一些信息,然而容易掩盖 一些极端的情况,所以有时候样本均值不一定合理 。
思考1. 甲同学听说,有个身高 1.75 米的成年人在 平均水深为 1 米的小河中淹死了,他觉得不可思议。
4
定理 1.19 设总体 X 的分布密度为 f(x)(分布函数为 F(x)), X1 , X 2 , , X n为样本,则第 k 个次序统计量 X(k) 的分布密度为
fX (k )( x ) ( k 1 ) n ! ( ! n k ) ! [ F ( x ) ] k 1 [ 1 F ( x ) ] n kf( x ) ,k 1 ,2 ,L ,n . 特 别 , 最 小 次 序 统 计 量 X (1 )和 最 大 次 序 统 计 量 X (n) 的 分 布 密 度 为
第五章 统计量及其分布PPT资料93页
X
0
1
p
0.983
0.017
X
0
p
0.915
0.085
第五章 统计量及其分布
第12页
5.1.2 样本
样品、样本、样本量: 样本具有两重性
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。
第10页
例5.1.1 考察某厂的产品质量,以0记合格品,以1记 不合格品,则
总体 = {该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数}
若以 p 表示这堆数中1的比例(不合格品率),则该 总体可由一个二点分布表示:
X01 P 1p p
第五章 统计量及其分布
第11页
比如:两个生产同类产品的工厂的产品的总体 分布:
>552
元件数 4 4 1 2 2 3 1 13
表5.1.2中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
第五章 统计量及其分布
第16页
样本的要求:简单随机样本
要使得推断可靠,对样本就有要求,使样本能很 好地代表总体。通常有如下两个要求:
随机性: 总体中每一个个体都有同等机会
类
找出所研究的对象的规律性
第五章 统计量及其分布
第8页
数参估计 (第六章)
推断 统计学
假设检验 (第七章) 方差分析 (第八章)
回归分析 (第八章)
第五章 统计量及其分布
次序统计量及其分布
§5.3次序统计量及其分布次序统计量在近代统计推断中起着重要的作用,这是由于次序统计量有一些性质不依赖于母体的分布并且计算量很小,使用起来较方便。
因此在质量管理、可靠性等方面得到广泛的应用,现在我们在本节中扼要地介绍有关次序统计量的内容。
gjzsj设1ξ,2ξ,…,n ξ是取自分布函数为F (x )的母体ξ的一个子样,x 1,x 2,… ,x n 表示这子样的一组观测值。
这些观测值,由小到大的排列用x )1(,x )2(,… ,x )(n 表示,即x )1(≤x )2(≤… ≤x )(n ,若其中有两个分量x 1与x 2相等,它们先后次序的安排是可以任意的。
定义5.3 第i 个次序统计量ξ)(i 是上述子样1ξ,2ξ,…,n ξ这样的一个的一个函数,不论子样1ξ,2ξ,…,n ξ取得怎样一组观测值x 1,x 2,… ,x n ,它总是取其中的x )(i 为观测值。
显然,对于容量为n 的子样可以得到n 个次序统计量ξ)1(≤ξ)2(≤… ≤ξ)(n ,其中ξ)1(称做最小次序统计量,ξ)(n 称做最大次序统计量。
如果1ξ,2ξ,…,n ξ是来自同一母体的n 个相互独立随机变量,那么次序统计量1ξ,2ξ,…,n ξ是否也相互独立呢?这可以从下述例子中看出(例略)。
定理5.5 设母体ξ有密度函数f (x)>0,a ≤x ≤b ,并且1ξ,2ξ,…,n ξ为取自这母体的一个子样,则第i 个次序统计量的密度函数为g i (y)=⎪⎩⎪⎨⎧≤≤-----其他,0),()](1][)([)!()!1(!1b y a y f y F y F i n i n i n i(5.24) 例5.3 设母体ξ有密度函数⎩⎨⎧<<=其他,010,2)(x x x f 并且ξ)1(<ξ)2(<ξ)3(<ξ)4(为从ξ取出的容量为4的子样的次序统计量。
求ξ)3(的密度函数)(3x g 和分布函数)(3x G ,并且计算概率)21()3(>ξP 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定理 5-3-2 :设总体 ξ 有密度函数 f (x) , a
≤x ≤b , (同样可设 a = - ∞, b = +∞ ) 。并
且 ξ1 , ξ2 , … , ξn 是取自这一总体的一个样本, 则其任意两个次序统计量 ξ (1) < ξ (2) 的联合分布
密度函数为
pij ( y, z)
(i
1)!(
pk
(
x)
lim
x0
Fk
(
x
x) x
Fk
(
x)
n!
[F (x)]k1 p(x)[1 F (x)]nk
(k 1)!(n k)!
推论1 :最大次序统计量 x (n) 的概率密度函数
为
pn (x) n [1 F (x)]n1 p(x) (5-3-4)
推论2 :最小次序统计量 x (1) 的概率密度函数为
j
n! i 1)!(n
[F ( y)]i1[F (z) j)!
F ( y)] ji1
[1 F (z)]n j f ( y) f (z), a y z b
(5-3-6)
证明:对增量 y, z 以及 y < z , 事件
x(i) ( y, y y], x( j) (z, z z]
(5-3-1)
为最小顺序统计量(Minimum order Statistic)
称
X (n)
max
1in
Xi
(5-3-2)
为最大顺序统计量(Maximum order Statistic) 。
例5-3-1:设总体X的分布为仅取 0, 1, 2 的离散
均匀分布,其分布列为
x0 1 2
p
1 3
1 3
X(2)
0
1
2
P 7/27 13/27 7/27
X(3)
0
1
2
P 1/27 7/27 19/27
可见这三个次序统计量的分布是不相同的。
进一步,我们可以给出两个次序统计量的联合分布,
如 x(1) 和 x(2) 的联合分布列为
x(2) x(1) 0
0 7/27
1 9/27
2 3/27
1
0
4/27
3/27
于是
P( x( 2)
1) 2
1
2 60x5 (1 x3)3 dx
0
yx3
1
8 20 y(1 y)3 dy
1
20(
z3
z4
)dz
0
7 8
5(1 (7)4 ) 4(1 (7)5) 0.1207
8
8
(二)多个次序统计量的联合分布
仅讨论任意二个次序统计量的情形。
2
0
01/27易于看出P( x(1)
0)
P( x( 2)
0)
19 27
7 27
不等于
P( x(1)
0,
x(2)
0)
7 27
即 x(1) 和 x(2) 是不独立的。
次序统计量的分布
(一)单个次序统计量的分布
定理 5-3-1:设总体X的密度函数为 p (x) ,分布
函数为 F (x) ,x1, x2, …, xn 为样本,则第 k 个次序统计量 x (k) 的密度函数为
(k 1)!1!(n k)!
种,于是,若以 Fk (x) 记 x (k) 的分布函数,则
由多项分布可得
Fk (x x) Fk (x)
n!
[F (x)]k1[F x x F (x)][1 F (x x)]nk
(k 1)!(n k)!
两边同除以 x , 并令 x→0 , 即有
p1(x) n [F (x)]n1 p(x)
(5-3-5)
例 5-3-2 :设总体X 的密度函数为
p(x) 3x2, 0 x 1
现从该总体中抽得一个容量为 5 的样本,试计算
P( x( 2)
1) 2
解: 我们首先应求出 x (2) 的分布。由总体密度
函数不难求出总体分布函数为
0 ,
1 y
j-i-11 ny-+jy
1
j-in--1j
z
z+z
于是由多项分布得
P(x(i) ( y, y y), x( j) (z, z z)) pij ( y, z)yz
F
(x)
x3
,
1 ,
x 0; 0 x 1; x 1
由公式(5-3-3)可以得到 x (2) 的密度函数为
p2
(x)
(2
5! 1)!(5
[F 2)!
( x)]21
p( x)[1
F
( x)]52
20 x3 3x2 (1 x3)3 60x5(1 x3)3 , 0 x 1
图见下图 5-8 .
k-1
1
n-k
x
x+x
图 5—8 x (k) 的取值示意图
样本的每一分量小于等于 x 的概率为 F (x) , 落 入区间 ( x , x + x ] 概率为F(x+ x)-F(x), 落入区间 (x+ x, b]的概率为 1-F(x+x) ,而将 n 个分量分成这样的三组,总的n!分法有
§5.3 次序统计量及其分布
定义
定义 5-3-1: 设 X1, X 2 , , X n 为取自总体X的样本, 将其按大小顺序排序 X (1) X (2) X (n)
则称 X(k) 为第 k 个次序统计量( No.k Order Statistic)
特别地,称
X (1)
min
1in
Xi
可以表述为“容量为 n 的样本 x1, x2, … , xn 中有 i-1 个观测值小于等于 y , 一个落入区间
( y , y + y ] ,
j –i -1 个落入区间 ( y
+ y , z ] , 一个落入区间 ( z, z+z ] ,而余
下的 n—j 个大于 z + z ”
i-i1-1 1
pk
(x)
(k
n! 1)!(n
[F (x)]k1[1 k)!
F
(x)]nk p(x)
(5-3-3)
证明: 对任意的实数 x ,考虑次序统计量 x(k) 取 值落在小区间 (x , x + x ] 内这一事件,它等价 于“样本容量为 n 的样本中有 1 个观测值落在区间 (x , x + x ] 之间,而有 k-1 个观测值小于等于 x ,有 n-k 个观测值大于 x + x ”,其直观示意
1 3
现从中抽取容量为 3 的样本,其一切可能取值有
33 27 种,现将它们以及由它们所构成的次序统
计量 X (1) , X (2) , X (3) 的一切可能值列在表中(P243), 由此可给出 X (1) , X (2) , X (3) 的分布列如下:
X(1)
0
12
P 19/27 7/27 1/27