次序统计量及其分布 PPT
合集下载
次序统计量统计课件
1 i1
j ! F y F zn j
i1
f y
f
z
,
0
a yzb 其他
例 设总体Xห้องสมุดไป่ตู้密度函数
f
x
2x
0
0 x 1 其他
X 1 X 2 X 3 X 4为从X取出的容量为4的样本
的次序统计量.求X 3的密度函数g3x,分布函数G3x,
及P
X 3
1 2
.
解
X的分布函数为
0
F x x2
y
y y
z z z
每个分量落入
a, y的概率为F( y),
y, y y 的概率为f yy
y y, z 的概率为F(z) F( y y)
z, z z 的概率为f (z)z
z z, b 的概率为1 F(z z)
X i Xj
y, z,
y z
y z
的概率为gij
y,
zyz
gij y, z
z
z
y
y
当a y z b时,
gij
y,
z yz
i
1!1!
j
n!
i 1!1!n
j!F yi1
F z F y yji 1 1 F z zn j f y f zyz
当y 0, z 0时, Fy y Fy, Fz z Fz.
则
gij
y,
z
i 1! j
Fz F
n!
i
y j
1!n
0 0 0 0 0 0 0 0 0 0
X 2
0 0 0 0 0 0 0 1 1 1
X 3
0 1 1 1 2 2 2 1 1 1
j ! F y F zn j
i1
f y
f
z
,
0
a yzb 其他
例 设总体Xห้องสมุดไป่ตู้密度函数
f
x
2x
0
0 x 1 其他
X 1 X 2 X 3 X 4为从X取出的容量为4的样本
的次序统计量.求X 3的密度函数g3x,分布函数G3x,
及P
X 3
1 2
.
解
X的分布函数为
0
F x x2
y
y y
z z z
每个分量落入
a, y的概率为F( y),
y, y y 的概率为f yy
y y, z 的概率为F(z) F( y y)
z, z z 的概率为f (z)z
z z, b 的概率为1 F(z z)
X i Xj
y, z,
y z
y z
的概率为gij
y,
zyz
gij y, z
z
z
y
y
当a y z b时,
gij
y,
z yz
i
1!1!
j
n!
i 1!1!n
j!F yi1
F z F y yji 1 1 F z zn j f y f zyz
当y 0, z 0时, Fy y Fy, Fz z Fz.
则
gij
y,
z
i 1! j
Fz F
n!
i
y j
1!n
0 0 0 0 0 0 0 0 0 0
X 2
0 0 0 0 0 0 0 1 1 1
X 3
0 1 1 1 2 2 2 1 1 1
次序统计量及其分布
种,于是,若以 Fk (x) 记 x (k) 的分布函数,则由多 项分布可得
F k(x x ) F k(x )
n ! [F (x )]k 1 [F x x F (x )][1 F (x x )]n k
(k 1 )!(n k)!
.
两边同除以 x , 并令 x→0 , 即有
pk(x) lixm 0F k(x xx )F k(x) n ! [ F ( x ) ] k 1 p ( x ) [ 1 F ( x ) ] n k ( k 1 ) ! ( n k ) !
p ij(y,z)(i 1 )!(jin ! (y)]j i 1
[1F (z)]njf(y)f(z), ayzb
(5-3-6) 证明:对增量 y, z 以及 y < z , 事件
x ( i ) ( y ,y y ] ,x ( j .) ( z ,z z ]
§5.3 次序统计量及其分布
定义
定义 5-3-1: 设 X1,X2,L,Xn 为取自总体X的样本, 将其按大小顺序排序 X (1 ) X (2 ) L X (n )
则称 X(k) 为第 k 个次序统计量( No.k Order Statistic)
特别地,称
X(1) m 1iinnXi
(5-3-1)
为最小顺序统计量(Minimum order Statistic)
称
X(n) m 1iaxn Xi
(5-3-2)
为最大顺序统计量(Maximum order Statistic) 。
.
例5-3-1:设总体X的分布为仅取 0, 1, 2 的离散均
匀分布,其分布列为
x0 1 2
p
1 3
1 3
1 3
次序统计量及其分布共26页
次序统计量及其分布
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·ቤተ መጻሕፍቲ ባይዱ 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
拉
60、生活的道路一旦选定,就要勇敢地 走到底 ,决不 回头。 ——左
40、人类法律,事物有规律,这是不 容忽视 的。— —爱献 生
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·ቤተ መጻሕፍቲ ባይዱ 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
拉
60、生活的道路一旦选定,就要勇敢地 走到底 ,决不 回头。 ——左
40、人类法律,事物有规律,这是不 容忽视 的。— —爱献 生
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿
2.5 次序统计量
,,
x n
时,定义
X (k )
取
值 为 x(k) (k 1, 2, , n), 由 此 得 到 的 ( X (1), X (2) , , X (n) ) 称 为
样本X1 , X 2 ,, X n 的次序统计量。
1
显然有
X(1) X(2) X(n)
其中
X (1)
min
1in
Xi
称为最小次序统计量,它的值
9
样本分布函数Fn(x)不仅与样本容量n有关,还与所
得到的样本观察值有关,故它是随机变量.Fn(x)的
图形呈跳跃上升的台阶状, 在x(1), x(2), …, x(n)中的不
重复的值处,跳跃高度为
1 n
;在重复l次的值处,跳
跃高度为 l .图中的曲线是总体X的理论分布函数
n
F(x)的图形.
图
10
对任意实数 x, Fn x就是事件X x
0,
则经验分布函数 F3( x)的观察值为
1 ,
F3
(
x
)
3 2
,
3
1,
x 1, 1 x 2,
2 x 3, x 3.
7
实例3 设总体 F 具有一个样本值 1, 1, 2, 则经验分布函数F3( x)的观察值为
0,
F3
(
x
)
2 3
,
1,
x 1, 1 x 2, x 2.
8
一般地, 设 x1, x2,, xn 是总体F的一个容量为n 样本值, 先将 x1, x2,, xn 按自小到大的次序排列, 并重新编号, x(1) x(2) x(n) , 则经验分布函数Fn( x)的观察值为
x(1)
顺序统计量的分布
它通常用于描述一组数据的分布特征, 如最大值、最小值、中位数等。
顺序统计量的特点
顺序性
顺序统计量按照数据的大小顺序排列,具有明确的顺 序关系。
唯一性
对于一组数据,其顺序统计量是唯一的,不会因数据 排列顺序的改变而改变。
简单易得
顺序统计量计算简单,容易获取,不需要复杂的数学 模型和计算过程。
顺序统计量的应用场景
独立样本假设检验
顺序统计量可以用于独立样本假设检验中, 通过比较两组独立样本的差异,判断两组样 本是否来自同一总体。
在决策分析中的应用
风险决策分析
顺序统计量可以用于风险决策分析中,通过比较不同方案的风险 和收益,选择最优方案。
贝叶斯决策分析
顺序统计量可以用于贝叶斯决策分析中,通过比较不同方案的期 望收益和风险,选择最优方案。
3
应用场景
顺序统计量分布广泛应用于统计学、数据分析、 风险管理和可靠性工程等领域,用于描述和分析 数据的概率分布特征。
03
CHAPTER
常见顺序统计量的分布
正态分布下的顺序统计量
总结词
正态分布下的顺序统计量呈现钟形曲 线,其概率密度函数为正态分布。
详细描述
在正态分布中,所有数据都围绕均值 对称分布,顺序统计量也不例外。随 着数据点在均值附近的增加,其出现 的概率也相应增加。
顺序统计量与参数和统计量的比较
顺序统计量是根据数据大小排列的数值,而参数和统计量则是基于数据计算得出的数值。
与其他统计量的联系与区别
联系
顺序统计量和总体及样本统计量都是描 述数据特征的数值,它们都可以用来描 述数据的分布情况、中心趋势和离散程 度等。
VS
区别
顺序统计量只关注数据的大小排列,不涉 及数据的具体数值;而总体和样本统计量 则更注重数据的具体数值和分布情况。
顺序统计量的特点
顺序性
顺序统计量按照数据的大小顺序排列,具有明确的顺 序关系。
唯一性
对于一组数据,其顺序统计量是唯一的,不会因数据 排列顺序的改变而改变。
简单易得
顺序统计量计算简单,容易获取,不需要复杂的数学 模型和计算过程。
顺序统计量的应用场景
独立样本假设检验
顺序统计量可以用于独立样本假设检验中, 通过比较两组独立样本的差异,判断两组样 本是否来自同一总体。
在决策分析中的应用
风险决策分析
顺序统计量可以用于风险决策分析中,通过比较不同方案的风险 和收益,选择最优方案。
贝叶斯决策分析
顺序统计量可以用于贝叶斯决策分析中,通过比较不同方案的期 望收益和风险,选择最优方案。
3
应用场景
顺序统计量分布广泛应用于统计学、数据分析、 风险管理和可靠性工程等领域,用于描述和分析 数据的概率分布特征。
03
CHAPTER
常见顺序统计量的分布
正态分布下的顺序统计量
总结词
正态分布下的顺序统计量呈现钟形曲 线,其概率密度函数为正态分布。
详细描述
在正态分布中,所有数据都围绕均值 对称分布,顺序统计量也不例外。随 着数据点在均值附近的增加,其出现 的概率也相应增加。
顺序统计量与参数和统计量的比较
顺序统计量是根据数据大小排列的数值,而参数和统计量则是基于数据计算得出的数值。
与其他统计量的联系与区别
联系
顺序统计量和总体及样本统计量都是描 述数据特征的数值,它们都可以用来描 述数据的分布情况、中心趋势和离散程 度等。
VS
区别
顺序统计量只关注数据的大小排列,不涉 及数据的具体数值;而总体和样本统计量 则更注重数据的具体数值和分布情况。
2.5 次序统计量
图
9
例 设总体F具有一个样本值1, 1, 2,则经验分布函数 F3 ( x )的观察值为 0, 若 x 1 2 F3 ( x ) , 若1 x 2 3 若x 2 1,
10
经验分布函数Fn(x)从样本直观得到描述性分布.
样本直方图可以描述. (2). 经验分布函数的性质 10. 具有通常分布函数的三个性质,图形呈跳跃上升; 20. Fn(x)是一个随机变量;
4
定理
设总体 X 的分布密度为 f(x)(分布函数为 F(x)),
, X ( n ) ) 的联合分布密度为
X 1 , X 2 ,, X n 为其样本,则次序统计量的分布密度为
( X (1) , X (2) ,
n n! f ( yi ), y1 y2 f ( y1 , y2 , , yn ) i 1 0, 其他
这件事情是否是一个玩笑?
14
中位数定义
设 ( X 1 , X 2 , , X n ) 是总体 X 中的样本 , ( X (1) , X (2) , , X ( n ) ) 为其次序统计量,则样本中位数定义为
X n 1 ,n奇 ( ) 2 X 1 [ X n X n 1 ],n偶 ( ) ( ) 2 2 2
vn ( x) Fn ( x) n
为子样的为经验分布函数.
7
设总体 X 的分布函数 F(x)未知, x1 , x2 , , xn 为总体 X 的一个样本观察值,将它们按大小 排列为: x1 x 2
x n ,令
0, 如果x x(1) , k Fn x , 如果x( k ) x x( k 1) , k 1, 2,..., n 1, n 1, 如果x( n ) x .
次序统计量及其分布通用课件
适用范围:适用于样 本量较大、数据分布 较为复杂的情况。
步骤
1. 根据数据的分布特 性,选择合适的近似 公式或经验分布函数。
2. 利用近似公式或经 验分布函数,计算次 序统计量的概率分布。
数值积分法
定义:数值积分法是通过数值计算的方法,将积分运算 转化为求和运算,从而计算次序统计量的概率分布。 步骤
在数据异常值检测中的应用
总结词
次序统计量在异常值检测中具有重要应用,能够识别出离群 点,帮助分析者了解数据分布和潜在问题。
详细描述
通过比较数据点与次序统计量的关系,可以快速识别出异常 值或离群点。例如,可以利用次序统计量来检测数据中的极 端值、缺失值或不符合预期的观察值,从而对数据进行清洗 和修正。
2. 利用数值积分方法,将积分运算转化为求和运算。
适用范围:适用于数据量较大、数据分布较为复杂且无 法找到近似公式或经验分布函数的情况。
1. 根据数据的分布特性,选择合适的数值积分方法, 如蒙特卡洛模拟或高斯积分。
3. 计算次序统计量的概率分布。
05
次序统计量与其他统计量 的关系
次序统计量与中心极限定理的关系
性质
$f_n(x)$是非负的,且在 $x$的取值范围内积分等 于1。
计算方法
通过概率密度函数的导数 得到。
次序统计量的累积分布函数
定义
次序统计量的累积分布函数是描 述次序统计量取值小于或等于某
个值的概率的函数,表示为 $F_n(x)$。
性质
$F_n(x)$是关于$x$的单调不减 函数,且$F_n(x)$的值域为 $[0,1]$。
次序统计量及其分 布通用课件
• 次序统计量的定义与性质 • 次序统计量的分布 • 次序统计量的应用场景 • 次序统计量的计算方法 • 次序统计量与其他统计量的关系 • 次序统计量在数据分析中的应用
1.4 次序统计量及其分布
1 , n!
二、单个次序统计量的分布
定理2 设总体X的密度函数为f(x), 分布函数为F(x), X1, X2,…, Xn为样本, 则第k个次序统计量X(k)的密度函 数为
n! k 1 n k fk ( x) ( F ( x )) (1 F ( x )) f ( x ) ( k 1)!( n k )!
F1n ( x , y ) P { X (1) x , X ( n ) y } P{ X ( n ) y } P{ x X (1) X ( n ) y } ( F ( y )) P{ x X i y } ( F ( y ))n ( F ( y ) F ( x ))n
1.4 次序统计量及其分布
一、次序统计量。
定义 设 ) 称为
该样本的第i 个次序统计量,它的取值是将样本观测
值由小到大排列后得到的第 i 个观测值。其中 X(1)=minX1, X2, …, Xn 称为该样本的最小次序统计量, X(n)=maxX1, X2, …, Xn
可给出的 X(1) , X(2), X(3) 分布列如下:
X (1)
0
19 27
1
7 27
2
1 27
X (2)
0
7 27
1
13 27
2
7 27
p
X (3)
p
0
1 27
1
7 27
2
19 27
p
这三个次序统计量的分布是不相同的。
进一步, 给出两个次序统计量的联合分布, 如:
X(1) 和X(2) 的联合分布列为
证明:k 1,n时,直接可得 F1 ( x ) P ( X (1) x ) 1 P (min( X i ) x ) 1 (1 F ( x ))n Fn ( x ) P ( X ( n ) x ) P (max( X i ) x ) ( F ( x ))
次序统计量
由于次序统计量的每一个分量X(k) 都是样本
X,X,, 12
X n
的函数,所以X(1),X(2),L
,X(n)
也都是随机
变量。样本X1,X2,,Xn是相互独立的,但其次序统
计量(X(1),X(2),L,X(n))一般不是独立的。
2
定义 样本X1,X2,,Xn按由小到大的顺序重排为 X(1) X(2) L X(n)
{ 1,1,3,3,4,2,3,8 } 3
11
Remark (1). 中位数比样本均值更为稳健,当二者相差不大时
常采用样本均值表示数据平均,否则应该用中位数。 (2). 样本的众数适用于离散的总体
12
2. 表示“变差”的统计量: 样本方差(或标准差)、极差
样本极差定义为
R X (n ) X ( 1 ) m 1 i a x nX i m 1 ii n nX i,
f(X (1 ),X (2 ))(x ,y )
0 ,x y ,
7
1. 表示“平均”的统计量: 样本均值、中位数、众数
例 关于平均值的理解 样本均值是人们采用最多的一种描述数据的方法,
它反映了一组数据整体上的一些信息,然而容易掩盖 一些极端的情况,所以有时候样本均值不一定合理 。
思考1. 甲同学听说,有个身高 1.75 米的成年人在 平均水深为 1 米的小河中淹死了,他觉得不可思议。
4
定理 1.19 设总体 X 的分布密度为 f(x)(分布函数为 F(x)), X1 , X 2 , , X n为样本,则第 k 个次序统计量 X(k) 的分布密度为
fX (k )( x ) ( k 1 ) n ! ( ! n k ) ! [ F ( x ) ] k 1 [ 1 F ( x ) ] n kf( x ) ,k 1 ,2 ,L ,n . 特 别 , 最 小 次 序 统 计 量 X (1 )和 最 大 次 序 统 计 量 X (n) 的 分 布 密 度 为
第五章 统计量及其分布PPT资料93页
X
0
1
p
0.983
0.017
X
0
p
0.915
0.085
第五章 统计量及其分布
第12页
5.1.2 样本
样品、样本、样本量: 样本具有两重性
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。
第10页
例5.1.1 考察某厂的产品质量,以0记合格品,以1记 不合格品,则
总体 = {该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数}
若以 p 表示这堆数中1的比例(不合格品率),则该 总体可由一个二点分布表示:
X01 P 1p p
第五章 统计量及其分布
第11页
比如:两个生产同类产品的工厂的产品的总体 分布:
>552
元件数 4 4 1 2 2 3 1 13
表5.1.2中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
第五章 统计量及其分布
第16页
样本的要求:简单随机样本
要使得推断可靠,对样本就有要求,使样本能很 好地代表总体。通常有如下两个要求:
随机性: 总体中每一个个体都有同等机会
类
找出所研究的对象的规律性
第五章 统计量及其分布
第8页
数参估计 (第六章)
推断 统计学
假设检验 (第七章) 方差分析 (第八章)
回归分析 (第八章)
第五章 统计量及其分布
【实用资料】顺序统计量PPT
按概率密度函数计算次序统计量的密度函数:
设F(x)是总体X的分布函数,X1,X2,…,Xn为X 的样本,X(1),X(2),…,X(n)为顺序统计量, F(1)(x),F(n)(x)分别表示随机变量X(1),X(n)的密度函数:
当X为连续型随机变量且有密度函数f(x)时,则 X(1),X(n)也是连续型随机变量,且它们的密度 函数分别为:
p2
(x)
(2
5! 1)!(5
[F 2)!
( x)]21
p( x)[1
F (x)]52
20 x3 3x2 (1 x3)3 60x5 (1 x3)3 , 0 x 1
于是
P( x( 2)
1) 2
1
2 60x5 (1 x3)3 dx
例3:设(X1,X2,…,Xn)是来自正态总体N(12,9) 的样本,求:
解:1)因X1,X2,…,Xn独立,且服从相同分布
解: 我们首先应求出 x (2) 的分布。由总体密度函数 不难求出总体分布函数为
0 ,
F
(
x)
x3
,
1 ,
x 0; 0 x 1; x 1
可以得到 x (2) 的密度函数为
x+x
求:f(1)(x),f(n)(x)。
x (k) 的取值示意图
Fk (x x) Fk (x)
n!
[F (x)]k1[F x x F (x)][1 F (x x)]nk
(k 1)!(n k)!
两边同除以 x , 并令 x→0 , 即有
推论1 :最大次序统计量 x (n) 的概率密度函数为 推论2 :最小次序统计量 x (1) 的概率密度函数为
n-k 排序后处于25%和75%位置上的值 k - 1 1 设总体X的密度函数为 f (x) ,分布函数为 F (x) ,x1, x2, …, xn 为样本,则第 k 个次序统计量 x (k) 的密度函数为:
次序统计量及其分布.ppt
m1
2
~
N
x1
2
, n[
f
1 (x1
2
)]2
例5-3-2: 设总体 X 为柯西分布,其密度函数为
f(x ;) (1 (1 x ))2, x
其分布函数为
F (x;)1 2 1arctan(x)
易知,θ是该总体的中位数,即 x ½ = θ.
设 X1,X2, ,Xn 是来自该总体的样本,则
图 ) 若 X~N(,2),要求的分位数 xα, 可化成求
N ( 0, 1 )的分位数 .
P { X x } P { X x }
此时, X~N(0,1)
故
x
u
从而 xu
(5-3-8)
2) 对于 T ~ t (n) ,由密度函数的对称性可知
推论1 :最大次序统计量 x (n) 的概率密度函数为
p n ( x ) n [ 1 F ( x ) ] n 1 p ( x ) (5-3-4)
推论2 :最小次序统计量 x (1) 的概率密度函数为
p 1 (x ) n [F (x ) ] n 1 p (x ) (5-3-5)
例 5-3-2 :设总体X 的密度函数为
F(y)]ji1[1F(z)]nj f(y)f(z) , ayzb
例5-3-4:设总体分布为 U ( 0 , 1 ) , x1, x2, … , xn 为
样本,则 ( x (1) , x (n) )的联合密度函数为
p 1 , n ( y , z ) n ( n 1 ) ( z y ) n 2 ,0 y z 1
P { T t ( n ) } P { T t ( n ) } 1 P { T t ( n ) } 1
即
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、多个次序统计量的联合分布
对任意多个次序统计量可给出其联合分布, 以两个为例说明:
定理3 次序统计量 (x(i), x(j)), (i j) 的联合分 布密度函数为
pij(y,z)=(i1)!(jin !1)!(nj)![F (y)]i1[F (z)F (y)]ji1 [1F (z)]njp(y)p(z), yz
1.4 次序统计量及其分布
一、次序统计量。
定义 设 X1, X2, …, Xn 是取自总体X的样本, X(i) 称为 该样本的第i 个次序统计量,它的取值是将样本观测 值由小到大排列后得到的第 i 个观测值。其中
X(1)=minX1, X2, …, Xn 称为该样本的最小次序统计量,
X(n)=maxX1, X2, …, Xn 称为该样本的最大次序统计量。
定 理 3: (X(1),X(n))的 联 合 分 布 密 度 为 ( 连 续 型 )
n(n1)(F(y)F(x))n2f(x)f(y),xy
fX(1),X(n)(x,y) 0
xy
证明:当x y时,显然成立。
当x y时{X(n) y} {X(1) x, X(n) y} {X(1) x, X(n) y}
大家有疑问的,可以询问
10
证法2
n
Fk(x) P{Xk x} Cni (F(x))i(1F(x))ni ik
n!
F(x) tk1(1t)nkdt
(k1)!(nk)! 0
fk(x)
(Fk (x))'
n!
(F(x))k1(1F(x))nk
(k 1)!(nk)!
f
(x)
当k 1,k n时,可得 f1(x) n(1 F(x))n1 f (x) fn(x) n(F(x))n1 f (x)
1, n!
二、单个次序统计量的分布
定理2 设总体X的密度函数为f(x), 分布函数为F(x), X1, X2,…, Xn为样本, 则第k个次序统计量X(k)的密度函 数为
fk(x )(k 1 )n !(!n k )!(F (x ))k 1 (1 F (x ))n kf(x )
证 明 :k1,n时 ,直 接 可 得 F 1(x)P(X(1)x)1P(m in(Xi)x)1(1F(x))n F n(x)P(X(n)x)P(m ax(Xi)x)(F(x))n
X(1)X(2)
0
1
2
0 7/27 9/27 3/27
1
0
4/27 3/27
2
0
0
1/27
因为 P(X(1) = 0, X(2) = 0) =7/27 ,
因为 P( X(1) = 0, X(2) = 0) =7/27 , 而
P( X(1) = 0)*P( X(2) = 0) = (19/27)*(7/27),
0
样本中位数和样本极差
• 设(X1,X2,L,Xn)T是来自总体 X 的样本,(X(1),X(2),L,X(n))T
是次序统计量,则样本中位数定义为
X n1 ,
X%
1
2
2
(X
n 2
X
), n
2
1
它的值为
n为 奇 数 n为 偶 数
x n1 ,
x%
1
2
2
(xn
2
x
n 2
1
)
,
n为 奇 数 n为 偶 数
一 般 地 ,用 P{xX(k)xx}表 示 X1,X2,L,Xn中 有 一 个 落 在 (x,xx],k1个 落 在 ( ,x],nk个 落 在 (xx, )的 概 率 ,则 Fk(x)P{xXkxx}
Cn 1F(x)Cn k 11(F(x))k1(1F(xx))nk nCn k 11(F(x))k1(1F(x))nkf(x)dx
可给出的 X(1) , X(2), X(3) 分布列如下:
X (1) 0 1 2
p
19 7 1 27 27 27
X (2) 0 1 2
p
7 13 7
27 27 27
X (3) 0 1 2
p
1 7 19
27 27 27
这三个次序统计量的分布是不相同的。
进一步, 给出两个次序统计量的联合分布, 如: X(1) 和X(2) 的联合分布列为
样本极差定义为 R X(n) X(1) max Xi min Xi 它的值为 r xn x1 max xi min xi
F1n( x, y) P{X(1) x, X(n) y}
P{X(n) y} P{x X(1) L X(n) y}
n
(F( y))n P{x Xi y} (F( y))n (F( y) F(x))n i 1Leabharlann f1n( x,y)
2F1n( x, xy
y)
n(n 0
1)(F (
二者不等,由此可看出 X(1) 和 X(2)是不独立的。
定理1:次序统计量是充分统计量. 证明:
P ( X i 1 x ( 1 ) , L , X i n x ( n ) | X ( 1 ) x ( 1 ) , L , X ( n ) x ( n ) )
P (X i1x (1 ),L ,X inx (n )) P (X (1 )x (1 ),X (2 )x (2 )L ,X (n )x (n ))
d F k ( x ) n C n k 1 1 ( F ( x ) ) k 1 ( 1 F ( x ) ) n k f ( x ) d x fk (x ) (k 1 )n !( ! n k )!(F (x ))k 1 (1 F (x ))n kf(x )
大家应该也有点累了,稍作休息
y)
F( x))n2
f
(x)
f
(
y)
对n个次序统计量也可给出其联合分布,
定理:设总体 X的密度函数为 f分( x布)
函数为F(x), (X1,X为2,L样,X 本n),T 则次序
统计量 (X(1),X(2),L的,X 联(n)合)T分布密度函数为
n
f(y1,y2,L,yn) n!i1
f(yi),y1y2Lyn
样本X1, X2,…,Xn 是独立同分布的,而次序统计 量 X(1), X(2),…, X(n) 则既不独立,分布也不相同。
例 设总体X 的分布为仅取0,1,2的离散均匀分布,分 布列为
x 012
p 1/3 1/3 1/3
现从中抽取容量为3的样本,其一切可能取值有 33=27种,下表列出了这些值,由此