次序统计量理论及应用
3-次序统计量
F ( z ) F ( y )
j i 1
n k
( X (1) , X ( 2 ) ,, X ( n ) )的联合密度函数为
p( n ) ( y1 , y2 ,, yn ) n! p( y1 ) p( y2 ) p( yn ), y1 y2 yn
二、与次序统计量相关的常用统计量
样本中位数m0.5的渐近分布为
m0.5
1 ~ N x , 0 . 5 2 4 n p ( x ) 0.5
例5 设总体分布为柯西分布 ,密度函数为
1 p( x; ) , x 2 (1 ( x ) )
若X 1 , X 2 ,, X n 来自该总体的样本,求 样本中位数 的渐近分布.
1、样本均值 X 总体均值
估计
2、样本中位数 估计 总体中位数
样本均值容易受离群值 的干扰,离群值会把样 本 均值拉向自己一侧,而 样本中位数不受此害 .
若有离群值时,可用截 尾均值代替样本均值 . 何为截尾均值? 把样本排序,并截去两 端一定比例的样本后求 得的 其余值的平均 .
m0.25 x([290.251]) x(8) 60
m0.5 x(15) 67 m0.75 x([290.751]) x(22) 73
五值 18 , 60 , ,67 , ,73 , 97
箱线图
18
60 67 73
97
1、样本中位数 设x(1) ,x(2) , , x( n) 是有序样本,则样本中 位数m0 .5为
m0 .5 x n 1 , n为奇数; ( ) 2 1 ( x n x n ), n为偶数. ( 1) 2 2 (2)
次序统计量及其分布通用课件
在大量独立同分布随机变量的样本中,任意一个样本的平均值(或 中位数)都将趋近于正态分布。
次序统计量
在给定样本中,按照大小排序后得到的顺序统计量。
关系
中心极限定理为次序统计量提供了理论基础,因为次序统计量是样本 中排序后的变量,其分布情况与中心极限定理密切相关。
次序统计量与大数定律的关系
次序统计量在统计学中的重要性
01
02
03
描述数据分布特征
次序统计量可以帮助我们 快速了解数据分布情况, 如数据的最大值、最小值 、中位数等。
进行统计分析
在统计分析中,次序统计 量常被用作描述变量或样 本的特性,如计算相关性 、进行回归分析等。
数据排序与筛选
通过次序统计量可以对数 据进行排序和筛选,以便 更好地理解和处理数据。
计算方法
通过概率密度函数或概率质量函 数积分得到。
03
次序统计量的应用场景
金融数据分析
风险评估
次序统计量可以用于评估投资组合的风险,通过分析历史收益率 数据,确定投资组合在不同市场环境下的风险水平。
市场趋势判断
利用次序统计量对市场数据进行排序,可以判断市场趋势,例如通 过分析股票价格指数的排序来判断市场的整体走势。
次序统计量及其分 布通用课件
目录
• 次序统计量的定义与性质 • 次序统计量的分布 • 次序统计量的应用场景 • 次序统计量的计算方法 • 次序统计量与其他统计量的关系 • 次序统计量在数据分析中的应用
01
次序统计量的定义与性质
次序统计量的定义
定义
次序统计量是指一组数 据中按照大小顺序排列
的统计量。
在数据异常值检测中的应用
总结词
次序统计量在异常值检测中具有重要应用,能够识别出离群 点,帮助分析者了解数据分布和潜在问题。
次序统计量理论及应用
顺序统计量的分布及其应用探究学生姓名:杨道圣 指导教师:刘宇民摘要 顺序统计量在近代统计推断中起着很重要的作用,在水文,地震,气象和建筑等领域都有重要作用。
经过总结得出了关于顺序统计量的离散型最大顺序统计量分布,最小顺序统计量分布,连续性第i 个顺序统计量ξ(i)的密度函数,连续性随机变量任意两个顺序统计量ξ(i )<ξ(j)的密度函数:1.离散型随机变量子样最小值的分布律为)(])1()!(!![)(11)1(I r pi r p l n l n x X P nl l n rl lr∈--==∑∑=-=2.离散型随机变量子样最大值的分布律为)(])1()!1()!1(![)(11111)(I r pi r p j n j n x X P nj j r l j n rn ∈-+--==∑∑=--=+-3.设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a=-∞,b=+∞),并且ξ1,ξ2,…,ξn 取自这一母体的一个子样,则第i 个顺序统计量ξ(i)的密度函数4.设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a=-∞,b=+∞),并且ξ1,ξ2,…,ξn 取自这一母体的一个子样,则任意两个个顺序统计量ξ(i )<ξ(j)的密度函数为关键词 最小顺序统计量,最大顺序统计量,第i 个顺序统计量ξ(i)的密度函数,任意两个个顺序统计量ξ(i )<ξ(j)的密度函数引言顺序统计量在近代统计推断中起着重要的作用,这是由于顺序统计量有一些性质不依赖于母体的分布,并且计算量很小,使用起来较方便,因此在质量管理、可靠性等方面得到广泛的应用。
顺序统计量在近代统计推断中起着很重要的作用,在水文,地震,气象和建筑等领域都有重要作用。
定义定义1:设(X 1,X 2…,X n )是总体X 的一个样本,假如样本的实值函数g(X 1,X 2…,X n )不依赖任何未知的量,则称g(X 1,X 2…,X n )为统计量。
次序统计量及其分布
§5.3次序统计量及其分布次序统计量在近代统计推断中起着重要的作用,这是由于次序统计量有一些性质不依赖于母体的分布并且计算量很小,使用起来较方便。
因此在质量管理、可靠性等方面得到广泛的应用,现在我们在本节中扼要地介绍有关次序统计量的内容。
gjzsj设1ξ,2ξ,…,n ξ是取自分布函数为F (x )的母体ξ的一个子样,x 1,x 2,… ,x n 表示这子样的一组观测值。
这些观测值,由小到大的排列用x )1(,x )2(,… ,x )(n 表示,即x )1(≤x )2(≤… ≤x )(n ,若其中有两个分量x 1与x 2相等,它们先后次序的安排是可以任意的。
定义5.3 第i 个次序统计量ξ)(i 是上述子样1ξ,2ξ,…,n ξ这样的一个的一个函数,不论子样1ξ,2ξ,…,n ξ取得怎样一组观测值x 1,x 2,… ,x n ,它总是取其中的x )(i 为观测值。
显然,对于容量为n 的子样可以得到n 个次序统计量ξ)1(≤ξ)2(≤… ≤ξ)(n ,其中ξ)1(称做最小次序统计量,ξ)(n 称做最大次序统计量。
如果1ξ,2ξ,…,n ξ是来自同一母体的n 个相互独立随机变量,那么次序统计量1ξ,2ξ,…,n ξ是否也相互独立呢?这可以从下述例子中看出(例略)。
定理5.5 设母体ξ有密度函数f (x)>0,a ≤x ≤b ,并且1ξ,2ξ,…,n ξ为取自这母体的一个子样,则第i 个次序统计量的密度函数为g i (y)=⎪⎩⎪⎨⎧≤≤-----其他,0),()](1][)([)!()!1(!1b y a y f y F y F i n i n i n i(5.24) 例5.3 设母体ξ有密度函数⎩⎨⎧<<=其他,010,2)(x x x f 并且ξ)1(<ξ)2(<ξ)3(<ξ)4(为从ξ取出的容量为4的子样的次序统计量。
求ξ)3(的密度函数)(3x g 和分布函数)(3x G ,并且计算概率)21()3(>ξP 。
次序统计量及其分布通用课件
3. 健康状况评估:通过 对个体的多项生理指标 进行监测,并利用次序 统计量进行分析,可以 对个体的健康状况进行 综合评估。
环境科学领域应用案例
总结词:环境科学领 域中,次序统计量可 用于环境监测、污染 物排放评估、气候变 化研究等。
详细描述
1. 环境监测:通过在 环境中布置传感器, 并利用次序统计量分 析传感器数据,可以 实时监测环境的空气 质量、水质等情况。
次序统计量的特点
次序统计量具有简单直观、可操 作性强、易于理解等优点,是统 计分析中常用的一种方法。
次序统计量的种类
简单次序统计量
只对总体或样本的视察值进行排序, 不涉及其他数据处理。
加权次序统计量
将总体或样本的视察值进行加权处理 后再进行排序,可以更准确地反应数 据的散布特征。
次序统计量的应用场景
统计模型
参数统计模型
在这种模型中,次序统计量被视为一个随机变量,并假定其 具有某种已知或可估计的散布情势(例如正态散布、泊疏松 布等)。然后通过参数估计和假设检验等方法对总体参数进 行推断。
非参数统计模型
在这种模型中,总体被视为非参数的,并不假定其具有某种 特定的散布情势。然后通过核密度估计、分位数回归等方法 对总体散布进行推断。
未来应用前景展望
金融风险管理
次序统计量在金融风险管理领域有着广泛的应用。例如,可以利用次序统计量分析股票市场的波动性 ,为投资决策提供支持。未来,随着金融数据的日益复杂化,次序统计量的应用将更加重要。
环境监测与保护
次序统计量可以用于环境监测和保护领域。例如,可以利用次序统计量分析空气质量、水质等环境指 标的变化趋势,为制定环境保护政策提供根据。
07
参考文献
参考文献
伽马分布次序统计量分布
伽马分布次序统计量分布
伽马分布的次序统计量分布是指根据伽马分布的概率密度函数,得到一组样本的次序统计量的概率分布。
伽马分布是一种重要的连续概率分布,常用于对正值随机变量进行建模。
假设我们有一个伽马分布的样本,其中包含有n个观测值。
我们可以按照这些观测值的大小,从小到大排列,得到一个次序统计量序列。
伽马分布的次序统计量分布可以描述这一序列中各个次序统计量的分布情况。
根据伽马分布的次序统计量分布,我们可以计算出不同次序统计量的概率密度函数和累积分布函数。
这些分布函数可以用于推断统计量、估计参数以及进行假设检验等统计推断操作。
需要注意的是,伽马分布的次序统计量分布通常需要借助数值计算或统计软件来进行计算和绘制。
这可以通过使用概率密度函数的解析形式或采用模拟方法来实现。
顺序统计量的分布
顺序统计量的特点
顺序性
顺序统计量按照数据的大小顺序排列,具有明确的顺 序关系。
唯一性
对于一组数据,其顺序统计量是唯一的,不会因数据 排列顺序的改变而改变。
简单易得
顺序统计量计算简单,容易获取,不需要复杂的数学 模型和计算过程。
顺序统计量的应用场景
独立样本假设检验
顺序统计量可以用于独立样本假设检验中, 通过比较两组独立样本的差异,判断两组样 本是否来自同一总体。
在决策分析中的应用
风险决策分析
顺序统计量可以用于风险决策分析中,通过比较不同方案的风险 和收益,选择最优方案。
贝叶斯决策分析
顺序统计量可以用于贝叶斯决策分析中,通过比较不同方案的期 望收益和风险,选择最优方案。
3
应用场景
顺序统计量分布广泛应用于统计学、数据分析、 风险管理和可靠性工程等领域,用于描述和分析 数据的概率分布特征。
03
CHAPTER
常见顺序统计量的分布
正态分布下的顺序统计量
总结词
正态分布下的顺序统计量呈现钟形曲 线,其概率密度函数为正态分布。
详细描述
在正态分布中,所有数据都围绕均值 对称分布,顺序统计量也不例外。随 着数据点在均值附近的增加,其出现 的概率也相应增加。
顺序统计量与参数和统计量的比较
顺序统计量是根据数据大小排列的数值,而参数和统计量则是基于数据计算得出的数值。
与其他统计量的联系与区别
联系
顺序统计量和总体及样本统计量都是描 述数据特征的数值,它们都可以用来描 述数据的分布情况、中心趋势和离散程 度等。
VS
区别
顺序统计量只关注数据的大小排列,不涉 及数据的具体数值;而总体和样本统计量 则更注重数据的具体数值和分布情况。
2.5 次序统计量
图
9
例 设总体F具有一个样本值1, 1, 2,则经验分布函数 F3 ( x )的观察值为 0, 若 x 1 2 F3 ( x ) , 若1 x 2 3 若x 2 1,
10
经验分布函数Fn(x)从样本直观得到描述性分布.
样本直方图可以描述. (2). 经验分布函数的性质 10. 具有通常分布函数的三个性质,图形呈跳跃上升; 20. Fn(x)是一个随机变量;
4
定理
设总体 X 的分布密度为 f(x)(分布函数为 F(x)),
, X ( n ) ) 的联合分布密度为
X 1 , X 2 ,, X n 为其样本,则次序统计量的分布密度为
( X (1) , X (2) ,
n n! f ( yi ), y1 y2 f ( y1 , y2 , , yn ) i 1 0, 其他
这件事情是否是一个玩笑?
14
中位数定义
设 ( X 1 , X 2 , , X n ) 是总体 X 中的样本 , ( X (1) , X (2) , , X ( n ) ) 为其次序统计量,则样本中位数定义为
X n 1 ,n奇 ( ) 2 X 1 [ X n X n 1 ],n偶 ( ) ( ) 2 2 2
vn ( x) Fn ( x) n
为子样的为经验分布函数.
7
设总体 X 的分布函数 F(x)未知, x1 , x2 , , xn 为总体 X 的一个样本观察值,将它们按大小 排列为: x1 x 2
x n ,令
0, 如果x x(1) , k Fn x , 如果x( k ) x x( k 1) , k 1, 2,..., n 1, n 1, 如果x( n ) x .
第1.4节 次序统计量及其分布
因而
[ F ( y )]n F( X (1) , X ( n ) ) ( x , y ) [ F ( y ) F ( x )]n
所以
F( X (1) , X ( n ) ) ( x , y ) [ F ( y )]n [ F ( y ) F ( x )]n
于是可以得到其联合分布密度为
其中( i1 , i2 ,
, in )是(1, 2,
-1
, n)的一个置换,这样的
置换共n ! ,因而c ( n !) 。由此可见,此条件分布 与总体无关,故
次序统计量是充分统计量.
3、次序统计量的分布 定理1.19 设总体X的分布密度为f ( x)(或分布函数 为F ( x )), X1 , X 2 , , X n为来自总体X的样本,则第k
f ( X (1 ) , X ( n ) ) ( x , y )
2 F( X(1) , X( n ) ) ( x , y ) xy
n( n 1)[ F ( y ) F ( x )]n 2 f ( x ) f ( y ), x y , x y. 0,
二、样本中位数和样本极差
1 i n
X ( n ) max X i 称为最大次序统计量 .
1 i n
注
由于每个X ( k )都是样本( X 1 , X 2 ,, X n )的函数,
所以, X (1) , X ( 2) ,, X ( n )也都是随机变量 , 并且它们 一般不相互独立 .
定义1.12 设样本X1 , X 2 , , X n按由小到达的顺序重排为
6 1 2 样本方差:sn xi2 x 2 167.583 6 i 1
1 6 2 2 样本标准差:sn x x 12.954 i 6 i 1
次序统计量
由于次序统计量的每一个分量X(k) 都是样本
X,X,, 12
X n
的函数,所以X(1),X(2),L
,X(n)
也都是随机
变量。样本X1,X2,,Xn是相互独立的,但其次序统
计量(X(1),X(2),L,X(n))一般不是独立的。
2
定义 样本X1,X2,,Xn按由小到大的顺序重排为 X(1) X(2) L X(n)
{ 1,1,3,3,4,2,3,8 } 3
11
Remark (1). 中位数比样本均值更为稳健,当二者相差不大时
常采用样本均值表示数据平均,否则应该用中位数。 (2). 样本的众数适用于离散的总体
12
2. 表示“变差”的统计量: 样本方差(或标准差)、极差
样本极差定义为
R X (n ) X ( 1 ) m 1 i a x nX i m 1 ii n nX i,
f(X (1 ),X (2 ))(x ,y )
0 ,x y ,
7
1. 表示“平均”的统计量: 样本均值、中位数、众数
例 关于平均值的理解 样本均值是人们采用最多的一种描述数据的方法,
它反映了一组数据整体上的一些信息,然而容易掩盖 一些极端的情况,所以有时候样本均值不一定合理 。
思考1. 甲同学听说,有个身高 1.75 米的成年人在 平均水深为 1 米的小河中淹死了,他觉得不可思议。
4
定理 1.19 设总体 X 的分布密度为 f(x)(分布函数为 F(x)), X1 , X 2 , , X n为样本,则第 k 个次序统计量 X(k) 的分布密度为
fX (k )( x ) ( k 1 ) n ! ( ! n k ) ! [ F ( x ) ] k 1 [ 1 F ( x ) ] n kf( x ) ,k 1 ,2 ,L ,n . 特 别 , 最 小 次 序 统 计 量 X (1 )和 最 大 次 序 统 计 量 X (n) 的 分 布 密 度 为
次序统计量及其分布
§5.3次序统计量及其分布次序统计量在近代统计推断中起着重要的作用,这是由于次序统计量有一些性质不依赖于母体的分布并且计算量很小,使用起来较方便。
因此在质量管理、可靠性等方面得到广泛的应用,现在我们在本节中扼要地介绍有关次序统计量的内容。
gjzsj设1ξ,2ξ,…,n ξ是取自分布函数为F (x )的母体ξ的一个子样,x 1,x 2,… ,x n 表示这子样的一组观测值。
这些观测值,由小到大的排列用x )1(,x )2(,… ,x )(n 表示,即x )1(≤x )2(≤… ≤x )(n ,若其中有两个分量x 1与x 2相等,它们先后次序的安排是可以任意的。
定义5.3 第i 个次序统计量ξ)(i 是上述子样1ξ,2ξ,…,n ξ这样的一个的一个函数,不论子样1ξ,2ξ,…,n ξ取得怎样一组观测值x 1,x 2,… ,x n ,它总是取其中的x )(i 为观测值。
显然,对于容量为n 的子样可以得到n 个次序统计量ξ)1(≤ξ)2(≤… ≤ξ)(n ,其中ξ)1(称做最小次序统计量,ξ)(n 称做最大次序统计量。
如果1ξ,2ξ,…,n ξ是来自同一母体的n 个相互独立随机变量,那么次序统计量1ξ,2ξ,…,n ξ是否也相互独立呢?这可以从下述例子中看出(例略)。
定理5.5 设母体ξ有密度函数f (x)>0,a ≤x ≤b ,并且1ξ,2ξ,…,n ξ为取自这母体的一个子样,则第i 个次序统计量的密度函数为g i (y)=⎪⎩⎪⎨⎧≤≤-----其他,0),()](1][)([)!()!1(!1b y a y f y F y F i n i n i n i(5.24) 例5.3 设母体ξ有密度函数⎩⎨⎧<<=其他,010,2)(x x x f 并且ξ)1(<ξ)2(<ξ)3(<ξ)4(为从ξ取出的容量为4的子样的次序统计量。
求ξ)3(的密度函数)(3x g 和分布函数)(3x G ,并且计算概率)21()3(>ξP 。
3-次序统计量解读
F ( z ) F ( y )
j i 1
n k
( X (1) , X ( 2 ) ,, X ( n ) )的联合密度函数为
p( n ) ( y1 , y2 ,, yn ) n! p( y1 ) p( y2 ) p( yn ), y1 y2 yn
二、与次序统计量相关的常用统计量
X ( n )称为该样本的最大次序 统计量
在一个简单随机样本中 ,X 1 ,X 2 , ,X n独立同分布, 注:
次序统计量X (1),X (2), ,X ( n )既不独立,分布也不相 同.
而且任何两个次序统计 量分布也不相同 .
1、单个次序统计量的分布 定理1 设X 1 ,X 2 , ,X n 是来自总体X的样本,且X的 密度函数为p( x ), 分布函数F ( x ), 则第k个次序统计 量x( k )的密度函数为 n! pk ( x ) ( F ( x )) k-1 (1 - F ( x )) n-k p( x ) ( k-1)! ( n-k )!
j2 -j1 1
[ F ( y jr ) - F ( y jr 1 )]
jr jr 1 1
1 F ( y )
jr
n jr
p( y j1 ) p( y j2 ) p( y jr ),
y j1 y j2 y jr
证明:
j1 1
1
y j1
j1 j2 1 y j1 y j1 yj
次序统计量和经验分布 函数
一、次序统计量(或称顺序统计量)及其分布 定义 设X 1 ,X 2 , ,X n是来自总体X的样本,将X 1 ,
X 2 , ,X n按从小到大的顺序排列 为 X (1) X ( 2 ) X ( n ) 则X ( i ) 称为该样本的第 i个次序统计量,
次序统计量的分布及其在数据分析中的应用
性即有
lim
△x→0
FX((i) x+△△xx)i -FX((i) x)=(i-1)(!n!n-i)!
[F(X x)(X x)][1-F(X x+△x)]n-i
圯fX((i) x)=(i-1)(!n!n-i)! [F(X x)]i-[1 1-F(X x)]n-if(X x),
n! -i-1)(! n-j)!
[F(X x)]i-[1 F(X x+△x)-F(X x)]
【作者简介】曲天尧,男,山东淄博人,硕士研究生,山东财经大学,研究方向:金融数学理论与方法、数理统计。
qiyekejiyufazhan 127
企业技术实践
×[F(X y)-F(X x+△x)]j-i-[1 F(X y+△y)
2018 年第 11 期(总第 445 期)
企业技术实践
次序统计量的分布及其在数据分析中的应用
曲天尧 (山东财经大学,山东 济南 250014)
【摘 要】次序统计量是数理统计中的一个重要概念。作为一个常用的统计量,无论是在参 数统计领域还是在非参数统计领域,次序统计量都有着广泛应用。在如今的大数据时代, 更需要借助次序统计量对数据进行整理、分析。文章主要就次序统计量及其分布、次序统 计量函数及其分布作简要总结,并介绍次序统计量在数据分析中的应用。 【关键词】简单随机样本;次序统计量;样本分位数;经验分布函数;箱线图 【中图分类号】O211.67 【文献标识码】A 【文章编号】1674-0688(2018)11-0127-03
△y>0,令 x+△x<y,则 x、y 将整个实数轴 (-肄,肄) 分成 如下 5 个部分: (-肄,x], (x,x+△x], (x,x+△y],
(y,y+△y], (y+△y,肄)。 并且有
最大次序统计量
最大次序统计量
最大次序统计量是一种统计方法,用于求出一组数据中最大值及其对应的次序。
该方法对于描述和分析给定数据集的极大值(即取值最大的数据)非常有用。
因此,最大次序统计量的使用已经广泛应用于生态学、气象学、植物学等多个学科领域。
由于最大次序统计量为求出一组数据中取值最大的数据而设计,故该方法经常用于解决一些涉及异常(extreme)值分析的统计问题。
例如,在描述一组温度观测数据中,如何得出最高温度,以及所观测到的最高温度是否是罕见的。
此外,可以根据最大次序统计量来评估研究区域的特性,确定研究区域的生态特征和植物最大和最小值,以及植物的多样性。
另外,最大次序统计量也可以用于处理各种环境问题,可为既往或未来的事件预测制定有效的方案。
例如,水质、空气质量和土壤污染三种环境问题,根据最大次序统计量可以有效地记录和分析已有研究,以确定问题的根本原因,并设计有效的解决方案。
总之,最大次序统计量是一种有效的统计方法,可以有效地用于描述、分析和预测一组数据中取值最大的数据。
该方法的使用不仅能够发现一组数据的极值,而且还可以用于探索研究区域的生态特征、研究人类各种环境问题等。
顺序统计量的分布及其应用探究论文
论文顺序统计量的分布及其应用探究系别:数学系专业:信息与计算科学学号:2008104121姓名:王海霞顺序统计量的分布及其应用探究顺序统计量在近代统计推断中起着重要的作用,这是由于次序统计量有一些性质不依赖于母体的分布,并且计算量很小,使用起来较方便,因此在质量管理、可靠性等方面得到广泛的应用。
定义:设12(,,...,)n XXX 是总体ξ的一个样本,将样本的一组观察值x=(12,,...,nx xx )的各分量按大小递增顺序排列为(1)(2)()...n x x x <=<=<=当12(,,...,)n XXX 取值为(12,,...,nx xx )时,定义n kx 取值为n kX(k=1,2,…n ),则称((1)(2)()...n xx x ,,,)为由12(,,...,)n XXX 导出的一组顺序统计量。
为方便起见,顺序统计量中的一个分量或部分分量也可称为顺序统计量,显然,顺序统计量是样本的函数,即n kX=nk X ,12(,,...,)n X X X (k=1,2,…n )因而顺序统计量中的每一个分量都是随机变量,当样本12(,,...,)n X XX 的观测值为(12,,...,nx xx )时,顺序统计量()()()12,,...,n n n nXXX的取值为((1)(2)()...n xx x ,,,)从而有()()()12...n n n n X XX<=<=<=。
()1n X =1m ini n<=<=iX叫做最小顺序统计量,()n nX=1ma xi n<=<=iX叫做最大顺序统计量,n kX 为第K 个顺序统计量。
顺序统计量在近代统计推断中起着很重要的作用,在水文,地震,气象和建筑等领域都有重要作用,下面从离散型随机变量和连续性随机变量来讨论顺序统计量的分布。
一、离散型随机变量1.设 1,2,3ξξξ为取自母体ξ的一个容量为3的子样,ξ的分布列为现在把子样1,2,3ξξξ与由他们所构成的次序统计量(1),(2),(3)ξξξ的一切可能观测值列于下表中。
次序统计量的概率性质与统计应用
次序统计量的概率性质与统计应用
张东;安玉娥
【期刊名称】《理论数学》
【年(卷),期】2024(14)1
【摘要】基于次序统计量在数理统计(非参数统计)中的重要应用,本文对次序统计量做了相对详细的介绍。
本文给出了次序统计量的概念、性质,并通过离散型总体的案例说明了次序统计量的分布不同于随机样本(总体)的分布,且不具有独立性。
不同于常见的微元法而运用分部积分法对次序统计量的分布密度作出了证明,并从可视化角度给出了常见连续型总体的次序统计量分布密度的数值分析与图像拟合。
最后通过常用的非参数检验方法阐释了次序统计量在统计工作中的重要应用。
【总页数】12页(P53-64)
【作者】张东;安玉娥
【作者单位】上海理工大学理学院;上海立信会计金融学院统数学院
【正文语种】中文
【中图分类】F20
【相关文献】
1.概率论与数理统计中关于均匀分布次序统计量的一些性质
2.利用概率元法推证次序统计量的密度函数
3.次序统计量概率密度函数的新的推导方法
4.次序统计量概率分布近似计算
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
顺序统计量的分布及其应用探究学生姓名:杨道圣 指导教师:刘宇民摘要 顺序统计量在近代统计推断中起着很重要的作用,在水文,地震,气象和建筑等领域都有重要作用。
经过总结得出了关于顺序统计量的离散型最大顺序统计量分布,最小顺序统计量分布,连续性第i 个顺序统计量ξ(i)的密度函数,连续性随机变量任意两个顺序统计量ξ(i )<ξ(j)的密度函数:1.离散型随机变量子样最小值的分布律为)(])1()!(!![)(11)1(I r pi r p l n l n x X P nl l n rl lr∈--==∑∑=-=2.离散型随机变量子样最大值的分布律为)(])1()!1()!1(![)(11111)(I r pi r p j n j n x X P nj j r l j n rn ∈-+--==∑∑=--=+-3.设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a=-∞,b=+∞),并且ξ1,ξ2,…,ξn 取自这一母体的一个子样,则第i 个顺序统计量ξ(i)的密度函数4.设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a=-∞,b=+∞),并且ξ1,ξ2,…,ξn 取自这一母体的一个子样,则任意两个个顺序统计量ξ(i )<ξ(j)的密度函数为关键词 最小顺序统计量,最大顺序统计量,第i 个顺序统计量ξ(i)的密度函数,任意两个个顺序统计量ξ(i )<ξ(j)的密度函数引言顺序统计量在近代统计推断中起着重要的作用,这是由于顺序统计量有一些性质不依赖于母体的分布,并且计算量很小,使用起来较方便,因此在质量管理、可靠性等方面得到广泛的应用。
顺序统计量在近代统计推断中起着很重要的作用,在水文,地震,气象和建筑等领域都有重要作用。
定义定义1:设(X 1,X 2…,X n )是总体X 的一个样本,假如样本的实值函数g(X 1,X 2…,X n )不依赖任何未知的量,则称g(X 1,X 2…,X n )为统计量。
设ξ1,ξ2,…,ξn 是取自函数F(x)的母体ξ的一个字样,x 1,x 2…,x n 表示这样的一组观测值。
这些观测值由小到大的排列用x (1),x (2)…,x (n)表示,即x (1)≤x (2)≤…x (n)。
若其中有两个分量x i 与x j 相等,他们先后顺序的安排是可以任意的。
定义2 第i 个顺序统计量ξ(i)是上述子样ξ1,ξ2,…,ξn 这样的一个函数,不论子样ξ1,ξ2,…,ξn 取怎样的一组观测值x 1,x 2,…,x n ,它总是取其中的x (i)为观测值。
显然,对于容量为n 的子样可也得到n 个顺序统计量ξ(1)≤ξ(2)≤…≤ξ(n).其中ξ(1)称为最小顺序统计量,ξ(n)称为最大顺序统计量。
第一部分离散型随机变量的顺序统计量设r,v,w,是一个取值可按大、小顺序排列的离散型随机变量,已知其分布率为}{1,2,3I ),()(0⋯∈==为下标集其中I i p x X P i i不妨设⋯<<⋯<<00201i x x x若假定有限个数为m ,则00201mx x x <⋯<< 又1X ,2X ,…,n X 是它的一个容量为你的子样,)(k X 为子样的第k 个顺序统计量),1(n k =.计算)(k X =0r X )(I i ∈的概率为)(0)(r k x X P =。
设j 表示子样值的顺序序列中一个等于0r x 的值的序号,l 表示最后一个等于0r x 值的序号,有n l k j ≤≤≤≤1,于是按顺序统计量定义,上诉事件即是表示子样1X ,2X ,…n X 中有j-1个取值小于0r x ,有l-j+1个取值等于0r x ,有n-1个取值大于0r x 。
可以分四步推导概率:[1](1)在子样值的顺序序列中,在0r x 前有j-1个样本值)(0I i x x r i ∈<,概率分别为)(0r i x X P =,由于样本与母体同分布,且相互独立,所以有∑∑--<===<==1100000)()()(r i x x rrr i pi x X P x X P x X P ri由于j-1个样本可以是n 个样本中任意j-1个,所以概率为1111][----∑j r i j npi C(2)在子样值的顺序序列中有l-j+1个样本)(0I i x x r i ∈=,概率分别为pr x X P x X P r r i ====)()(00由于这l-j+1个样本可以是俞夏的n-j+1个样本中任意l-j+1个,所以概率为r pC j l j l j n 111+-+-+-(3)在子样值的顺序序列中,在0r x 后面有n-lg 样本值)(0I i x x r i ∈>,概率分别为l n ri ln ln pi C -=--∑-]1[1(4)将上列三部分综合起来,并考虑j 与l 在n l k j ≤≤≤≤1情况下的变动,得到离散型随机变量顺序统计量的分布律:)()]1()()!()!1()!1(![])1()([),1)((1111111111111110)(I r i p pi r p l n j l j n pi rCpCpi i C n k x X P k j nk l ri j r i j l nl k j r i ri l n l n ln j l j l j n j j nr k ∈--+--=-===∑∑∑∑∑∑∑===--=+-≤≤≤≤-==---+-+-+---由推导过程可知,运用结果时应约定10,001==∑=i pi推论离散型随机变量子样最小值的分布律为)(])1()!(!![)(11)1(I r pi r p l n l n x X P nl l n rl lr∈--==∑∑=-=离散型随机变量子样最大值的分布律为)(])1()!1()!1(![)(11111)(I r pi r p j n j n x X P nj j r l j n rn ∈-+--==∑∑=--=+-例1如果ξ1,ξ2,…,ξn 这是来自同一母体的n 个相互独立随机变量,那么顺序统计量ξ(1),ξ(2),…,ξ(n )是否也相互独立呢?[2]设ξ1,ξ2,ξ3为取自母体ξ的一个容量为3的子样,ξ的分布列为现在把子样ξ1,ξ2,ξ3与由它们所构成的顺序统计量ξ(1),ξ(2),ξ(3)的一切可能观测值列于下表中由于子样(ξ1,ξ2,ξ3)取到每一组观测值的概率都等于1/27,容易从表中看出以下几点:ξ(1),ξ(2),ξ(3)的分布列分别为:另外:ξξξ(1)(2)(3),,的分布列还可以用以下的方法求解:(1,2,3ξξξ)的取值有27种,其中:(1).最小顺序统计量ξ(1)取0的个数可以通过如下方法计算:三个0,一种。
两个0,一个1,三种。
两个0,一个2,三种。
一个0两个1,三种。
一个0两个2,三种。
一个0一个1一个2,六种。
一共有19种。
所占的概率为19 27。
(2).最小顺序统计量ξ(1)取1的个数:三个1,一种。
两个1一个2,三种。
一个1两个2,三种,一共7种。
所占的概率为7 27。
(3).最小顺序统计量ξ(1)取2的个数:三个2,一种。
所占的概率为1 27。
(1).第2个顺序统计量ξ(2)取0的个数:三个0,一种,两个0,一个1,三种。
两个0,三个2,三种。
一共7种,所占的概率为7 27。
(2). 第2个顺序统计量ξ(2)取1的个数:三个1,一种。
两个1一个2,三种。
一个0,一个1,一个2,六种。
一共13种,所占的概率为13 27。
(3). 第2个顺序统计量ξ(2)取2的个数:三个2,一种。
一个0两个2,三种。
一个1两个2,三种,共7种,所占的概率为7 27。
(1).最大顺序统计量ξ(3)取0的个数:三个0,一种。
所占概率为1 27。
(2).最大顺序统计量ξ(3)取1的个数:三个1,一种。
两个1,一个0,三种。
一个1.两个0.三种。
共7种,所占比例为7 27。
(3). 最大顺序统计量ξ(3)取2的个数:三个2,一种,两个2,一个0,三种。
两个2,一个1,三种。
一个2两个0,三种,一个2两个1,三种,一个2,一个0,一个1,六种。
共19种,所占概率为19 27。
(1)ξ(i)与ξ(j)(i<j)的联合分布列为:(3)ξ(1),ξ(2),ξ(3)相互之间不独立,例如:P(ξ(1)=0,ξ(2)=0)=7/27,而P(ξ(1)=0)P(ξ(2)=0)=19/27 *7/27两者不相等,故与不独立。
其他类似。
由上述例子可以看出:顺序统计量之间是不相互独立的。
第二部分连续型随机变量的顺序统计量由例1可以看出求离散型随机变量顺序统计量的分布是较为方便的。
下面我们对连续型随机变量的情况来推导第i 个顺序统计量的分布。
定理定理1 设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a =-∞,b=+∞),并且ξ1,ξ2,…,ξn取自这一母体的一个子样,则第i 个顺序统计量ξ(i)的密度函数为[3]例2设母体ξ有密度函数并且ξ(1)<ξ(2)<ξ(3)<ξ(4)为从ξ取出的容量为4的子样的顺序统计量。
求ξ(3)的密度函数)(3x g 和分布函数)(3x G ,并计算概率P(ξ(3)>21) 解:母体ξ的分布函数为由定理1知道ξ(3)<的密度函数10),21(5242]21[2]2[!2!4)(34)](1[2)]([)!34(!2!4)(<≤-=-=---=y y y y y y y f y F y F y 3g 对于y 的其他值0)(3=y g ,分布函数为而概率P (ξ(3)>21)=256243])21(34[)21(1)21(1263=--=-G定理2设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a =-∞,b=+∞),并且ξ1,ξ2,…,ξn取自这一母体的一个子样,则任意两个个顺序统计量ξ(i )<ξ(j)的密度函数为例3设母体ξ的分布函数()x F 是连续型的,()(),,,1n ξξ 为取自此母体的子样的顺序统计,设()(),i i F ξη= 试证:(1) n ηηη≤≤≤ 21,且i η是来自均匀分布()1,0R 母体的顺序统计量; (2) (),1+=n i E i η ()()()()n i n n i n i D i ≤≤++-+=1,2112η (3) i η和j η的协方差矩阵为()()()()⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧+-+-+-+-2121212122212111n a a n a a n a a n a a ,其中.1,121+=+=n j a n i a证: (1) 因为ξ是连续型v r ,,分布函数为()x F .则()ξηF =服从均匀分布()1,0R .又因为ξ(i )是取自母体ξ的子样的顺序统计量.()x F 单调下降.所以有()()()n F F F ξξξ≤≤≤ 21,从而得出i η是取自均匀分布母体的子样的顺序统计量, ().,2,1n i =(2) i η的密度函数为()()()()i n i x x i n i n x f -----=1!!1!1 .10≤≤x()()()()()!!1!1!!1!1i n i n dx x x i n i n E in i i --=---=-⎰η.()().1!1!!+=+-n i n i n i()()()()()().2111!!1!1102+++=---=-+⎰n n i i dx x x i n i n E i n i i η()()()()()()().21112112222++-+=⎪⎭⎫ ⎝⎛+-+++=-=n n i n i n i n n i i E E D i i i ηηη(3) 对任意的()j i ,.0n j i ≤<≤ i η和j η的联合密度函数为()()()()()()j n j i j i j i i j i x x x x j n i j i n x x f ----------=1!!1!1!,11 .10<<<j i x x因而()()()()()()j i jn j i j i j j i i y ji j i j i j i dy dy y y y y y j n i j i n dx dx x x f x x E j ---------==⎰⎰⎰⎰1!!1!1!,1100101ηη()()()()j j n j j j y jii j j i ijidy y y y y d y y y y j n i j i n j -+---⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛----=⎰⎰11!!1!1!10110()()()()()j jn j i j i i j i i i dy y y dz z z j n i j i n -+--------=⎰⎰11!!1!1!110110=()()()()()()()()()().211!2!!1!!!1!!1!1!+++=+-+⨯------n n j i n j n j j i i j j n i j i n 令11a n i E i =+=η .12a n iE j =+=η()()()()()21211,cov +-+++=-=n ijn n j i E E E j i j i j i ηηηηηη ()()()[]()()().2112211212+-=+++-++=n a a n n j n n j i所以j i ηη,的方差矩阵为 ()()()()⎪⎪⎪⎪⎭⎫⎝⎛+-+-+-+-2121212122212111n a a n a a n a a n a a .例4.设电子元件的寿命X 服从参数为0.0015θ=的指数分布。