第1.4节 次序统计量及其分布

合集下载

次序统计量计算次序统计量和进行排序

次序统计量计算次序统计量和进行排序

次序统计量计算次序统计量和进行排序次序统计量是在统计学中常用的概念,它用来描述样本中的特定数值在排序后的位置和相对大小。

在数据分析和排序算法中,次序统计量的计算和排序是十分重要的步骤。

本文将介绍次序统计量的概念、计算方法以及在排序中的应用。

一、次序统计量的概念次序统计量是指样本中第k个小的观测值,其中k可以是任意正整数(1 ≤ k ≤ n)。

当k=1时,次序统计量即为最小值;当k=n时,次序统计量即为最大值。

通过计算次序统计量,我们可以得到样本中某一特定百分位数的值,例如中位数、四分位数等。

二、次序统计量的计算方法计算次序统计量的方法有多种,下面介绍两种常见的方法。

1. 快速选择算法快速选择算法是一种高效的计算次序统计量的方法。

它基于快速排序算法的思想,在每次划分过程中只选择其中一个子序列进行递归。

通过不断地划分和比较,最终可以找到第k个小的观测值。

快速选择算法的时间复杂度为O(n),是一种较快的计算次序统计量的方法。

2. 堆排序算法堆排序算法是另一种常用的计算次序统计量的方法。

它通过构建最小堆或最大堆的数据结构,每次取出堆顶元素并重新调整堆的结构,直到找到第k个小的观测值。

堆排序算法的时间复杂度为O(nlogn),虽然较快速选择算法慢一些,但在实际应用中仍然具有较好的性能。

三、次序统计量在排序中的应用次序统计量在排序中有着广泛的应用。

以下是两个常见的应用场景。

1. 快速排序算法快速排序算法是一种常用的排序算法,它利用次序统计量的概念进行排序。

快速排序算法通过选择一个枢轴元素,将序列分成左右两部分,并通过递归地对左右子序列进行排序,最终将整个序列有序化。

在每次排序过程中,通过求解次序统计量的值来确定枢轴元素的位置,从而实现排序。

2. 堆排序算法堆排序算法也是一种常用的排序算法,它利用次序统计量的计算方法进行排序。

通过构建最小堆或最大堆的数据结构,并依次取出堆顶元素,可以实现将序列有序化的过程。

在每次取出堆顶元素时,通过计算次序统计量的值来确定堆顶元素的位置,从而实现排序。

1-4 次序统计量

1-4 次序统计量
1
显然有
X (1) ≤ X (2) ≤ L ≤ X ( n )
称为最小次序统计量 它的值 x(1) 是样本 最小次序统计量, 其中 X (1) = min X i 称为最小次序统计量, 1≤i≤n 值中最小的一个; 称为最大次序统计量 最大次序统计量, 值中最小的一个;而 X (n) = max X i 称为最大次序统计量, 1≤i≤n 是样本值中最大的一个。 它的值 x(n) 是样本值中最大的一个。
米的小河中淹死了,他觉得不可思议。 平均水深为 1 米的小河中淹死了,他觉得不可思议。 这件事情是否是一个玩笑? 这件事情是否是一个玩笑?
8
思考2. 一位统计学家把一只脚放进 100℃ 的开水里, 思考 ℃ 的开水里, 另一只脚放进冰水中。然后宣布:现在, 另一只脚放进冰水中。然后宣布:现在,在平均值的 意义上,我感觉很舒服。 意义上,我感觉很舒服。
16
乙同学毕业后求职于一家公司。总经理说, 例 乙同学毕业后求职于一家公司。总经理说, 公司平均月薪是 3000 元。一个月后乙同学得到 工资1000元,据了解,公司共有21人,和自己 元 据了解,公司共有 人 工资 职位相同的业务员共有 10 人,每人的月薪都是 1000 元。应该如何理解乙同学的遭遇 ? 总经理 15,000 ;两个副总经理每人 8,000 ; , , 3 个部门经理每人 4000;5 个财务等行政人员 ; 每人 2000;10 个业务员每人 1000 。 ; 一共 21 人,每月支出工资 63,000。 , 。 平均值 3000,中位数 2000,众数 1000,极差 14,000 , , , ,
2
定义
样本 X 1 , X 2 ,L , X n 按由小到大的顺序重排为
X (1) ≤ X (2) ≤ L ≤ X ( n )

次序统计量及其分布通用课件

次序统计量及其分布通用课件

3. 健康状况评估:通过 对个体的多项生理指标 进行监测,并利用次序 统计量进行分析,可以 对个体的健康状况进行 综合评估。
环境科学领域应用案例
总结词:环境科学领 域中,次序统计量可 用于环境监测、污染 物排放评估、气候变 化研究等。
详细描述
1. 环境监测:通过在 环境中布置传感器, 并利用次序统计量分 析传感器数据,可以 实时监测环境的空气 质量、水质等情况。
次序统计量的特点
次序统计量具有简单直观、可操 作性强、易于理解等优点,是统 计分析中常用的一种方法。
次序统计量的种类
简单次序统计量
只对总体或样本的视察值进行排序, 不涉及其他数据处理。
加权次序统计量
将总体或样本的视察值进行加权处理 后再进行排序,可以更准确地反应数 据的散布特征。
次序统计量的应用场景
统计模型
参数统计模型
在这种模型中,次序统计量被视为一个随机变量,并假定其 具有某种已知或可估计的散布情势(例如正态散布、泊疏松 布等)。然后通过参数估计和假设检验等方法对总体参数进 行推断。
非参数统计模型
在这种模型中,总体被视为非参数的,并不假定其具有某种 特定的散布情势。然后通过核密度估计、分位数回归等方法 对总体散布进行推断。
未来应用前景展望
金融风险管理
次序统计量在金融风险管理领域有着广泛的应用。例如,可以利用次序统计量分析股票市场的波动性 ,为投资决策提供支持。未来,随着金融数据的日益复杂化,次序统计量的应用将更加重要。
环境监测与保护
次序统计量可以用于环境监测和保护领域。例如,可以利用次序统计量分析空气质量、水质等环境指 标的变化趋势,为制定环境保护政策提供根据。
07
参考文献
参考文献

1-4 次序统计量

1-4 次序统计量

等于极差的四分之一。
(3). 大多数情况下,数据基本上落在“均值±2个 标准差”的区间内,否则这个数据就被认为是
异常的大或异常的小。
在绝大多数情况下,一组正常的数据基本上 落在“均值±3个标准差”的区间内。
14

从总体中抽取容量为6的样本,测得样本值为 32, 65, 28, 35, 30, 29,
特别,最小次序统计量X (1) 和最大次序统计量X ( n ) 的分布 密度为
f X (1) ( x) n[1 F ( x)]n1 f ( x), f X ( n ) ( x) n[ F ( x)]n1 f ( x).
5
定理 1.20
设总体 X 的分布密度为 f(x)(分布函数为
F(x)), X 1 , X 2 ,, X n 为其样本, 则次序统计量的分布 密度为 ( X (1) , X (2) ,, X ( n) ) 的联合分布密度为
n n! f ( yi ), y1 y2 yn f ( y1 , y2 ,, yn ) i 1 0, 其他
6
定理 1.21
设总体 X 的分布密度为 f(x)(分布函数为
F(x)), X 1 , X 2 ,, X n 为其样本, 则次序统计量的分布 密度为 ( X (1) , X ( n ) ) 的联合分布密度为
定理
证明
次序统计量是充分统计量。
当给定 X (1) x(1) ,, X ( n ) x( n ) 时,由于X 1 , X 2 ,, X n
1 P( X i1 x(1) ,, X in x( n) ) n!
独立同分布,所以
此条件分布与总体分布无关,故次序统计量是充分统计量。
3

§1.4 顺序统计量的分布

§1.4 顺序统计量的分布

§1.4 顺序统计量≤≤≤=1212(1)(2)()1212()()(1)(2)()12(,,,) (,,,),(,,,)(,,,),(1,2,,), (,,,)(,,1.4.1 ,n n n n n k k n X X X X x x x x x x X X X x x x X x k n X X X X X 设是从总体中抽取的一个样本,是其一个观测值将观测值按由小到大的次序重新排列为一、顺序统计量的定义当取值为时定义取值为由此得到的称为样本 定义(1)(2)()) (,,,)..n n X x x x 的对应的成为其顺序统计量观察值≤≤≤≤===-称为样本的特别地,称为 称为 称为由于每个都是样本的函数,所以都是随机变量第个顺序统计量最小顺序统计量最大顺序统计量. 一般它们不相互独立.设总体的分布为样本极差.例1注:: ()12(1)1()1()()(1)()12(1)(2)():(,,,)min .max .(,,,),,,.k n i i nn i i nn n k n n X X X X X X X X R X X X X X X X k X X X 仅取的离散均匀分布,其分布列为0, 1, 2----=--<<<=-><=-≤-=-+-=---⎰设总体分布为为样本,则的联合密度函数为 令 由可以推出 则该分布参例数为 12(1)()21,()(1)(1)()122(0,1),,,,(,)(,)(1)(),0 1.,001()(1)[3()](1)(1).(1n n n n n n r n R n X U X X X X X f y z n n z y y z R x x R X X R R f r n n y r y dyn n r r n 的贝塔分布.,2)。

次序统计量

次序统计量

次序统计量次序统计量是一个重要的统计概念,它是统计学中实现经验概率分布的基础。

它的定义、计算方法以及应用都具有特殊意义。

首先,次序统计量是一类根据观测值确定概率分布的特征量。

它能够有效地实现观测值之间的比较,并区分出观测值在不同位置上的差异。

其次,次序统计量可以通过秩矩阵法来计算,由于一般假设有较大的正态分布,它是非常有用的。

次序统计量的计算方法以及计算结果,能够在不少统计学的应用实践中得到有效的利用。

次序统计量在实际应用中的类型比较多,它包括排序指数、Kendall’sτ、Spearman’sρ、Spearman-Brown预测公式等等。

排序指数是次序统计量的一种,它通过研究观测值在样本中出现的次数,来判断哪些观测值被认为是“比较大”。

Kendall’sτ和Spearman’sρ都是排序指数的扩展,它们能够涵盖更多的概念,比如离散度、偏度以及峰度等。

最后,Spearman-Brown预测公式是一种应用在排序统计量上的公式,它能够帮助我们评估一些概念的可靠性,从而使我们识别和预测一些特定模式。

次序统计量在统计学中有着重要的应用,它们能够实现观测值之间的比较,帮助我们识别和预测一些特定模式。

它们能够有效地帮助我们分析不同对象之间的差异,从而更好地掌握经验概率分布。

次序统计量也拥有计算灵活、应用广泛、考虑多种因素、能够实现丰富统计分析的优点。

因此,次序统计量在统计学的实践中具有极为重要的地位,它的定义、计算方法以及应用都是统计学的重要内容。

从本质上讲,次序统计量是统计学实现经验概率分布的基础,它能够有效地帮助我们分析不同对象之间的差异,有助于我们更好地掌握经验概率分布。

次序统计量及其分布

次序统计量及其分布

(5-3-3) 证明: 对任意的实数 x ,考虑次序统计量 x(k) 取值落 在小区间 (x , x + x ] 内这一事件,它等价于“样本 容量为 n 的样本中有 1 个观测值落在区间 (x , x + x ] 之间,而有 k-1 个观测值小于等于 x ,有 n-k 个 观测值大于 x + x ”,其直观示意图见下图 5-8 .
p (1 p ) mp ~ N xp , 2 n [ f ( x )] p
特别地,对样本中位数有
(5-3-13)
1 m1 ~ N x1 , 2 2 2 n [ f ( x )] 1 2
例5-3-2: 设总体 X 为柯西分布,其密度函数为
n! pk ( x) [ F ( x)]k 1[1 F ( x)]nk p( x) (k 1)!(n k )!
k-1 x

1
n-k
x+x
图 5—8 x (k) 的取值示意图
样本的每一分量小于等于 x 的概率为 F (x) , 落入区 间 ( x , x + x ] 概率为F(x+ x)-F(x),落入区间 (x+ x, b]的概率为 1-F(x+x) ,而将 n 个分量分成这 样的三组,总的分法有 n!
1i n
(5-3-1)
为最小顺序统计量(Minimum order Statistic) 称
X ( n ) max X i
1i n
(5-3-2)
为最大顺序统计量(Maximum order Statistic) 。
例5-3-1:设总体X的分布为仅取 0, 1, 2 的离散均
匀分布,其分布列为
pn ( x) n [1 F ( x)]

次序统计量

次序统计量

次序统计量次序统计量是统计学中重要的概念,又被称为次序统计学或秩序统计学,它广泛应用于热点问题的统计研究。

次序统计量是一种从原始数据中可以提取出来的数值,这些数值可以用来衡量样本中变量的排序。

它们经常被用来构建常见的统计插图或报告,以便对研究的结果作出准确的统计描述。

次序统计量有很多种形式,包括排序、中位数、分位数、众数和四分位数。

排序次序统计量是根据变量的相对大小对数据进行排序的结果。

排序可以提供原始数据的整体概貌和波动趋势。

中位数是指数据集中所有数据项排列好后对数据集中间位置的数值,它是没有偏差的。

分位数是指数据集中具有特定比例的数据值,它们可以提供数据的分布情况。

众数是指一组数据集中出现次数最多的数值,可以体现数据集最常见的数值。

四分位数是指数据集中25%、50%、75%的数值,它们可以衡量一个数据集中特定比例数值的大小。

次序统计量有一系列用于统计检验和分析的方法。

首先,它可以用于确定数据是否是正态分布的,以及观测样本中变量的分布情况。

其次,它可以用于判断两个样本之间的差异,以及样本中变量的分布情况。

此外,次序统计量还可以用于工具的建模,对多变量研究提供重要的信息,并可用于预测和估计数据。

次序统计量还可以用于衡量抽样技术的效果,例如随机抽样、分层抽样和自然系统抽样。

它们还可以用于确定不同类别的抽样结果,从而推断出某种测量程序的有效性。

最后,次序统计量可用于确定统计显著性,确定样本的推断参数和定量方法。

总之,次序统计量无处不在,是统计研究的基础。

它们可以用于描述变量的分布情况,确定统计显著性,比较两个样本的差异,用于数据建模,并可用于抽样技术的分析。

它们可以有助于研究人员做出准确的分析和统计推断,并充分发挥其对统计研究的价值。

次序统计量

次序统计量

次序统计量
次序统计量是概率论和统计学中一个重要的概念,它可以用来表示某一总体的分布特征以及它的极端值。

次序统计量能够提取出一定总体中的序列信息,从而有效识别出极值情况,从而更有效地提取总体信息,从而更完整地反映出一定总体情况。

次序统计量经常用于反映一组数据的分布特征,而且也可以用于定量研究我们对不同变量之间的关系。

次序统计量也可以用来识别和分析总体中的数据分布特点。

次序统计量可以分为中位数和四分位数两大类。

中位数是一组数据的中点,也就是说,它是将一组数据进行排序后中间点的数值;四分位数是指将一组数据进行排序后分割成四等份时,每个分割点的值。

四分位数可以帮助我们识别出那些极值,也就是说,它们可以帮助我们发现哪些数据点比其他数据点更高或更低。

此外,次序统计量还用于定量研究协方差,以及分析不同分布的数据,以及探究各种变量之间的关系和它们的影响。

次序统计量的数值分析可以帮助研究人员快速识别出一组数据中的任何显著变化,从而帮助更好地控制和管理实验结果。

次序统计量在多个领域都被广泛应用,例如经济学、会计学、市场营销学等,这些学科更多使用次序统计量去分析不同变量之间的关系,也适用于各类实验和统计学中不同总体数据分布研究,以及识别和分析总体中的极端值。

次序统计量是一个重要的概念,它可以有效帮助我们分析研究不
同变量之间的关系和影响,也有助于我们识别出极值情况,更好地提取总体情况和特征,从而可以更好地研究和分析现实世界中的复杂性和变化。

次序统计量及其分布通用课件

次序统计量及其分布通用课件

适用范围:适用于样 本量较大、数据分布 较为复杂的情况。
步骤
1. 根据数据的分布特 性,选择合适的近似 公式或经验分布函数。
2. 利用近似公式或经 验分布函数,计算次 序统计量的概率分布。
数值积分法
定义:数值积分法是通过数值计算的方法,将积分运算 转化为求和运算,从而计算次序统计量的概率分布。 步骤
在数据异常值检测中的应用
总结词
次序统计量在异常值检测中具有重要应用,能够识别出离群 点,帮助分析者了解数据分布和潜在问题。
详细描述
通过比较数据点与次序统计量的关系,可以快速识别出异常 值或离群点。例如,可以利用次序统计量来检测数据中的极 端值、缺失值或不符合预期的观察值,从而对数据进行清洗 和修正。
2. 利用数值积分方法,将积分运算转化为求和运算。
适用范围:适用于数据量较大、数据分布较为复杂且无 法找到近似公式或经验分布函数的情况。
1. 根据数据的分布特性,选择合适的数值积分方法, 如蒙特卡洛模拟或高斯积分。
3. 计算次序统计量的概率分布。
05
次序统计量与其他统计量 的关系
次序统计量与中心极限定理的关系
性质
$f_n(x)$是非负的,且在 $x$的取值范围内积分等 于1。
计算方法
通过概率密度函数的导数 得到。
次序统计量的累积分布函数
定义
次序统计量的累积分布函数是描 述次序统计量取值小于或等于某
个值的概率的函数,表示为 $F_n(x)$。
性质
$F_n(x)$是关于$x$的单调不减 函数,且$F_n(x)$的值域为 $[0,1]$。
次序统计量及其分 布通用课件
• 次序统计量的定义与性质 • 次序统计量的分布 • 次序统计量的应用场景 • 次序统计量的计算方法 • 次序统计量与其他统计量的关系 • 次序统计量在数据分析中的应用

§1.4顺序统计量的分布(发)

§1.4顺序统计量的分布(发)

第四节顺序统计量≤≤≤=1212(1)(2)()1212()()(1)(2)()12(,,,) (5.4.1 ,,,),(,,,)(,,),(1,2,,), (,,,)( ,,,n n n n n k k n X X X X x x x x x x X X X x x x X x k n X X X X X X 设是从总体中抽取的一个样本,是其一个观测值将观测值按由小到大的次序一、顺序统计量的定义定重新排列为当取值为时定义取值为由此得到的称为样本义(1)(2)()) (,,,)..n n x x x 顺序的对应的成统量为其计观察值≤≤≤≤===-称为样本的特别地,称为 称为 称为由于每个都是样本的函数,所以都是随机变量第个顺序统计量最小顺序统计量最大顺序统计量. 一般它们不相互独立.设总体的分布为样本极差.例1注:: ()12(1)1()1()()(1)()12(1)(2)():(,,,)min .max .(,,,),,,.k n i i nn i i nn n k n n X X X X X X X X R X X X X X X X k X X X 仅取的离散均匀分布,其分布列为0, 1, 2----=--<<<=-><=-≤-=-+-=---⎰设总体分布为为样本,则的联合密度函数为 令 由可以推出 则该分布参例数为 12(1)()21,()(1)(1)()122(0,1),,,,(,)(,)(1)(),0 1.,001()(1)[3()](1)(1).(1n n n n n n r n R n X U X X X X X f y z n n z y y z R x x R X X R R f r n n y r y dyn n r r n 的贝塔分布.,2)。

次序统计量

次序统计量

由于次序统计量的每一个分量X(k) 都是样本
X,X,, 12
X n
的函数,所以X(1),X(2),L
,X(n)
也都是随机
变量。样本X1,X2,,Xn是相互独立的,但其次序统
计量(X(1),X(2),L,X(n))一般不是独立的。
2
定义 样本X1,X2,,Xn按由小到大的顺序重排为 X(1) X(2) L X(n)
{ 1,1,3,3,4,2,3,8 } 3
11
Remark (1). 中位数比样本均值更为稳健,当二者相差不大时
常采用样本均值表示数据平均,否则应该用中位数。 (2). 样本的众数适用于离散的总体
12
2. 表示“变差”的统计量: 样本方差(或标准差)、极差
样本极差定义为
R X (n ) X ( 1 ) m 1 i a x nX i m 1 ii n nX i,
f(X (1 ),X (2 ))(x ,y )
0 ,x y ,
7
1. 表示“平均”的统计量: 样本均值、中位数、众数
例 关于平均值的理解 样本均值是人们采用最多的一种描述数据的方法,
它反映了一组数据整体上的一些信息,然而容易掩盖 一些极端的情况,所以有时候样本均值不一定合理 。
思考1. 甲同学听说,有个身高 1.75 米的成年人在 平均水深为 1 米的小河中淹死了,他觉得不可思议。
4
定理 1.19 设总体 X 的分布密度为 f(x)(分布函数为 F(x)), X1 , X 2 , , X n为样本,则第 k 个次序统计量 X(k) 的分布密度为
fX (k )( x ) ( k 1 ) n ! ( ! n k ) ! [ F ( x ) ] k 1 [ 1 F ( x ) ] n kf( x ) ,k 1 ,2 ,L ,n . 特 别 , 最 小 次 序 统 计 量 X (1 )和 最 大 次 序 统 计 量 X (n) 的 分 布 密 度 为

1.3--1.4 抽样分布,次序统计量

1.3--1.4 抽样分布,次序统计量

位数记为 Fa (n1, n2 ) ,它满足
P{F > Fa (n1, n2 )} = a
对 a = 0.05, 0.01 ,0.10 ,0.025 的 Fa (n1, n2 ) 的值,可由附表 5 查出。
P{X > ua} = 1 − P{X ≤ ua}= 1 − Φ(ua ) = a
即 Φ(ua ) = 1 − a
给定 a ,由附表 2 可查得 ua 的值,如 u0.05 = 1.64 ,u0.025 = 1.96 。由于 标准正态分布的对称性,显然有
ua = −u1−a
2、如果
χ
2 n
~
χ
2 (n)
)
=
E(
X
2 i
)
=
E
(
X
2 i
)
=
[D( X i ) + (E( X i ))2 ] =n
i =1
i =1
i =1
∫ 由于
D(
X
2 i
)
=
E
(
X
4 i
)

(
E
(
X
2 i
))2
=
+∞ −∞
x4
− x2
e 2 dx − 1 = 3 − 1 = 2

n
n
∑ ∑ 所以
D(
χ
2 n
)
=
D(
X
2 i
)
=
D(
n→∞
ϕT
(t
)
=
1
−t2
e2

此性质说明,当 n → ∞ 时, t 分布的极限分布是标准正态分布。

次序统计量及其分布

次序统计量及其分布

§5.3次序统计量及其分布次序统计量在近代统计推断中起着重要的作用,这是由于次序统计量有一些性质不依赖于母体的分布并且计算量很小,使用起来较方便。

因此在质量管理、可靠性等方面得到广泛的应用,现在我们在本节中扼要地介绍有关次序统计量的内容。

gjzsj设1ξ,2ξ,…,n ξ是取自分布函数为F (x )的母体ξ的一个子样,x 1,x 2,… ,x n 表示这子样的一组观测值。

这些观测值,由小到大的排列用x )1(,x )2(,… ,x )(n 表示,即x )1(≤x )2(≤… ≤x )(n ,若其中有两个分量x 1与x 2相等,它们先后次序的安排是可以任意的。

定义5.3 第i 个次序统计量ξ)(i 是上述子样1ξ,2ξ,…,n ξ这样的一个的一个函数,不论子样1ξ,2ξ,…,n ξ取得怎样一组观测值x 1,x 2,… ,x n ,它总是取其中的x )(i 为观测值。

显然,对于容量为n 的子样可以得到n 个次序统计量ξ)1(≤ξ)2(≤… ≤ξ)(n ,其中ξ)1(称做最小次序统计量,ξ)(n 称做最大次序统计量。

如果1ξ,2ξ,…,n ξ是来自同一母体的n 个相互独立随机变量,那么次序统计量1ξ,2ξ,…,n ξ是否也相互独立呢?这可以从下述例子中看出(例略)。

定理5.5 设母体ξ有密度函数f (x)>0,a ≤x ≤b ,并且1ξ,2ξ,…,n ξ为取自这母体的一个子样,则第i 个次序统计量的密度函数为g i (y)=⎪⎩⎪⎨⎧≤≤-----其他,0),()](1][)([)!()!1(!1b y a y f y F y F i n i n i n i(5.24) 例5.3 设母体ξ有密度函数⎩⎨⎧<<=其他,010,2)(x x x f 并且ξ)1(<ξ)2(<ξ)3(<ξ)4(为从ξ取出的容量为4的子样的次序统计量。

求ξ)3(的密度函数)(3x g 和分布函数)(3x G ,并且计算概率)21()3(>ξP 。

次序统计量与分布27页PPT

次序统计量与分布27页PPT
次序统计量与分布
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·吐 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
40、人类法律,事物有规律,这是不 容忽视 的。— —爱献 生
谢谢你的阅读
❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言

次序统计量及其分布

次序统计量及其分布

§5.3次序统计量及其分布次序统计量在近代统计推断中起着重要的作用,这是由于次序统计量有一些性质不依赖于母体的分布并且计算量很小,使用起来较方便。

因此在质量管理、可靠性等方面得到广泛的应用,现在我们在本节中扼要地介绍有关次序统计量的内容。

gjzsj设1ξ,2ξ,…,n ξ是取自分布函数为F (x )的母体ξ的一个子样,x 1,x 2,… ,x n 表示这子样的一组观测值。

这些观测值,由小到大的排列用x )1(,x )2(,… ,x )(n 表示,即x )1(≤x )2(≤… ≤x )(n ,若其中有两个分量x 1与x 2相等,它们先后次序的安排是可以任意的。

定义5.3 第i 个次序统计量ξ)(i 是上述子样1ξ,2ξ,…,n ξ这样的一个的一个函数,不论子样1ξ,2ξ,…,n ξ取得怎样一组观测值x 1,x 2,… ,x n ,它总是取其中的x )(i 为观测值。

显然,对于容量为n 的子样可以得到n 个次序统计量ξ)1(≤ξ)2(≤… ≤ξ)(n ,其中ξ)1(称做最小次序统计量,ξ)(n 称做最大次序统计量。

如果1ξ,2ξ,…,n ξ是来自同一母体的n 个相互独立随机变量,那么次序统计量1ξ,2ξ,…,n ξ是否也相互独立呢?这可以从下述例子中看出(例略)。

定理5.5 设母体ξ有密度函数f (x)>0,a ≤x ≤b ,并且1ξ,2ξ,…,n ξ为取自这母体的一个子样,则第i 个次序统计量的密度函数为g i (y)=⎪⎩⎪⎨⎧≤≤-----其他,0),()](1][)([)!()!1(!1b y a y f y F y F i n i n i n i(5.24) 例5.3 设母体ξ有密度函数⎩⎨⎧<<=其他,010,2)(x x x f 并且ξ)1(<ξ)2(<ξ)3(<ξ)4(为从ξ取出的容量为4的子样的次序统计量。

求ξ)3(的密度函数)(3x g 和分布函数)(3x G ,并且计算概率)21()3(>ξP 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

X (1)称为样本的最小次序统计量, X ( n)称为样本的 最大次序统计量.
2、次序统计量的性质 定理1.19 次序统计量是充分统计量
证 由充分统计量的定义可知,只需要证明其条件 分布与总体分布无关即可.由于样本具有独立性与同分 布性,因而
P{ X1 x1 ,, X n xn | X(1) x(1) ,, X( n) x( n) }
其观测值为
x n1 , ( 2) x 1 [ x n x n1 ], ( ) 2 (2) 2
n为奇数, n为偶数,
2、样本中位数的意义 样本中位数主要用来描述样本位置的特征, 具有和样本均值类似的含义,但它不受样本异常值 的影响,同时也容易计算,也可以作为总体均值的 估计. 缺点是分布不容易计算,因而在理论讨论时, 带来一定困难. 3、样本极差 定义 设(X (1) , X ( 2 ) , , X ( n ) )T 为样本( X1 , X 2 ,

根据分布函数的定义可得
F( X(1) , X( n ) ) ( x, y ) P{ X (1) x, X ( n) y}
以下分两种情形讨论:
(1)当x y时,
F( X(1) , X( n ) ) ( x, y) P{ X (1) x, X ( n) y} P{ X ( n) y}
第1.4节 次序统计量及其分布
一、次序统计量 二、样本中位数和样本极差
一、次序统计量
1、 次序统计量 设( X1 , X 2 , , X n )T 是从总体X中抽取的一个样本,
( x1 , x2 , , xn )T 是其一个观测值, 将观测值按由小到 大的次序重新排列为 x(1) x( 2 ) x( n ) 当( X1 , X 2 , , X n )T 取值为( x1 , x2 , xn )T 时, 定义 X ( k )取值为x( k ) ( k 1, 2, n),由此得到
特别地,X (1) min X i 称为最小次序统计量 .
1 i n
X ( n ) max X i 称为最大次序统计量 .
1 i n

由于每个X ( k )都是样本( X 1 , X 2 ,, X n )的函数,
所以, X (1) , X ( 2) ,, X ( n )也都是随机变量 并且它们 , 一般不相互独立 .
定理1.20 设总体X的分布密度为f ( x)(或分布函数
为F ( x ), X1 , X 2 , , X n为来自总体X的样本,则次序 统计量( X (1) , X 2), , X n))T 的联合分布密度为 ( ( n n ! f i ( yi ), y1 y2 yn f ( y1 , y2 ,, yn ) i 1 0, 其他, 证明省略
n 1
F ( x) n! = t k 1 (1 t )n k dt (利用分部积分) ( k 1)!( n k )! 0
因此
n! f X(k)( x ) = ( F ( x ))k 1 (1 F ( x ))n k f ( x ) ( k 1)!( n k )!
f ( X (1 ) , X ( n ) ) ( x , y )
2 F( X(1) , X( n ) ) ( x , y ) xy
n( n 1)[ F ( y ) F ( x )]n 2 f ( x ) f ( y ), x y 其他, 0,
二、样本中位数和样本极差
FX( k ) ( x ) P{ X ( i ) x X ( i 1) } P{ X ( n ) x }
i k n 1
= P{v ( x ) i } P{v ( x ) n}
i k
i = Cn [F ( x )]i [1 F ( x )]n i i k n 1

首先将样本观测值进行排序,可得
28, 29, 30, 32, 35, 65,

1 样本中位数:x ( x( 3) x( 4 ) ) 31 2 1 6 样本均值:x xi 36.5 6 i 1
样本极差:r max xi min xi 65 28 37
1 i 6 1 i 6
匀分布,( X1 , X 2 , , X n )为总体X的样本, 试求X ( k )的 分布.

总体X的分布密度为 1, 0 x 1 f ( x) 0, 其他
X的分布函数为 0, x 0 F ( x ) x, 0 x 1 1, x 1
n! k 1 n k f X(k)( x ) = ( F ( x )) (1 F ( x )) f ( x ) ( k 1)!( n k )! n! = ( x )k 1 (1 x )n k , 0 x 1. ( k 1)!( n k )!
说明 (1) 最大次序统计量X ( n )的分布密度为
f X( n ) ( x ) n[ F ( x )]n1 f ( x )
( 2) 最小次序统计量X (1)的分布密度为 f X(1) ( x ) n[1 F ( x )]
n 1
f ( x)
例1(p30例1.18) 设总体X 服从区间 [0,1] 上的均
其中k 1, 2,, n.
证 根据分布函数的定义,可以得到
n 1
FX( k ) ( x ) P{ X ( k ) x } P{( X ( i ) x X ( i 1) X ( n ) x ) P{ X ( i ) x X ( i 1) } P{ X ( n ) x }
P{ X i1 x(1) ,, X in x( n ) | X (1) x(1) ,, X ( n) x( n) } c
其中( i1 , i2 , , in )是(1, 2, , n)的一个置换,这样的 置换共n ! ,因而c ( n !) 。由此可见,此条件分布
-1
( X (1) , X ( 2 ) , , X ( n ) )T 称为样本 ( X1 , X 2 ,, X n )T 的次序统计量.
对应的( x(1) , x( 2 ) , x( n ) )称为其观测值 .
X ( k ) : 样本( X 1 , X 2 ,, X n )的第k个次序统计量.
1 6 2 2 样本方差:sn xi x 2 167.583 6 i 1
1 6 2 样本标准差:sn xi x 2 12.954 6 i 1
再 见
0 y1 y2 yn , 其他,
定理1.21 设总体X的分布密度为f ( x)(或分布函数
为F ( x ), X1 , X 2 , , X n为来自总体X的样本,则次序 统计量( X (1) , X n))T 的联合分布密度为 (
n( n 1)[ F ( y ) F ( x )]n 2 f ( x ) f ( y ), x y f ( X (1) , X ( n ) ) ( x , y ) 其他, 0,
与总体无关,故
次序统计量是充分统计量.
3、次序统计量的分布
定理1.19 设总体X的分布密度为f ( x)(或分布函数
为F ( x ), X1 , X 2 , , X n为来自总体X的样本,则第k 个次序统计量X k的分布密度为
n! f X( k ) ( x ) [ F ( x )]k 1[1 F ( x )]n k f ( x例1.19) 设总体X 服从区间 [0, ] 上的均
匀分布,( X1 , X 2 ,, X n )为总体X的样本, 试求样本 的联合分布. 解 总体X的分布密度为
1 , 0 x f ( x ) 0, 其他 样本的联合分布为
n! n, f ( y1 , y2 , , yn ) 0,
, X n )T 的次序统计量,样本的极差定义为 R X ( n ) X (1) max X i min X i
1 i n 1 i n
其观测值为 r x( n ) x(1) max xi min xi 1 i n 1 i n
4、样本极差的意义 样本极差主要用来描述样本变化幅度以及离散 程度的特征,具有和样本方差类似的含义,但它受 样本异常值的影响较小,同时也容易计算,也可以 作为总体均方差的估计. 在实际中应用比较广泛. 例3(p32例1.20) 从总体中抽取容量为6的样本, 测得样本值为 32, 65, 28, 35, 30, 29 试求,样本中位数、样本均值、样本极差、样本方差、 以及样本标准差。
P{ X (1) y, , X ( n ) y } P{ X ( i ) y } [F ( y )]n
(2)当x y时,
i 1 n
F( X(1) , X( n ) ) ( x, y ) P{ X (1) x, X ( n) y}
又由于 { X ( n ) y } { X (1) x , X ( n ) y } { X (1) x , X ( n ) y } { X (1) x , X ( n ) y } { x X (1) y , , x X ( n ) y }
1、样本中位数 定义 设(X (1) , X ( 2 ) , , X ( n ) )T 为样本( X1 , X 2 ,
, X n )T 的次序统计量,样本的中位数定义为
X n 1 , ( 2) X 1 [ X n X n1 ], ( ) 2 (2) 2 n为奇数, n为偶数,
i k n 1 ik
设vn ( x ) ( x )表示 x1 , x2 , , xn中不超 过 于 x 的个数. 它表示的是总体X 作n次重复独立观 测时,事件{ X x }出现的次数,也就是样本观测中 ( X1 , X 2 , , X n )T 不超过x的个数,因而vn ( x ) B( n, F ( x )),因此
相关文档
最新文档