第6章抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* * Xm 的分布已知,故可求出 X 函数的分布,设 m
所以 n! 1 m 1 nm hm ( y ) f ( x)[1 F ( x)] [ F ( x)] (n m)!(m 1)! f ( x) n! y m 1 (1 y ) n m , (n m)!(m 1)! 0 y 1, m 1 ~ n
所以
X 的特征函数为
2 2 t / n iat / n x t exp 2
n
t 2 2 exp iat 2 n
可见 X ~ N ( a,
2
n
) 分布。
(二)样本均值的极限分布 定理:设 X1, X2,…,Xn来自一般总体X,且E(X)=a,
若总体X为连续型随机变量,其密度函数为f (x),则(X1,X2,…,Xn) 的联合密度函数为
§6-2 样本分布
一、频率直方图
二、样本分布函数
如果我们从随机变量X的总体中抽取了一个样本,把样本的n个值
* * * x1,x2,…, xn加以排队 x1 ,并把它看成是某个离散 x2 xn 随
1 n 2 S (Xi X ) n i 1 2 2
_
1 n S* (Xi X ) n 1 i 1
2
2 2 2、设X ~ N ( a1 , 1 ), Y ~ N ( a2 , 2 ), X 1 , X 2 ,..., X n1 及Y1 , Y2 ,..., Yn 2 分别为
—
t 1 式中 ( ) 是 X 的特征函数。 n nn n 1 证: X X i 1 X i ,且 1 X , 1 X ,, 1 X 相互独立 1 2 n n i 1 i 1 n
所以
X t
t n
n
x (t )
样本的连续函数,如果函数中不包含任何未知参数,则称U为统计量。 例如 则 因为 未知。
2、样本特征值
样本平均值
样本方差
样本均方差
样本k阶原点矩
样本k阶中心矩
样本变差系数
样本偏态系数
上述两式中,
样本相关系数
R
(X
i 1
n
i
X )(Yi Y )
2
(X
i 1
n
i
X)
(Y
i 1
令x 0即得 n! f m ( x) [ F ( x)]n m [1 F ( x)]m 1 f ( x) (m - 1 ) !(n m)! 只要f ( x)已知,则f m ( x)唯一确定
x n! nm m 1 Fm ( x) P( X x) [ F ( x )] [ 1 F ( x )] f ( x)dx (m - 1 ) !(n m)! * m
§6-5 顺序统计量及其分布
一、顺序统计量的概念
设(X1, X2 , … , Xn )为X的样本,定义样本函数 =g(X1, X2 , … , Xn ), (m=1, 2 ,…,n) 含义:当(X1, X2 , … , Xn )取值(x1, x2 , … , xn )时, 取(x1, x2 , … , xn )中 大到小排列的第m项数值。即当把(x1, x2 , … , xn )按由大到小的顺序排列成 ,
i 1 n
n
xi
n
t t x
n i 1
i
n
n
n
n
t t i 1 n n
n
例 设总体X服从 N a, 2 分布,求样本平均值 解: 因为X的特征函数为
X的分布。
2 2 t exp t iat 2
机变量Xne的全部可能取值,它的概率分布为 那么可以求得Xne的分布函数:
样本分布函数与总体分布函数的关系 :
当n趋于无穷大时,Fn ( x) 就以概率1收敛到X的分布函数F(x)。
*
格利汶科-肯达利定理 分布函数,则
设F(x)是随机变量X的分布函数,
是X的经验
格利汶科-肯达利定理是用简单随机样本推断总体的依据。
f ( x)x[ F ( x)]nm [1 F ( x x)]m1
所以
P( x X x x) nC
* m
m 1 n 1
f ( x)x[ F ( x)]
nm
[1 F ( x x)]
m 1
* P( x X m x x) Fm ( x) x x m 1 nm m 1 nCn [ F ( x )] [ 1 F ( x x )] f ( x) 1
1 n k 1 D( Ak ) D( X i ) 2 n i 1 n 1 2 n
n 2k i
1 D ( X ) n2 i 1
k k 2 k
n
{E[( X
i 1
n
k 2 i
) ] E 2 ( X ik )}
2 v2 k vk {E ( X ) v } n i 1
三、样本数字特征
1、定义: 对于一个给定的样本x1, x2 ,…, xn,有了样本分布函数后就可 以计算它的数字特征,为了区别于总体数字特征,我们称它们为样本数 字特征。
2、样本数字特征计算公式: 样本数字特征就是离散型随机变量Xne的数字特征 样本平均值 样本方差 样本均方差 样本k阶原点矩
样本k阶中心矩
2 1 D( X i ) 2 n 2 n n i 1 n
2、样本k阶原点矩的数学期望和方差
按定义有
n 1 n k 1 1 k E ( Ak ) E ( X i ) E ( X i ) nE ( X K ) E ( X K ) k n i 1 n i 1 n
假想总体:试验观察可能结果作为个体,如研究灯泡寿命,总体为(0,无穷 大),并不是所有灯泡,还有全国人口男女比例与身高,其总体不同。本课程 主要研究假想总体情况。 上述所说的总体和个体事实上是随机变量的样本空间和基本事件的另 一说法。如研究灯泡寿命,随机变量的样本空间为(0, ∞),在数理统计中, 把(0, ∞)称为灯泡寿命的总体,每个正实数为该总体个体。 随机变量的分布即称为总体分布。 (二)样本 1、定义 通过试验或观测得到的总体中一部分个体构成的集合。水文中习惯称 之为实测系列。 样本容量:样本中所含个体的数目,水文中常称之为系列长度,记为n。 抽样:在数理统计中,为了研究总体的性质,需要进行的观测或试验。 例如:我们在一条河流的某一断面处观测年最大洪峰流量,观测50年,就得 到一个长度为50的年最大洪峰流量的实测系列。
D( X ) 2 ,则当
Yn
n 时有
n i
X
i 1
a
n
, 服从标准化正态分布N(0,1)
,
二、抽自正态总体样本的抽样分布
下面,不加证明地给出几个抽自正态总体之样本的统计量的分布
(3)T 式中
( X a) n 1 ( X a) n ~ t (n 1)分布 * S S 1 n X Xi n i 1
X和Y的样本,且X与Y相互独立,则 ( 1 )Z X Y ~ N (( a1 a2 ), ( 而U ( X Y ) ( a1 a2 )
12
n1
2 2
n2
))分布
2 1
n1
2 2
~ N (0,1)分布
n2
2 2 *2 2 n1S1 (n2 1) 2 S1 2 (2) F *2 2 ~ F (n1 1, n2 1)分布 2 2 n2 S 2 (n1 1) 1 S2 1
顺序统计量。
二、顺序统计量的分布推求
假定X为连续型随机变量,其分布函数为F(x),密度函数为f (x)。 记 Xm*的分布函数为Fm (x),密度函数为fm (x)。
图
6-1
* x与x x 之间的概率 P( x X m x x)
参照6-1图,计算Xm* 落在 每个事件发生的概率都是
3、样本方差的数学期望与方差
下面不加证明地给出S 2的数学期望与方差 n 1 2 E (S ) n 2 2 2 2 ( 2 ) 3 2 4 2 4 2 D( S 2 ) 4 n n2 n3
2
§6-4 几种统计量的抽样分布
一、 样本均值的分布 (一)一般情形: 设 (t ) 为总体X的特征函数,X1, X2,…,Xn是总体X的样本,则样 本平均值 X 的特征函数为
n
i
Y )2
二、抽样分布的概念
统计量也是随机变量,它的分布称为抽样分布。 统计量的分布有精确分布和极限分布(或称渐近分布)两种形式。
若总体X的分布函数表达式已知,如对任一自然数n,都能给出统计
量U(X1, X2,…,Xn)的分布函数,则称此分布函数为统计量U的精确 分布。 若统计量U的精确分布无法求得,则可退而求其次,求出其当 时的极限分布,这是用大样本进行统计推断的一般做法。
二、简单随机抽样
随机样本:因为在概率论和数理统计中所说的试验都是指随机试验,所以, 所得样本就叫做随机样本. 简单随机抽样:n次试验是相互独立的抽样方法 简单随机样本:简单随机抽样得到的样本称为简单随机样本.
三、作为n元随机变数的本样
实际样本
( x1 , x2 ,..., xn )
可以看作是随机变量X的n次试验的结果,
三、统计量的数字特征
1、样本均值的数学期望与方差
由于样本( X 1 , X 2 , X i (i 1, 2,
, X n )的各分量是独立同分布的随机变量,
且与原总体X 具有相同分布,因此,每一个分量 , n)都与X 有相同的数学期望a与方差 2 ,于是有 1 n 1 n 1 E ( X ) E ( X i ) E ( X i ) nE ( X ) E ( X ) a n i 1 n i 1 n 1 n 1 D( X ) D( X i ) 2 n i 1 n
样本变差系数
样本偏态系数
上述两式中,
3、二元随机变量数字特征 对于二元随机变量(X ,Y),每次试验得到一对数值(x , y),因此其样本 可记为(x1,y1), (x2,y2),…,(xn,yn),利用类似于一元随机变量样本分布的定义方法 可定义二元随机变量的样本分布函数,也可以计算样本数字特征,除了每一 个变量的均值、方差和矩外,还有样本协方差和样本相关系数,它们的公式 可按离散型二元随机变量数字特征公式得到,即
第6 章
一、总体与样本
(一)总体 1、定义
抽样分布
§6-1 简单随机抽样
总体:所研究对象的全体元素的集合;个体:组成总体的每一个元素。 例1:研究某工厂生产某种规格的10万只灯泡的质量(如合格率),这10万只 灯泡就是一个总体,每个灯泡是一个个体。例2:某水文站,所有年平均流量的 全体是一个总体,而每一年平均流量则是一个个体。 2、分类 有限总体和无限总体,也可分成现实总体和假想总体。 有限总体:个体的数量是有限的,如上述例1,含有10万只灯泡的总体是有限 的,本课程主要研究无限总体。 无限总体:个体的数量是无限的,如上述例2,年平均流量的总体是无限的。 现实总体:由客观存在真实事件组成总体各个元素,如灯泡合格率,所有灯泡 (现实实体)。
也可看作n元独立同分布随机变量( X 1 , X 2 ,..., X n ) 一次试验的结果。 将样本看作n元随机变量 ( X 1 , X 2 ,..., X n ) 。这样做是便于统计推断的 分析。 由于(X1,X2,…,Xn)是独立同分布的随机变量,若总体X的分布函数
为F(x),则(X1,X2,…,Xn)的联合分布函数应为
样本协方差
样本相关系数
例:用测温仪对一物体的温度测量 5 次,其结果为(℃): 1250 , 1565 , 1245 , 1260 , 1275 ,试求样本均值、方差、样本离势系 数及偏态系数。
解:样本均值
样本均方差
样本离势函数
样本偏态系数
§6-3 抽样分布的概念
一、统计量
1、定义:
设X1 , X2 ,…, Xn为总体X的一个样本,U=U(X1,X2 , … , Xn ) 为