第1章 数理统计的基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果X ~ Γ(α1 , λ ), Y ~ Γ(α 2 , λ ), X 和Y 相互独立,
(b’)(可加性)
(c)
如果X ~ Γ(α , λ ), 则Y = X k ~ Γ(α , k λ ), k ≠ 0
(d )
如果X 1 ,
X n为i.i.d .且X 1 ~ Exp(λ ), 则∑ X i ~ Γ(n, λ )
(2)顺序统计量的概率分布 设总体X的分布函数为F(x),概率密度为f(x), (X1, …, Xn)T为总体X的一个样本,该样本的顺序统 计量为 (X(1), …, X(n))T。 (a)X(k)的概率密度f(k)(x)(1≤k≤n):
n! f ( k ) ( x) = [ F ( x)]k −1[1 − F ( x)]n − k f ( x) (k − 1)!(n − k )!
1 n Bk = ∑ ( X i − X ) k , n i =1
分别为样本k阶(原点)矩和样本k阶中心矩。 样本二阶中心矩
~2 1 n ′ = S = ∑ ( X i − X )2 M2 n i =1
注:样本二阶中心矩与样本方差的区别:
~ 2 n −1 2 S = S n
样本矩与总体矩之间的关系: 只要总体的k阶矩存在,则样本小于等于k的各 阶矩依概率收敛到总体的相应各阶矩。 所以当n很大时,可用一次抽样所得的样本均 值和样本方差分别作为总体X的均值和方差的近似 值。
样本值与样本空间:样本(X1, …, Xn)每次抽样得到 的观察值(x1,…, xn) 称为样本值,样本值的集合称为 样本空间。 样本的联合分布函数、联合概率密度、联合概率函数:
F ( x1 , f ( x1 , p ( x1 , , xn ) = , xn ) =
∏ F (x )
i =1 n i
总体的分布就是指数量指标X的分布。 由于数量指标X是一个随机变量(或随机向 量),所以总体的分布也即随机变量X的概率分 布。 以后将总体记为X。当总体X服从某种分布 时,简称其为某总体,如正态总体。
1.1.2 样本及其分布
样本(子样):从总体中随机抽取的若干个个体。 样本中个体的个数叫做样本容量(子样容量)。 样本中的每个个体称为样品。 注:样本大小为n 的样本可以看成是一个n维随机 向量(X1, …, Xn),但这只是针对一次抽样前而言。
n 1 *2 2 S = (Xi − X ) ∑ n − 1 i =1
分别为样本方差和修正样本方差。称S为样本 标准差。
样本标准差 称统计量
n 1 2 S = S2 = ( X − X ) ∑ i n − 1 i =1
1 n Ak = ∑ X i k , n i =1
k = 1, 2,
k = 1, 2,
3) Fn ( x) ---n次独立重复试验中,事件 {X ≤ x}
发生的频率。
F ( x)是总体X的分布函数,表示事件{X ≤ x}的概率
由伯努利大数定律(频率与概率可以任意接近),
对∀ε > 0 lim P { Fn ( x) − F ( x) < ε } = 1
n →∞
4)经验分布与理论分布的关系(Glivenko定理):
2 X ~ N ( μ , σ ), X 1 , X 2 , 例如 总体
, X n 是一个样本,
则 2 X1 + X 2 , X − X ,
2 n 2 1
∑X
k =1
n
k
均为统计量。
2 μ , σ 未知时, 当
X 1 − 2 X 2 + μ , X 12 / σ 2
均不是统计量。 当 μ , σ 2 已知时,
n! f ( k )( j ) ( x, y ) = (k − 1)!( j − 1 − k )!(n − j )! ⋅ [ F ( x)]k −1[ F ( y ) − F ( x)] j −1− k [1 − F ( y ) n − j ] f ( x) f ( y )
(c) 前r个顺序统计量X(1),...,X(r) (r≤n)的 联合概率密度:
数理统计的基本任务
概率论与数理统计的比较 概率论:从一个数学模型出发,如随机变量的 分布,研究其性质、特点和规律性。 数理统计:利用观测随机现象得到观测数据, 选择或检验数学模型,并对所考察的问题作出 推断和预测.
数理统计的基本内容: 1、试验设计:设计有效地获得数据的方法,如正交 设计(第4章) 2、统计和推断:靠抽验得到的数据来推断整体的情 况,包括参数估计(第2章),假设检验(第3章) 3、研究应用统计推断中的基本原理,研究处理线性 模型中的某些问题的方法,如回归分析(第5章), 方差分析(第4章)
1.2
抽样分布
抽样分布 —— 统计量的概率分布。
1.2.1几种常用的统计统计分布 1.Γ分布 (1)定义1.2.1 若随机变量X具有概率密度:
λ α α −1 − λ x f ( x; α , λ ) = x e ,x >0 Γ(α )
Γ函数
则称X服从参数为 α , λ 的Γ分布,记为 X ∼ Γ(α , λ ) 其中α > 0, λ > 0 为参数。
为样本中位数。
(2) 称统计量
R = X ( n ) − X (1)
为样本极差。
5 经验分布函数
1)定义:理论分布=总体分布 ;经验分布=样本分布 经验分布的构建:将样本(X1, …, Xn)T的n 个观察值 (x1,…, xn )T由小到大排列为, x(1) , , x ,则相应的 (n)
样本分布为
经验分布Fn(x) 以概率1关于x 一致收敛到 理论分布F(x),即
⎧ ⎫ P ⎨lim sup Fn ( x ) − F ( x ) = 0⎬ = 1 ⎩n→∞ −∞ < x < +∞ ⎭
定理告诉我们,当样本容量n足够大时,对所 有的x, Fn(x)与F(x)之差的绝对值都很小,这件事 发生的概率为1. 这就是我们可以由样本推断总体的基本理论依据.
抽样:取得样本的过程。 抽样中采用的方法称为抽样法。 随机抽样法:从总体中随意地抽取若干个个体。 从总体X随机抽样得到的样本用X1,...Xn表 示,或者用n维随机向量的形式 X=(X1 ...Xn)T 表 示。 简单随机样本(X1, …,) :X1,…, Xn相互独立,并 与总体X具有具有相同的分布函数F,即X1...Xn是 独立同分布的(i.i.d)。简称样本。
第1章
1.1.1 总体及其分布
数理统计的基本概念
1.1 总体、样本与统计量 总体:是指对某一问题的研究对象的全体. 亦称母体。 在数理统计中,总体就是具有确定分布的随机变量。 所以总体通常表示为随机变量的概率分布F(x) 或概率 密度 f(x)。
个体:组成总体的每个研究对象。也就是总体中的元素。 一个个体是随机变量的一次观测值。 有限总体与无限总体
0 , x < x(1) ⎧ ⎪ ⎪k Fn ( x ) = ⎨ , x( k ) ≤ x ≤ x( k +1) , k = 1, 2, ⎪n 1 , x( n ) ≤ x ⎪ ⎩
称上式为经验分布函数。
, n −1
2)可以证明,经验分布函数具有如下性质: (1) 0 ≤ F n ( x ) ≤ 1, F n ( − ∞ ) = 0, F n ( + ∞ ) = 1 (2) F n ( x ) 是单调不减函数 (3) F n ( x ) 处处右连续
注:
( Ι ) 最大次序统计量 X ( n )的分布密度为 f X ( n ) ( x ) = n[ F ( x )]n −1 f ( x )
( ΙΙ ) 最小次序统计量 X (1)的分布密度为 f X (1) ( x ) = n[1 − F ( x )]n −1 f ( x )
(b) X(k)与X(j)的联合概率密度f(k)(j)(x,y)(1≤k<j≤n)
n
数理统计的任务
∏ f (x )
i =1 n i i =1
由样本 推断总体
, x n ) = ∏ p ( xi )
1.1.3 统计量
1、定义:设X1, …, Xn是来自总体X的一个样本, 若 g(x1,...xn)为样本空间ж到Rk的可测映射,且g中不含任 何未知参数,则称t=g(X1, …, Xn)为统计量。即称不包 含 参数的实值函数 t=g(X1, …, Xn) 是一个统计量. 统计量是一个随机变量。
X 1 − 2 X 2 + μ , X 12 / σ 2
均为统计量。
2、样本矩 定义1.1.2 设(X1, …, Xn)T为总体X的一个样 本,称统计量
1 n X = ∑ Xi n i =1
为样本均值;称统计量 n n 2 1 1 2 2 2 S = ∑ (Xi − X ) = ∑ Xi − X n i =1 n i =1 及
2.β分布
1)定义1.2.2 若随机变量 X具有概率密度
Γ(a + b) a −1 f ( x; a, b) = x (1 − x)b −1 Γ(a)Γ(b) x a −1 (1 − x)b −1 ,0 < x <1 = B ( a, b)
则称X服从参数为a,b的β分布,记为X~β(a,b), 其中a>0,b>0为参数。
i =1
n
(3)倒Γ分布或逆Γ分布
1 若X ~ Γ(α , λ ), 令Y = ,则Y的概率密度 X
λ fY ( y; α , λ ) = y Γ(α )
α
−λ − (α +1) y
e ,y>0
此时,称Y服从倒Γ分布或逆Γ分布,记为
Y ~ ΙΓ(α , λ ),其中 α > 0, λ > 0为参数。
b=1.5
β分布有几个重要的特例. 当a=1,b=1时, β分布就是 U(0,1)
2 χ 3. 分布
1)定义1.2.3 若随机变量 X具有概率密度
n −1 ⎧ 1 −x/2 2 , x e ⎪ n / 2 ⎪ 2 Γ ( n / 2) 2 x>0 χ ( x; n) = ⎨ ⎪ 其它 ⎪ ⎩0,
2)β分布的性质
性质1 若X~β(a,b),则
a ab E( X ) = , D( X ) = (a + b) 2 (a + b + 1) a+b
性质2 若X~ Γ(a,1),Y~ Γ(b,1),且X,Y相互独 立,则 X Z= ∼ β ( a, b) X +Y a=0.6,b=0.3 a=1.2
f (1) ( x1 , ⎧ n! n−r [1 ( )] − F x f ( x1 ) ⎪ r , xr ) = ⎨ (n − r )! ⎪ 0 ⎩ f ( xr ) x1 <
其他
< xr
(r )
4、样本中位数与样本极差 (1) 称统计量
X (( n +1) / 2) , n是 奇 ⎧ ⎪ Me = ⎨ 1 ( X ( n / 2) + X ( n / 2+1) , n是 偶 ⎪ ⎩2
例1
设总体X 的数学期望和方差分别为
E ( X ) = μ , D( X ) = σ
其样本为 X 1 , X 2 ,
2
, X n , 求E ( X ), D( X ), E ( S 2 ) .
μ,
σ
2
n
, σ
2
3、顺序统计量及其分布 (1)定义1.1.3 设(X1, …, Xn)T为总体X的一个样本,其 观察值为(x1,...,xn)T,将x1,...,xn由小到大进行排列, 依次记为x(1),...,x(n),即x(1) ≤... ≤x(n),按下述方法定 义统计量X(k):当样本(X1, …, Xn)T取值为(x1,...,xn)T 时,规定X(k)的取值为x(k),由此得到的(X(1), …, X(n))T 称为样本(X1, …, Xn)T的顺序统计量或次序统计量, 其中的X(k)称为样本的第k顺序统计量,X(1)称为样本 的最小顺序统计量,X(n)称为样本的最大顺序统计量。
当α=1时的Γ分布为指数分布其密度曲线如下:
Γ ( 1 ,0 .5 )
α=0.5 λ=0.3 α=1.0 α=1.6 α=2.8
(2)Γ分布的性质
( a ) 如果X ~ Γ(α , λ ), 则E ( X ) = α λ ,
(b)
则X + Y ~ Γ(α1 + α 2 , λ )
D( X ) = α λ 2
Γ(α ) = ∫
+∞
0
xα −1e − x dx
Γ函数有如下公式:
wenku.baidu.com
Γ(α + 1) = αΓ(α ), (Γ(n + 1) = n !) Γ(1) = 1 Γ(1/ 2) = π Γ ( p )Γ ( q ) = B ( p, q ) Γ( p + q )
其中 B ( p, q ) =
∫
1
0
x p −1 (1 − x) q −1 dx 称为β函数。