应用统计方法课件 2-1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
j 1
p xi1 (1 p)1xi1 p xi2 (1 p)1xi2 p xi3 (1 p)1xi3
p (1 p) xi1 xi2 xi3
3( xi1 xi2 xi3 )
(xij 1,0) 。
三、 统计量及样本数字特征
Statistic
定义 2-1 设 X1, X 2,, X n 为总体 X 的一个样本, g( x1, x2 ,, xn )为连续函数,如果 g( X1,X 2,,X n )
=
n
1 1
n
E(
i 1
X
2 i
n
X
2
)
=
1
n
[ ( DX
n 1 i1
i
(EX i )2 )
n(D X
(E
X
)2 )]
1
n
[ (
2
2)
n(
2
2 )]
2
n 1 i1
n
还可证明: mk p EX k k
mk pE(X )k k
顺序统计量 Order Statistic
设 X1, X 2 ,, X n 是取自总体 X 的一个样本,将样本
则 X 1,X 2 ,,X n 的联合概率分布为 P{X 1 xi1 , X 2 xi2 ,, X n xin } pi1 pi2 pin
i1, i2 ,, in 1,2,
例 2-1 设总体 X ~ B(1, p),即
P{X x } px (1 p)1x ( x 1,0 ),
X1,X 2,X 3 为 X 的一个样本,求样本 X1,X 2,X 3 的联 合概率分布。
Population Sample
样品:从总体中随机抽取的一个个体;
样本:由若干个样品构成,样本中包含样品的个
数称为样本长度。
Sample size
(1)总体是一个 r v ,记为 X ,其分布函数
F(x) 称为总体分布函数;
(2)样品也是一个r v ,它与总体同分布; (3)样本是由若干独立同分布的r v 所构
n1
f (x)
(
2
)
(1
x
2
)
n1 2
n (n) n
2
其中 ( )为 函数。
( x ) (2-8)
图 2-3 中画出了n 1、10、 时 f (x) 的图形。
y
n 10
n 5
n 1
y
o
x
图 2-3
o
x
图 2-4
对于给定的正数(0 1),称满足条件
P{t
}
f
( x)dx
的点为t(n) 分布的上 分位点(如图 2-4 所示)。有时
例 2-2 设 X1,X 2 ,,X n 是来自总体
X ~ N (, 2 ) 长度为 n 的一个样本,且
EX
,DX
= 2 ,记 S 2
n
1
1
n
i 1
(
X
i
X )2

证明 2 (n 1)S 2 ~ 2 (n 1) 。 2
证明:由于
S2
n
1
1
n
i 1
(
X
i
X )2
1 n 1
n
[( X i
观测值 x1, x2 ,, xn 按大小递增的顺序排序:
x(1) x(2) x(n)
Observed value
当 X1, X 2 ,, X n 取 值 为 x1 , x2 ,, xn 时 , 定 义
X (1) , X (2) ,, X (n) 取 值 为 x(1) , x(2) ,, x(n) , 则 称
N (0,
而 X 1,X 2 ,,X n 相互独立,故
1) ,
X 1 , X 2 ,, X n 相互独立,
从而由 2 分布定义知
n ( X i ) 2 ~ 2 (n)
i 1
又 X ~ N (0, 1) ,所以 / n
( X )2 ~ 2 (1) / n
由 2 分布的性质 3 得
n
证明:由于 X i 与总体 X 同分布,因而 EX i , DX i 2 ,i 1,2,,n ,所以
EX
E
(
1 n
n
i1
X
i
)
1 n
n
i1
EX
i
DX
D(
1 n
n
i1
X
i
)
1 n2
n
DX i
i1
2
n
ES 2
E[
n
1
1
n
i1
(
X
i
X
)2 ]
=
E[
n
1
1
n
i 1
(
X
2 i
2X
Xi
X
2 )]
X S2
1 n
n
i 1
X
i
1
n
n 1 i1
(
X
i
Sample mean
(2-3)
Sample variance
X )2
(2-4)
Origin moments
mk
1 n
n
i 1
X
i
k
(k 1,2,)
(2-5)
Central moments
mk
1 n
n
(Xi
i 1
X
)k
(k 1,2,)
(2-6)
x(1) x(2) x(n) ,并作函数
0,
Fn
( x)
k, n 1
x x(1) x(k ) x x(k 1)
x(n) x
则称 Fn (x) 为总体 X 的经验分布函数。
定理* (格列汶科ΓЛИВеΗО) 设总体 X 的分布
函数为 F(x) ,经验分布函数为 Fn (x) ,则当 n 时有
n
F *( x1, x2 ,, xn )= F (xi )
i 1
(2-1)
若 X 的分布密度为 f ( x) ,则 X1,X 2,,X n 的 联合分布密度为
f
*(
x1,
x2 ,,
xn
)=
n
f
( xi
)
i 1
(2-2)
若 X 是离散型随机变量,其概率分布为
pk P( X xk ), k 1,2,,
也称 为随机变量t的1 分位数(或临界值)。不同的
、n 对应的 值已制成表格(见附表 3)。
例 2-3 设 X1,X 2 ,,X n 是来自总体 X ~ N (, 2 ) 长度为 n 的一个样本,且 EX , DX 2 ,记
S2
n
1
1
n
i 1
(
X
i
X )2
,证明
X
S/ n
~
t(n 1) 。
解 由于 X1,X 2,X 3 相互独立,且它们的概率分 布分别为
P{X j xij } p xi j (1 p)1xi j ( xij 1,0; j 1,2,3 ),
故样本 X1,X 2,X 3 的联合概率分布为
3
P{X 1 xi1 , X 2 xi2 , X 3 xi3 } P{X j xij }
X (1) , X (2) ,, X (n) 为由 X1, X 2 ,, X n 导出的一组顺序
统计量,称 X (k) 为第 k 个顺序统计量,特别地分别称
X (1)
min 1in
Xi
X (n)
max 1in
Xi
为最小顺序统计量和最大顺序统计量。
经验分布函数
设 X1, X 2 ,, X n 是取自总体 X 的一个样本,将样本 观 测 值 x1, x2 ,, xn 按 大 小 递 增 的 顺 序 排 成
y
n 1
y
n 5
n 10
o
x
o
x
图 2-1
图 2-2
对于给定的正数 (0 1) ,称满足条件
P{ 2 }
f (x)dx
Critical value
的点 为 2 (n) 分布的上 分位点,如图 2-2 所示。
有时也称 为随机变量 2 的 1- 分位数(或临界值)。 不同的 、n对应的 值已制成表格(见附表 4)。
证明:由于 X / n
~
N
(0,1)

(n
1)
2
S
2
~
2 (n 1) ,
又 X 与 S 2 相互独立,故由 t 分布的定义知
X X S/ n / n
(n 1)S 2 ~ t(n 1)
2 (n 1)
3.F 分布
设U ~ 2 (m) ,V ~ 2 (n) ,并且U、V 相互独立,
i 1
)
(X
)]2
S 2
n
1
1
n
i 1
(
X
i
X )2
1n n 1 i1 [( X i
) (X
)]2
1[ n 1
n i 1
(Xi
)2
n( X
)2 ]
于是
(n 1)S 2 n ( X i )2 ( X )2
2
i1
/ n
又 Xi
~
N (, 2 ) ,标准化得
Xi
~
10.了解单个和两个正态总体的均值和方差的假 设检验。
11.了解总体分布假设的 2 检验法,会应用该 方法进行分布拟合优度检验。
重点
1.样本、统计量和估计量等概念的理解。 2.矩估计法和极大似然估计法。 3.估计量的评选标准(无偏性、有效性)。 4.正态总体的均值和方差的置信区间。 5.假设检验的基本思想方法、步骤及两类错误。
不包含任何未知参数,则称其为一个统计量。
例如 X ~ N (, 2 ),其中 已知, 2 未知,
n
X1,X 2,,X n 为总体 X 的一个样本,则 ( X i )2 是
一个统计量,但
n
X
i
/
i 1
不是一个统计量。
i 1
常用的统计量 样本均值、样本方差和样本矩。
定义 2-2 设 X1,X 2,,X n 是来自总体 X 长度 为n 的一个样本,则称
2 (n 1)S 2 ~ 2 (n 1) 2
利用线性代数中正交变换的方法还可
以证明:X 与 S 2 相互独立。
2.t 分布:
设 X ~ N(0,1),Y ~ 2 (n) ,并且相互独立,则称 r.v
t X Y /n
服从自由度为 n 的t 分布,记为t ~ t(n) 。
t(n) 分布的概率密度函数为
第二章 数理统计初步
基本概念 参数估计 假设检验
学习目的
数理统计的内容十分丰富,本章主要介 绍它的基本概念、参数估计和假设检验。通 过本章的学习应初步掌握用数理统计处理随 机现象的基本思想和方法,提高运用数理统 计方法分析和解决实际问题能力。
6
frist
基本要求
1.理解总体、个体、简单随机样本和统计量的 概念。
6.理解参数的点估计、估计量与估计值的概念。 掌握矩估计法(一阶、二阶矩)与极大似然估计法。
7.了解无偏性、有效性和一致性(相合性)的 概念,并会验证估计量的无偏性、有效性。
8.理解区间估计的概念,会求单个正态总体的 均值和方差的置信区间,会求两个正态总体的均值差 和方差比的置信区间。
9.理解假设检验的基本思想,掌握假设检验的 基本步骤,了解假设检验可能发生的两类错误。
P{lim n
sup
x
|
Fn
(x)
F
(x)
|
0}
1
四、几种常用统计量的分布
Sampling distrbution
统计量是样本的函数,它是一个随机变量, 统计量的分布称为抽样分布。以下介绍来自正 态总体的几个常用统计量的分布。
1. 2 分布 2.t 分布
3.F 分布
1. 2 分布
设 X1,X 2,,X n 是来自正态总体X ~ N (0,1) 的
一个样本,则称统计量
2
X
2 1
ຫໍສະໝຸດ Baidu
X
2 2
X
2 n
服从自
由度为n 的 2 分布,记为 2 ~ 2 (n) 。
此处,自由度是指上式右端包含独立变量的个数。
2 (n) 分布的概率密度为
f
(x)
1
2n
/
2
(n
/
2)
x
n 2
1
e
x
2,
x
0
0,
其它
(2-7)
f (x) 的图形如图 2-1 所示, (x)为 函数。
难点
1.统计量和估计量等概念的理解。 2.极大似然估计法的基本思想的理解。 3.统计量的分布及不同情况下临界值的确定。
§2.1数理统计的基本概念
一.总体、样品、样本 二.X1, X 2, X的n 联合分布
三.统计量及其数字特征 四.几种常用统计量的分布
返回
一.总体、样品、样本
总体:要研究对象的全体;
成,样品的个数称为样本长度。
二. X1,X2,,Xn 的联合分布
Allied Distribution
设 X 为一个总体, X1,X 2,,X n 为来自总体的 一个长度为n 的样本,它的观察值为 x1, x2 ,, xn 。
由 X1,X 2,,X n 的独立性知,若 X 的分布函数为 F(x) ,则 X1,X 2,,X n 的联合分布函数为
2.了解频率分布表、直方图的作法。 3.理解样本均值、样本方差的概念,掌握根据 数据计算样本均值、样本方差的方法。
4.了解产生 2 变量、 t 变量、 F 变量的典型模
式;理解 2 分布、 t 分布和 F 分布的分位数,会查 相应的数值表。
5.了解正态总体的某些常用抽样分布,如正态 总体样本产生的标准正态分布、 2 分布、t 分布、F 分布等。
分别为样本均值、样本方差、样本 k 阶原点矩和样
本 k 阶中心矩。
为了讨论问题方便,我们称总体 X 的k 阶矩为总体k
阶矩。例如 EX 称为总体均值, DX 称为总体方差。
定理 2-1 设 EX = , DX = 2 , X1, X 2,, X n 是来 自 X 的一个样本,则 E X , D X 2 , ES 2 2 。
2分布随机变量有如下性质:
1.设 12 ~ 2 (n1), 22 ~ 2 (n2 )且相互独立,则有
12
2 2
~
2 (n1
n2 )
2.设 2 ~ 2(n) ,则 E( 2 (n )) ,n D( 2 (n)) 2n
3.设 Q1 ~ 2 (n1 ) ,Q2 ~ 2 (n2 ) ,n1 n2 ,则 Q1 Q2 与 Q2 相互独立,且 Q1 Q2 ~ 2 (n1 n2 ) 。
相关文档
最新文档