第6章参数估计与假设检验.

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

pq 标准化 ˆ ~ N ( p, ) p n
ˆ -p p ~ N (0,1) pq n
第二节 参数估计
直接用某一个样本的指标值
参 数 估 计
点估计
ˆ
作为总体未知参数 的
估计值
根据给定可靠程度的要求,
区间估计
估计总体未知参数 所在的 可能区间
一、点估计 ˆ
1、点估计的优良性标准 无偏性 E(ˆ)
构造检验统计量 Z
np 5 nq 5
双侧检验 H 0 : p p0 H1 : p p0 H1 : p p0 H1 : p p0
3、非正态总体(必须是大样本) 方差已知时
X-0 Z= ~ N (0,1)(当=0时) n
方差未知时
X-0 Z= ~ N (0,1)(当=0时) S n
检验规则同正态总体方差已知的情况
(二)总体成数的检验
左侧检验 H 0 : p p0 右侧检验 H 0 : p p0
第六章 参数估计和假设检验
统 计 学 的 基 本 内 容
数据描述性分析
描述 统计 时间数列分析 指数分析
推断 统计
参数估计
假设检验
推描 断述 统统 计计 是是 描推 述断 统统 计计 的的 发前 展提 。,
理 基 论 础
抽样分布
概 分 率 布
参数
参数估计 假设检验
统计量
随机原则
容量 均值 方差 标准差 成数 总体参数 N 2 p 样本统计量 n X S 2 S p ˆ
n 有限总体的校正系数,当N很大时,简化为 1 , N 当抽样比 n N 5% 时可忽略不计。
2、样本均值的抽样分布 正态总体的样本均值的分布 X ~ N ( , 2 ) 由正态分布的性质知,样本均值也服从正态分布
X ~ N ( , n)
2
标准化
X- ~ N (0,1) n
双侧检验 H 0 : 0 H1 : 0 左侧检验 H 0 : 0 H1 : 0 右侧检验 H 0 : 0 H1 : 0
在实际问题中,为了通过样本信息对总体某一假设取得强 有力的支持,通常把这种假设本身作为备择假设,对这一假
设的否定作为原假设。
力)。
基本思想:小概率原理 小概率原理:小概率事件在一次试验中几乎不可能发生 如果对总体所作的某种假设是真的,那么样本值与原假设出现 显著性差异的概率是很小的。如果在某一次随机抽样中,显著性 差异竟然出现了,我们就有理由怀疑这一假设的真实性,拒绝这 一假设。 总 体 (某种假设) 接 受 抽 样
(四)检验步骤
1 2
建立总体假设 H0, H 1
4
3
抽样得到样 本观察值
5
根据H0为真时的 统计量抽样分布 选择检验统计量
根据具体决策 要求确定α
6
计算检验统计量 的数值
7
确定分布上的 临界点值及检验规则 比较并作出检验判断
三、假设检验与置信区间
当假设检验在 水平下接受H0,则 的置信度为 1- 的
二、区间估计
确定参数的置信区间 。 ˆ , ˆ) ( L U ˆ ˆ) P( L U 1 ˆ , ˆ) ( - 的置信区间 L U 称为参数 的置信度为 1
在一定的置信度 1- 的保证下,利用抽样分布理论,
置信区间包括置信度和精确度两个方面
ˆ , ˆ) 置信度:随机区间( L U 包含 的概率,越大越好 ˆ , ˆ) ( 精确度:随机区间 L U 长度,越短精确度越好
X
ˆp p
s
2
2
2 ˆ-) 有效性 E( 最小
一致性
n
ˆ ) 0 lim P( n
数理统计证明:
X 是 的无偏、有效、一致估计量
ˆ 是 p 的无偏、有效、一致估计量 p
2、点估计的评价 点估计的不足是不能反映估计的误差和精确程度, 但一个优良的点估计量为区间估计提供了基础,决 定了区间的位置。
假设,然后利用样本信息来判断该假设是否成立。
逻辑推理方法:反证法 先假定原假设正确,然后对样本值与原假设的差异进行分析: 如果有充分的理由证明这种差异完全是由于样本的随机性引 起的(差异不显著),就接受原假设(一般很难); 反之,如果有充分的理由证明这种差异并非完全是由于样本 的随机性引起的(差异是显著的),就否定原假设(较有说服
检验统 计量
(三)两类错误
原假设正确时却被检验规则否定了,这类错误称为 弃真错误或第一类错误(发生的概率记为α)。 原假设本来不正确而检验规则却接受了原假设,这类 错误称为取伪错误或第二类错误(发生的概率为β)。
H0为真 H0非真
拒绝H0
接受H0
犯第一类错误

犯第二类错误

在样本容量一定时,不能同时减少两类错误 ! 力求在控制α前提下减少β。
ˆ ) 置信区间 点估计 极限误差(
2、正态总体,方差未知(小样本)
X- T= ~ t( n 1) S n

2

1
t 2 0 t 2
2
t
P( t
(n 1) 2
T t
(n 1) 2
)) 1
X P(t t ) 1 ( n 1) S n 2 ( n1) 2
1、样本成数的数字特征
抽样方法
ˆ) 均值 E(p
2 方差 p ˆ
标准差 p ˆ
pq n pq N n ( ) n N 1
无限总体或 有限总体放回抽样 有限总体 不放回抽样
p p
pq n pq N n ( ) n N 1
2、样本成数的抽样分布 根据中心极限定理,当样本容量足够大时 ( np 5 、 nq 5 ) ,不管总体分布如何,样本成数 的抽样分布总可以看作是正态分布。
(一)总体均值的检验
双侧检验 H 0 : 0 H1 : 0 左侧检验 H 0 : 0 右侧检验 H 0 : 0 H1 : 0 H1 : 0
1、正态总体,方差已知 构造检验统计量 Z= X-0 ~ N (0,1) (当=0时)
第一节 抽样分布
一、简单随机样本的性质
不放回
有限 总体 无限 总体
同分布但不独立
放回
放 回 不放回
同分布且独立
几种常用的分布
二、统计量与抽样分布
统计量:样本指标,不依赖与任何未知参数。
X X n
2
样本均值
样本成数
n1 ˆ= p n
1 ( X X ) 2 样本方差 S n 1
抽样分布:某一统计量所有可能取值的概率分布

n
检验规则 双侧检验
图示
Z Z 2时,拒绝原假设 Z Z 2时,接受原假设
左侧检验
Z Z时,拒绝原假设Z Z时,接受原假设
右侧检验
Z Z时,拒绝原假设Z Z时,接受原假设
2、正态总体,方差未知
构造检验统计量 t= 检验规则 双侧检验
t t
样本容量一定时,置信度和精确度是一对矛盾, 在保证置信度的前提下,尽可能提高精确度。
(一)总体均值的置信区间
1、正态总体,方差已知 X ~ N ( , 2 )
X ~ N ( ,
2
n
)
标准化
X- Z= ~ N (0,1) n
为了使置信区间长度最小,将事先给定的置信度1- 对称分配到分布的两侧 1 P( Z 2 Z Z 2) 1 2 2 1 X z z z P( Z 2 Z 2) 1 2 0 2 n
数字特征
均值 E ( X )
方差 D( X ) EX E ( X )2
(一)样本均值的抽样分布
1、样本均值的数字特征
抽样方法 无限总体或 有限总体放回抽样 有限总体 不放回抽样 均值 E(X)
2 方差 X
抽样误差
标准差 X

n
2
n

n )
2 N n
( N 1
n
N n N 1
P(X t
2
( n 1)
S S X+t ) 1 ( n 1) n n 2
的置信度 1- 的置信区间为:
(X t
2
( n 1)
S S ,X+t ( n 1) n n 2
3、非正态总体(大样本) 在总体方差已知条件下,根据 Z 分布进行区间估计, 可得 的置信度为 1- 的置信区间为:
P X z 2 X z 2 1 n n
的置信度 1- 的置信区间为:
(X z

n Z
2

2
n
,X z

2
n

为样本均值的抽样误差

n
为抽样极限误差 ,表明在给定置信度的条
件下对总体均值进行区间估计所允许的最大误差。
犯第二类错误四检验步骤建立总体假设抽样得到样本观察值统计量抽样分布选择检验统计量根据具体决策要求确定确定分布上的临界点值及检验规则计算检验统计量的数值比较并作出检验判断三假设检验与置信区间当假设检验在水平下接受h当假设检验在水平下拒绝h可通过构造的臵信度为的臵信区间来检验总体的假设四几种常见的假设检验一总体均值的检验检验规则双侧检验左侧检验右侧检验时接受原假设时拒绝原假设时接受原假设时拒绝原假设时接受原假设时拒绝原假设图示构造检验统计量检验规则双侧检验左侧检验右侧检验时接受原假设时拒绝原假设时接受原假设时拒绝原假设时接受原假设时拒绝原假设检验规则同正态总体方差已知的情况二总体成数的检验nq例题设随机变量皆服从且相互独立则随机变量服从自由度为n的分布分布一般为正偏态分布但随着自由度n的增大曲线趋向于正态分布
置信区间必定包含
0
当假设检验在 水平下拒绝H0,则 的置信度为 1- 的
置信区间必定不包含
0
可通过构造 的置信度为 1- 的置信区间来检验总体的假设
(X z

2
n
,X z

2
n

当 0 在该置信区间内时,接受H0;
当 0 不在该置信区间内时,拒绝H0。
四、几种常见的假设检验
在给定置信度 1- 的前提下,通过样本容量的改变
来确保一定的估计精确度 。
在总体均值的估计中
n 在总体成数的估计中
=Z
2
=Z

2
n
2 2 Z 2

2
Z 2 pq pq n n 2
2
第三节 假设检验
一、假设检验的基本原理
基本思路:假设检验就是事先对总体参数或分布形式作出某种
(二)检验规则的制定(正态总体方差已知双侧检验)
H0为真时 X ~ N ( 0 , ) n 标准化 X- 0 Z= ~ N (0,1) n
2
侧检验 H 0 : 0 H1 : 0

1
2

1
z 2
2
z 2 0
z
X-0 当Z = Z 2时,拒绝原假设 n X-0 当Z = Z 2时,接受原假设 n
2 ( n 1)
X-0 (当=0时) ~ t( n 1) S n
时,拒绝原假设 t t
2
( n 1)
时,接受原假设
左侧检验
t t ( n1)时,拒绝原假设t t ( n1)时,接受原假设
右侧检验
t t ( n1)时,拒绝原假设t t ( n1)时,接受原假设
(X z

2
n
,X z

2
n

2
在总体方差未知条件下,以
区间估计,可得 的置信度为 1- 的置信区间为:
(X z
2
s
2 代替
根据 Z 分布进行
S ,X z n
2
S ) n
(二)总体成数的置信区间
pq 标准化 ˆ ~ N ( p, ) p n
np 5 nq 5
ˆ -p p ~ N (0,1) pq n
p 的置信度 1- 的置信区间为:
ˆ z (p
2
pq ˆ z ,p n
2
pq ) n
p 为待估参数,以样本 p ˆ 代替
ˆ z (p ˆˆ pq ˆ z ,p n ˆˆ pq ) n
2
2
例题
三、样本容量的确定
样本容量一定时,置信度与精确度不能同时满足 ;
(大概率),认为该差异是由于样本的随机 性引起(有1 的可靠程度的保证) 2
样本均值落在阴影区间内的概率为 (小概率),认为该差异是显著的, 即为 显著性水平
1
u
X ~ N ( ,
22n)二、假设检验规则(以总体均值检验为例)
(一)提出总体的假设
原假设 ——H0
备择假设——H1(与原假设相对立的假设)
非正态总体或总体分布未知的样本均值的分布 根据中心极限定理,当样本容量足够大时(n 30 )
不管总体分布如何,样本均值的抽样分布总可以
看作是正态分布。
X ~ N ( , n)
2
标准化
X- ~ N (0,1) n
(二)样本成数的抽样分布
p 实质上是总体“是非标志”的均值 总体“是非标志”的方差为 2 pq
样 本 (观察结果)
拒 绝 小概率事件 发 生
检 验
小概率事件 未 发 生
假设检验的显著性差异 假设检验的显著性差异是一定的显著性水平下的差异 显著性水平是出现显著性差异的概率,在检验之前事先给定, 假设检验又称为显著性检验。 以总体均值的检验为例说明 样本均值落在非阴影区间内的概率为 1
相关文档
最新文档