第六章 估计与假设检验教案资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章 参数估计与假设检验

第一节 参数估计

一、参数估计概述 在许多实际问题中,总体被理解为我们所研究的那个统计指标,它在一定范围内取数值,而且是以一定的概率取各种数值的,从而形成一个概率分布,但是这个概率分布往往是未知的。例如为了制定绿色食品的有关规定,我们需要研究蔬菜中残留农药的分布状况,对这个分布我们知之甚少,以致它属于何种类型我们都不清楚。有时我们可以断定分布的类型,例如在农民收入调查中,根据实际经验和理论分析如概率论中的中心极限定理,我们断定收入服从正态分布,但分布中的参数取何值却是未知的。这就导致统计估计问题。统计估计问题专门研究由样本估计总体的未知分布或分布中的未知参数。直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。本节我们研究参数估计问题。本节及以后假定抽样方法为放回简单随机抽样,样本的每个分量都与总体同分布,它们之间相互独立。

二、参数估计的基本方法 (一)估计量与估计值

1.参数估计就是用样本统计量去估计总体参数

2.用来估计总体参数的统计量的名称称为估计量,如样本均值、样本比例、样本方差等都可以是一个估计量。

3.估计量的具体数值称为估计值 (二)点估计与区间估计

参数估计方法有点估计与区间估计两种方法。 1.参数估计的点估计法

(1)设总体X 的分布类型已知,但包含有未知参数θ,从总体中抽取一个简单随机样本12(,,,)n X X X L ,欲利用样本提供的信息对总体未知参数θ进行估计。构造一个适当的统计量

ˆT θ=12(,,,)n X X X L

作为θ的估计,称ˆθ为未知参数θ的点估计量(Point estimate )。当有了一个具体的样本

观察值12(,,,)n x x x L 后,将其代入估计量中就得到估计量的一个具体观察值

T 12(,,,)n x x x L ,称为参数θ的一个点估计值。今后点估计量和点估计值这两个名词将不

强调它们的区别,通称为点估计,根据上下文不难知道此处的点估计究竟是点估计量还是点

估计值。

通俗地说,用样本估计量的值直接作为总体参数的估计值称为点估计。

常用的点估计量有:X μ∧= p P ∧

= 2

2

2()

1

X X s n σ∧-==

-∑

2、估计的评价标准:

(1)无偏性: 设ˆT θ=12(,,,)n

X X X L 是未知参数θ的一个点估计量,若ˆθ满足

ˆE θθ= 即估计量的数学期望等于被估计参数

则称ˆθ是θ的无偏估计量(Unbiased estimate ),否则称为有偏估计量。

需要注意的是,由于估计量ˆθ是样本12(,,,)n

X X X L 的函数,样本量是n 维随机变量,所以对ˆθ求平均是按样本12(,,,)n

X X X L 的概率分布求平均。 无偏性是我们衡量点估计量好坏的一个评价标准,这个评价标准的直观意义如下。由于样本的出现带有随机性,所以基于一次具体抽样所得的参数估计值未必等于参数真值,这是由样本的随机性造成的。我们希望当大量使用这个估计量对参数进行估计时,一系列估计值的平均值应该与待估参数真值相等。这就从平均效果上对估计量的优劣给出一个评价标准。

(2)有效性:设11ˆT θ=12(,,,)n X X X L ,22

ˆT θ=12(,,,)n X X X L 均为未知参数θ的无偏估计量,如果对参数θ的一切可能取值有

1ˆ()Var θ≤2

ˆ()Var θ 且严格不等号至少对参数θ的某个可能值成立,则称无偏估计量1ˆθ比2

ˆθ有效(Efficiency )。

一个无偏估计量并不意味着他就非常接近被估计的参数,他还必须与总体参数的离散程度比较小。对同一总体参数的两个无偏点估计量,方差小者更有效。

(3)一次性:设对容量为n 的样本12(,,,)n X X X L ,ˆn n

T θ=12(,,,)n X X X L 是参数θ的一个估计量,1,2n =L ,若对任意ε>0,

{}

ˆ

1lim n

n P θθε→∞

-=p

则称{}ˆn θ是θ的一个一致的估计量序列,或称此估计量序列{}

ˆn

θ具有一致性。 随着样本容量的增大,点估计量的值越来越接近总体参数

2.参数估计的区间估计法

在参数估计中,虽然点估计可以给出未知参数的一个估计,但不能给出估计的精度。为此人们希望利用样本给出一个范围,要求它以足够大的概率包含待估参数真值。这就是导致区间估计(Interval estimation )问题。

所谓区间估计,就是估计总体参数的区间范围,并要求给出区间估计成立的概率值。

设θ是未知参数,12(,,,)n X X X L 是来自总体的样本,构造两个统计量

11ˆT θ=12(,,,)n X X X L ,22

ˆT θ=12(,,,)n X X X L ,对于给定的α(0<α<1),若1ˆθ、2ˆθ满足

{

1ˆP θ≤ }2

ˆθθ≤ 1α=-

则称随机区间[1ˆθ,2

ˆθ]是参数θ的置信水平(Confidence level )为1α-的置信区间

(Confidence interval ), 1α-称为[1ˆθ,2ˆθ]的置信度,1ˆθ,2ˆθ称为置信限(Confidence limit )。

这里有几点需要说明:

(1)区间[1ˆθ,2ˆθ]的端点1ˆθ,2ˆθ及长度2ˆθ-1

ˆθ都是样本的函数,从而都是随机变量,因此[1ˆθ,2

ˆθ]是一个随机区间。 (2){

1ˆP θ≤ }2

ˆθθ≤ 1α=-是说随机区间

[1ˆθ,2

ˆθ]以1α-的概率包含未知参数真值,区间长度2ˆθ-1

ˆθ描述估计的精度,置信水平1α-描述了估计的可靠度。 (3)因为未知参数θ是非随机变量,所以不能说θ落入区间[1ˆθ,2ˆθ]的概率是1α-,而应是随机区间[1

ˆθ,2

ˆθ]包含θ的概率是1α-。 通俗地说,在点估计的基础上,给出总体参数的一个范围称为区间估计。

三、总体均值的区间估计

(一)正态总体且方差已知;或非正态总体、方差未知、大样本情况下

在这种情况下,样本均值的抽样分布呈正态分布,其数学期望为总体均值μ,方差为

2

n

σ。则2

X Z α±称为总体均值在1α-置信水平下的置信区间。

设样本12(,,,)n X X X L 来自正态总体2

(,),x N μσμ是总体均值,当2x σ已知时数理统

计证明X 服从正态分布2

(,)N

n

σμ,X 服从标准正态分布(0,1)N ,对给定的置信

度1α-查(0,1)N 表可得2

Z

α,使得

21P Z αα⎫⎪≤=-⎬⎪⎭

从而有

22

1P X Z X Z ααμα⎧

-≤≤+=-⎨⎩

1ˆμ

=2

2

2ˆX Z X Z ααμ

-=+

则 [1ˆ,μ

]2ˆμ即是μ的置信水平为1α-的置信区间。 [例6.5]保险公司从投保人中随机抽取36人,计算得36人的平均年龄39.5X =岁,

相关文档
最新文档