抽样分布与参数估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5章 抽样分布与参数估计
总体? Population?
统计推断
• 统计方法
统计描述
统计推断
参数估计
假设检验
5.5 参数估计概述
• 参数估计(estimation of parameter)是统计 推断的一个方面,它是指由样本结果对总 体参数在一定概率水平下作出的估计。参 数估计包括区间估计(interval estimation) 和点估计(point estimation)。
置信区间的下限L1和上限L2为:
(L1 x u x ,L2 x u x )
1-α


2
2
u
u
区间估计的原理(t-分布)
在样本n少于30(t分布)条件下,对于某一概率标准,
则有以下通式:P( x

t
x



x

t
)
x
1
t为自由度df n 1,置信度P 1-时的t临界值
1147(hr)
n 10
_
95%的置信区间为: x1.96 x
即:1147 1.96
n
1147 1.96 8 1145.25 ~ 1148.75(hr) 10
P59例5.3
2.总体方差未知,但n足够大,比如n>30,用近似正态分 布,以样本方差代替总体方差

P(1.96 xμ 1.96) 1 α 0.95 s/ n
2
1-α
2
那么称区间(1,2 )是的100(1)% 置信区间.1 , 2称为的100(1 )% 置信下限和上限, 百分数100(1 )%
称为置信度.
1
2
3) 区间估计的原理
• 由中心极限定理得知,只要抽样为大样本,不论其总 体是不为正态分布,其样本平均数都近似服从正态分 布,因而,当概率水平α=0.05 或0.01时,其置信度为 P = 1- α=0.95或0.99的条件下,有
P( 1.96 x x 1.96 x ) 0.95
P( 2.58 x 2.58 ) 0.99
x
x
通过移项,上两式可变成
P(x 1.96 x 1.96 ) 0.95
x
x
P(x 2.58 x 2.58 ) 0.99
其总体参数的置信区间为:(x t x ,x t x )
置信区间的下限L1和上限L2为:
(L1 x t x ,L2 x t x )
1-α


2
2
t
t
4) 区间估计中的一些名词
– α: 称估计不确定概率,又称显著水准,通常取2个 值α=0.05、 α=0.01

P(2.58 xμ 2.58) 1 α 0.99 s/ n
即:பைடு நூலகம்

P(x1.96
s

μ x1.96
x
x
1-α


2
2
1.96
1.96
2.58
2.58
区间估计的原理(正态分布)
对于某一概率标准,则有以下通式
P(x

u
x



x

u
)
x
1
u为正态分布下置信度P 1-时的u临界值
该式表明,尽管我们只知道x而不知道,但知道区间 (x u x ,x u x )内包含在内的可可靠程度为1-, 因此(x u x ,x u x )被称作的1-置信区间
(L1 x u x ,L2 x u x ) (L1 x t x ,L2 x t x )
5.5.4 总体均数的区间估计
• 1. 总体方差已知,按正态分布原理,由于α通常取两个值, 即α=0.05, α=0.01

P (1.96 xμ 1.96) 1 α 0 .9 5 σ/ n
1) 区间估计的必要性
• 既然总体参量的点估计值有 偏差,就有必要对这种偏差 的范围作出估计,即区间估 计。
• 在一定置信度下的置信区间 是指总体参量以多大的把握 落入(位于)某个以下限和 上限构成的数量范围之中。
1-α


2
2
1
2
2) 区间估计的定义
设总体分布有一未知参量 ,若由样本 确定两个统计量1(x1, x2,xn )及 2 (x1, x2 xn ),对于给定的(0 1)满足 : p{1 2} 1
σ
n
n
• 例:某灯泡厂生产大批灯泡,从中抽取10个 进行寿命试验,数据如下(单位:hr):
– 1050、1100、1080、1120、1200、1250、1040、1130、 1300、1200
– 若灯泡寿命服从正态分布 N (,8) ,试求灯泡平均寿
命的95%置信区间。
解:
_
x


x

11470
– P(P=1- α):为置信度、置信概率或置信系数 (confidence coefficient)
– uα(tα),正态分布(t分布)下置信度P=1- α时的临界值
– 置信区间: (x u x ,x u x ) , (x t x ,x t x )
置信区间的下限L1和上限L2

P (2.58 xμ 2.58) 1 α 0 .9 9 σ/ n
即:

P(x1.96
σ
μ

x 1.96
σ
)

0.95
n
n

P(x
2.58
σ
μ

x
2.58
σ
)

0.99
n
n
则 总 体 均 数 μ的9 5%和99%的 可 信 区 间 为

x 1.96
σ

,x
2.58
μ x, σ s
• 5.5.1 点估计
– 点估计有明显的局限性。点估计虽然在 估计总体实况上有一定的意义,但它是 不完整的、不稳定的。
– 点估计的局限性的原因:
• 忽略了取样误差 • 忽略了取样单位数
– 如以点估计值简单地等同于总体真值或 把几个点估计值简单地相互比较,都是 错误的。
5.5.2 区间估计及其原理
• 5.5.1 点估计
– 假定 是总体X的未知参数,用来自总体X的
样本(x1、x2、… …xn)构造一个适当的统计

^^
(x1, x2
称为未知参数
,的x点n ) 去估估计计方未法知,参^数为点,估就计
值。
– 如用样本均数直接估计总体均数, 样本 标准差估计总体标准差即

相关文档
最新文档