6.5区间估计

合集下载

区间估计及运算

区间估计及运算

查表,得到
整理课件
13
由公式,
得,总体均值μ的置信度为90%的置信区间 为
于是可以说,我们有90%的把握确信,寿险 投保人总体的平均年龄介于37.37到 41.63
岁之间。
整理课件
14
1.从正态总体中抽取样本,且总体方差已知, 均值μ的区间估计
(2)在不重复抽样的条件下,置信区间为
X Z
2
n
N n N 1
的置信度为1-α的置信区间。
整理课件
54
四、简单随机抽样和等距抽样的参数估计
(三)一个总体比例的区间估计
整理课件
55
在许多实际应用中,经常会遇到总体比例的 估计问题。例如:企业的管理人员想了解 一批产品中次品的比例;职工收入中工资 外收入所占的比例;某高校学生参加英语 四级考试的通过率;某地区绿化荒山新栽 树木的成活率等。
整理课件
8
1.从正态总体中抽取样本,且总体方差已知,
均值μ的区间估计
(1)重复抽样的条件下

, 已知,
为来自总体的容
量为n的简单随机样本,则 的抽样分布为
整理课件
9
在重复抽样的方式下,总体均值μ的置信度 为1-α的置信区间为
其中, 是标准正态分布α水平的双侧分位数。
整理课件
10
整理课件
11
例一:
信区间。 称为置信区间的置信度,也称
置信概率、置信系数或置信水平, 称为置
信下限, 称为置信上限。
整理课件
6
三、置信区间的含义
若独立地反复多次抽取容量相同的简单随机样本,每一个样
本都确定一个随机区间
,在这些区间中,包含总体
参数 真值的约占

区间估计

区间估计

常见形式
间估计的区间上、下界通常形式为:“点估计±误差” “总体均值”的区间估计
总体均值:μ 总体方差:σ 样本均值:x =(1/n)×Σ(Xi) 样本方差:s =(1/(n-1))×Σ(Xi-x)^2 符号假设置信水平:1-α 显著水平:α
已知n个样本数据Xi (i=1,2,...,n),如何估计总体的均值? 首先,引入记号: 区间估计σ'=σ/sqrt(n) s'=s/sqrt(n) 然后,分情况讨论: 情况1 小样本(n<30),σ已知,此时区间位于 x ± z(α/2)×σ' 情况2 小样本(n<30),σ未知,此时区间位于 x ± t(α/2)×s' 区间估计情况3 大样本(n≥30),σ已知,此时区间位于 x ± z(α/2)×σ' 情况4 大样本(n≥30),σ未知,此时区间位于 x ± z(α/2)×s' 其中, z(α/2)表示:正态分布的水平α的分位数 t(α/2)表示:T分布的水平α的分位数
置信区间
区间估计有时,对所考虑的置信区间(或上、下限)加上某种一般性限制,在这个前提下寻找最优者。无偏 性是经常用的限制之一,如果一个置信区间(上、下限)包含真值θ的概率,总不小于包含任何假值θ┡的概率, 则称该置信区间(上、下限)是无偏的。同变性(见统计决策理论)也是一个常用的限制。
求置信区间的方法 最常用的求置信区间及置信上、下限的方法有以下几种。

费希尔把这个等式解释为:在抽样以前,对于θ落在区间内的可能性本来一无所知,通过抽样,获得了上述 数值,它表达了统计工作者对这个区间的"信任程度",若取b)=-α=uα/2,则得到区间,其信任程度为 1-α。即 当用上述区间作为θ的区间估计时,对于“它能包含被估计的θ”这一点可给予信任的程度为1-α。

区间估计的原理

区间估计的原理

区间估计的原理
区间估计是统计学中常用的一种方法,它可以用来估计总体参数的范围。

区间估计的原理是基于样本数据,通过一定的统计方法计算出一个区间,这个区间包含了总体参数的真实值的可能范围。

区间估计的原理可以通过以下步骤来说明:
1. 确定总体参数
首先,需要确定要估计的总体参数,例如总体均值、总体比例等。

2. 采样
从总体中随机抽取一定数量的样本,样本的数量应该足够大,以保证估计的准确性。

3. 计算样本统计量
根据样本数据,计算出相应的样本统计量,例如样本均值、样本比例等。

4. 确定置信水平
置信水平是指在多次重复采样的情况下,估计结果落在区间内的概率。

通常情况下,置信水平取95%或99%。

5. 计算标准误差
标准误差是指样本统计量与总体参数之间的差异,它可以用来衡量估
计的准确性。

6. 计算置信区间
根据样本统计量、标准误差和置信水平,可以计算出置信区间。

置信
区间是一个范围,它包含了总体参数的真实值的可能范围。

7. 解释结果
最后,需要解释计算出的置信区间。

例如,如果计算出的置信区间为[10,20],则可以说在95%的置信水平下,总体参数的真实值有可能在10到20之间。

总之,区间估计是一种常用的统计方法,它可以用来估计总体参数的
范围。

区间估计的原理是基于样本数据,通过一定的统计方法计算出
一个区间,这个区间包含了总体参数的真实值的可能范围。

在实际应用中,需要注意样本的大小、置信水平的选择以及标准误差的计算等问题,以保证估计的准确性。

统计学区间估计

统计学区间估计

统计学区间估计
统计学区间估计是一种基于样本数据的推断方法,用于估计总体参数的取值范围,通常使用置信区间来描述这个范围。

在统计学中,区间估计是一种比点估计更加精确的方法,因为它考虑了样本误差和不确定性的影响。

区间估计的过程可以分为以下几步:首先,选择一个统计量作为总体参数的估计值,例如样本均值或比例。

其次,计算这个统计量的标准误差和置信水平,这可以用来确定置信区间的宽度。

最后,根据样本数据计算置信区间的上限和下限,使得总体参数的真实值有一定的概率落在这个区间内。

值得注意的是,置信区间的宽度和置信水平是相互关联的,一般来说,提高置信水平会导致置信区间变宽,而降低置信水平则会使置信区间变窄。

因此,在进行区间估计时,需要权衡置信度和估计精度的关系,选择最合适的置信水平。

最后,需要注意的是,区间估计只能用来估计总体参数的取值范围,并不能确定总体参数的具体取值。

如果需要确定总体参数的具体取值,需要进行假设检验等其他方法。

- 1 -。

关于区间估计6页word文档

关于区间估计6页word文档

(1) P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。

2) 拒绝原假设的最小显著性水平。

3) 观察到的(实例的) 显著性水平。

4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

(2) P 值的计算:一般地,用X 表示检验的统计量,当H0 为真时,可由样本数据计算出该统计量的值C ,根据检验统计量X 的具体分布,可求出P 值。

具体地说:左侧检验的P 值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X < C}右侧检验的P 值为检验统计量X 大于样本统计值C 的概率:P = P{ X > C}双侧检验的P 值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍: P = 2P{ X > C} (当C位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。

若X 服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。

计算出P 值后,将给定的显著性水平α与P 值比较,就可作出检验的结论:如果α > P 值,则在显著性水平α下拒绝原假设。

如果α ≤ P 值,则在显著性水平α下接受原假设。

在实践中,当α = P 值时,也即统计量的值C 刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。

整理自:区间估计区间估计(Interval Estimation)[编辑]什么是区间估计区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。

它包括两部分内容:一是这一可能范围的大小;二是总体指标落在这个可能范围内的概率。

区间估计既说清估计结果的准确程度,又同时表明这个估计结果的可靠程度,所以区间估计是比较科学的。

用样本指标来估计总体指标,要达到100%的准确而没有任何误差,几乎是不可能的,所以在估计总体指标时就必须同时考虑估计误差的大小。

§6.5 区间估计 演示文稿1

§6.5   区间估计   演示文稿1
由 1 X 1, n
2
2 Y 2, m
2
1 2 X Y 1 2 , n m
2 2
U=
X Y (1 2 )
1
n
2


2 2
0 ,1
U
X
/
N ( 0 , 1)
n
按 照 给 定 的 置 信 度 1 0.9 5 , 可 查 正 态 分 布 表 得
P (|U |< 1 .9 6 ) = 0 .9 5
即 P( |
X
把上式括号内的不等式变形得:
/
| 1.9 6 ) 0 .9 5
n
P X 1.9 6

n
2
X + 1.9 6

0 .9 5 n
2
由 置 信 区 间 的 定 义 可 看 出 : 区 间 [ X 1.9 6 内 环 高 度 的 置 信 度 为 0 .9 5 的 置 信 区 间 。

n
2
, X + 1.9 6

n
2
]就 是
下面把样本观察值代入
x 1.9 6
二、正态总体期望和方差的置信区间
1、已知方差,求期望的置信区间 因为样本均值是期望的无偏估计量,所以要构造的样本 函数必须含有样本均值和数学期望
由经验可知: U X
/
N ( 0 , 1)
U 1 - /2, 使 得
n
按 给 定 的 置 信 度 1 - , 查 正 态 分 布 表 得
§6.5 区间估计
一、基本概念和方法

6.5参数的区间估计

6.5参数的区间估计
* n
附表3-2
查 t ( n 1) 分布表可知:
t0.025 (11) 3.201,
于是
s
* n
12.35 t1 /2 (n 1) 3.201 11.41, n 12
得的置信度为95%的置信区间(491.51, 514.33)
附加 4:设有一批胡椒粉,每袋净重 X(单位:克) 服从正态分布.从中任取8袋,测得净重分别为:
试求该批零件长度的置信度为 0.95 置信区间.

0.06
n6
经计算可得
x 14.95
查表得
u1 /2 u0.975 1.96, 故所求置信区间为
14.75, 15.15
从 x u1 /2 14.95 0.06 1.96 14.75 n 6 而
1 于是得 2 的一个置信度为 0.90的置信区间 2
2
0.34 0.34 1 , 2.38] [0.45, 2.79]. [ 0.29 2.59 0.29
又x 32.3, 0.4, n 20, 算得
x u1 /2
x u1 /2


0.4 32.3 1.96 32.12 n 20
32.3 1.96 0.4 32.48 20
n
所以的一个置信度为 %的置信区间为32.12,32.48) 95 (
解 已知 0 7, n 9, 0.05. 由样本值算得 1 x (115 120 110) 115. 9 查正态分布表得临界值 1.96,由此得置信区间:
(1151.96 7 / 9 , 1151.96 7 / 9 ) (110.43 , 119.57)

区间估计资料

区间估计资料

1-91
37
对给定的置信水平 使
,确定分位数

于是得到 的置信水平为 信区间为
的单侧置
1-91
38
即 的置信水平为 的单侧置信下限为
将样本值代入得 的置信水平为0.95的单侧置信下限是 1065小时
1-91
39
例5 为估计制造某种产品所需要的单件平均工时 (单位:小时),现制造5件,记录每件所需工时如 下 10.5 11.0 11.2 12.5 12.8 假设制造单位产品所需工时 试求平均工时的置信水平为0.95的单侧置信上限.
解 已知
由样本值算得:
查正态分布表得
得置信区间:
1-91
13
注意:置信区间并不是唯一的。 同样给定
置信区间越短,估计精度越高
1-91
14
(2) 未知方差,估计均值
可用样本方差:
构造统计量:
对于给定 的使 我们取对称区间
即:
查 分布表,得临界值 使
1-91
15
由 分布表
查 分布表
找出
其中, 是样本容量
第五讲 区间估计
在估计湖中鱼数的问题中,若我们根 据一个实际样本,得到鱼数 N 的极大似 然估计为1000条.
实际上,N的真值可能大于1000条, 也可能小于1000 条.
若我们能给出一个区间,在此区间内我们合理 地相信 N 的真值位于其中.这样对鱼数的估计就 有把握多了.
1-91
1
也就是说,我们希望确定一个区间,使我们能以 比较高的可靠程度相信它包含真参数值.
28
经计算得 X 6.0, (n1 1)S12 0.64 Y 5.7, (n2 1)S22 0.24
查表得t0.0025 (18) 2.1009, SW 0.2211

【VIP专享】6-5区间估计

【VIP专享】6-5区间估计

p(x)
G ~ 2(n)
α/2 α/2
2 2 (n)
2 1
2 (n)
x
单个正态总体置信区间常用公式
(1) 方差 2已知, 的置信区间
[
x
u1
2
n
,
x
u1
2
] LLL n
(1)
(2) 方差 2未知 , 的置信区间
x
t1
2
(n
1)
S, n
x
t1
2
(n
1)
S n
LLL
(2)
(3) 当 未知时, 方差 2 的置信区间
对任意的θΘ,有 P($L ) 1 则θ称Θ成ˆL立是,则θ称的置信为水ˆθL平的为1-1α- α的的(单(单侧侧)同)置等信置下信限下.若限等. 号对一切 任定则切意义θ称的4ΘˆθU:成设是Θ立,θθ有$,U的则置称θ$信UP水((x为平1,ˆULθ为的1ˆ,U-x1)αn-的是)α1的(统单(计单侧量侧)置,)若同信对等上给置限定信. 若的上等α限(号0.<对α<一1),对
(n 1)S 2
,
(n
1)S
2
LLL
(3)
2
1
2
(n
1)
2
2
(n
1)
(2)推导
选取枢轴量
T
x
S
~
t(n 1)
n

P
x
S n
t1
2
(n
1)
1
确定 t1 (n 1) 2
故 的置信区间为
注2: 要求θ以很大的可能被包含在区间 [ˆL ,ˆU ]
内,即概率 P($L ˆU ) 要尽可能大 .也就

总体参数的区间估计公式

总体参数的区间估计公式

总体参数的区间估计公式摘要:1.总体参数的区间估计概述2.区间估计公式的推导3.区间估计在统计学中的应用正文:一、总体参数的区间估计概述总体参数的区间估计是统计学中一种重要的参数估计方法。

在实际问题中,我们通常需要对总体的某个未知参数进行估计,例如均值、方差等。

由于样本数据的随机性,我们需要通过一定的方法来估计总体参数的真实值,区间估计就是其中一种常用的方法。

区间估计的核心思想是利用样本数据计算出一个区间,该区间内包含总体参数真实值的概率在一定范围内。

这个概率范围通常用置信水平来表示,置信水平越高,所估计的区间范围就越宽,包含总体参数真实值的可能性就越大。

二、区间估计公式的推导设总体X 的概率密度函数为f(x),样本容量为n,样本均值为x,样本标准差为s,我们要估计总体均值μ。

根据中心极限定理,当n 充分大时,样本均值的分布近似于正态分布,即:x ~ N(μ, σ/n)其中,σ为总体方差。

为了估计总体均值μ,我们可以构造一个置信区间。

设α为置信水平,对应的Z 值为Zα,那么:μ的置信区间为:x ± Zα * s / √n其中,s / √n 为样本标准差除以√n,它实际上是总体标准差σ的估计。

三、区间估计在统计学中的应用区间估计在统计学中有广泛的应用,主要包括以下几个方面:1.对总体参数的单个估计:通过构造置信区间,我们可以估计总体参数的单个值,如均值、方差等。

2.对总体参数的统计推断:通过比较不同置信水平下的置信区间,我们可以对总体参数进行统计推断,如判断总体参数是否等于某个值等。

3.对样本容量的估计:在实际问题中,我们通常需要根据样本数据来估计总体参数,而样本容量的大小直接影响到估计的准确性。

通过构造置信区间,我们可以估计合适的样本容量。

点估计的几种方法

点估计的几种方法

如果某统计量 ˆ ˆ(x1, x2满, 足, xn)
L ˆ max L( ),
则称 是ˆ 的极(最)大似然估计,简记为MLE
(Maximum Likelihood Estimate)。
求极大似然估计通常分如下两种情形:
1. 总体X 的取值范围与未知参数无关; 2. 总体X 的取值范围与未知参数有关。
现做了n次试验,观测到三种结果发生的次数 分别为 n1 , n2 , n3 (n1+ n2+ n3 = n)。求的最大 似然估计。
例6.1.7 设(X1,X2,…,Xn)是来自正态总体X~N(μ,σ2)的一 个样本,μ,σ2未知,求μ,σ2的极大似然估计。
解 设(x1,x2,…,xn)为样本(X1,X2,…,Xn)的一个观察值,则
现在我们来介绍一类重要的统计推断问题
参数估计问题是利用从总体抽样得到的信息 来估计总体的某些平均体重
估计废品率 估计湖中鱼数
估计平均降雨量
… …
第六章 参数估计
§6.1 点估计的几种方法 §6.2 点估计的评价标准 §6.3 最小方差无偏估计 §6.4 贝叶斯估计 §6.5 区间估计
ˆjˆj j(aj1(,a1 ,,ak ),, ak )j,1,j ,k1,, , k,
其中a jaj n1in1n1 xiijn1 xij为j阶样本原点矩.
矩法的步骤:
设总体X的分布为F(x;θ1,θ2,…,θk),k个参数θ1,θ2,…,θk待 估计,(X1,X2,…,Xn)是一个样本 。
Xk
1 n
n j 1
X
k j
从中解出方程组的解,记为 ˆ1,ˆ2,,ˆk
则 ˆ1,ˆ2,,ˆk 分别为参数θ1,θ2,…,θk的矩估计。

区间估计基本原理

区间估计基本原理

区间估计基本原理
区间估计是指通过样本数据对总体参数进行估计时,给出一个区间范围,以及一个置信度。

区间估计的基本原理是利用样本统计量来估计总体参数,并给出一个置信区间,即有一定置信度的总体参数在该区间内。

在进行区间估计时,通常会使用样本均值、样本比例或样本方差等统计量作为总体参数的点估计。

然后结合样本大小、总体标准差或其估计值,以及所选取的置信水平,利用统计分布的性质进行计算,得到一个区间范围。

置信度是指在重复抽样的情况下,得到的置信区间能够包含真实总体参数的概率。

通常使用的置信度为95%或99%。

即如果重复进行抽样,有95%或99%的抽样结果都能够包含真实总体参数。

区间估计的基本原理是建立在大数定律和中心极限定理的基础上。

根据大数定律,当样本容量足够大时,样本统计量的分布会趋近于总体参数的分布。

而根据中心极限定理,当样本容量足够大时,样本统计量的分布会近似服从正态分布。

因此,可以利用正态分布或t分布来进行区间估计。

当给出一个置信度时,可以根据正态分布或t分布的性质,计算出一个临界值,即一个与置信度对应的取值。

然后根据样本统计量的分布情况,在样本统计量的点估计上加减一个与临界值相乘的标准误差,得到一个区间范围。

通过区间估计,可以对总体参数进行更全面、更准确的估计。

同时,区间估计也可以告诉我们有多大的把握认为总体参数在给定的区间范围内。

区间估计

区间估计

第二节区间估计、区间估计的概念和步骤点估计用一个确定的值去估计未知的参数,具有较大的风险。

因为估计量来自于一个随机抽取的样本,结果也就带有随机性。

样本估计量刚好等于所估计的总体参数的可能性极小。

但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。

这种方法就是区间估计法。

在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧x范围内的概率是0.683 ,落在总体均值2范围内的概率是0.955 ,落在总体均值3 范围内的概率是0.997 等等。

由此xx 可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。

我们把这种对总体均值的估计称作区间估计。

从上述说明可以看到:1. 如果所估计的区间越大,参数被包含在该区间内的概率就越大。

2. 如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。

一般地,设为总体的一个未知参数,1, 2 分别为由一组样本所确定的对的两个估计量,对于给定的0 1,若P( 1 2 )=1 ,则称区间[ 1, 2 ]为置信度是1 的置信区间。

1, 2 分别为置信区间的下限和上限。

1 称为置信度或置信概率,表示区间估计的可靠度。

称为置信度水平。

常用的置信度有0.80,0.90,0.95 0.99等。

一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。

置信度反过来也表示可能犯错误的概率。

如置信度为95%,则犯错误的概率就为1-95%=5% 。

这一概率也就是置信度水平,也可理解为风险率或风险水平。

图5-2 根据不同样本所得到的置信度为95.5%的置信区间需要指出的是, P ( 1 2 )=1不应理解为 落在某一固定区间的概率。

因为这里 是一个参数,而不是随机变量,而1, 2 是根据抽样的结果计算出来的,因此,[ 1, 2 ]是一个随机区间。

6-5非正态总体参数的区间估计

6-5非正态总体参数的区间估计

2 a n u ,
2
2 b (2nX u ) ,
2
总体服从指数分布 未知参数 的置信水平为1 的置信区间是 1 1 1 1 ˆ ˆ ( 1 , 2 ) ( (1 u ) , (1 u ) ).
X n
2
c nX 2 .
X
n
2
概率论与数理统计教程(第四版)
[例2] 从一批电子元件中,抽取 50个样品,测得它们 设电子元件的使用寿命 的使用寿命的均值为1200小时, 服从指数分布e( ) , 求未知参数 的置信水平为 0.99 的置信区间.
解:由题设有 n 50 , x 1200. 已给置信水平1 0.99 ,
0.01 , 查附表得 u2 u0.005 t0.005 () 2.58. 由此得
目录
上一页
下一页
返回
结束
[例1]从一批产品中抽取 200个样品, 发现其中 9 个次品, 求这批产品的次品率 p 的置信水平为90%的置信区间. 解: 设随机变量 0 , 若取得正品; X 1 , 若取得次品. p ( x ; p ) p x (1 p )1 x , 概率函数为 则 X 服从 "0 1" 分布, x 0或1, 其中 p 是这批产品的次品率. 按题意, 样本容量 n 200 ,样本观测值 x1 , x2 ,, x200 中恰有 9 个 1 与 191个 0 , 所以 1 200 9 x xi 200 0.045. 200 i 1
则未知参数 p 的置信水平为1 的置信区间是
b b 2 4ac b b 2 4ac ( p1 , p2 ) ( ˆ ˆ , ). 2a 2a

区间估计

区间估计

(
)
X −µ 50 P X − µ < 50 = P < ≥ 0.95 σ n σ n X −µ 50 50 P > ≥ u0.025 = 1.96 ≤ 0.05 ⇒ σ n σ n σ n 50 n 2 ≥ 1.96 ⇒ n ≥ (19.6 ) = 384.16 500
(
)
14.6, 15.1, 14.9, 14.8, 15.2, 15.1. 的置信区间。 滚珠直径均值 µ 的置信概率为 0.95 的置信区间。 解:样本均值 x = 14.95, 样本均方差 S = 0.226 n = 6, α = 0.05, tα 2 ( 5 ) = t0.025 ( 5 ) = 2.5706
2
2
未知, 代替之。 且总体方差 σ 未知,我们考虑用样本方差 S 代替之。
X −µ ~ t ( n − 1) 利用统计量 T = S n
2、 σ 未知,估计 µ 、 未知,
X −µ ~ t ( n − 1) 利用统计量 T = S n
X −µ 对给定的置信度 1 − α , < b = 1 − α 要使 P T = S n X −µ PT = > b = α S n X −µ < tα 2 ( n − 1) b = tα 2 ( n − 1) T = S n
1、 σ 已知,估计 µ 、 已知,
X −µ < b = 1 − α 要使 P U = σ n X −µ P U = > b = α σ n X −µ U = < uα 2 b = uα 2 σ n σ σ < µ < X + uα 2 X − uα 2 n n σ σ , X + uα 2 的置信区间: 均值 µ 的置信区间: X − uα 2 n n

6.5 区间估计

6.5 区间估计
此处 s 2 1
n 1
2 2 ( x x ) 是 的无偏估计。 i
18 July 2014
第六章 参数估计
第25页
例6.5.5 假设轮胎的寿命服从正态分布。为估计某 种轮胎的平均寿命,现随机地抽12只轮胎试用, 测得它们的寿命(单位:万公里)如下: 4.68 4.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70 此处正态总体标准差未知,可使用t分布求均值 的置信区间。经计算有 x =4.7092,s2=0.0615。取 =0.05,查表知t0.975(11)=2.2010,于是平均寿命 的0.95置信区间为(单位:万公里)
取 查表得
0.05
z / 2 1.96
18 July 2014
第六章 参数估计
第4页
这说明
X P 1.96 0.05 1 5

P X 1.96 15 X 1.96 15 0.95
X 1.96 15 , X 1.96 15
4.7092 2.2010 0.0615 / 12 [4.5516, 4.8668]
第六章 参数估计
第1页
第六章 参数估计
§6.1 §6.2 §6.3 §6.4 §6.5 点估计的几种方法 点估计的评价标准 最小方差无偏估计 贝叶斯估计 区间估计
18 July 2014
第六章 参数估计
第2页
§6.5 区间估计
引例 已知 X ~ N ( ,1),
的无偏、有效点估计为 X
常数 随机变量
称随机区间
为未知参数 的置信度为0.95的置信区间.

区间估计和误差计算

区间估计和误差计算

(二)区间估计区间估计是指用样本指标、抽样误差和概率所构造的区间以估计总体指标存在的可能范围。

在进行区间估计的时候,根据所给定的条件不同,总体平均数和总体成数的估计有两条模式可供选择: 第一套:给定置信度要求,去推算抽样误差的可能范围。

第二套:根据已给定的抽样误差范围,求出概率保证程度。

1. 总体平均数的区间估计按照第一套模式,根据置信度F t ()的要求,估计极限抽样误差的可能范围)(∆∆∆或p x ,并指出估计区间(置信区间)。

具体步骤是:(1)抽取样本,并根据调查所得的样本单位标志值,计算样本平均数x ;计算样本标准差;在大样本下用以代替总体标准差推算抽样平均误差μ。

(2)根据给定的置信度F t ()的要求,查《正态分布概率表》,求得概率度t 值。

(3)根据概率度t 和抽样平均误差μx 计算极限抽样误差的可能范围μxx t =∆,并据以计算置信区间的上下限。

例14 麦当劳餐馆在7周内抽查49位顾客的消费额(元)如下,求在概率95%的保证下,顾客平均消费额的置信区间。

15 24 38 26 30 42 1830 25 26 34 44 20 3524 26 34 48 18 28 4619 30 36 42 24 32 4536 21 47 26 28 31 4245 36 24 28 27 32 3647 35 22 24 32 46 26第一步:根据样本计算样本平均数和标准差:x x n ==∑32 (元) S n x x ==-∑2945().(元),用样本标准差代替总体标准差σ=945.(元) 样本平均误差 x n μσ===94549135..(元)第二步:根据给定的置信度F t ()=95%,查概率表得t =196. 第三步:根据概率度t 和抽样平均误差推算抽样极限误差的可能范围。

65.235.196.1=⨯==∆μxx t (元) 将μxx ,的值代入区间估计公式 )(65.34)(35.2965.23265.232元元≤≤+≤≤-+≤≤-∆∆X X x X x xx计算结果表明,以95%的概率保证,麦当劳餐馆顾客消费额在29.35~34.65元之间。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P{θ L ( X 1 , X 2 , ⋯, X n ) ≤ θ ≤ θ U ( X 1 , X 2 ,⋯, X n )} = 1 − α
关于定义的说明
同等置信区间 P{θ L ( X 1 , X 2 , ⋯, X n ) ≤ θ ≤ θ U ( X 1 , X 2 ,⋯, X n )} = 1 − α
一般由点估计 引出
其中仅包含待估参数 θ , 并且 Z 的分布已知 且不依赖于任何未知参数 (包括 θ ).
(2) 对于给定的置信水平 1 − α , 定 出两个常数c, d , 使 P{c ≤ G ( X 1 , X 2 ,⋯ , X n ;θ ) ≤ d } = 1 − α .
(3) 若能从 c ≤ G ( X 1 , X 2 , ⋯ , X n ;θ ) ≤ d 等价 ⇕ 不等式 θ L < θ < θ U 其中 θ L θ U 都是统计量, 那么 [θ L , θ U ] 是 θ 的 1 − α 的置信区间.
例1
设总体 X 在 [0,θ ] 上服从均匀分布 , 其中 θ
(θ > 0) 未知, ( X 1 , X 2 ,⋯, X n ) 是来自总体 X的样本 , 给定 α , 求 θ 的置信水平为 1 − α 的置信区间.
解 θ的最大似然估计量为
因为 X ( n ) 的概率密度为
X ( n ) = max{ X 1 , X 2 , ⋯ , X n },
Z=
X(n)
θ
,
nxn−1 n , 0 ≤ x ≤ θ, f ( x) = θ 0, 其他.
考察包括待估参数 θ 的随机变量
Z=
X(n)
θ
,
nz n −1 , 0 < z < 1, 其概率密度为 g ( z ) = 其他. 0,
对于给定的 α , 可定出两个常数 a , b(0 < a < b ≤ 1),
于是得 µ 的一个置信水平为 1 − α 的置信区间 σ σ X − z1−α / 2 , X + z1−α / 2 . n n
这样的置信区间常写成 X ± σ z 1−α / 2 . n σ 其置信区间的长度为 2× z1−α / 2 . n 取 n = 16, σ = 1, α = 0.05, 查表可得 z1−α / 2 = z 0.975 = 1.96,
例2
设某产品的长度 X 服从正态分布 N ( µ ,16),
今抽9件测量其长度 得数据如下(单位 单位:mm): 今抽 件测量其长度, 得数据如下 单位 件测量其长度 142, 138, 150, 165, 156, 148, 132, 135, 160.
试求参数 µ 的置信水平为 95%的置信区间.
其置信区间的长度为 2× σ z 1−α / 2 ≤ 1.2 n
为置信区间.
三、单个正态总体参数的置信区间
(一)σ已知时μ的置信区间
设 X 1 , X 2 ,⋯, X n 是来自正态总体 N ( µ , σ 2 ) 的样本 , 其中σ 2 为已知, µ 为未知, 求 µ 的置信水平 为 1 − α 的置信区间.
因为 X 是 µ 的无偏估计 , 且 Z =
随机区间[θ L , θ U ]以 1 − α的概率包含着参数θ的真值, 而不能说参数θ以 1 − α的概率落入随机区间[θ L , θ U ].
还可以解释为:
若反复抽样多次(各次得到的样本容量相等,都是n)
每个样本值确定一个区间(θ L , θ U ),
每个这样的区间包含θ 的真值或不包含θ 的真值,
1 得一个置信水平为 0.95的置信区间 X ± × 1.96 . 16 由一个样本值算得 则置信区间为 x = 5.20, 即 [4.71, 5.69].
注意: 置信水平为 1−α的置信区间 是不唯一的 .
X −µ α = 0.05有 P − z1−0.04 ≤ ≤ z1−0.01 = 0.95, σ/ n
说明: 说明: 被估计的参数θ虽然未知, 但它是一个常数,
没有随机性, 而区间[θ L , θ U ])是随机的.
每次试验后,根据样本就能确定一个区间[θ L , θ U ]
当我们做10次试验后,就会有10组样本对应10个区间
样本容量 样本容量 n 固定 , 置信水平 1 − α 增大 , 置信区 间长度增大 , 可信程度增大 , 区间估计精度降低 . 置信水平 置信水平 1 − α 固定 , 样本容量 n 增大 , 置信区 间长度减小 , 可信程度不变 , 区间估计精度提高 .
比较两个置信区间的长度
L1 = 2 ×
L2 =
σ
n
z1−0.025 = 3.92 ×
σ
nHale Waihona Puke ,σn( z1−0.04 + z1−0.01 ) = 4.08 ×
σ
n
,
显然 L1 < L2 . 置信区间短表示估计的精度高 置信区间短表示估计的精度高.
说明: 说明 对于概率密度的图形是单峰且关于纵坐标 轴对称的情况, 易证取a和 关于原点对称时 关于原点对称时,能使 轴对称的情况 易证取 和b关于原点对称时 能使 置信区间长度最小. 置信区间长度最小
单击图形播放/ ESC键退出 单击图形播放/暂停 ESC键退出
1. 置信区间的定义
设总体 X 的分布函数 F ( x;θ ) 含有一个未知参数θ ,
若由样本X 1 , X 2 , ⋯ , X n 确定的两个统计量
对于给定值α (0 < α < 1), .满足 P{θ L ( X 1 , X 2 , ⋯, X n ) ≤ θ ≤ θ U ( X 1 , X 2 , ⋯, X n )} ≥ 1 − α ,
按伯努利大数定理, 在这样多的区间中 伯努利大数定理 在这样多的区间中, 包含θ真值的约占100(1 − α )%, 不包含的约占100α %.
二. 求置信区间的一般办法——枢轴量法 求置信区间的一般办法 枢轴量法
步骤为:
(1) 寻求一个样本 X 1 , X 2 , ⋯, X n 的函数 : Z = G ( X 1 , X 2 , ⋯ , X n ;θ )
区间估计
置信区间、枢轴量法
一、区间估计的基本概念
设总体 X 的分布函数 F ( x;θ ) 含有一个未知参数θ ,
若由样本X 1 , X 2 , ⋯, X n 确定的两个统计量 θ L = θ L ( X 1 , X 2 ,⋯ , X n )和θ U = θ U ( X 1 , X 2 ,⋯ , X n ) ˆ ˆ 使得 θ L < θ U , 在得到样本值之后, ˆ ˆ 就把θ估计在区间[θ L , θ U ]里.
解 由 n = 9, σ = 4, α = 0.05,
正态分布µ的置信度为 1 − α的置信区间 :X ±
z1−0.025 = 1.96, x = 147.333知,
σ
n
z1−α / 2
的置信区间为 µ的置信度为 0.95的置信区间为 (144.720, 149.946).
练习
设 总体 服从正态分布 N ( µ ,1), 为得到的置信水平 为0.95的置信区间长度不超过1.2, 样本容量应该多大 ?
X (n) 满足条件 P a ≤ ≤ b = 1 − α , θ
即 满足 1 − α = ∫ nz n −1dz = b n − a n 条件的的a , b
a
b
X (n) X (n) 使得 P ≤θ ≤ = 1−α, a b
X ( n) X (n) b , a
X −µ
X −µ ~ N (0,1)是不依赖于任何未知参 数的, σ/ n
σ/ n
~ N (0,1),
由标准正态分布的 α 分位点的定义知
−z
1−
α
2
z
1−
α
2
X −µ P − z α ≤ ≤ z α = 1−α, 1− 1− σ/ n 2 2
σ σ P X − zα / 2 ≤ µ ≤ X + zα / 2 = 1 − α , n n
θ L = θ L ( X 1 , X 2 ,⋯ , X n )和θ U = θ U ( X 1 , X 2 ,⋯ , X n )
则称随机区间(θ L , θ U )是θ 的置信水平为1 − α 的置信区间
θ L 和θ U 分别称为θ的(双侧)置信下限和置信上限, 1 − α为置信水平.
参数θ的1-α的同等置信区间 同等置信区间
即 P{ X −
σ
n
z1−0.01 ≤ µ ≤ X +
σ
n
z1−0.04 } = 0.95,
σ σ z1−0.01 , X + z1−0.04 也是 µ 的置信水平 故 X − n n 为 0.95的置信区间. 其置信区间的长度为
σ
n
( z1−0.04 + z1−0.01 ) .
相关文档
最新文档