7.3 区间估计

合集下载

概率论与数理统计第7章参数估计PPT课件

概率论与数理统计第7章参数估计PPT课件
5
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,

7.6 区间估计的基本概念

7.6 区间估计的基本概念

区间估计的基本概念前面介绍了参数的点估计,讨论了估计量的优良性准则,给出了寻求估计量最常用的矩估计法和最大似然估计法.参数的点估计是用一个确定的值去估计未知参数,看似精确,实际上把握不大,没有给出误差范围,为了使估计的结论更可信,需要引入区间估计.Neyman(1894–1981)引例在估计湖中鱼数的问题中,若根据一个实际样本,得到鱼数N的最大似然估计为1000条.实际上,N的真值可能大于1000,也可能小于1000.为此,希望确定一个区间来估计参数真值并且满足:1.能以比较高的可靠程度相信它包含参数真值.“可靠程度”是用概率来度量的.2.区间估计的精度要高.可靠度:越大越好估计你的年龄八成在21-28岁之间区间:越小越好被估参数可靠度范围、区间一、置信区间的定义(Confidence Interval )对于任意θ∈Θ,满足设总体X 的分布函数F (x ,θ)含有一个未知参数θ,θ∈Θ,对于给定常数α(0<α<1),若由抽自X 的样本X 1,X 2,…,X n 确定两个统计量112212ˆˆ{(,,,)(,,,)}1n n P X X X X X X θθθα<<≥-112ˆ(,,,)nX X X θ212ˆ(,,,)nX X X θ和则称随机区间是θ的置信水平为1−α的置信区间.12ˆˆ(,)θθ和分别称为置信下限和置信上限.1ˆθ2ˆθ(1)当X 连续时,对于给定的α,可以求出置信区间满足此时,找区间使得至少为1−α,且尽可能接近1−α.12ˆˆ(,)θθ112212ˆˆ{(,,,)(,,,)}1nnP X X X X X X θθθα<<=-12ˆˆ(,)θθ112212ˆˆ{(,,,)(,,,)}1n n P X X X X X X θθθα<<=-12ˆˆ()P θθθ<<(2)当X 离散时,对于给定的α,常常找不到区间满足12ˆˆ(,)θθ说明:(2)估计的精度要尽可能高. 如要求区间长度尽可能短,或者能体现该要求的其他准则.(1)要求θ以很大的可能被包含在区间内,即概率尽可能的大.可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.12ˆˆ()P θθθ<<12ˆˆ(,)θθ21ˆˆθθ-(3)对于样本(X 1,X 2,…,X n )112212ˆˆ((,,,),(,,,))n n X X X X X X θθ以1−α的概率保证其包含未知参数的真值.随机区间112212ˆˆ{(,,,)(,,,)}1n n P X X X X X X θθθα<<=-即有:(4)对于样本观测值(x 1,x 2,…,x n )可以理解为:该常数区间包含未知参数真值的可信程度为1−α.112212ˆˆ((,,,),(,,,))n n x x x x x x θθ常数区间只有两个结果,包含θ和不包含θ.此时,不能说:112212ˆˆ{(,,,)(,,,)}1n n P x x x x x x θθθα<<=-没有随机变量,自然不能谈概率如:取1−α=0.95.若反复抽样100次,样本观测值为112212ˆˆ{(,,,)(,,,)}1n n P X X X X X X θθθα<<=-1121ˆˆ((,,),(,,))i i i in n x x x x θθ于是在100个常数区间中,包含参数真值的区间大约为95个,不包含真值的区间大约为5个.12,,,ii i nx x x1,2,,100i =对应的常数区间为1,2,,100i =对一个具体的区间而言,它可能包含θ,也可能不包含θ,包含θ的可信度为95%.1121ˆˆ((,,),(,,))i i i i nnx x x x θθ二、构造置信区间的方法枢轴量法1.寻求一个样本X 1,X 2,…,X n 和θ的函数W =W (X 1,X 2,…,X n ;θ),使得W 的分布不依赖于θ和其他未知参数,称具有这种性质的函数W 为枢轴量(Pivotal quantity ).3.若由不等式a <W (X 1,X 2,…,X n ;θ)<b 得到与之等价的θ的不等式2.对于给定的置信水平1−α,定出两个常数a 和b ,使得P {a <W (X 1,X 2,…,X n ;θ)<b }=1−α112212ˆˆ(,,,)(,,,)n n X X X X X X θθθ<<即有P {a <W (X 1, X 2,…, X n ;θ)<b }关键:1.枢轴量W (X 1, X 2,…, X n ;θ)的构造2.两个常数a ,b 的确定一般从θ的一个良好的点估计出发构造,比如MLE因此,是θ的一个置信水平为1−α的置信区间.112212ˆˆ{(,,,)(,,,)}1n n P X X X X X X θθθα=<<=-12ˆˆ(,)θθf (w )ababab1−α1−α1−α希望置信区间长度尽可能短.对于任意两个数a 和b ,只要使得f (w )下方的面积为1−α,就能确定一个1−α的置信区间.f(w)abab ab1−α1−α1−α当W 的密度函数单峰且对称时,如:N (0,1),t 分布等,当a =−b 时求得的置信区间的长度最短.如:b =z α/2或t α/2(n )当W 的密度函数不对称时,如χ2分布,F 分布,习惯上仍取对称的分位点来计算未知参数的置信区间.χ21−αα/2α/222()n αχ21-2()n αχ。

§7-3 区间估计

§7-3  区间估计

S S X tα / 2 ( n 1) , X tα / 2 ( n 1) n n
二.正态总体均值与方差的置信区间
S S X tα / 2 ( n 1) , X tα / 2 ( n 1) n n
例题 1
有一大批糖果。现从中随机地取16袋,称得重量 (以克计)如下:
称随机区间 X 1.96 15 , X 1.96 15

为未知参数 的置信度为0.95的置信区间.
置信区间的意义
反复抽取容量为5的样本,都可得一个
区间,此区间不一定包含未知参数 的真
值, 而包含真值的区间占95%. 若测得 一组样本值, 算得 x 1.86 则得一区间 (1.86 – 0.877, 1.86 + 0.877) 它可能包含也可能不包含 的真值, 反复 抽样得到的区间中有95%包含 的真值.
注 记
(2)概率等式
确定方法: ◆ 当 W 的分布为对称时,可取 a = - b ,使得
Pa W b 1 中 a, b 的 α
P b W b 1 α
此时,b 为随机变量 W 的 上 /2 分位点。 ◆ 当 W 的分布为非对称时,可取a, b ,使得
P a α / 2 W
( n 1) S 2 , 2 χ ( n 1) α/2
( n 1) S
( n 1) S 2 χ1α / 2 (n 1)
2
χ
2 α/2
,
( n 1)
( n 1) S 2 χ1α / 2 (n 1)
P b α / 2 W
此时,b 为随机变量 W 的 上 /2 分位点,

7-3区间估计

7-3区间估计
2 ( X ) i i 1 n
从不等式 2 (n)
1 2 i 1
( X i )2
1 的置信区间为
( i 1
( Xi )
( n)
2 2
n
2
,

2
1

2
(n)
).
•13
⑵ 未知的情形
y


2
(n 1) S
2
2
1
~ (n 1),
1 1 ( X , X ,, X ) 和 2 2 ( X , X ,, X ) 为 X 中的未知参数,记 1 2 n 1 2 n
两个统计量,对于给定的 (0 1) ,如果
1 , 2 )} P{ 1 ( X , X ,, X ) 2 ( X , X ,, X )} 1 , P{ ( 1 2 n 1 2 n 1 , 2 ) ( 1 ( X , X ,, X ), 2 ( X , X ,, X )) 为 的置信度 就称区间 ( 1 2 n 1 2 n 1 1 ( X , X ,, X ) 为 置 信 下 限 , 为 1 的 置 信 区间 , 并称 1 2 n 2 2 ( X , X ,, X ) 为置信上限,1 称为置信系数或置信水平. 1 2 n
2
置信区间为
( x t (n 1)
2
s s , x t (n 1) ) n n 2
0.5744 0.5744 (6 2.306 , 6 2.306 ) 9 9
( 5 . 5 5 8 , 6 .. 442)
•12
2. 2 的置信系数为 1 的置信区间

glCH7-3

glCH7-3

2 2 为未知
X 选择样本函数 ~ t ( n 1) S n X P { t ( n 1) t ( n 1)}1 S 2 2 n
2
t (n 1) 0
2
2
t (n 1) t
2
S S 即 P{ X t ( n 1) X t (n 1)} 1 n 2 n 2
2 2 n n 从而正态总体参数 的置信度为 1 的置信区间为 (X z ,X z ) 或 记 作: (X z ) 2 2 2 n n n

P{ X

z X

z } 1
2
1-
2
z
0
2
z
2
从而正态总体参数 的置信度为 1 的置信区间为 (X
解: 已知 1 0.95 ,

2 查 t 分布表得: t / 2 (15) t 0.025 (15) 2.1315
0.025 , n 1 15
据题设数据算得x 503.75 及 s 6.2022 则所求均值 的 0.95 置信区间为: 6.2022 503.75 2.1315 即 ( 500.4 , 507.1 ) 16
0.025
s x t 0.025 (5) 14.97 0.21, 即 (14.76,15.18)。 6
所以,的置信度为95%的置信区间的上、下限为:
例 2 从 一 大 批 糖 果 中 随 机取 抽16袋 , 称 得 重 量 如 下 (以克计): 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 设 袋 装 糖 果 重 量 近 似从 服正 态 分 布 , 求 总 体值 均 的 置信度为 0.95的 置 信 区 间 。

概率论与数理统计--- 估计量的评选标准

概率论与数理统计--- 估计量的评选标准


15
例3 设总体 X 的均值和方差均存在 ,nX1, „, Xn 是总体 X 的样本, C1 , C2 ,„ ,Cn 为不全相同且满足 C i 1 的任一组常数,
证明: (1) 样本的线性函数 Ci X i 是总体均值 的无偏估计量 ; i 1 n n 1 X 较 C X 有效. (2) 总体均值的无偏估计量 X n i i i i 1 i 1 n n n 证(1) E ( C i X i ) C i EX i C i
24
譬如,在估计湖中鱼数的问题中, 若我们根据一个 实际样本得到鱼数 N 的极大似然估计为 1000 条.
但实际上, N 的真值可能大于 1000 条, 也可能小于1000条. 若我们能给出一个区间, 在此区间内我们合 理地相信 N 的真值位于其中, 这样对鱼数的估计就有 把握多了.
也就是说, 我们希望确定一个尽可能小的区间, 使我们能以 • 比较高的可靠程度相信它包含真参数值.
i 1 j 1
n
m
解:(1) E(T)=an+bm =(na+mb) 当na+mb=1时, E(T)=
此时,T是的无偏估计
(2) D(T)=a2n+b24m
1 na 2 na 4m( ) m 2 4(1 na ) 2 na m 8n(1 na ) dD 0 0 2na 令 m da 4 (4n+m)a=4 a 4n m D(a)>0 此时D(T)最小,即T最有效 4 1 a , b 4n m 4n m
定义:设ˆ (X1,X2,…,Xn)为的估计量,若E(ˆ) 存在,且有 ˆ E ( ) , 则称ˆ 为的无偏估计量

7.2区间估计

7.2区间估计

h 计)为 1050 1100 1120 1250 1280,设灯泡寿命服从
正态分布,求灯泡寿命平均值的置信水平为 0.95 的单侧置信下
限.
解:因为 2未知,所以选 X ~ t(n 1)估计均值 .
Sn
1 0.95, 0.05, n 5, t n 1 t0.05(4) 2.1318, x 1160, s2 950.
(1)
2 1
,
2 2
均为已知
X Y 是1 2的无偏估计,且 X ,Y 独立
X
~
N
(
1
,
2 1
n1
)
,Y
~
N
(
2
,
2 2
n2
)

X
Y
~
N (1
2
,
2 1
n1
2 2
)
n2
X Y (1 2)~ N (0,1)
2 1
2 2
n1 n2
于是1 2的一个置信水平为1 的置信区间为
X Y z 2
区间估计
寻求未知参数 的置信区间的主要步骤如下: (1) 寻求一个 X1, X2 ,L , Xn的函数(可从 的点估计考虑)
W W ( X1, X2 ,L Xn; ) 它包含待估参数 ,而不含其他未知参数,并且W 的分布已知
且不依赖于任何未知参数.
(2) 对于给定的置信水平1 (0 1),给定两个常数a, b,
2 2
S12
1
, S12
1
.
S22
F (n1 2
1, n2
1)
S22 F1 2 (n1 1, n2 1)
区间估计
四、单侧置信区间

名词解释区间估计

名词解释区间估计

区间估计的名词解释
一、什么是区间估计?
区间估计是统计学中一种常用的参数估计方法,用于根据样本数据来估计总体参数的范围。

在区间估计中,我们通过样本数据计算出一个区间,该区间通常包含总体参数的真实值。

区间估计的方法包括单侧区间估计和双侧区间估计。

二、区间估计的原理
区间估计的原理基于抽样分布理论。

根据中心极限定理,当样本容量足够大时,样本均值的分布近似于正态分布。

因此,我们可以利用样本均值和标准误差来估计总体均值的分布。

具体来说,我们首先根据样本数据计算出样本均值和标准误差。

然后,利用样本均值加减标准误差的倍数来计算出置信区间的上下限。

置信区间的置信度通常设置为 95% 或更高,这表示我们有 95% 的把握认为总体参数的真实值落在这个区间内。

三、区间估计的应用场景
区间估计在实际应用中具有广泛的应用价值,下面列举了一些常见的应用场景:
1. 估计总体均值:例如,通过对某批次产品进行抽样检测,计
算出样本均值和标准误差,然后用区间估计方法估计该批次产品的总体均值。

2. 估计总体比例:例如,通过对某人群进行抽样调查,计算出
样本比例和标准误差,然后用区间估计方法估计该人群的总体比例。

3. 估计总体标准差:例如,通过对某批次产品进行抽样检测,计算出样本标准差和样本容量,然后用区间估计方法估计该批次产品的总体标准差。

总之,区间估计是一种常用的参数估计方法,能够帮助我们在实际问题中对总体参数进行估计。

掌握区间估计的方法和原理,对于统计分析和决策具有重要意义。

概率论与数理统计 7.3 区间估计

概率论与数理统计 7.3 区间估计

不依赖于未知参数 ;
(3) 对给定的置信水平 1 , 确定 = 1 ,
5
一般是选取满足
2 (4) 由不等式 1 < g < 2 解出 的置信区间
( 1 , 2 ) .
P{ g 1 } = P{ g 2 } =
中, 分别独立抽取一些样品, 测得蓄电池的电
容量为 甲: 144, 141, 138, 142, 141, 143, 138, 137; 乙: 142, 143, 139, 140, 138, 141, 140, 138, 140, 136 设两个工厂生产的蓄电池电容量分别服从正态 分布 N( μ1 ,σ12), N( μ2 ,σ22) . 求 σ12/σ22 的 95% 的置信区间
[2.18, 9.52]
18
二 、两个正态总体 N( μ1 ,σ12), N( μ2 ,σ22) 的情况 (一) 两个总体均值差 μ1 μ2 的置信区间: 1、两个总体的方差 σ12 , σ22已知:
由于 X
12 N 1 , , Y n1
2 2 N 2 , , n2
引言
前面我们介绍了点估计的概念。点估计只是给出 了未知参数值的近似值。人们常常不满足于得到近 似值,还需要知道估计的误差是多少?即参数的一个 估计范围,还希望知道该范围覆盖参数真值的可信
程度。这种范围的估计称为区间估计。
1
7. 3 区间估计
定义7.6:
设 是总体的一个参数, ( X 1 , X 2 , , X n )是
由于
故有
2 S12 S2

2 1
2 2
F ( n1 1 , n2 1) ,
2 2 S S 1 2 P F ( n1 1 , n2 1) < 2 < F ( n1 1 , n2 1) 2 1 1 2 2 2

区间估计

区间估计

II. 方差 2 的置信区间
根据实际需要 , 只介绍 未知的情况.
方差 的置信度为 1 的置信区间
2
*2 *2 (n 1) Sn (n 1) Sn , 2 2 . / 2 (n 1) 1 / 2 (n 1)
推导过程如下:
因为 S
根据
7.3 参数的区间估计
一、区间估计基本概念 二、正态总体均值与方差的区间估计 三、小结
引言
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围,使用起来把握不大. 区间估计 正好弥补了点估计的这个缺陷 .
2 1 n 2 2 2 2 [ ] n , n 1 i 1 n
4 4 2 *2 [t1- / 2 ( n 1)]2 2 . [t1- / 2 (n 1)] E ( S n ) n n
*2 4Sn 2 2 于是 E ( L ) E [t1- / 2 (n 1)] n
推导过程如下:
因为 是 的无偏估计,
且U ~ N (0,1), / n
~ N (0,)是不依赖于任何未知参数的. / n
由标准正态分布的上 分位点的定义知
P u1 / 2 1 , / n
于是得方差 2 的置信度为1 的置信区间 *2 ( n 1) S * 2 ( n 1) S n n , 2 . 2 / 2 ( n 1) 1 / 2 ( n 1)
进一步可得: 标准差 的一个置信度为1 的置信区间
* n 1S n , 2 ( n 1) /2

统计学第六版贾俊平第7章无水印

统计学第六版贾俊平第7章无水印

1. 估计量:用于估计总体参数的随机变量
2. 如样本均值,样本比例、样本方差等
3. 例如: 样本均值就是总体均值 的一个估
计量
ˆ
4. 参数用 表示,估计量用 表示
5. 估计值:估计参数时计算出来的统计量的 详细值
6. 假如样本均值 计值
x =80,则80就是二点战估中计的的估
点估计与区间估计
参数估计的方法
P(1 P)
n 3. 总体比例 在1- 置信程度下的置信区间为
P z 2
(1 )
n

P
z
2
P(1- P) ( 未知时)
n
总体比例的区间估计
(例题分析)
【例】某城市想 要估计下岗职工 中女性所占的比 例,随机抽取了 100个下岗职工 ,其中65人为女 性职工。试以 95%的置信程度 估计该城市下岗 职工中女性比例 的置信区间
S1=5.8
x2 78
S2=57.2
两个总体均值之差的估计
(例题分析)
解: 两个总体均值之差在1-
为 (x1 x2 ) z 2
s12
s
2 2
3.
为是总体参数未在区间内的比例
4. 常用的置信程度值有 99%, 95%, 90%
5. 相应的 为,,
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称 为置信区间
2. 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间
3. 用一个详细的样本所构造的区间是一个特定的 区间,我们无法知道这个样本所产生的区间是 否包含总体参数的真值
(例题分析)
【例】一家保险公司搜集到由36投保个人组成的随 机样本,得到每个投保人的年龄(周岁)数据如下表。 试建立投保人年龄90%的置信区间

概率论与数理统计 7.2(参数的区间估计)

概率论与数理统计 7.2(参数的区间估计)

常将该对称区间写成较短的形式: X z 2 n
7.2.2 正态总体均值的区间估计 当然,(7.7)式中的不等式不是唯一的,取两个对称 的分位点 –z/2 和 z/2 是为了使两点之间的长度最小, 从而保证了所得置信区间的精度最大. 2. 2未知时, 的置信区间
1. 已知时,2的置信区间
由于X~N(,2),所以 取枢轴量
n 2
Xi 2 ~ ( n), i 1
n
2
n X 1 2 2 i 2 X i i 1 i 1
由于 2概率密度不是对称的,对给定的置信水平1 – ,不容易找到最短的置信区间,习惯上仍取对称形
2未知时,不能再用
区间的枢轴量,因为其中含有另一个未知参数2. 考虑到S2是2的无偏估计,可以用S2代替2, 由定理6.3知 X ~ t ( n 1),
S/ n
X Z 作为求 的置信 / n
所以,可以选用 T
X 作为枢轴量. S/ n
7.2.2 正态总体均值的区间估计
第三节 区间估计
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值。 点估计缺点
它没有反映出这个近似值的误差范围, 还有可信度. 区间估计正好弥补了点估计的这个缺陷 .
7.2.1 区间估计的一般步骤
定义7.5 设X1,X2,…,Xn为总体X的一个样 本,θ为总体X的未知参数,对给定的(0,1),如 果有两个统计量 ˆ1 ˆ1 ( X1 , X 2 ,, X n )和
本相互独立,其样本均值分别记为 X 和 Y ,其样本方 差分别记为S12和S22. 我们来研究参数1 – 2的区间估计. 1. 12和22已知时,1–2的置信区间 由定理6.4知

《概率论与数理统计》课件第七章 参数估计

《概率论与数理统计》课件第七章 参数估计
添加标题
03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10

11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.

D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2

3

1

6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题

7.4 区间估计1

7.4 区间估计1

于是得 的一个置信水平为 1 的置信区间 z / 2 , X z / 2 . X n n 这样的置信区间常写成 X z . /2 n 其置信区间的长度为 2 z / 2 . n
例如取 n 16, 1, 0.05, 查表可得 z / 2 z0.025 1.96,
求置信区间的三个步骤.
正态总体的均值与方差的区间估计
(1) 单个总体均值 的置信区间
为已知, X 2为未知, X
2

z / 2 . n S t / 2 ( n 1) . n
( 2) 单个总体方差 2 的置信区间
例1 有一大批糖果, 现从中随机地取 16 袋,
称得重量(克)如下: 506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
设袋装糖果的重量服从正态分布, 试求总体均值
的置信度为0.95 的置信区间.

1 0.95, n 1 15,
可以认为该种灯泡的使用寿命在1473.4个单位时间左右, 但范围有多大呢?又有多大的可能性在这“左右”呢? 如果要求有95%的把握判断在1473.4左右,即
1 x 1455 1502 1370 1610 1430 1473.4 5
P{ X ? X ?} 0.95 P{?? X ?} 0.95
1. 置信区间的定义
设总体 X 的分布函数 F ( x; ) 含有一个未知参
数 , 对于给定值 (0 1), 若由样本 X 1 , X 2 ,, X n 确定的两个统计量 ( X 1 , X 2 ,, X n ) 和 ( X 1 , X 2 ,, X n ) ( ) ,

《概率学》7.2区间估计

《概率学》7.2区间估计
S/ n
3
(n 1)S 2
2
~
2 (n 1)
4 n ( X i )2 ~ 2 (n)
i1
证明2. 由于 X ~ N(, 2 ) ,
n 所以 X ~ N(0,1)
/ n

(n 1)
2
S
2
~
(2 n 1)
且与 X 相互独立
/ n

X
/ n
(n 1)S 2
2
/ (n 1)
( X ) ~ t(n 1)
区间估计:就是用样本来确定一个
区间,使这个区间以很大的概率包含所
估计的未知参数,这样的区间称为置信
区间.
3
山东农业大学公共数学系概率统计课程组 版权所有
第2节 区间估计
第七章 参数估计
一、参数的区间估计法
设总体X的分布中含有未知参数θ , 若由来自总体X
的一个样本确定的两个统计量:
ˆ1 ˆ1(X1X2,..., Xn ) , ˆ2 ˆ2(X1X2,..., Xn ) ,
置信区间
X
u
2
n
X
t (n 1)
2
S
n
μ已知
σ2
μ未知
1
2
n
(Xi
i1
)2
~
2 (n)
n
(Xi )2
i1
2
2
(n)
,
n
(Xi
)2
i1
2 1
(n)
2
(n 1)S 2 2
~ 2 (n 1)
(n x2
1)S 2 (n 1)
,
2
(n 1)S 2
x12 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对给定的 (0 1),满足P 1 则称随机区间(, )是 置信区间,及 分别称为 置信下限和置信上限,1 称为置信水平.
首页 上页 返回 下页 结束


(1)
第7章
§7.3 区间估计
第2页
对给定的 (0<<1),满足P{<< }=1
§7.3 区间估计
第4页
在概率密度为单峰且对称的情形,当c = d 时求得 的置信区间的长度为最短.
f (u )
0.95
ccc0Fra bibliotek95d d
u u
0.95
0
d
u
c=d
首页 上页 返回 下页 结束
第7章
§7.3 区间估计
第5页
当概率密度不对称的情形,如 2分布,F 分布,习惯 上仍取对称的百分位点来计算未知参数的置信区间.
(1)
说明 : (1)式表示( , )包含未知参数的真值概率为 1- , 如 0.05时,若从总体中抽得容量相同的 100个样本,则在确定的100个置信区间中将有95个 包含的真值,不包含 真值的区间只有5个。绝不 能理解为的真值落在( , )内的概率为1-!
显然,置信区间不唯一.
n
第6页
2 ( X ) 2 i 2 ~ 2 ( n) i 1
(n 1) S 2 2 ~ (n 1) 2
Φ(x)
1-α
Z
2
2.
P{| t | t a (n)} 1 P | U | u 1 2 2
2 P({ 2 (n) 2 (n)}) 1 1 2 2
第7章
§7.3 区间估计
第1页
7.3 区间估计
区间估计:用样本来确定一个区间,使这个区间以很 大的概率包含所估计的未知参数,这样的区间称为置 信区间.
置信区间与置信水平:设总体X的分布中含有未知参数
, 若由来自总体X的一个样本确定的两个统计量: ( X 1,X 2, ,X n )和 ( X 1,X 2, ,X n )
首页 上页 返回 下页 结束
第7章 §7.3 7.3.2 单个正态总体均值 区间估计 与方差 2的置信区间
第9页
若 X ~ N ( , 2 ) : X 1,X 2, ,X n , 有 : X ~ N ( , ) n X ~ N (0,1) 1、 2已知, 的1 置信区间 / n P X u X u 1 n n 2 2 X 2 ~ t ( n 1) 2、 未知, 的1 置信区间

2
Z
2
2
0
x
首页
上页
返回
下页
结束

第7页 第7章 §7.3 区间估计 如何求未知参数的置信区间呢 ?下面通过一个例子阐述其方法 . 引例.设总体X ~N ( , 2 ), 2已知.X 1 , X 2 ,,X n是一个样本,
对于给定的置信水平1 , 求的置信区间.
分析 : 因 X是的一个点估计, 的区间估计应为在 X附近的 的一个区间, 如何得到这样的区间?自然回想到构造含有 X 和待估参数的样本函数,且其分布已知(应与无关). X 取U ~ N (0,1),对于给定的置信水平1 ,通过下式 / n X 而由P{ u } 1 P {| U | u } 1 确定U的范围, / n 2 2
首页 上页 返回 下页 结束
第10页 第 章 §7.3 区间估计 例 17 .为估计 35亩大豆的产量,以 200米 2面积上的大豆作为总
确定的范围,即P{ X
2

n
u X
2

n
u } 1 ,
2
如 =0.15, 样本的一组观测值为, 3.1, 3.4, 2.7, 2.9, 对于给定的数值得置 3.3, 2.9, 3.0, 3.1, 2.8( n 9), 取=0.05, 求出置信区间.信区间为:(2.94, 3.10)
首页 上页 返回 下页 结束
第7章
§7.3 区间估计
第8页
求置信区间的方法:
1、选取统计量。找样本( X 1,X 2, ,X n )的一个函数 W ( X 1,X 2, ,X n ; ) 并且W 只含所求置信区间的未知参数 , 不含其它未知参数.且 分布与 无关,此函数一般可从的某个点估计经过变换得到
首页
上页
返回
下页
结束

第7章
§7.3 区间估计
第3页
如何确定( , )
任意两个数c和d,只要它们的横标包含f(x)下95% 的面积,就确定一个95%的置信区间.
f (u )
0.95
c c c
0.95
d d
u u
0.95
0
d
u
我们总是希望置信区间尽可能短.
首页 上页 返回 下页 结束
第7章
f ( x)
X ~ ( n)
2

2 1 2
(n)
上页
2 ( n )
2
x
下页 结束
首页
返回
第7章 §7.3 区间估计 附:常用统计量及分位点的确定方法
1.若 X ~ N ( , 2 ) : X 1,X 2, ,X n
U X X ~ t ( n 1) ~ N (0 ,1) S/ n n
2
S/ n X t ( n 1) 1 故对给定的置信概率1-,有 P S/ n 2 S S P X t ( n 1) X t ( n 1) 1 n n 2 2 S X t ( n 1 ) 由此可得总体均值的1-置信区间为: n 2
2、确定分位点。对于给出的置信水平1 ,确定W 的分位点. 注意,在确定函数W 时,确保W 的分布有表可查.
3、变换不等式。利用不等式变形得到未知参数的置信区间
特别指出:求未知参数的置信区间所采用函数 W ( X 1,X 2, ,X n ; ) 与将来进行相关假设检验时所采用的统计量为同一函数
相关文档
最新文档