5.3置信区间

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
μ的点估计
1 n σ2 X = ∑ Xi ~ N µ, n i =1 n
(
)
U=
X −µ
σ
~ N ( 0, 1 )
n
对于给定的置信度 1 − α ( 0 < α < 1) y =ϕ( x) α α 1 − α = P {− λ < U < λ } 2 2 1 −α α 由 Φ 0 (λ ) = 1 − 求出 λ = uα −λ λ = uα 2 记 2 2
例 X ~ N ( µ , σ 2 ) 从中随机抽查10人, 测得身高: 从中随机抽查10人 测得身高: 抽查10
162, 159.5, 168, 160, 157, 162, 163.4, 158.5, 170.3, 166 y = f (x) 求 EX = µ 的0.95 置信区间. 置信区间. 0.025 0.025 S 0.95 解 X − t α (9) , X + t α (9) S n 2 n λ − λ 2 s 2 = 18.43 x = 162.67 t α ( n − 1) = t ( 9 )= 2.262 0.025 2 s = 18.43 = 4.29 S 4.29 X − t α (9) =162.67 − 2.262 × = 159.60 10 n 2 S 4.29 = 165.74 X + t α (9) = 162.67 + 2.262 × 10 n 2
§5.3 置信区间
ˆ 点估计 是用一个统计量 θ ( X1 , X 2 ,..., X n ) 估计 未知参数 当一次抽样实现后, 参数θ 未知参数θ.当一次抽样实现后,得到样本观测值 x1 , x2 ,..., xn 代入估计量后,得到一个具体的数值 代入估计量后, ˆ θ ( x1 , x2 ,..., xn ) 用这个数值作为θ的估计值. 用这个数值作为θ的估计值.
{
n
}
α
α
{
}
}
X ~ N ( µ , σ 2 ) 从中随机 例 某校高三女生的身高
抽查10人 测得身高如下: 抽查10人, 测得身高如下: 162, 159.5, 168, 160, 157, 10 162, 163.4, 158.5, 170.3, 166 求高三女生平均身高 y = f (x) EX = µ 的0.95 置信区间. 置信区间. 解 μ的 1 − α 置信区间为
设总体 X ~ N ( µ , σ 2 )
估计 µ
X 1 , X 2 ,..., X n 是来自 X 的样本. 的样本.
未知, (2) σ 未知, 求μ的置信区间
2
未知, 2.σ 未知, 求μ的置信区间 μ的点估计 2 1 n µ, σ X = ∑ Xi ~ N
2
X −µ ~ t ( n − 1) T= σ S n n i =1 n 对于给定的置信度 1 − α 查表得 λ = t α ( n − 1) 2 X −µ 1 − α = P −λ ≤ TS ≤ λ y =f (x)
(
)
uα = 1.96 0.025 0.025 1 2 x = (5.52 + ... + 5.76) = 5.44 0.95 7 σ 0.16 −λ λ uα X − uα = 5.44 − 1.96 × = 5.32 2 ( 5.32, 5.56 ) 2 n 7 σ 95%置信 为μ的95%置信 0.16 X + uα = 5.44 + 1.96 × = 5.56 2 区间. 区间. n 7
0.95置信区间 置信区间. (159.60, 165.74 ) 为μ的0.95置信区间.
三、正态总体方差 的区间估计
X ~ N ( µ , σ 2 ) 其中 µ 和 σ 2 均未知 估计 σ 2 均未知, 设总体 X 1 , X 2 ,..., X n 是来自 X 的样本. 的样本.
1. 取 σ 2 的一个良好的点估计, 的一个良好的点估计, 可取
随机抽取7 例 从某厂生产的一种钢球中随机抽取7个,测得 它们的直径为 它们的直径为 5.52, 5.41, 5.18, 5.32, 5.64, 5.22, 求一区 5.76(单位:mm ) 若钢球直径 X ~ N µ , 0.162 求一区 单位:mm 使它有95% 95%的把握 保证包含 的真值. 间,使它有95%的把握 保证包含 μ的真值. σ σ 解 μ的1-α置信区间为 X − uα , X + uα 2 2 n n 1 − α = 0.95 Φ 0 ( λ ) = 0.975 y =ϕ( x)
α
α
2
n
y =ϕ( x) α
2
λ = uα 2 X −µ σ −λ <µ−X <λ σ 1 − α = P −λ < U < λ = P X −µ σ n
求出 λ = uα 2 记 2
{
} {
−λ
1 −α
n σ σ X −λ < µ <X +λ =P n n
} n
{
}
uα σ , X + uα σ 是μ的 1 − α 置信区间. λ2 置信区间. X − λ2 n n
0.025
0.95
0.025
−λ λ S S − , X + t α ( n9 1) − X − t α ( n9 1) n 2 n 2 1 − α = 0.95 t α ( n − 1) = t ( 9 ) = 2.262 0.025 2 1 x= (162 + ... + 166) = 162.67 10 2 2 1 2 2 2 s = (162 + 159.5 + ... + 166 ) −10 × 162.67 = 18.43 9
2 2
(
)
2
(
)
n −1 2 S < λ2 = P 1 < W 4. 1 − α =P λ1 < 2
{
2
σ
} {λ
χ 2−α ( n − 1) λ1 = 1
2
2
( n − 1) S
σ X −µ 1 − α = P −λ < U < λ = P − λ <µ − X < λ σ X −µ σ n n n
{
}
{
}
1 n σ2 X = ∑ Xi ~ N µ, n i =1 n
(
)
U=
X −µ
σ
Biblioteka Baidu
~ N ( 0, 1 )
1 − α = P {− λ < U < λ }
由 Φ( λ ) = 1 −
误差范围, 点估计没有反映这个估计值的 误差范围, 把握不大. ˆ 使用起来 把握不大. θ ( x1 , x2 ,..., xn ) −θ < ? 例如: 例如: 参数真值 未知) (未知) 区间估计 可以弥补点估计的这个缺陷. 可以弥补点估计的这个缺陷. 估计值
有一个未知参数θ 设总体的分布中 有一个未知参数θ 为了估计θ 为了估计θ,从总体中抽取样本 X 1 , X 2 ,..., X n 所谓区间估计,就是构造两个 两个统计量 所谓区间估计,就是构造两个统计量 ˆ ˆ θ1 ( X 1 , X 2 ,..., X n ) < θ 2 ( X 1 , X 2 ,..., X n ) ˆ ˆ 一旦抽样实现后, 以它们为端点得到区间 ( θ1 , θ 2 ) 一旦抽样实现后, 就得到一个具体的区间 如果重新抽样,就得到另一 一个具体的区间, 就得到一个具体的区间,如果重新抽样,就得到另一 ˆ ˆ 是一个随机区间. 区间, 区间, 即 ( θ1 , θ 2 ) 是一个随机区间. ( ( ( •) ) ) θ 对这个随机区间有两个要求: 对这个随机区间有两个要求: 1. 要求θ有很大的可能 被包含在这个区间内. 要求θ 被包含在这个区间内. ˆ ˆ 尽可能大. 即要求 P {θ1 < θ < θ 2 } 尽可能大. ˆ ˆ ˆ ˆ 估计的精度要尽可能高, 2. 估计的精度要尽可能高,即 ( θ1 , θ 2 ) 的长度 θ2 −θ1 尽可能小. 尽可能小.
θ
分别为置信下限 置信上限. 分别为置信下限 和置信上限.1 − α 称为置信水平, 称为置信水平, 置信水平 也称置信度 置信概率. 也称置信度 或置信概率. 当一次抽样实现后, 当一次抽样实现后,得到样本观测值 x1 , x2 ,..., xn ˆ ˆ 称为置信区间 ( θ1 , θ 2 ) 的 即可得到一个具体的区间, 即可得到一个具体的区间, 一个实现 也称为置信区间. 实现, 一个实现, 也称为置信区间.
i =1
1 n ∑ Xi − X 1. 取 σ 的一个良好的点估计 S = n − 1 i=1 2 n −1 2 1 n 2 2. W = 2 S = 2 ∑ X i − X ~ χ ( n − 1)
2 2
(
)
2
(
)
λ2 = χα ( n − 1)
2
2
λ1 = χ 1−α ( n − 1)
2
2
α n −1 2 WS < λ2 = 1 − α 4.对 4.对P λ1 < 2 2 σ
{
2
}
α
2
作等价变形
1− 查表得 α
λ1
λ2
σ σ χα2 ( n − 1) 3.对于给定的 对于给定的α 3.对于给定的α λ2 =
i =1
1 n ∑ Xi − X 1. 取 σ 的一个良好的点估计 S = n − 1 i=1 2 n −1 2 1 n 2 2. W = 2 S = 2 ∑ X i − X ~ χ ( n − 1)
1 n ∑ Xi − X S = n − 1 i=1
2
(
)
2
2. W =
n −1
σ
2
S =
2
1
σ
2 i=1
∑ Xi − X ~
n
(
)
2
χ ( n − 1)
2
σ σ 3.对于给定的 对于给定的α 3.对于给定的α ( 0 < α < 1) 选取 λ1 , λ2 , 使得 P { λ1 < W < λ2}= 1 − α 但这样的 λ1 , λ2 , 不唯一. 不唯一. α 进一步要求 P {W ≤ λ1}= P {W ≥ λ2 } =
求置信区间的步骤: 求置信区间的步骤: 1.明确问题 是求什么参数的置信区间? 明确问题, 1.明确问题,是求什么参数的置信区间? 置信度是多少? 置信度是多少? 即 1 − α = ? 2. 寻找待估参数的 一个良好的点估计 T . 寻找一个待估参数θ和其估计量T 3. 寻找一个待估参数θ和其估计量T的函数 S ( θ , T ) 其分布为已知 S ( θ , T ) ~ 已知分布 已知分布 其分布为已知 为已知. 4.对于给定的置信水平 的分布, 4.对于给定的置信水平 1 − α , 根据 S (θ , T ) 的分布, 确定常数 确定常数 a , b 使得 P { a < S (θ , T ) < b } = 1 − α 5.对 作等价变形,得到如下形式: 5.对 a < S (θ , T ) < b 作等价变形,得到如下形式: ˆ ˆ P θ1 ( X 1 , X 2 ,..., X n ) < θ < θ 2 ( X 1 , X 2 ,..., X n ) = 1 − α
(
)
{
2 2 S S 1 −α = P −λ < µ−X <λ X −µ n n −λ λ = tα ( n−1) S S 2 = P X −λ < µ < X +λ n n S t αλn−1) S , X + t α ( n−1) ( λ 置信区间. 是μ的 1 − α 置信区间. X − 2 2 n n
{
ˆ ˆ 置信区间. 则区间 θ1 , θ 2 是θ的 1 − α 置信区间.
(
)
}
三、正态总体均值的区间估计 设总体 X ~ N ( µ , σ 2 ) 估计 µ
X 1 , X 2 ,..., X n 是来自 X 的样本. 的样本.
(1) σ 已知, 求μ的置信区间 已知,
2
σ 2 已知, 求μ的置信区间 已知, 1.
定义5.5 是一个要估计的参数, 定义5.5 设θ是一个要估计的参数, 对给定的小 正数 0 < α < 1 若由样本 X 1 , X 2 ,..., X n 确定的两个
ˆ ˆ 统计量 θ1 ( X 1 , X 2 ,..., X n ), θ 2 ( X 1 , X 2 ,..., X n ) ( θˆ1 < θˆ2 ) ˆ ˆ ( ( ( •) ) ) 满足 P {θ1 < θ < θ 2 }= 1 − α ˆ ˆ ˆ 置信区间. ˆ 则称区间( θ1 , θ 2 ) 是θ的 1 − α 置信区间.称 θ1 和 θ 2
相关文档
最新文档