《应用统计学》第6章:置信区间估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

χ =∑X
2 i =1
n
2 i
为服从自由度为 n 的 χ 2 分布,记为 自由度为
χ 2 ~χ 2(n)
3
“自由度”的含义 自由度” 自由度
若对于随机变量 X1, X2, ··· , Xn, 存在一组不全为 零的常数 c1, c2, ··· , cn, 使 c1 X1+ c2 X2 + ··· + cn Xn = 0 则称变量 X1, X2, ··· , Xn 线性相关,或称它们间存在 一个线性约束条件; X1, X2, ··· , Xn 间存在 k 个独立 若 的线性约束条件, 则它们中仅有 n-k 个独立的变量, 并称平方和 的自由度为 n-k。
d = Zα / 2 p (1 − p ) / n
= 1.96 0.0167 (1 − 0.0167 ) / 300 = 1.45%
该厂产品次品率的置信度为95%的置信区间为
( p − d , p + d ) = (0.22%, 3.12% )
22
案例思考题
国外民意调查机构在进行民意调查时,通常要求 在95%的置信度下将调查的允许误差(即置信区间的 d 值)控制在3%以内。 ⑴问为满足该调查精度要求,至少需要多大的样 本? ⑵如果要求置信度达到99%,调查误差仍为3%, 此时至少需要多大的样本?
从而 σ 2 的置信度为1-α 的置信区间为:
( n − 1) S 2 ( n − 1) S 2 2 , 2 χ ( n − 1) χ 1 − α / 2 ( n − 1 ) α /2
f (x)
α/2
0χ 2 (n −1) 1−α / 2
1-α
α/2
2 χα / 2 (n −1) x
α/2
α/2
( x − Zα / 2σ / n , x + Zα / 2σ / n )
为便于记忆和理解,将 µ 的置信区间表示为如下形式:
( x − d , x + d ) , d = Zα / 2σ / n
其中 d 称为估计的允许误差 允许误差。 允许误差
12
用 Excel 求 Zα
可用 Excel 的统计函数 NORMSINV 返回 Zα 。 语法规则如下: 格式:NORMSINV(1-α) 功能: 返回 Zα 的值。 说明: NORMSINV(α) 返回的是 Z1-α 的值。
χ =
2
(n − 1) S 2
σ2

σ
2
2
χ 2 (n − 1)
2 < χ α / 2 ( n − 1)} = 1 − α
由 可得
P { χ 12− α / 2 ( n − 1) <
( n − 1) S 2
( n − 1) S 2 P{ 2 <σ χ α / 2 ( n − 1)
( n − 1) S 2 < 2 } = 1−α χ 1 − α / 2 ( n − 1)
23
案例思考题解答(1) 案例思考题解答
由 d = Zα / 2 p (1 − p ) / n ,可得
2 Zα / 2 p (1 − p ) n= d2
本案例中,当 p = 0.5时,p (1 − p ) 达到最大值, 故需要的样本容量至少为
1.96 2 × 0.5 × 0.5 = 1067.1 ≈ 1068 (人) n= 2 0.03
由此可得 µ 的置信度为 1-α 的置信区间为 ( x − d , x + d ) , d = tα / 2 (n − 1) S / n
18
§6.2 总体比例的区间估计
设总体比例为 P, 则当 nP 和 n (1-P) 都大于5时, 样本成数 p 近似服从均值为 P, 方差为 P (1-P)/n 的正态 分布。从而
26
1.总体均值区间估计时样本容量的确定 总体均值区间估计时样本容量的确定
故所求 µ 的 95% 置信区间为
( x − d , x + d ) = (1282.5, 1563.7)
可用 Excel 的【工具】→“数据分析”→“描述统 计” 求解正态总体均值 µ 的置信区间。
20
课堂练习2: 课堂练习 :
某车床加工的缸套外径尺寸 X~N( µ, σ 2 ), 下面是随机测得的10个加工后的缸套外径尺寸(mm), 90.01,90.01,90.02,90.03,89.99 89.98,89.97,90.00,90.01,89.99 ( , ) 2 2 S = 0.01853 求 x = 90.001 µ 的置信度为95%的置信区间;
21
【例4】某厂为了解产品的质量情况,随机抽取了300件产品 例 】 进行检验,其中有5件次品,求该厂产品次品率的置信度为 95%的置信区间。 解:产品次品率为比例,α =1-0.95=0.05, α/2=0.025,n=300,,查表得 Z0.025=1.96, 样本成数
p = 5 / 300 = 1.67%
16
用 Excel 求 tα /2(n)
可用 Excel 的统计函数 TINV 返回 tα (n)。 语法规则如下: 格式:TINV( 2α , n ) 功能:返回 tα (n)的值。 说明:TINV(α, n )返回的是 tα/2(n)的值。
17
4.σ 2 未知时总体均值 µ 的区间估计
设总体 X~N( µ, σ 2 )ห้องสมุดไป่ตู้ X1, X2, ···, Xn 为 X 的容量为 n 的样本, X 和 S2 分别为样本均值和样本方差。
故所求σ 2的置信区间为 (135.22,358.82)
9
课堂练习1 课堂练习
某车床加工的缸套外径尺寸 X ~ N(µ, σ 2),现随机测 得的 10 个加工后的某种缸套外径尺寸(mm) 如下: 90.01,90.01,90.02,90.03,89.99 89.98,89.97,90.00,90.01,89.99 ( ) S 2 = 0.018532 求 σ 2 的置信度为 95% 的置信区间。
13
3. t 分布 设 X~N(0, 1),Y~χ 2(n), 且 X 与 Y 相互 独立, 则随机变量
X t= Y/n
服从自由度为 n 的 t 分布 分布,记为 t~t(n)。
14
t 分布密度函数的图形
f (x) n = ∞,N (0, 1) n = 10 n=4 n=1 x
0
标准正态分布分布是 t 分布的极限分布。 当 n 很大时,t 分布近似于标准正态分布。
19
【例3】求例 中元件平均寿命 µ 的95%置信区间。 求例1中元件平均寿命 置信区间。 求例 置信区间
S=196.5, α =1-0.95=0.05, 解:由例1, x =1423.1,
α /2=0.025, n=10, 查表得 t0.025(9)=2.2622
d = tα / 2 ( n − 1) S / n = 2.2622 × 196.5 / 10 = 140.6
15
t 分布的右侧 α 分位点 tα(n)
tα(n)为 t 分布中满足下式的右侧 α 分位点:
P{ t > tα ( n ) }= α
由给定的概率 α,可查表得到 tα(n)。 由 t 分布的对称性,可得:t1-α(n)=-tα(n)。
f (x)
α
t1-α(n) = - tα(n) 0
α
x tα(n)
8
【例2】求例1中元件寿命方差 σ 2 的 95% 置信区间。
解:由例1,S2 =196.52,n =10,α/2=0.025, 2 2 χ 0.975 (9) = 2.7 1-α/2=0.975, χ 0.025 (9) = 19.023, (n-1)S2/ (n-1)S2/
2 χ 0.025 (9) = 9×196.52/19.023 = 135.22 2 χ 0.975 (9) = 9×196.52/2.7 = 358.82
4
i =1
∑ X i2
n
χ2 分布密度函数的图形
f (x)
n=1 n=4 n=10 x
o
5
χ 2 分布的右侧
α 分位点 χα (n)
2
2 χα (n) 为χ 2分布中满足下式的的右侧α 分位点:
2 P{χ 2 > χα (n) } = α
f (x)
α
o
2 χ α ( n)
x
2 χ α ( n) 由给定的概率 α 和自由度,可查表得到
24
案例思考题解答(2) 案例思考题解答
如果要求置信度达到99%,则Zα/2=Z0.005=2.575,
2.5752 × 0.5 × 0.5 = 1841.8 ≈ 1842 (人) n= 2 0.03
25
§6.3 样本容量确定
前面的分析都是在给定的样本容量和样本数据下 求置信区间。但在实际应用中,应当在随机抽样前 就确定所需抽取的样本容量。 抽取的样本容量过大,虽然可以提高统计推断的 精度,但将增加不必要的人力、物力、费用和时间 开支; 如果抽取的样本容量过小,则又会使统计推断的 误差过大,推断结果就达不到必要的精度要求。 确定样本容量的原则 ——在满足所需的置信度和允许误差条件(置信区 间的 d 值)下,确定所需的最低样本容量。
X −µ 可以证明: t = ~ t(n-1) S/ n
因此,对给定的置信度 1-α,有
X −µ P{−tα / 2 (n − 1) < < tα / 2 (n − 1)} = 1 − α S/ n
即 P{ X − tα / 2 (n − 1) S / n < µ < X + tα / 2 (n − 1) S / n } = 1 − α
Φ (1.96) = 0.975 = 1-0.025, 故 Z0.025 =1.96
11
2.σ 2 已知时总体均值µ的区间估计 时总体均值 的区间估计
由正态分布的性质可得 X −µ Z= ~N(0,1) σ/ n f (x) 1- α
对给定的置信度1-α, 有 -zα/2 0 zα/2 x X −µ P{− Zα / 2 < < Zα / 2 } = 1 − α σ/ n 由此可得 P{x − Zα / 2σ / n < µ < x + Zα / 2σ / n } = 1 − α 从而µ的置信度为 1-α 的置信区间为
1 2
ˆ ˆ 则称随机区间 ( θ1 , θ 2 ) 为 θ 的置信度 置信度为1-α 的 置信度 置信区间。 置信区间
2
2
§6.1 单个正态总体均值和方差的区间估计 一. 总体方差 σ 2 的区间估计 1.χ 2 分布
设总体 X~N (0, 1), X1, X2, ···, Xn 为 X 的 一个样本,则它们的平方和
第6章 置信区间估计 章
本章教学目标: 本章教学目标:
(1) 单个正态总体均值和方差的区间估计。 (2) 总体比例的区间估计。 (3) 均值和比例置信区间估计中的样本容量确定。 (4) 两个正态总体的均值差和方差比的区间估计。 (5) 单侧置信区间估计。
1
区间估计
由于点估计存在误差,因此仅对总体参数作出点 估计是不够的,还需要了解估计的精度及其误差。 参数的区间估计就是在给定的可信度下,估计未 知参数的可能取值范围。 设 θ 为总体分布的未知参数,若由样本确定的两 ˆ ˆ 个统计量 θ1 和 θ2 , 对给定的概率 α(0<α<1),满足 ˆ ˆ P{θ < θ < θ } = 1 − α
p−P 近似服从 N (0, 1) P (1 − P ) / n
对给定的置信度1-α,由 p−P P{− Zα / 2 < < Zα / 2 } = 1 − α P (1 − P ) / n 用样本比例代替总体比例, 可得总体成数 P 的置信度 为 1-α 的置信区间为
( p − d , p + d ) , d = Zα / 2 p (1 − p ) / n
10
总体均值µ的区间估计 二. 总体均值 的区间估计
1. 标准正态分布的右侧 α 分位点 Zα Zα 是标准正态分布中满足下式的右侧α分位点: P{ Z > Zα } = α
f (x) 1- α zα
α
x
0
如图所示,Φ ( Zα )=1- α ,因此, 可由正态分布表 得到 Zα 。 如:要查 Z0.025, 由正态分布表可查得:
6
2 用 Excel 求 χ α ( n )
2 χ α ( n) 可用 Excel 的统计函数 CHIINV 返回 语法规则如下:
格式:CHIINV (α , n )
2 χα (n) 的值。 功能:返回
7
2. 总体方差 σ 2 的区间估计
设总体 X~N( µ, σ2 ), X1, X2, ··· , Xn 为 X 的容量为n的样本, X 和 S2 分别为样本均值和样本方差。 可以证明,
相关文档
最新文档