《应用统计学》第6章:置信区间估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13
3. t 分布
设 X~N(0, 1),Y~ 2(n), 且 X 与 Y 相互 独立, 则随机变量
X t Y/n
服从自由度为 n 的 t 分布,记为 t~t(n)。
14
t 分布密度函数的图形
f (x) n = ∞,N (0, 1) n = 10 n=4 n=1 x
0
标准正态分布分布是 t 分布的极限分布。 当 n 很大时,t 分布近似于标准正态分布。
由此可得 的置信度为 1- 的置信区间为
( x d , x d ) , d t / 2 (n 1) S / n
18
§6.2 总体比例的区间估计
设总体比例为 P, 则当 nP 和 n (1-P) 都大于5时, 样本成数 p 近似服从均值为 P, 方差为 P (1-P)/n 的正态 分布。从而
23
案例思考题解答(1)
由 d Z / 2 p(1 p) / n ,可得
2 Z / 2 p (1 p ) n d2
本案例中,当 p 0.5时,p(1 p) 达到最大值, 故需要的样本容量至少为
1.96 2 0.5 0.5 (人) 1067 .1 1068 n 2 0.03
(9) = 9196.52/19.023 = 135.22 (9) = 9196.52/2.7 = 358.82
故所求 2的置信区间为 (135.22,358.82)
9
课堂练习1
某车床加工的缸套外径尺寸 X ~ N(μ, σ 2),现随机测 得的 10 个加工后的某种缸套外径尺寸(mm) 如下: 90.01,90.01,90.02,90.03,89.99 89.98,89.97,90.00,90.01,89.99 ( ) S 2 0.01853 2 求 σ 2 的置信度为 95% 的置信区间。
1 2
ˆ ˆ 则称随机区间 ( 1 , 2 ) 为 的置信度为1- 的 置信区间。
2
2
§6.1 单个正态总体均值和方差的区间估计 一. 总体方差 2 的区间估计 1. 2 分布
· · 设总体 X~N (0, 1), X1, X2, ·, Xn 为 X 的 一个样本,则它们的平方和
16
用 Excel 求 t /2(n)
可用 Excel 的统计函数 TINV 返回 t (n)。 语法规则如下: 格式:TINV( 2 , n ) 功能:返回 t (n)的值。 说明:TINV(, n )返回的是 t/2(n)的值。
17
4. 2 未知时总体均值 μ 的区间估计
· · 设总体 X~N( μ, σ 2 ), X1, X2, ·, Xn 为 X 的容量为 n 的样本, X 和 S2 分别为样本均值和样本方差。
n=1 n=4 n=10 x
o
5
2 分布的右侧
2 ( n) 分位点
2 (n) 为 2分布中满足下式的的右侧 分位点:
2 P{ 2 (n) }
f (x)
o
2 ( n)
x
2 ( n) 由给定的概率 和自由度,可查表得到
6
2 用 Excel 求 (n)
21
【例4】某厂为了解产品的质量情况,随机抽取了300件产品 进行检验,其中有5件次品,求该厂产品次品率的置信度为 95%的置信区间。 解:产品次品率为比例, =1-0.95=0.05, /2=0.025,n=300,,查表得 Z0.025=1.96, 样本成数
p 5 / 300 1.67%
2
(n 1) S 2
2
~
2
2 (n 1)
2 / 2 (n 1)} 1
由
可得
P{12 / 2 (n 1)
(n 1) S 2
( n 1) S 2 ( n 1) S 2 2 P{ 2 2 } 1 / 2 ( n 1) 1 / 2 (n 1)
26
1.总体均值区间估计时样本容量的确定
在给定置信度和允许误差 d 的条件下,由 d t / 2 (n 1) S / n 可得
z / 2 S t / 2 (n 1) S z / 2 n d d d
2 2 2
故所求 的 95% 置信区间为
( x d , x d ) (1282 .5, 1563 .7)
可用 Excel 的【工具】→“数据分析”→“描述统 计” 求解正态总体均值 的置信区间。
20
课堂练习2:
某车床加工的缸套外径尺寸 X~N( μ, σ 2 ), 下面是随机测得的10个加工后的缸套外径尺寸(mm), 90.01,90.01,90.02,90.03,89.99 89.98,89.97,90.00,90.01,89.99 ( , ) 2 2 S 0.01853 求 x 90.001 μ 的置信度为95%的置信区间;
其中总体标准差或样本标准差也是未知的,通 常可以先通过小规模抽样作出估计。 由于使用的是近似公式,可知实际采用的最低 样本容量应比计算结果稍大。
从而 2 的置信度为1- 的置信区间为:
( n 1) S ( n 1) S 2 ( n 1) , 2 ( n 1) 1 / 2 /2
2 2
f (x)
/2
0 2
1-
/2
1 / 2 ( n 1) 2 / 2 (n 1) x
10
二. 总体均值μ的区间估计
1. 标准正态分布的右侧 分位点 Z Z 是标准正态分布中满足下式的右侧分位点: P{ Z > Z } =
f (x)
1-
z
x
0
如图所示, ( Z )=1- ,因此, 可由正态分布表 得到 Z 。 如:要查 Z0.025, 由正态分布表可查得:
X
2 i 1
n
2 i
为服从自由度为 n 的 2 分布,记为
2 ~ 2(n)
3
“自由度”的含义
若对于随机变量 X1, X2, · , Xn, 存在一组不全为 · ·
零的常数 c1, c2, · , cn, 使 · ·
c1 X1+ c2 X2 + · + cn Xn = 0 · ·
X 可以证明: t ~ t(n-1) S/ n
因此,对给定的置信度 1-,有
X P{t / 2 (n 1) t / 2 (n 1)} 1 S/ n
即 P{ X t / 2 (n 1) S / n X t / 2 (n 1) S / n} 1
第6章 置信区间估计
本章教学目标:
(1) 单个正态总体均值和方差的区间估计。 (2) 总体比例的区间估计。 (3) 均值和比例置信区间估计中的样本容量确定。 (4) 两个正态总体的均值差和方差比的区间估计。 (5) 单侧置信区间估计。
1
区间估计
由于点估计存在误差,因此仅对总体参数作出点 估计是不够的,还需要了解估计的精度及其误差。 参数的区间估计就是在给定的可信度下,估计未 知参数的可能取值范围。 设 为总体分布的未知参数,若由样本确定的两 ˆ ˆ 个统计量 θ1 和 θ2 , 对给定的概率 (0<<1),满足 ˆ ˆ P{ } 1
可用 Excel 的统计函数 CHIINV 返回 (n) 语法规则如下:
2
格式:CHIINV ( , n )
2 (n) 的值。 功能:返回
7
2. 总体方差 2 的区间估计
设总体 X~N( μ, σ2 ), X1, X2, · , Xn 为 X 的容量为n的样本, · ·
X 和 S2 分别为样本均值和样本方差。 可以证明,
d Z / 2 p(1 p) / n
1.96 0.0167 (1 0.0167 ) / 300 1.45%
该厂产品次品率的置信度为95%的置信区间为
( p d , p d ) (0.22%, 3.12% )
22
案例思考题
国外民意调查机构在进行民意调查时,通常要求 在95%的置信度下将调查的允许误差(即置信区间的 d 值)控制在3%以内。 ⑴问为满足该调查精度要求,至少需要多大的样 本? ⑵如果要求置信度达到99%,调查误差仍为3%, 此时至少需要多大的样本?
则称变量 X1, X2, · , Xn 线性相关,或称它们间存在 · · 一个线性约束条件; X1, X2, · , Xn 间存在 k 个独立 若 · · 的线性约束条件, 则它们中仅有 n-k 个独立的变量, 并称平方和 n
i 1
X i2
的自由度为 n-k。
4
2 分布密度函数的图形
f (x)
19
【例3】求例1中元件平均寿命 的95%置信区间。
S=196.5, =1-0.95=0.05, 解:由例1, x =1423.1,
/2=0.025, n=10, 查表得 t0.025(9)=2.2622
d t / 2 (n 1) S / n 2.2622 196 .5 / 10 140 .6
pP 近似服从 N (0, 1) P(1 P) / n
对给定的置信度1-,由 pP P{ Z / 2 Z / 2 } 1 P(1 P) / n 用样本比例代替总体比例, 可得总体成数 P 的置信度 为 1- 的置信区间为
( p d , p d ) , d Z / 2 p(1 p) / n
24
案例思考题解答(2)
如果要求置信度达到99%,则Z/2=Z0.005=2.575,
2.575 2 0.5 0.5 (人) 1841 .8 1842 n 2 0.03
25
§6.3 样本容量确定
前面的分析都是在给定的样本容量和样本数据下 求置信区间。但在实际应用中,应当在随机抽样前 就确定所需抽取的样本容量。 抽取的样本容量过大,虽然可以提高统计推断的 精度,但将增加不必要的人力、物力、费用和时间 开支; 如果抽取的样本容量过小,则又会使统计推断的 误差过大,推断结果就达不到必要的精度要求。 确定样本容量的原则 ——在满足所需的置信度和允许误差条件(置信区 间的 d 值)下,确定所需的最低样本容量。
15
t 分布的右侧 分位点 t(n)
t(n)为 t 分布中满足下式的右侧 分位点:
P{ t > t ( n ) }=
由给定的概率 ,可查表得到 t(n)。
由 t 分布的对称性,可得:t1-(n)=-t(n)。
f (x)
t1-(n) = - t(n) 0
x
t(n)
8
【例2】求例1中元件寿命方差 2 的 95% 置信区间。
解:由例1,S2 =196.52,n =10,/2=0.025, 2 2 0.975 (9) 2.7 1-/2=0.975, 0.025 (9) 19.023, (n-1)S2/ (n-1)S2/
2 0.025 2 0.975
(1.96) = 0.975 = 1-0.025, 故 Z0.025 =1.96
11
ຫໍສະໝຸດ Baidu 2.σ
2 已知时总体均值μ的区间估计
由正态分布的性质可得 X Z ~N(0,1) / n
对给定的置信度1-, 有 -z/2 0 z/2 x X P{ Z / 2 Z / 2 } 1 / n 由此可得 P{x Z / 2 / n x Z / 2 / n } 1 从而的置信度为 1- 的置信区间为
/2
f (x) 1-
/2
( x Z / 2 / n , x Z / 2 / n )
为便于记忆和理解,将 的置信区间表示为如下形式:
( x d , x d ) , d Z / 2 / n
其中 d 称为估计的允许误差。
12
用 Excel 求 Zα
可用 Excel 的统计函数 NORMSINV 返回 Z 。 语法规则如下: 格式:NORMSINV(1-) 功能: 返回 Z 的值。 说明: NORMSINV() 返回的是 Z1- 的值。