第四章 参数的区间估计(Confidence Interval Estimation)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


应用t分布 置信区间

X t / 2, n 1
S S X t / 2, n 1 n n
Chap 4-18
t 分布
标准正态
钟形 对称 平滑 肥尾(Tails)
t (df = 13)
t (df = 5)
0
Z t
Chap 4-19
自由度(df )


计算出样本均值后, 可以自由变动的观测值 的数目 例如: 自由度
总体总值95% 的置信区间为1,000,559.15, 到 1,152,220.85
Chap 4-34
PHStat用于解决此类问题

PHStat | confidence intervals | estimate for the population total Excel spreadsheet for the voucher example
Chap 4-4
点估计
总体参数
均值
样本统计量
比例
方差 差值
p
X
PS
2
1 2
S
2
X1 X 2
Chap 4-5
区间估计

提供参数值的变化范围



建立在一个样本观测值的基础上 给出了总体未知参数接近程度的信息 以置信水平来描述,

永远不能达到100%
Chap 4-6
待估参数的置信区间

n
) 1
Chap 4-9
区间估计的要素

置信度

区间内包含未知总体参数的确定程度 与未知参数的接近程度 获得容量为 n 的样本所需付出的代价

精度


成本

Chap 4-10
置信度

以 100 1 %表示,如:90%,95%,99% 相对频率意义上的解释

从长期来看, 所构建的所有置信区间中,100 1 % 的置信区间都将含有未知参数,即未知参数落入区间的 概率;
2 2 2
2
219.2 220
近似为
Chap 4-16
PHStat估计均值时样本容量的确 定

PHStat | 样本容量 | 均值的确定 … Example in excel spreadsheet
Chap 4-17
的置信区间
( 未知)

前提条件

总体标准差未知 总体服从正态分布 若总体不服从正态分布,则应使用大样本
n
( z 2 ) (1 )
2
E2
其中: E z 2
(1 )
n
2. 3.
E的取值一般小于0.1 (=p) 未知时,可取最大值0.5
Chap 4-27
估计总体比例时样本容量的确定 (例题分析)
【例】根据以往 解 : 已 知 =90% , =0.05 , Z/2=1.96,E=5% 的生产统计,某 种产品的合格率 应抽取的样本容量为 ( z 2 ) 2 (1 ) 约为90%,现要 n 求边际误差为 E2 5% , 在 求 95% (1.96) 2 0.9 (1 0.9) 的置信区间时, 0.05 2 应抽取多少个产 138.3 139 品作为样本?
2 2
近似为
Chap 4-29
PHStat估计比例时样本容量的确 定


PHStat | sample size | determination for the proportion … Example in excel spreadsheet
Chap 4-30wenku.baidu.com
评价区间估计的两个标准: 估计的可靠度。置信度 1 反映了区间估 计的可信度。置信水平 1 =0.95,说明估计 区间(ˆ1,ˆ2 )以95%的概率包含总体的参数θ 。或者说,100个这样的估计区间中,平均有 95个包含了总体参数θ; 估计的精确度。区间的长度 ˆ2 ˆ1 反映了 区间估计的精确度。当区间的长度愈大,估 计区间包含真值θ的可能性也就愈大,但是估 计也愈不精确。 可靠度和精确度是相互矛盾的。
Chap 4-2
本章概要

(continued)
置信区间的应用

总体总值的置信区间 总体总值之差的置信区间

有限总体样本容量的确定 置信区间的估计和职业道德上的考虑
Chap 4-3
估计的步骤
总体
均值 未知
随机样本
均值 X = 50
我有 95% 的把 握认为 在40 &和60之间.
样本

Chap 4-35
总体差值(Difference) 的置信区间

点估计

ND
其中 D
D
i 1
n
i
为样本的平均差值

区间估计

n
ND N t / 2,n 1
n
SD n
i
N n N 1
2

其中
SD
D D
i 1
n 1
Chap 4-36
对某公司的审计,要求以95%的置信度估计销售单据的 实际数额与整个销售和库存信息系统显示的数额之间的 差额(单据总数为5000张)。 随机抽取100个销售单据的样本,审计发现其中有12个 数据不符,其余的单据无差异,这12个单据的差异(单位美 元)如下:9.03 7.47 17.32 8.30 5.21 10.8 6.22 5.63 4.97 7.43 2.99 4.63 0 0 …… 0 n D Di n 90 / 100 0.90
Chap 4-23
比例的区间估计

前提条件:




两种分类的结果(Two categorical outcomes) 总体服从二项分布 若 np 5 并且 n 1 p 5 ,可以近似 看成正态分布 置信区间估计:
pS Z / 2
pS 1 pS pS 1 pS p pS Z / 2 n n
Chap 4-33
解答
N 1000 n 50 S n X $1076.39 S $273.62 NX N t / 2, n 1
N n N 1
273.62 1000 50 1000 1076.39 1000 2.0096 1000 1 100 1, 076,390 75,830.85
已知: =0.15mm, n=9, x =21.4mm 选取 (1- )=0.95; 查表得到: z / 2 =1.96 置信区间 0.15 0.15 ( 21.4 1.96 , 21.4 1.96 ) 9 9 ( 21.302, 21.498)
X Z / 2

n
X Z / 2

n
Chap 4-14
样本容量(成本)的确定
太大:
• 耗费的人 力、物力、 财力太多 太小:
• 估计的效 果不佳
Chap 4-15
估计均值时样本容量的确定
一项调查置信度要求90% ,误差要求不超过± 5, 已知标准差为 45,求所需抽取的样本容量.
1.645 45 Z n 2 2 Error 5
令n=3 df = n - 1 = 2 = .10 /2 =.05
/ 2 = .05
1 1.000 3.078 6.314
2 0.817 1.886 2.920
3 0.765 1.638 2.353
t值
0 2.920
t
Chap 4-21
Example
A random sample of n 25 has X 50 and S 8. Set up a 95% confidence interval estimate for
i 1
置信 区间
均值 比例
已知
未知
Chap 4-7
的置信区间( 已知)

前提条件:



总体标准差已知 总体服从正态分布 若总体不服从正态分布,则应使用大样本

置信区间的估计
X Z / 2

n
X Z / 2

n
Chap 4-8
2 ,有 由前面的讨论已知 X ~ N ( , )
n X Z ~ N (0,1) n
由此,根据给定的置信度 1 ,可以确定 u 2 ,使在区间(u 2, 2 )上取值的概率等于1 u
X 即 P(u 2 u 2 ) 1 n
经过整理,可得
P( X u 2

n
X u 2
S S X t / 2,n1 X t / 2,n1 n n 8 8 50 2.0639 50 2.0639 25 25 46.69 53.30
Chap 4-22
PHStat用于 的置信区间的估计 ( 未知)


PHStat | confidence interval | estimate for the mean, sigma unknown Example in excel spreadsheet

是参数不落入区间的概率
Chap 4-11
区间和置信度
抽样分布的均值
Z / 2 X
区间范围从
/2
X
/2
_
1
Z / 2 X
X Z X

X
X
区间有 100 1 % 的可能性含有 ; 的可能性不含 有 。
Chap 4-12
X Z X
置信区间
100 %
影响区间长度(精度)的因素
数据的变异性 (方差或标准差)

区间范围从
X - Z
x
到 X+Z
x
样本容量大小

X

n

置信度

100 1 %
© 1984-1994 T/Maker Co.
Chap 4-13
例: 某零件长度服从正态分布。从一批零件中随机抽取9 件。测得它们的平均长度为21.4mm。已知总体标准差为 0.15mm。求这批零件平均长度的95%水平的置信区间。
Chap 4-31
总体总值的区间估计

点估计

NX

区间估计

NX N t / 2,n1
S n
N n N 1
Chap 4-32
总体总值的置信区间: Example
想要计算1000张购货券的 总值。随机抽取50张,其 均值为 $1076.39,标准差 为$273.62. 试构建这 1000张购货券总值的95% 的置信区间。
应抽取139个产品作为样本
Chap 4-28
估计比例时样本容量的确定
在总数为 1,000的产品中, 随机抽取 100件,其 中 30件为不合格品 .要求置信度为90%,误差 不超过 ± 5% ,则所需样本容量是多少?
Z p 1 p 1.645 0.3 0.7 n 2 2 Error 0.05 227.3 228
Chap 4-24
Example
在选民中随机抽取容量为400的样本,有32人把选 票投给了候选人 A. 试构建 p 的95%的置信区间.
ps Z /
ps 1 ps ps 1 ps p ps Z / n n
.08 1 .08 .08 1 .08 .08 1.96 p .08 1.96 400 400 .053 p .107
Chap 4-25
PHStat用于总体比例的区间估计


PHStat | confidence interval | estimate for the proportion … Example in excel spreadsheet
Chap 4-26
估计总体比例时样本容量的确定
1. 根据比例区间估计公式可得样本容量n为

3个数字求均值, 自由度为 2
X1 1 (or any number) X 2 2 (or any number) X 3 3 (cannot vary)
= n -1 = 3 -1 =2
Chap 4-20
t 分布表
上尾面积(Upper Tail Area) df .25 .10
.05
第四章 参数的区间估计 (Confidence Interval Estimation)
阅读教材:第7章
Chap 4-1
本章概要



估计的步骤(Estimation process) 点估计(Point estimates) 区间估计(Interval estimates) 均值的置信区间( 已知) 样本容量的确定(Determining sample size) 均值的置信区间 ( 未知) 比例的置信区间
相关文档
最新文档