[经管营销]计量经济学第七章

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【例】拥有工商管理学士学位的大学毕业生年薪的标准差 大约为2000元,假定想要估计年薪95%的置信区间,希 望极限误差为400元,应抽取多大的样本容量?
估计总体均值时样本容量的确定(例题分析)
解: 已知 =2000,Δ=400, 1-=95%, z/2=1.96
应抽取的样本容量为
n (z 2 )2 2 (1.96)2 20002
正态总体、方差已知,或非正态总体、大样本
z

x



N (0,1)
n
x z 2

n
总体均值的区间估计(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,为对产量
质量进行监测,企业质检部门经常要进行抽检,以分析
每袋重量是否符合要求。现从某天生产的一批食品中随 机抽取了25袋,测得每袋重量如下表所示。已知产品重 量的分布服从正态分布,且总体标准差为10g。试估计该 批产品平均重量的置信区间,置信水平为95%
第七章 参数估计
参数估计的一般问题 抽样估计的基本方法 样本容量的确定
抽样估计的过程
总体

样本统计量

例如:样本均
值、比例
参数估计的一般问题
参数估计:用样本统计量估计去估计参数
估计量:用来估计总体参数的统计量。 估计值:根据样本计算出来的估计量的数值。
参数估计的方法
点估计: 区间估计:
估计总体均值时样本容量的确定
1. 估计总体均值时样本容量n为
n 2z2
2
n

Nz 2 2 N2 z 2
2
2. 样本容量n与总体方差 2、极限误差Δ、可靠性系数 Z或t之间的关系为
与总体方差成正比 与极限误差成反比 与可靠性系数成正比
估计总体均值时样本容量的确定(例题分析)
已知:X~N(,102),n=25, 1- = 95%,z/2=1.96。根
据样本数据计算得:
总体均值在1-置信水平下的置信区间为
x z 2

n
105.36 1.96
10 25
105.36 3.92
101.44,109.28
该食品平均重量的置信区间为101.44g~109.28g
2
400 2
96.04 97
即应抽取97人作为样本
估计总体比例时样本容量的确定
1. 根据比例区间估计公式可得样本容量n为
n (z 2 )2 p(1 p) 2
Nz2 p1 p n N2 z 2 p1 p
2. P未知时,可取最大值0.5
估计总体比例时样本容量的确定(例题分析)
总体平均数的置信区间
P{55 xi 65} 16.67% 33.34% 16.67% 66.68% P{ xi X 5} 16.67% 33.34% 16.67% 66.68% P{5 xi X 5} 16.67% 33.34% 16.67% 66.68% P{xi 5 X xi 5} 16.67% 33.34% 16.67% 66.68%
总体均值 X = E( x) 设总体的标准差为
x 由中心极限定理得 服从正态分布
x~
2
N(X, )
n
(x X )
由中心极限定理
~ N (0,1)
/ n
x X
P(
z) 1
/ n
P( x X z / n) 1
x X z / n 得到极限误差
【例】根据以往的
生产统计,某种产品 的合格率约为90%, 现要求极限误差为 5%, 在 求 95%的 置 信区间时,应抽取多
少个产品作为样本?
解:已知=90%,=0.05,
z/2=1.96,Δ=5%
n (z 2 ) 2 P(1 P) 2
(1.96) 2 0.9 (1 0.9) 0.05 2
总体均值的区间估计(例题分析)
解: 已知:n=36, 1- = 90%,z/2=1.645。根据样本
数据计算得:
总体均值在1- 置信水平下的置信区间为
x z 2
s 39.5 1.645 7.77
n
36
39.5 2.13 37.37,41.63
投保人平均年龄的置信区间为37.37岁~41.63岁
总体均值的区间估计
正态总体、方差未知,小样本(如:7.3题)
t x t(n 1)
s n
x t 2
s n
总体比例的区间估计
当总体服从二项分布时,从总体中抽取容量为n的样本
,当n充分大时,样本的比例p服从正态分布,p 的数学
期望为
,方差为

2 p


(1
n
1. 在点估计的基础上,给出总体参数估计的一个区间范围,该 区间由样本统计量加减抽样极限误差而得到的
2. 根据样本统计量的抽样分布能够对样本统计量与总体参数的 接近程度给出一个概率度量
比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量 (点估计)
置信下限
置信上限
区间估计是按预先给定的概率(1)所确定的 包含未知总体参数的一个范围。该范围称为 参数的可信区间或置信区间(confidence interval, CI);
P{55 xi 65} 16.67% 33.34% 16.67% 66.68% P{55 X xi X 65 X} 16.67% 33.34% 16.67% 66.68% P{5 xi X 5} 16.67% 33.34% 16.67% 66.68% P{ xi X 5} 16.67% 33.34% 16.67% 66.68%
总体均值的区间估计(例题分析)
【例】一家保险公司收集到由36投保个人组成的随机样 本,得到每个投保人的年龄(周岁)数据如下表。试建 立投保人年龄90%的置信区间
36个投保人年龄的数据
23 35 39 27 36 44 36 42 46 43 31 33 42 53 45 54 47 24 34 28 39 36 44 40 39 49 38 34 48 50 34 39 45 48 45 32
Ex z / n
区间估计的图示
x z 2 x
x
- 2.58x

x
-1.65 x
+1.65x +2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
评价估计量的标准
无偏性 有效性 一致性
总体均值的区间估计
z/2=1.96
p z 2
p(1 p) n
65% 1.96 65%(1 65%) 100
65% 9.35%
55.65%,74.35%
该城市下岗职工中女性比例的置信 区间为55.65%~74.35%
样本容量的确定
估计总体均值时样本容量的确定 估计总体比例时样本容量的确定
)
z p ~ N (0,1)
(1 ) / n
总体比例的置信区间为:
p z 2
(1 )
n
~
p
z
2
p(1 p) n
例:某地对上年栽种一批树苗共5000株进行抽样调查, 随机抽200株苗中有170株成活,试以95.45%的概率 估计该批树苗成活率的置信区间和总成活数的置信 区间。
E(x)
2. 重复抽样
样本均值的抽样方差

2 x

2
n
样本均值的抽样标准差
x
2
n
统计量与总体参数接近程度的概率度量
不重复:样本平均数的抽样分布
样本平均数 xi
样本平均数个数(个) 概率(频率)(%)
45
55
60
65
75 合计
2
Baidu Nhomakorabea
2
4
2
2 12
16.67 16.67 33.34 16.67 16.67 100
25袋食品的重量
112.5 101.0 103.0 102.0 100.5
102.6 107.5 95.0 108.8 115.6
100.0 123.5 102.0 101.6 102.2
116.6
95.4
97.8 108.6 105.0
136.8 102.8 101.5 98.4 93.3
总体均值的区间估计(例题分析)
预先给定的概率(1)称为置信水平。
可信区间通常由两个数值即可信限/置信限 (confidence limit, CL)构成。其中较小的值 称可信下限(lower limit, L),较大的值称可 信上限(upper limit, U),一般表示为LU。
样本均值的抽样分布
1. 样本均值的数学期望(无偏性)
138.3 139
应抽取139个产品作为样本
例题
某厂有一条彩电生产线,为调查这条彩电生产线 的一级品率,问应抽取多少彩电才能以95.45%的置 信度保证估计误差不超过2%
某彩色电视机制造商准备开发某发展中国家的市 场,为此事先估计该国的家庭拥有彩电的比例。问应 抽取多少家庭才能以95%的置信度保证估计误差不超 过5%?
我们只能是希望这个区间是大量包含总体参数真值的 区间中的一个,但它也可能是少数几个不包含参数真 值的区间中的一个
置信水平
(confidence level)
1. 将构造置信区间的步骤重复很多次,置信 区间包含总体参数真值的次数所占的比例 称为置信水平
2. 表示为 (1 - 为是总体参数未在区间内的比例
3. 常用的置信水平值有 99%, 95%, 90%
相应的为0.01,0.05,0.10
抽样极限误差 E
抽样极限误差:在一定概率条件下,样本统计量和总体 参数之间误差的可能范围。
P ˆ E 1
如:样本均值的抽样极限误差
P{ x X E} 1
根据中心极限定理:
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称为 置信区间
2. 统计学家在某种程度上确信这个区间会包含真正 的总体参数,所以给它取名为置信区间
3. 用一个具体的样本所构造的区间是一个特定的区 间,我们无法知道这个样本所产生的区间是否包 含总体参数的真值
N 5000, n 200, n1 170 p n1 170 85%
n 200
2 p(1 p) 0.85 0.15 0.1275
p 0.1275 0.357
Ep z

n
2 0.357 5% 200
p E 85% 5% p
总成活数Np N ( p E p )
总体比例的区间估计(例题分析)
【例】某城市想 要估计下岗职工 中女性所占的比 例,随机地抽取 了 100 名 下 岗 职 工,其中65人为 女性职工。试以 95% 的 置 信 水 平 估计该城市下岗 职工中女性比例 的置信区间
解:已知 n=100,p=65% , 1- = 95%,
点估计 (point estimate)
1、用样本的估计量直接作为总体参数的估计值
例如:用样本均值直接作为总体均值的估计 例如:用样本的方差直接作为总体方差的估计
2、没有给出估计值接近总体参数程度的信息
点估计
可以估计的总体参数
平均
μ
比例
π
样本值 (点估计)
x
p
区间估计 (interval estimate)
相关文档
最新文档