第3讲 参数估计与假设检验(上)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.078 6.314 12.706
31.821
2
……
1.061
…… …… 0.847 0.847
1.886 2.920 4.303
…… …… …… …… …… …… …… ……
6.965
…… …… 2.382 2.381
9.925
69
70
1.294 1.667 1.995 1.294 1.667 1.995
21
[ 例 ] 一位研究者想估计他所在的行业中经理 们每周加班的平均时间。他随机挑选18个经理构 得到的结果如下(以小时为单位): 6 21 17 20 7 0 8 16 29 3 8 12 11 9 21 25 15 16 该研究者选取90%的置信系数,估计该行业 的经理们每周加班的平均时间。
22
25
三、总体均值的区间估计
(二)两个总体均值之差的区间估计 略
26
三、总体比例P的区间估计
(一)单个总体比例的区间估计
1.总体比例区间估计的前提条件:
(1)由中心极限定理可知,对于大样本P的
抽样分布,可以近似看成为正态概率分布。
(2)当 pn
5和np 1 p 5
同时成立时,可以
计。
28
三、总体比例P的区间估计
由于单个样本比例是总体比例的无偏估
计量,所以,可以将公式(3.15)改写为:
p z p 1 p P p z p 1 p 2 2 n n
(3.16)
29
三、总体比例P的区间估计
例如,在前面先科计算机公司的例子中,经 过抽取30个员工组成一个简单随机样本,统计 计算得到男性员工所占比重的样本比例为0.7, 则在95%置信水平的情形下,该公司男性员工 的比例区间大约为:
12
三、总体均值的区间估计
在本次抽样中: n 30
x 56883 .33
1 0.95 z
2
1.96
3900
3000名员工年均收入区间估计为:
x z x z 2 2 n n 3900 3900 .33 1.96 56883 .33 1.96 56883 30 30 55487 .73 58278 .93
20
三、总体均值的区间估计
2.小样本总体标准差未知时总体均值的区间估计 此种情况下用公式(3.14)进行总体均值的区 间估计
s s x t x t 2 2 n n
(3.1 4) t :自由度为(n-1的t分布右侧面积为 2 t值。

2
时的
(1)总体标准差已知:
x z x z (3.12) 2 2 n n
9
三、总体均值的区间估计
例如,先科计算机公司共有员工3000人。人 力资源部门工作人员想通过从中随机抽取30名员 工了解一下他(她)们的平均收入和性别构成情 况,以推断全公司上述两个指标的数值。
13
三、总体均值的区间估计
【统计分析】计算结果表明,在已知总体标准 差为3900元,样本容量为30个人,置信水平为 95%的情况下,先科计算机公司3000名员工的 年均收入大约在55487.73~58278.93元之间。
14
三、总体均值的区间估计
(2)总体标准差未知:
s s x Z x Z / 2 2 n n
(一)点估计的含义 用样本统计量一个特定的值(一个点)作为相 应总体参数的估计值。
ˆ
(3.9)
5
二、点估计
(二)评价点估计优良标准 【思考与讨论】为什么要对点估计的优良性进 行评价?
1.无偏性
样本估计量抽样分布的数学期望等于被估计的 总体参数。
ˆ E

3.10
6
二、点估计
成一个样本,计算在给定的星期他们的加班时间,
分析:假定总体是正态分布的。 n 18,df 17,
90%置信系数对应的每一侧的面积 2 0.05,对 应的t值为: t 0.0517 1.740
x 6 21 16 x 13.56小时 n 18
s
用正态概率分布作为样本比例的抽样分布。
27
三、总体比例P的区间估计
P 1 P P 1 P p z P p z 2 2 n n
(3.1 5)
由于公式(3.15)中的总体比例P是未知的,
所以在进行总体区间估计前,还需要对P作出估
3.4
3
一、几个常用公式
(二)关于样本 1.样本均值
x
x
n
(3.5)
2
2.样本均值方差
3.样本比例 4.样本比例方差
p
s2
x x
n -1
3.6
n1 n ;q 0 1 p (3.7) n n
2 sp p 1 p 3.8
4
二、点估计
30
三、总体比例P的区间估计
p z 2 p1 p P p z 2 n p1 p n
0.71 0.7 0.71 0.7 [0.7 1.96 P 0.7 1.96 ] 30 30
(0.54 P 0.86)
18
三、总体均值的区间估计
s s x Z x Z 2 2 n n
9312 1.96 4007 70 9312 1.96 4007 70
8373 .30 10250 .70
19
三、总体均值的区间估计
【统计分析】该银行信用卡部的工作人员通过 对70名持卡人的随机调查,有95%的把握认为, 全市持该行信用卡人的平均余额大约在8373.3010250.70元之间。
10
三、总体均值的区间估计 通过抽样和有关计算得到以下两个相关 数据: 被抽中的30名员工的年平均收入为 56883.33元,年员工所占比重为0.70。
现假定根据历史资料得知:3000名员工
年均收入的标准差为3900元。
11
三、总体均值的区间估计
问:在置信水平为95%的情况下,全公司职工 年均收入大约是多少?
8137
3603
6525
4078 10544 9467 8279 5239 16804 …… …… …… …… …… ……
17
三、总体均值的区间估计
经过对样本数据进行计算,得到:
x 9312 s 4007
问:在置信水平为95%的情形下,该工作人员 可以认为该市所有持工商银行信用卡的人均债务 余额是多少?
第3讲
参数估计与假设检验
1
第一节 参数估计
2
一、几个常用公式
(一)关于总体
1.总体均值 2.总体均值方差 3.总体比例 4.总体比例方差

X
N
(3.1)

2
Leabharlann Baidu

2

X
N
3.2
P
N1 N ; Q 0 1 P (3.3) N N
2 P P 1 P
2.649 2.648
38
x x
n 1
2
6 13.562 21 13.562 16 13.562
17
7.8小时
23
x t
2
s n
7.8 18 13.56 3.20
13.56 1.740
10.36 16.76小时
24
【统计分析】该研究者通过对18个经理的抽样 调查,有90%的把握相信他所在的行业中经理们 每周加班的平均时间在10.36 ~ 16.76小时之间。 【思考】如果你与该研究者从事同一种行业, 并且担任某个部门的经理,当你得到这个信息会 有怎样的反应呢?
2.有效性 对于同一总体参数多个无偏估计量,用其中方
差最小的那个估计量去估计总体参数,我们称为
更有效。
ˆ ˆ D 1 D 2

3.11
7
二、点估计
3.一致性 随着样本容量的不断增加,点估计量的值越来 越趋近于被估计总体的参数。
8
三、总体均值的区间估计 (一)单个总体均值的区间估计 1.大样本情形下总体均值的区间估计
31
三、总体比例P的区间估计
(二)两个总体比例之差的区间估计 略
32
第二节 适度样本容量的确定
33
一、估计总体均值所需要的样本容量
x z 2 n
和n 在上述公式中, z 、 共同确定了边际误差。
2
34
一、估计总体均值所需要的样本容量
z 2 2 Z2 n
(3.13)
15
三、总体均值的区间估计
例如,工商银行某市分行信用卡部的工作人员 对该市持有工商银行信用卡人总体债务均值做了 一项研究。 该工作人员经过随机抽样,对70名持卡人的 信用卡余额进行调查得到如下数据:
16
三、总体均值的区间估计 9430 14661 11032 7535 12195 11448 7159 9071 9691
2 2
n
3.17
35
二、估计总体比例所需要的样本容量
z p 1 p 2
2
nP
Z 2
p 1 p n
2
3.18
36
附 1:
37
附2 : t分布简表
自由度
1
上侧面积
0.20 1.376 0.10 0.05 0.025 0.01 0.005 63.656
相关文档
最新文档