第5讲 参数估计老师
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
24
郑州市所有单位用户用水 量总量的95%置信区间
郑州市所有单位用户平均每户月用 水量的95%置信区间为: (43.4±2.00) (41.4 45.4) 95%置信区间为 (43.4±2.00)*4810 (208754±9620) (199134 218374)
25
区间估计的应用续
35
数据,见数据文件GulfProp
36
第五讲 小结
参数估计方法 区间估计
参数估计
样本容量的确定
点估计
总体比例的区间估计 样本比例±误差
总体均值的区间估计 样本均值±误差
样本比例的抽样分布 (正态分布) nP>5且n(1-P)>5
样本均值的抽样分布 (正态分布
P
P(1-P) n
正态分布再生定理
6
户
样本容量 用水单位 800 66
用水单位占样本容量的比重 8.3% 样本平均月用水量 样本用水量的标准差 3.26桶 2.94
统计量
反应样本分布特征的指标统称为样本统计 量,简称统计量。 2
x, s , s, p
7
总体参数 平均数 比率
样本统计量
X
N
x x
n x p n
N1 N
教材112,例题4-5, 例题4-6 例题4-7 例题4-8\9
26
总体比率的估计
教材119页 有一家大型报社,他的运营经理想要了解报纸 印刷出错的比率,比如过度的擦拭、错误的页 面设置、漏页、重页。他决定随机抽取200份 报纸作为样本来分析。200份中有35份出错。 运营经理希望以90%的置信度估计报纸印刷出 错的比率的置信区间。 求解标准差:0.0269、误差:0.0442、区间 (0.1308,0.2192)
给定置信系数 判断统计量的抽样分布,判断是查z分布表还是t分布表 得到置信区间的临界值 结论
44
用水单位数占所有 单位的比重 估计值=33.8%
平均月用水总量 估计值=43.4
用水户数估计值 8.3%×327314户 =27167户
用水单位数量的估计 14230×33.8% =4810
9
区间估计
总体比例的区间估计 总体平均数的区间估计
10
平均数上午区间估计:
家庭用户月平均使用量的区间估计 3.26桶±误差 单位用户月平均使用量的区间估计 43.4桶±误差 如何选择估计方法
x
n
E( X ) X
19
中心极限定理
总体为任意分布时,若从该总体中随机抽取
样本容量为n的样本,当n很大(n>30)时,则 样本平均数的抽样分布近似为正态分布,即:
20
区间估计公式的简单推导
X
如果有
那么有
n X p 2 2 0.9544 n p( X 2 X 2 ) 0.9544 n n
方差 2 ( X )
( X )
N
2
s
2
(x x) ( x)
n 1
2
8
郑州市大瓶装纯水市场容量的估计 (点估计) 市场容量估计
(点估计,297,319)
家庭用水总量 88,565
单位用水总量 208,754
用水家庭数占所有 家庭户数的比重 估计值=8.3%
平均月用水总量 估计值=3.26
23
郑州市所有家庭用户用水量总量 的95%置信区间
郑州市所有家庭用户平均月用水量的95%置信 区间为: (3.26±0.71)(2.55 3.97) 郑州市所有家庭用户用水总量的95%置信区间 为: (3.26±0.71)*27165 (88565±19289) (69276 107854)
第五讲 参数估计
1
参数估计案例
郑州市大瓶装纯水消费需求,消费行为, 消费意向估计
郑州市4个市区的总户数为327314户, 单位的总数为14230个。
2
参数估计案例 郑州市大瓶装纯水市场估计
1. 2. 3. 4. 5. 6. 7.
估计当前的市场容量 预测未来市场的潜力 计算各纯水品牌的知名度 估计各纯水品牌的覆盖率 估计各纯水品牌的市场占有率 估计各纯水品牌的满意度 中美纯水价格定位
3
估计当前的市场容量
郑州市大瓶纯水 市场容量
家庭用水总量
单位用水总量
用水家庭数
每家 月平均用水量 μ
用水单位数
每单位 月平均用水量 μ
用水家庭数 占总家庭 户数的比重 π
用水单位数 占总单位 数的比重 π
四个参数
4
本讲学习要点:参数估计方法 点估计 区间估计
5
调查数据
家庭用户 单位用 151 51 33.8% 43.4桶 7.29
的销售进行监督。某海滨城市开发了几处高级别墅 群。有的别墅可以直接看到海,把这类房屋则称之 为“看得见海湾的房屋”;其他则称之为“看不见 海湾的房屋”。该城市行业协会的样本数据,给出
了不同房地产公司最近售出的40套看得见海湾的房
屋和18套房屋看不见海湾的房屋数据,价格以千美 元计。
33
问题
1、对40套看得见海湾的房间,用适当的描述性统计 量对3个变量中的每个变量进行汇总。 2、对18套看不见海湾的房间,用适当的描述性统计 量对3个变量中的每个变量进行汇总。 3、比较你的汇总结果,讨论有助于房地产代理商了 解地产市场的各种统计结果。 4、对看得见海湾的房间,求售价的总体均值以及售 出中花费天数的总体均值的95%值信区并解释你 的结果。
27
样本容量的确定
•估计总体均值时
根据均值区间估计公式可得样本容量n为
28
举例
某消费者组织希望估计某大城市9月份 家庭电费均值.基于其它城市的研究情况, 标准差约为25元,小组希望以99%的置信 度在±10元内估计总体电费均值,问需要 多大的样本容量. 42户
29
估计总体比例时样本容量的确定 教材123页
39
数据
85092.00 94219.00 101769.0 69922.00 37831.00 32609.00 116803.0 95774.00 35662.00 89341.00 59465.00 92857.00 121352.0 74425.00 73341.00 77437.00 63436.00 69568.00 67202.00 85288.00 32534.00 65605.00 74276.00 118444.0 138114.0 64090.00 85861.00 66998.00 53500.00 53402.00 32464.00 64342.00 40001.00 79294.00 85586.00 59902.00 61978.00 72069.00 64544.00 82256.00 39323.00 67998.00 25066.00 86813.00 77539.00 89641.00 59817.00 77098.00 116269.0 88798.00
41
关键词
参数、统计量 点估计 点估计的优缺点 区间估计 置信区间 置信度(置信水平)、估计的把握性 估计精度
42
The end of chapter 5
2013-7-12
王玉荣制作
43
作业,自编例题或案例
研究背景 研究问题 数据的采集方法 估计方法 点估计值,描述其局限性 区间估计
中心极限定理
37
本讲学习要点
什么情况下需要应用参数估计方法分析数据 统计量和参数 重点掌握两个参数的估计方法
总体均值(μ) 总体比率(π)
以上两个参数的点估计量 以上两个参数的区间估计 以上两个参数的区间估计的步骤 确定样本容量 38
作业
都市研究公司
该公司是一家消费者研究组织,它设计调查对消 费者所使用的大量的产品和服务进行评估。在 某一项调研中,该公司调查消费者对A城市某 一主要制造商生产的汽车的性能的满意度感兴 趣。分发给制造商所生产的一种最大型号小汽 车用户的调查表表明,许多人抱怨该车的变速 箱过早出现问题。为了更好地了解变速箱的缺 陷问题,该公司采用由A城市一家变速箱维修 公司所提供的变速箱维修的样本数据
30
用EXCEL及SPSS进行区间估计
31
用EXCEL
1 大样本 总体标准差已知(经验数据)
教材114 例题4-6
2 小样本 总体标准差未知,用S替代
32
案例2
DEF有限责任公司是中国南部的一家房地产代理商。 企业在广告中称他们是真正的地产专家。公司通过
搜集有关地点、售价和每套售出花费天数,对房屋
想知道的指标为:参数:
,
实际可以得到的数据为统计量
X 51814 p 0.63(19/30 n 30 )
15
16
17
X 的概率分布
正态分布再生定理 中心极限定理
18
正态分布再生定理
当总体服从正态分布时,从中 抽取样本容量为n的样本,样 本均值一定服从正态分布。
样本均值的期望值 标准差
z
有95.44%的把握估计区间
包含总体均值
X 2
X源自文库
, X 2 X
21
当
时,
总体平均数的置信区间为
22
区间估计的几个关键概念
置信系数 1 使人相信区间包含总体均值 的概率,一般取 0.95,0.90,0.99.它的大小说明估 计的把握性的大小. 置信区间:在一定概率的保证下,包含总体均值 的区间,区间的宽窄说明估计精度的大小.区间 越宽,估计的精度就小;否则就大. 临界值:置信区间的上限和下限 注意置信系数和 区间宽窄的关系
11
如何得到误差
公式
s 样本平均数 z (n30) n
推导
12
样本均值的抽样分布 样本比率的抽样分布
13
样本平均数的概率分布的引出
14
EAI公司的抽样问题
EAI公司的人事主管正在制定一项公司25000名人员的 简报。其中包括中层管理人员的人均年薪和公司中已 完成管理培训项目的管理人员所占的比率。
34
问题续
5、对看不见海湾的房间,求售价的总体均值以 及售出中花费天数的总体均值的95%值信区 间并释你的结果 6、假定分公司的经理要求在40000美元的边际误 差下对看得见海湾的房间售价的均值进行估 计,在15000美元的边际误差下对看不见海湾 的房间售价的均值进行估计。取置信度为95 %,应选取多大的样本容量?
40
问题
用适当的描述统计方法分析变速箱数据 建立变速箱失效汽车总体的在变速箱失效之前 行使的平均里程的95%的置信区间。并给出这 个区间估计的管理解释。 根据一些经历过变速箱失效的车主们的意见来 讨论你的统计结果的含义? 如果该公司想在边际误差为5000英里,估计变 速箱失效汽车总体在变速箱失效时所行使的均 值里程的95%的置信区间,则应该抽取多少条 维修记录? 为了更充分地评价变速箱失效问题,你还需要 收集哪些信息?