2008年统计学试题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2008年统计学试题答案
1.有报道称“香港经济发展迅速,但统计调查却显示香港低收入家庭的比例在逐步提高.”该报道认为,“低收入家庭是指收入水平低于中位数的家庭” 请运用统计学的知识简要分析该报道的说法.
答:用中位数来描述数据分布的集中趋势有优点亦有不足
①中位数表示一组数据排序后处于中间位置的变量值,是位置代表值,它不受极端值的影响,对偏态数据的代表性比较好
②但作为描述数据集中趋势的指标,中位数的应用远不及平均值的广泛.中位数只是一组数据中的一个值,无法表示数据中其他变量值的信息;而均值则包含了全部数据的信息,具有优良的数学性质
③用中位数作为判别低收入的指标,则低收入的家庭比例则一直都是50%(第3小点的解答是考试结束之后大家讨论的结果,我当时的第3小点答的是:用中位数作为判别低收入的指标,能去除收入过高以及收入过低所带来的极端影响,但无法体现整个香港家庭收入的信息,故使用中位数有利亦有弊)
2.消费者反映某工厂的产品不符合厂商承诺的重量标准(>=500g),投诉于质检部门.相关部门为了了解情况,对该工厂的产品进行假设检验.问:(1)请解释一下p值的含义;(2)若站在对厂商有利的立场,该如何设置原假设和备择假设,为什么;(3)若站在对消费者有利的立场上,又该如何设置呢?
答:(1)p值就是当原假设H
为真时,所得到的样本观察结果或更为极端结果出现的概率.若p
值很小,说明这种情况发生的概率很小,若出现了,根据小概率原理,我们就有理由拒绝H
.p值
越小,拒绝H
的理由就越充分
(2)站在对厂商有利的立场,H
0:重量标准>=500g,H
1
:重量标准<500g.因为H
是被保护的,
推翻H
0需要检验统计量落入拒绝域.根据小概率原理,在一次试验中拒绝H
不容易发生,所
以一次试验中,原假设H
是具有优势的
(3)若站在对消费者有利的立场,H
0:重量标准<500g , H
1
:重量标准>=500g
3.方差分析的基本思想,原题是问为什么叫做方差分析?方差分析为何名为方差但实际使用均值进行操作
答:①方差分析是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响
②方差分析假定:第一,每组观测值数据都是从具有相同方差的正态分布总体中抽取的;第二,各个总体的方差都相同;第三,观测值是独立的
③在上述假设成立的前提下,要分析自变量对因变量是否有影响,形式上就转化为检验自变量的各个水平总体的均值是否相等
4.多元回归分析中有哪些基本假定?这些假定有什么作用?如果违反他们会造成什么后果?
答:多元回归模型:y=β
0+ β
1
X
1
+ β
2
X
2
+ ... + β
p
X
p
+ ε
对模型的基本假定:
①解释变量X
1, X
2
, ... , X
p
是确定性变量,不是随机变量;自变量列向量之间不相关.若违
背此假定,会造成多元共线性
②样本容量个数n应大于解释变量个数p,即n>=p+1.用最小二乘法估计多元模型的未知参数时,必须n>=p+1,否则检验无任何意义
③(高斯-马尔科夫条件) E(ε)=0 ; 对所有的X值, ε的方差δ2都相同.违反G-M条件的后果有异方差性和自相关.异方差性,即ε的方差δ2随着观测数据而变化.使用OLS时,估计量不再
是有效的,即不再具有最小方差.自相关也会使估计量不再具有最小方差,并且使t检验和F 检验不再可靠
④ε服从正态分布,且相互独立. ε~N( 0 ,δ2) . 正态假定的目的是方便对参数作区间估计和假设检验
5.有一组时间序列,包含有趋势波动和季节波动,请写出该时间序列可能的模型(至少两个),并简要分析该模型
答:①乘法模型:Y
t = T
t
×S
t
×C
t
×I
t
其中T是趋势波动项,表示时间序列在长期内呈现出
来的某只持续向上或下降的变动;S是季节波动项,表示时间序列在一年内重复出现的周期波动;C是周期波动项,无固定规律,变动周期多在一年以上且周期长短不一,通常由经济环境的变化引起;I表示随机项.乘法模型表示假定四个因素的影响是相互的
②加法模型:Y
t = T
t
+ S
t
+ C
t
+ I
t
其中T,S,C,I各因素的代表意义同以上模型.加法模型
表示假定四个因素的影响是独立的
6.请说明贝叶斯判别分析的基本原理及其前提假设,并回答以下问题: (1)与聚类分析相比,贝叶斯判别分析在数据处理上有什么不同(2)贝叶斯判别与其他判别分析方法在判定准则和方法上的异同
答:贝叶斯判别的基本原理:用先验概率分布来描述对研究对象已有的一定认识,然后取得一个样本,用样本得到后验概率分布修正已有的认识,通过后验概率分布来进行各种统计推断贝叶斯判别的前提假设:①每个解释变量不能是其他解释变量的线性组合②由被解释变量定义的各组变量的协方差矩阵相等③每个解释变量对于所有其他变量的固定值具有正态分布④被解释变量是属性变量,而解释变量是度量变量
(1)聚类分析是把相似的研究对象归成类,使类间对象的同质性最大化并且使类与类之间对象的异质性最大化.聚类分析首先要定义类,然后利用数据之间的距离或离差平方和等指标逐步合并类.而贝叶斯判别分析则是利用先验分布信息构造后验分布来分析解决问题(答的很模糊,想听听大家的意见)
(2)判别分析包括距离判别,贝叶斯判别,Fisher判别和逐步判别等.
距离判别:若样品x到总体G
1的距离小于到总体G
2
的距离,则认为样品x属于总体G
1