人民大学统计学在职题库统计综述答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1中国人民大学接受同等学历人员申请硕士学位考试试题
招生专业:统计学
考试科目:统计思想综述
课程代码:123201 考题卷号:1
包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。
L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更
新是t期的季节调整因子,是用于预测的模型。
使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。
使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。
(2)引入季节哑变量的多元回归
对于以季度记录的数据,引入3个哑变量
,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为:
其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测
第1步,确定并分离季节成分。计算季节指数,然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。
第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。
第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。
2中国人民大学接受同等学历人员申请硕士学位考试试题
招生专业:统计学
考试科目:统计思想综述
课程代码:123201 考题卷号:2
组间210 0.245946 组内3836 ——
总计2
———
(1)完成上面的方差分析表。
(2)组装方法与组装产品数量之间的关系强度如何?
(3)若显著性水平05
.0
=
α,检验三种方法组装的产品数量之间是否有显著差异?
(1)
差异
源SS df MS F P-value
组间2*210=420 I-1=2 210 0.24594
6
组内3836 30-3=2
7
=142.0
7
——
总计420+3836
=4256
29 ———
(2)
从P值来看,组装方法与组装产品数量之间的关系强度较弱。
(3)
原假设:三种方法每小时组装的产品数量没有差异
若显著性水平为0.05,则P>0.05,因此不能拒绝原假设,即不能证明三种方法组装的产品数量之间有显著差异。
五、(20分)简要说明分解预测的基本步骤。
第1步,确定并分离季节成分。计算季节指数,然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。
3中国人民大学接受同等学历人员申请硕士学位考试试题
招生专业:统计学
考试科目:统计思想综述
课程代码:123201 考题卷号:3
一、(20分)在2008年8月10日举行的第29届北京奥运会女子
10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表:
要对各名运动员进行综合评价,使用的统计量有哪些?简要说明这些统计量的用途。
(1)集中趋势:指一组数据向某一中心值靠拢的程度,它可以反映选手射击成绩中心点的位置
平均数:一组数据相加后除以数据的个数得到的结果。若各组数据在组内是平均分布的,则计算的结果还是比较准确的,否则误差会比较大。(如中国选手发挥很稳定,适合使用平均数判断其成绩)中位数:一组数据排序后处于中间位置上的变量值,但不受极端值的影响。(如波兰选手大多数成绩比较平均,但有一枪打到8.1,会严重影响其平均值,但不会影响中位数)
(2)离散程度:各变量值远离其中心值的程度,它可以反映选手发挥的稳定性
标准差:方差的平方根,能够很好的反映出数据的离散程度,若选
显示没有充分理由拒绝原假设时,也难以确定第Ⅱ类错误发生的概率。因此,在假设检验中采用“不拒绝H0”而不采用“接受H0”的表述方法,这样在多数场合下便避免了第Ⅱ类错误发生的风险。
三、 (20分)为估计公共汽车从起点到终点平均行驶的时间,一
家公交公司随机抽取36班公共汽车,得到平均行驶的时间为26分钟,标准差为8分钟。
(1) 说明样本均值服从什么分布?依据是什么?
(2) 计算平均行驶时间95%的置信区间。
(3) 解释95%的置信水平的含义。
(645.105.0=z ,96.1025.0=z ,860.105.0=t ,306.2025.0=t )
(1)样本均值服从正态分布。通过中心极限定理:设从均值为,方差为(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值的抽样分布近似服从均值、方差的正态分布。一般统计学中的n 30为大样本,本题中抽取了36个样本,因此样本均值服从正态分布。
(2)已知n=36,=26,s=8,置信区间95%所以=
=1.96
平均行驶时间95%的置信区间为:
= 26 1.96 x = 26 2.61 即(23.39,28.61) (3)一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平。如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么用该方法构造的区间称为置信水平为