人民大学统计学在职题库统计综述答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1中国人民大学接受同等学历人员申请硕士学位考试试题
招生专业:统计学
考试科目:统计思想综述
课程代码:123201 考题卷号:1
法等进行预测。
(1)Winter指数平滑模型
包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。
L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更
新是t期的季节调整因子,是用于预测的模型。
使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。
使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。
(2)引入季节哑变量的多元回归
对于以季度记录的数据,引入3个哑变量
,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为:
其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测
第1步,确定并分离季节成分。计算季节指数,然后将季节成分从
2中国人民大学接受同等学历人员申请硕士学位考试试题
招生专业:统计学
考试科目:统计思想综述
课程代码:123201 考题卷号:2
总计2
———
(1)完成上面的方差分析表。
(2)组装方法与组装产品数量之间的关系强度如何?
(3)若显著性水平05
.0
=
α,检验三种方法组装的产品数量之间是否有显著差异?
(1)
差异
源SS df MS F P-value 组间2*210=420 I-1=2 210
0.24594
6
组内3836
30-3=2
7 =142.0
7
——
总计
420+3836=
4256
29 ———
(2)
从P值来看,组装方法与组装产品数量之间的关系强度较
3中国人民大学接受同等学历人员申请硕士学位考试试题
招生专业:统计学
考试科目:统计思想综述
课程代码:123201 考题卷号:3
一、(20分)在2008年8月10日举行的第29届北京奥运会女子
10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表:
要对各名运动员进行综合评价,使用的统计量有哪些?简要说明这些统计量的用途。
(1)集中趋势:指一组数据向某一中心值靠拢的程度,它可以反映选手射击成绩中心点的位置
平均数:一组数据相加后除以数据的个数得到的结果。若各组数据在组内是平均分布的,则计算的结果还是比较准确的,否则误差会
时,犯第Ⅰ类错误的概率不超过给定的显著性水平α;当样本结果显示没有充分理由拒绝原假设时,也难以确定第Ⅱ类错误发生的概率。因此,在假设检验中采用“不拒绝H0”而不采用“接受H0”的表述方法,这样在多数场合下便避免了第Ⅱ类错误发生的风险。
三、 (20分)为估计公共汽车从起点到终点平均行驶的时间,一
家公交公司随机抽取36班公共汽车,得到平均行驶的时间为26分钟,标准差为8分钟。
(1) 说明样本均值服从什么分布?依据是什么?
(2) 计算平均行驶时间95%的置信区间。
(3) 解释95%的置信水平的含义。
(645.105.0=z ,96.1025.0=z ,860.105.0=t ,306.2025.0=t )
(1)样本均值服从正态分布。通过中心极限定理:设从均值为,方差为(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值的抽样分布近似服从均值、方差的正态分布。一般统计学中的n 30为大样本,本题中抽取了36个样本,因此样本均值服从正态分布。
(2)已知n=36,=26,s=8,置信区间95%所以=
=1.96 平均行驶时间95%的置信区间为:
= 26 1.96 x = 26 2.61 即(23.39,28.61)
(3)一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平。如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么用该方法构造的区间称为置信水平为95%的置信区间。
四、 (20分)设单因素方差分析的数学模型为:
ij i ij y εαμ++=。解释这一模型的含义,并说明对这一模型的基本假定。
单因素方差分析指的是只有一种处理因素在影响结果,或者说只有一个自变量在影响因变量的情况。
(1)设任何一次实验结果都可以表示成如下形式:Yi=μ+εi
其中Yi 是第i 次实验的实际结果,μ是该结果的最佳估计值,其实就是总体均值,εi 是均值和实际结果的偏差也就是随机误差(2)
4中国人民大学接受同等学历人员申请硕士学位考试试题
招生专业:统计学
考试科目:统计思想综述
课程代码:123201 考题卷号:4
估数据,由统计软件给出的部分回归结果如下(显著性水平为95%):
方差分析
df
SS
MS F
Sig.
回归 3 87803505.46 29267835.15 46.70 3.879E-08
残差 16 10028174.54 626760.91
总计 19 97831680
Coefficients
标准误差 t Stat P-value Intercept 148.7005 574.4213 0.2589 0.799 X Variable 1 0.8147 0.512 1.5913 0.1311 X Variable 2 0.821 0.2112 3.8876 0.0013 X Variable 3
0.135
0.0659
2.0503
0.0571
对所建立的回归模型进行综合评价。 (1)线性回归方程为
其中第 (1,2,3)i i =个回归系数ˆi
β的意义是,在其它自变量保持不变时,i x 每变动一个单位,y 就平均变动ˆi β个单位。例如在房产的评估价值和使用面积都不变的情况下,地产的评估价值每上升1万元,房地产销售价格就上升8147元。
(2)设α=0.05,由p 值=3.879*
<α知,回归方程的线性关
系是显著的。