研究生《应用统计方法》试卷

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

管理工程学院2015级硕士研究生《应用统计方法》试卷

姓名:学号:专业:

一、简答题(15分)

1、(5分)P-value给出的是原假设为真的机会吗?P-value的影响因素有哪些?

2、(5分)相关性分析与回归分析有何异同,请举例说明。

3、(5分)多元线性回归分析中,为什么不能单凭2R的大小去推断模型的优劣?

二、分析题(35分)

1、(15分)据英国《每日电讯报》2015年12月8日报道,一般认为,高颜值男性在职场颇具竞争力;然而研究发现,实际上此类男性易被他人视为威胁,升职难度较大。实验由870名志愿者(不一定是HR经理)扮演经理人角色来招募新人。虽然只能招一人,但研究人员提供了多份背景、能力类似的简历,每个应聘者的颜值在个人证件照上均有较客观地体现,且存在差距。模拟实验后得到上述结论。

(1)从统计学的角度看,上述研究可以归结为哪一类型的问题?

(2)仅从上述文字判断,该项研究是否有值得改进之处?

(3)如何有男性以此研究结论为借口,声明是由于自己颜值高而影响提职(事实并不一定如此),如何从统计学的角度给出令他信服的解释?

2、(10分)一个900学生的大班分成30人一组,由助教率领上课。大考后全班的平均成绩为62分,标准差为20分。然而有一组学生的平均分数为57分,助教争辩说:如果你随机地从大班中挑选30个学生,有很好的机会他们大考的平均分数低于57分。这就是我所遇到的情况——随机变异。

(1)这种争辩令人信服吗?给出统计学的解释和判断。

(2)如果另一组学生的平均成绩为59分,又该如何解释这一现象?

3、(10分)内行星(水星、金星)指那些比地球更靠近太阳的行星,外行星指离得更远一些的。这些行星的质量如下,取地球的质量为1。

水星金星火星木星土星天王星海王星冥王星

0.05 0.81 0.11 318 95 15 17 0.8

内行星的质量平均为0.43,而外行星的质量平均为74。请问这个差是统计显著的吗?或者这个问题有没有统计学意义,为什么?

三、计算题(50分):

1、(10分)B公司和C公司产品的加速腐蚀实验数据如下表:

Runs B C Runs B C Runs B C Runs B C Runs B C

1 3.64 3.97 11 3.77 3.86 21 3.65 4 31 3.9

2 3.96 41 3.68 3.82 51 3.68 4.15

2 3.61 3.89 12 3.82 3.78 22 3.94 3.97 32 3.68 3.86 42 3.72 3.78 52 3.78 4.08

3 3.6

4 3.7

5 13 3.69 3.9 23 3.8

6 3.78 33 3.76 3.68 43 3.82 4.02 53 3.82 4.06

4 3.88 4.02 14 3.73 3.8

5 24 3.73 3.7 34 3.92 3.94 44 3.75 3.

6 54 3.69 3.94

5 3.62 3.87 15 3.7 4.18 25 3.78 3.68 35 3.9 3.83 45 3.8 3.65 55 3.79 3.95

6 3.94 3.69 16 3.83 4.03 26 3.74 3.9 36 3.83 4.06 46 3.72 3.74 56 3.98 3.67

7 3.73 3.96 17 3.75 3.87 27 3.8 3.88 37 3.8 3.92 47 3.76 3.96 57 3.75 4.1

8 3.82 3.73 18 3.68 4.15 28 3.73 3.99 38 3.79 3.89 48 3.9 4.03 58 3.79 4.08

9 3.76 4.04 19 3.74 3.89 29 3.84 3.84 39 3.87 3.8 49 3.88 3.98 59 3.72 3.9

10 3.81 3.98 20 3.86 3.78 30 3.86 3.98 40 3.78 3.76 50 3.8 3.89 60 3.83 3.88

(1)给出上述两公司的数据的描述性统计量(至少包括表示位置的、表示离散程度的、表示分布形状各两种),绘制出直方图、Boxplot、区间图,并简要说明。

(2)分析两公司的加速腐蚀实验数据的均值和方差是否相等。

(3)若要求加速腐蚀实验数据越小越好,你准备采购哪家公司的产品?

2、(15分)研究化学过程的产率。两个最重要的变量有可能是压强与温度,每一因素选取三个水平,进行有两次重复的实验,产率数据如下:

压强

温度

200 215 230

90.4 90.7 90.2

90.2 90.6 90.4

90.1 90.5 89.9

90.3 90.6 90.1

90.5 90.8 90.4

90.7 90.9 90.1

(1)分析这些数据并做出结论。(产率当然越高越好)

(2)论述模型的适合性。

(3)画出主效应及交互作用图。

(4)在什么条件下运行这一过程?

3、(10分)某地区对某种消费品的销售量(y)进行调查,它与以下四个量有关:居民可支配的收入(x1)、该类消费品的平均价格指数(x2)、社会上该消费品的保有量(x3)、其他消费品的平均价格指数(x4)。数据见下表:

No. y x1x2x3x4

1 8.4 82.9 92.0 17.1 94.0

2 9.6 88.0 93.0 21.

3 96.0

3 10.

4 99.9 96.0 25.1 97.0

4 11.4 105.3 94.0 29.0 97.0

5 12.2 117.7 100.0 34.0 100.0

6 14.2 131. 101.0 40.0 101.0

7 15.8 148.2 105.0 44.0 104.0

8 17.9 161.8 112.0 49.0 109.0

9 19.6 174.2 112.0 51.0 111.0

10 20.8 184.7 112.0 53.0 111.0

(1)建立销售量与四个变量之间的标准化线性回归关系式。

(2)对回归方程及各回归系数进行显著性检验。

(3)剔除回归方程中的不显著项,重新建立回归方程并进行显著性检验。

相关文档
最新文档