统计学第三版答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章统计和统计数据
第2章1。
1 指出下面的变量类型.
(1) 年龄。
(2) 性别。
(3)汽车产量。
(4) 员工对企业某项改革措施的态度(赞成、中立、反对)。
(5) 购买商品时的支付方式(现金、信用卡、支票).
详细答案:
(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调
查,其中60%回答他们的月收入在5000元以上,50%的人回答他
们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?
(2)“月收入”是分类变量、顺序变量还是数值变量?
(3) “消费支付方式”是分类变量、顺序变量还是数值变量?
详细答案:
(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,
他们选择在网上购物的主要原因是“价格便宜"。
(1) 这一研究的总体是什么?
(2) “消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?
详细答案:
(1)总体是“所有的网上购物者"。
(2)分类变量.
1。
4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查.
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?
(2)样本量是多少?
详细答案:
(1)分层抽样。
(2)100。
第2章用图表展示数据
(3)帕累托图如下:
(4)饼图如下:
2。
2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:
710~720 13 13
720~730 10 10
730~740 3 3
740~750 3 3
合计100 100
(2)直方图如下:
从直方图可以看出,灯泡使用寿命的分布基本上是对称的. (3)茎叶图如下
茎叶
数
据
个
数
65 1 8 2
66 1 4 5 6 8 5
67 1 3 4 6 7 9 6
68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26
(2 )雷达图如下:
从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班.从雷达图的形状看,两个班考试成绩的分布没有相似之处.
2.4 下面是我国10个城市2006年各月份的气温数据:
月份北京沈阳上海南昌郑州武汉广州海口重庆昆明
1月—1.9 —12.7 5.7 6.6 0。
3 4。
2 15。
8 18.5 7。
8 10.8
2月-0.9 —8.1 5.6 6。
5 3。
9 5.8 17。
3 20。
5 9。
0 13.2
3月8。
0 0。
5 11。
1 12。
7 11。
5 12。
8 17。
9 21。
8 13.3 15。
9
4月13。
5 8。
0 16。
6 19.3 17。
1 19.0 23。
6 26。
7 19。
2 18。
0
5月20。
4 18。
3 20。
8 22。
7 21.8 23.9 25.3 28.3 22。
9 18.0
6月25.9 21.6 25。
6 26。
0 27。
8 28。
4 27。
8 29。
4 25。
4 20。
4
7月25。
9 24。
2 29.4 30.0 27。
1 30.2 29。
8 30。
0 31。
0 21.3
8月26。
4 24。
3 30。
2 30。
0 26。
1 29.7 29.4 28。
5 32。
4 20。
6
9月21.8 17.5 23.9 24。
3 21。
2 24。
0 27.0 27。
4 24。
8 18。
3
10
16。
1 11。
6 22。
1 22.1 19。
0 21.0 26.4 27。
1 20。
6 16。
9
月
11
6.7 0.8 15.7 15。
0 10。
8 14。
0 21.9 25。
3 14。
6 13。
2
月
12
-1。
0 -6.7 8。
2 8。
1 3。
0 6.8 16。
0 20.8 9。
4 9。
8
月
绘制各城市月气温的箱线图,并比较各城市气温分布的特点.
详细答案:
箱线图如下:
从箱线图可以看出,10个城市中气温变化最小的是昆明,最大的是沈阳。
从中位数来看,多数靠近上四分位数,说明多数城市的气温分布都有一定的左偏。
第3章用统计量描述数据
3。
1 随机抽取25个网络用户,得到他们的年
龄数据如下(单位:周岁):
计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析。
详细答案:
网民年龄的描述统计量如下:
最大值41
从集中度来看,网民平均年龄为24岁,中位数为23岁。
从离散度来看,标准差在为6。
65岁,极差达到26岁,说明离散程度较大。
从分布的形状上看,年龄呈现右偏,而且偏斜程度较大.
3。
2 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。
一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待.为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间
为7。
2分钟,标准差为1。
97分钟,第二种排队方式的等待时间(单位:分钟)如下:
5。
5 6。
6 6。
7 6.8 7。
1 7.3 7.4 7。
8 7。
8
(1)计算第二种排队时间的平均数和标准差.
(2)比两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
详细答案:
(1)(岁);(岁)。
(2);。
第一中排队方式的离散程度大.
(3)选方法二,因为平均等待时间短,且离散程度小.
3。
3 在某地区随机抽取120家企业,按利润额进行分组后结果如下:按利润额分组(万元) 企业数(个)
300以下19
300~400 30
400~500 42
500~600 18
600以上11
合计120
计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。
详细答案:
=426。
67(万元);(万元)。
3。
4 一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分.与平均分数相比,该位应试者哪一项测试更为理想?
详细答案:
通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想.
3。
5 一种产品需要人工组装,现有3种可供选择的组装方法。
为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装.下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:个):方法A方法B方法C
164 129 125
167 130 126
1。
你准备用哪些统计量来评价组装方法的优劣?
2。
如果让你选择一种方法,你会做出怎样的选择?试说明理由. 详细答案:
偏度0.35 偏度-0。
17 偏度-3。
24
极差8 极差7 极差12
离散系数0。
013 离散系数0。
014 离散系数0.022
最小值162 最小值125 最小值116
最大值170 最大值132 最大值128
(1)从集中度、离散度和分布的形状三个角度的统计量来评价。
从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A的离散系数最小,方法C最大;从分布的形状看,方法A和方法B的偏斜程度都不大,方法C则较大。
(2)综合来看,应该选择方法A,因为平均水平较高且离散程度较小.第4章概率分布
4。
1 消费者协会经过调查发现,某品牌空调器有重要缺陷的产品数出现的概率分布如下:
X012345678910
P 0。
041 0。
130 0。
209 0。
223 0。
178 0。
114 0。
061 0。
028 0.011 0.004 0.001
根据这些数值,分别计算:
(1)有2到5个(包括2个与5个在内)空调器出现重要缺陷的概率。
(2)只有不到2个空调器出现重要缺陷的概率.
(3)有超过5个空调器出现重要缺陷的概率。
详细答案:
(1)0。
724.(2)0。
171。
(3)0。
105。
4。
2 设是参数为和的二项随机变量。
求以下概率:(1);(2)。
详细答案:
(1)0.375。
(2)0。
6875。
4。
3 求标准正态分布的概率:
(1);(2);(3)。
详细答案:
(1)0。
3849。
(2)0。
1844.(3)0.0918。
4.4 由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据如下(单位:公升)
9。
19 10。
01 9。
60 9。
27 9。
78 8.82
9.63 8.82 10.50 8.83 9。
35 8。
65
10。
10 9。
43 10。
12 9。
39 9.54 8。
51
9。
70 10。
03 9.49 9。
48 9。
36 9。
14
10。
09 9。
85 9。
37 9.64 9.68 9。
75
绘制正态概率图,判断该种汽车的耗油量是否近似服从正态分布?
详细答案:
正态概率图如下:
由正态概率图可以看出,汽车耗油量基本服从正态分布.
4。
5 从均值为200、标准差为50的总体中,抽取的简单随机样本,用样本均值估计总体均值。
(1)的期望值是多少?
(2)的标准差是多少?
(3)的概率分布是什么?
详细答案:
(1)200。
(2)5。
(3)近似正态分布。
4.6 从的总体中,抽取一个容量为500的简单随机样本。
(1)的期望值是多少?
(2)的标准差是多少?
(3)的分布是什么?
详细答案:
(1)0。
4.(2)0.0219 。
(3)近似正态分布。
4。
7 假设一个总体共有8个数值,54,55,59,63,64,68,69,70。
从该总体中按重复抽样方式抽取的随机样本。
(1)计算出总体的均值和方差.
(2)一共有多少个可能的样本?
(3)抽出所有可能的样本,并计算出每个样本的均值。
(4)画出样本均值的正态概率图,判断样本均值是否服从正态分布?(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?
详细答案:
(1),。
(2)共有64个样本。
(3)所有样本的样本均值如下:
54。
5 56。
5 58.5 59。
0 61。
0 61.5 62。
0
54。
0
54。
5 55.0 57.0 59.0 59。
5 61.5 62.0 62。
5
56。
5 57。
0 59.0 61。
0 61.5 63.5 64。
0 64.5
58.5 59.0 61.0 63.0 63。
5 65。
5 66.0 66。
5
59.0 59。
5 61。
5 63。
5 64.0 66.0 66。
5 67。
0
61.0 61.5 63.5 65.5 66。
0 68。
0 68.0 69.0
61。
5 62。
0 64。
0 66.0 66。
5 68。
5 69。
0 69.5
62。
0 62。
5 64.5 66。
5 67.0 69。
0 69。
5 70。
0
(4)样本均值的正态概率图如下:
从正态概率图可以看出,样本均值近似服从正态分布.
(5),。
样本均值的平均数等于总体平均数,样本均值的标准差等于总体标准差的.
第5章参数估计
5。
1 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本.
(1)假定总体标准差为15元,求样本均值的标准误差。
(2)在95%的置信水平下,求估计误差.
(3)如果样本均值为120元,求总体均值的95%的置信区间。
详细答案:
(1)。
(2)E=4.2.
(3)(115。
8,124.2).
5。
2 利用下面的信息,构建总体均值的置信区间.
(1)总体服从正态分布,且已知,,,置信水
平为95%。
(2)总体不服从正态分布,且已知,,,置信水平为95%.
(3)总体不服从正态分布,未知,,,,置信水平为90%。
(4)总体不服从正态分布,未知,,,,置信水平为99%。
详细答案:
(1)(8647,9153)。
(2)(8734,9066)。
(3)(8761,9039).
(4)(8682,9118).
5。
3 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)如下:
3。
3 3.1 6.2 5。
8 2。
3 4.1 5。
4 4。
5 3。
2
4。
4 2.0 5.4 2。
6 6。
4 1。
8 3.5 5。
7 2.3
2.1 1。
9 1。
2 5.1 4。
3 4。
2 3。
6 0。
8 1。
5
4。
7 1。
4 1。
2 2.9 3.5 2.4 0.5 3。
6 2。
5
求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。
详细答案:
(1)(2。
88,3。
76);
(2)(2。
80,3。
84);
(3)(2。
63,4。
01).
(2)(1。
25,3。
33)。
(3)第一种排队方式更好。
5.6 两个正态总体的方差和未知但相等.从两个总体中分别抽取两个独立的随机样本,它们的均值和标准差如下:
来自总体1的样本来自总体2的样本
(1)求的95%的置信区间。
(2)求的99%的置信区间。
详细答案:
(1)(1。
86,17.74)。
(2)(0.19,19。
41)。
(3)(—3.34,22。
94)。
5.7 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下:
人员编号方法1方法2
1 78 71
2 6
3 44
3 72 61
4 89 84
5 91 74
6 49 51
7 68 55
8 76 60
9 85 77
10 55 39
构建两种方法平均自信心得分之差的95%的置信区间.
详细答案:
(6。
33,15。
67)。
5.8 从两个总体中各抽取一个的独立随机样本,来自总体1的样本比例为,来自总体2的样本比例为。
(1)构造的90%的置信区间.
(2)构造的95%的置信区间。
详细答案:
(1)(3。
02%,16.98%)。
(2)(1。
68%,18。
32%)。
5。
9 生产工序的方差是工序质量的一个重要度量。
当方差较大时,需要对工序进行改进以减小方差.下面是两部机器生产的袋茶重量(单位:克)的数据:
机器1机器2
3。
45 3。
22 3。
90 3.22 3。
28 3.35
3。
20 2。
98 3.70 3。
38 3。
19 3。
30
3。
22 3.75 3。
28 3.30 3.20 3。
05
3。
50 3。
38 3。
35 3。
30 3。
29 3.33
2。
95 3.45 3。
20 3。
34 3.35 3.27
3。
16 3。
48 3。
12 3。
28 3。
16 3。
28
3.20 3.18 3。
25 3。
30 3。
34 3。
25
构造两个总体方差比的95%的置信区间。
详细答案:
(4.06,24.35)。
5。
10 某超市想要估计每个顾客平均每次购物花费的金额。
根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过20元,应抽取多少个顾客作为样本?
详细答案:
139.
5.11 假定两个总体的标准差分别为:,,若要求估计误差不超过5,相应的置信水平为95%,假定,估计两个总体均值之差时所需的样本量为多大?
详细答案:
57.
5.12 假定,估计误差,相应的置信水平为95%,估计两个总体比例之差时所需的样本量为多大?
详细答案:
769。
第6章假设检验
6。
1 一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2。
5小时。
据报道,10年前每天每个家庭看电视的平均时间是6。
70小时.取显著性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?
详细答案:
,=3。
11,,拒绝,如今每个家庭每天收看电视的平均时间显著地增加了。
6。
2 为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。
已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克.在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):
81。
6 86。
6 80.0 85.8 78。
6 58。
3 68。
7 73。
2
96。
6 74。
9 83.0 66。
6 68.6 70。
9 71。
7 71。
6
77。
3 76。
1 92。
2 72.4 61.7 75。
6 85。
5 72。
5
74。
0 82。
5 87。
0 73。
2 88。
5 86。
9 94.9 83。
0
根据最近的测量数据,当显著性水平时,能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值?
详细答案:
,=—2.39,,拒绝,该城市空气中悬浮颗粒的平均值显著低于过去的平均值。
6.3 安装在一种联合收割机的金属板的平均重量为25公斤。
对某企业生产的20块金属板进行测量,得到的重量数据如下:
22。
6 26.6 23.1 23。
5
27。
0 25.3 28。
6 24。
5
26。
2 30。
4 27。
4 24。
9
25.8 23。
2 26.9 26。
1
22.2 28。
1 24。
2 23。
6
假设金属板的重量服从正态分布,在显著性水平下,检验该企业生产的金属板是否符合要求?
详细答案:
,,,不拒绝,没有证据表明该企业生产的金属板不符合要求。
6.4 在对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
在
显著性水平下,检验该生产商的说法是否属实?详细答案:
,,,拒绝,该生产商的说法属实。
6。
5 某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:
操作A操作B
=100 =50
=14。
8 =10.4
=0。
8 =0.6
对=0.02,检验平均装配时间之差是否等于5分钟.
详细答案:
,=—5。
145,,拒绝,两种装配操作的平均装配时间之差不等于5分钟。
6。
6 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。
样本中每个人都分别在看过该产品的新的电视广告之前与之后打分.潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。
原假设认为“看后”平均得分小于或等于“看前"平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分.对=0。
05的显著性水平,用下列数据检验该假设,并对该广告给予评价。
购买力得分购买力得分个体看后看前个体看后看前
1 6 5 5 3 5
2 6 4 6 9 8
3 7 7 7 7 5
4 4 3 8 6 6
详细答案:
设,。
,=
1.36,,不拒绝,广告提高了平均潜在购买力得分。
6。
7 某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采用方法2 对12名员工进行培训。
培训后的测试分数如下:
方法1 方法2
56 51 45 59 57 53
47 52 43 52 56 65
42 53 52 53 55 53
50 42 48 54 64 57
47 44 44
两种方法培训得分的总体方差未知且不相等。
在显著性水平下,检验两种方法的培训效果是否有显著差异?
详细答案:
,,,拒绝,两种方法的培训效果是有显著差异。
6。
8 为研究小企业经理们是否认为他们获得了成功,在随机抽取100个小企业的女性经理中,认为自己成功的人数为24人;而在对95个男性经理
的调查中,认为自己成功的人数为39人.在的显著性水平下,检验男女经理认为自己成功的人数比例是否有显著差异?
详细答案:
设,。
,,,拒绝,男女经理认为自己成功的人数比例有显著差异。
6。
9 为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。
研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:
旧肥料新肥料
109 101 97 98 100 105 109 110 118 109
98 98 94 99 104 113 111 111 99 112
103 88 108 102 106 106 117 99 107 119
97 105 102 104 101 110 111 103 110 119
取显著性水平,检验:
(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:
①两种肥料产量的方差未但相等,即。
②两种肥料产量的方差未且不相等,即.
(2)两种肥料产量的方差是否有显著差异?
详细答案:
(1)设,。
,,,拒绝,新肥料获得的平均产量显著地高于旧肥料。
(2),拒绝,新肥料获得的平均产量显著地高于旧肥料。
(3),。
,,两种肥料产量的方差有显著差异。
6。
10 生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。
某杂志上刊载了关于两部机器生产的袋茶重量的数据(单位:克)如下,检验这两部机器生产的袋茶重量的方差是否存在显著差异(a=0。
05).
机器1 2.95 3。
45 3.50 3。
75 3.48 3。
26 3.33 3.20 3。
16 3。
20 3.22 3.38 3。
90 3.36 3.25 3.28
3。
20 3。
22 2。
98 3。
45 3。
70 3.34 3。
18 3.35
3.12
机器2 3.22 3.30 3。
34 3。
28 3.29 3.25 3。
30 3.27 3。
38 3。
34 3.35 3。
19 3.35 3。
05 3.36 3。
28
3。
30 3。
28 3。
30 3。
20 3.16 3.33
详细答案:
,。
=8。
28,,拒绝,两部机器生产的袋茶重量的方差存在显著差异。
第7章方差分析与实验设计
教材习题答案
7。
1 一家牛奶公司有4台机器装填牛奶,每桶的容量为4升。
下面是从4台机器中抽取的装填量样本数据:
机器1机器2机器3机器4
4。
05 3。
99 3.97 4.00
4。
01 4。
02 3。
98 4。
02
4.02 4.01 3。
97 3。
99
4。
04 3。
99 3。
95 4。
01
4。
00 4.00
4。
00
取显著性水平,检验4台机器的装填量是否相同?
详细答案:
7.2 一家管理咨询公司为不同的客户进行人力资源管理讲座。
每次讲座的内容基本上一样的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是低级管理者。
该咨询公司认为,不同层次的管理者对讲座的满意度是不同的。
对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准是从1~10,10 代表非常满意):
高级管理者中级管理者低级管理者
7 8 5
7 9 6
8 8 5
7 10 7
9 9 4
10 8
8
取显著性水平,检验管理者的水平不同是否会导致评分的显著性差异?
详细答案:
7。
3 某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经实验得其寿命(单位:小时)数据如下:
实验号
电池生产企业
A B C
1 2 3 4 5 50
50
43
40
39
32
28
30
34
26
45
42
38
48
40
试分析3个企业生产的电池的平均寿命之间有无显著差异?()如果有差异,用LSD方法检验哪些企业之间有差异?
详细答案:
7。
4 某企业准备用3种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。
通过对每个工人生产的产品数进行方差分析得到下面的结果:
方差分析表
差异源SS df MS F P—value F crit 组间210 0。
245946 3。
354131
组内3836 ——-
总计29 —- —-
(1)完成上面的方差分析表。
(2)若显著性水平,检验3种方法组装的产品数量之间是否有显著差异?
详细答案:
7。
5 有5种不同品种的种子和4种不同的施肥方案,在20块同样面积的土地上,分别采用5种种子和4种施肥方案搭配进行实验,取得的收获量数据如下表:
品种
施肥方案
1234
1 2 3 4 5
12.0
13.7
14.3
14。
2
13。
0
9.5
11。
5
12。
3
14。
0
14.0
10。
4
12.4
11。
4
12。
5
13。
1
9。
7
9。
6
11.1
12.0
11。
4
检验种子的不同品种对收获量的影响是否显著?不同的施肥方案对收获量的影响是否显著?()
详细答案:
7。
6 城市道路交通管理部门为研究不同的路段和不同的时间段对行车时
间的影响,让一名交通警察分别在3个路段和高峰期与非高峰期亲自驾车进行实验,通过实验取得共获得30个行车时间(单位:分钟)的数据.试分析路段、时段以及路段和时段的交互作用对行车时间的影响。
()
路段
路段1 路段2 路段3
时段
高峰期
36.5 28。
1 32。
4
34.1 29。
9 33。
0
37.2 32。
2 36。
2
35。
6 31。
5 35。
5
38。
0 30.1 35.1 非高峰期
30.6 27。
6 31。
8
27。
9 24.3 28。
0
32。
4 22。
0 26。
7
31。
8 25.4 29.3
27.3 21。
7 25。
6
详细答案:
7。
7 为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项实验,考察三种广告方案和两种广告媒体,获得的销售量数据如下:
广告媒体
报纸电视
广告方案 A 8 12
12 8
22 26
B
14 30
10 18
C
18 14
检验广告方案、广告媒体或其交互作用对销售量的影响是否显著?
()
详细答案:
第8章一元线性回归
8.1 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:
企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元)
1 40 130 7 84 165
2 42 150 8 100 170
3 50 155 9 116 167
4 5
5 140 10 125 180
5 65 150 11 130 175
6 78 154 12 140 185
(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
(2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(),并说明二者之间的关系强度。
详细答案:
(1)散点图如下:
产量与生产费用之间为正的线性相关关系。
(2).检验统计量,,拒绝原假设,相关系数显著。
8。
2 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:
地区人均GDP(元)人均消费水平(元)
北京22460 7326
辽宁11226 4490
上海34547 11546
江西4851 2396
河南5444 2208
贵州2662 1608
陕西4549 2035
(1)绘制散点图,并计算相关系数,说明二者之间的关系。
(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
(3)计算判定系数和估计标准误差,并解释其意义。
(4)检验回归方程线性关系的显著性()
(5)如果某地区的人均GDP为5000元,预测其人均消费水平.
(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间.
详细答案:
(1)散点图如下:
二者之间为高度的正线性相关关系.,二者之间为高度的正线性相关关系。
(2)估计的回归方程为:。
回归系数表示人均GDP每变动1元,人均消费水平平均变动0。
3087元。
(3)判定系数。
表明在人均消费水平的变差中,有99。
63%是由人均GDP与消费水平之间的关系决定的。
估计标准误差,表示用人均GDP预测人均消费水平的平均误差为247。
3元。
(4)检验统计量,,拒绝原假设,线
性关系显著。
(5)元.
(6)置信区间:[1990.749,2565。
464];预测区间:[1580。
463,2975。
750].
8.3 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,所得数据如下:
航空公司编号航班正点率(%)投诉次数(次)
1 81。
8 21
2 76。
6 58
3 76。
6 85
4 75。
7 68
5 73.8 74
6 72。
2 93
7 71.2 72
8 70。
8 122
9 91。
4 18
10 68.5 125
(1)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义。
(2)检验回归系数的显著性()。
(3)如果航班正点率为80%,估计顾客的投诉次数。
详细答案:
(1)估计的回归方程为:。
回归系数表示航班正点率每变动1%,顾客投诉次数平均反向变动4。
7次.
(3)检验回归系数的P=0。
001108<,拒绝原假设,回归系数显著。
(4)次。
(5)置信区间:[37。
660,70.619];预测区间:[7。
572,100。
707].
8.4 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:
方差分析表
变差来源df SS MS F Significance F 回归2。
17E—09
残差40158.07 ——
总计11 1642866.67 —- —
参数估计表
Coefficients 标准误差t Stat P-value Intercept 363.6891 62。
45529 5.823191 0。
000168
X Variable 1 1。
420211 0。
071091 19.97749 2。
17E—09
(1)完成上面的方差分析表.
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?
(3)销售量与广告费用之间的相关系数是多少?
(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显著性(a=0。
05)。
详细答案:
(1)方差分析表中所缺的数值如下:
方差分析表
变差来源df SS MS F Significance F 回归11422708。
61422708。
6354.2772。
17E-09
残差1040158。
07 4015。
807——
总计11 1642866。
67 - ——
(2)。
表明汽车销售量的变差中有86.60%是由于广告费用的变动引起的。
(3)。
(4).回归系数表示广告费用每变动一个单位,销售量平均变动1。
420211个单位。
(5)Significance F=2。
17E—09
8.5 随机抽取7家超市,得到其广告费支出和销售额数据如下
超市广告费支出/万元销售额/万元
A 1 19
B 2 32
C 4 44
D 6 40
E 10 52
F 14 53
G 20 54
1.用广告费支出作自变量,销售额为因变量,求出估计的回归方程.
2.检验广告费支出与销售额之间的线性关系是否显著(a=0.05).
3.绘制关于的残差图,你觉得关于误差项的假定被满足了吗?
4.你是选用这个模型,还是另寻找一个该更好的模型?
详细答案:
(1)估计的回归方程为:.
(2)Significance F=0。
020582
(3)残差图如下:
(4)虽然线性关系通过了显著性检验,但从残差图来看,关于x与y之间存在线性关系的假设仍只得怀疑.因此可考虑选用非线性模型。
第9章多元线性回归
9.1 根据下面的数据用Excel进行回归,并对回归结果进行讨论,计算
、时y的预测值。
y x1x2
12 174 3
18 281 9
详细答案:
由Excel输出的回归结果如下:
Upper
Coefficients 标准误差t Stat P—value Lower 95%
95%Intercept 25。
0287 22。
27863 1。
12344 0。
298298 -27.6519 77。
70928 X Variable 1 —0。
04971 0.105992 —0.46904 0.653301 —0.30035 0。
200918 X Variable 2 1。
928169 1。
47216 1。
309755 0。
231624 —1.55294 5。
409276 得到的回证方程为:。
表示,在不变的条件下,每变化一个单位,y平均下降0。
04971个单位;表示,在不变的条件下,每变化一个单位,y平均增加1。
928169个单位。
判定系数,表示在因变量y的变差中能够被y与和之间的线性关系所解释的比例为21.09%。
由于这一比例很低,表明回归方程的拟合程度很差。
估计标准误差,预测误差也较大.
方差分析表显示,Significance F=0.436485〉a=0.05,表明y与和之间的线性关系不显著.用于回归系数检验的P值均大于a=0。
05,两个回归系数均不显著。
当=200、=7时,y的预测值为:
9。
2 根据下面Excel输出的回归结果,说明模型中涉及多少个自变量?多少个观察值?写出回归方程,并根据F、、及调整的的值对模型进行讨论.
SUMMARY OUTPUT
回归统计
Multiple R 0.842407
R Square 0。
709650
Adjusted R Square 0。
630463
标准误差109。
429596
观测值15
方差分析
df SS MS F Significance F
回归 3 321946.8018 107315。
6006 8.961759 0。
002724 残差11 131723。
1982 11974。
84
总计14 453670
Coefficients 标准误差t Stat P-value
Intercept 657。
0534 167。
459539 3。
923655 0。
002378
X Variable 1 5.710311 1。
791836 3.186849 0.008655
X Variable 2 —0.416917 0。
322193 —1.293998 0。
222174
X Variable 3 —3。
471481 1.442935 -2.405847 0.034870
详细答案:
模型中涉及2个自变量,15对观察值。
估计的回归方程为:.
从判定系数和调整的判定系数可以看出,回
归方程的拟合程度一般。
估计标准误差,预测误差比较大。
从方差分析表可知,Significance F=0.002724〈a=0。
05,表明因变量Y与3个自变量之间的线性关系显著。
从回归系数检验的各P值可知,自变量x2不显著,表明因变量y与3个自变量之间的线性关系显著。
从回归系数检验的各P值可知,自变量不显著,其他两个自变量都是显著的。
这可能意味着模型中存在多重共线性。
9。
3 根据两个自变量得到的多元回归方程为,并且已知n=10,SST=6724.125,SSR=6216。
375,,。
(1)在a=0。
05的显著性水平下,、与y线性关系是否显著?
(2)在a=0.05的显著性水平下,是否显著?
(3)在a=0。
05的显著性水平下,是否显著?
详细答案:
(1)提出假设::
:至少有一个不等于0
计算检验的统计量F
当a=0。
05时,。
由于
,所以拒绝原假设,表明、与y线性关系显著。
(2)提出假设:
:
:
计算检验的统计量t。