统计学一元线性回归课后习题答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
r=0.9202
(3)对相关系数的显著性进行检验( =0.05),并说明二者之
间的关系强度。
1、提出假设:H0: ;H1: 0
2、计算检验的统计量
t r n 2 ~ t(n 2) 1 r2
t 0.9202
12 2 1 0.92022
7.435453
t(12-2)=2.2281
置信区间为[1990.74915,2565.46399]
解:根据前面的计算结果,已知n=7,t(7-2)=2.5706
n
yi yˆi 2
se
i 1
n2
预测区间为
SSE n2
305795.0343 61159.007 5
2278.1078 2.5706*61159.007 1+ 1 5000 4515.57142
yˆ 10 0.5xˆ
1)表示在没有自变量X的影响时其他各种因素对因变 量Y的影响为10 2)斜率的意义在于:自变量X变化对Y影响程度。回 归方程中,当x增加一个单位时,y将减少0.5个单位。 3)x=6时,代入方程,则,y=10-0.5 6=7
11.4 设SSR=36,SSE=4,n=18 要求:1)计算判定系数R^2并解释其意义
7 13625127.29
1580.46315 E( y0 ) 2975.74999
人均GDP为5 000元时,人均消费水平95%的预 测区间为[1580.46315,2975.74999]。
11.7随机抽取10家航空 公司,对其近一年的航 班正点率和顾客投诉次 数进行调查,所得数据 如下
表示实际值与估计值之间的差异程度是0.5
11.5一家物流公司的管理人员想研究货物的运输距离和运输时 间的关系,为此,他抽出了公司最近10个卡车的运货记录的随 机样本,得到运送距离(单位:km)和运送时间(单位:天) 的数据如下表:
运送距离x 825 215 1070 550 480 920 1350 325 670 1215
置信区间为
yˆ80 t 2 (8)se
1
10
x0 x 2
r
n xy x y
n x 2 x2 n y 2 y2
7 *651007421 2710124051
0.998123
7 *1904918867 857392 7 *1346900766 316092
说明两个变量之间高度相关
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际 意义。
ˆ1
7*651007421 2710124051
7*1904918867 857392
=0.308683
ˆ0 4515.571429 0.308683*12248.428
=734.6928
y = 734.6928 + 0.308683x
回归系数的含义:人均GDP每增加1元, 人均消费增加0.309元。
yˆ0 t 2 (n 2)se
1
n
x0 x 2
n
xi x 2
i 1
2278.1078 2.5706*61159.007 1 5000 4515.57142
7 13625127.29
1990.74915<E(y)2565.46399
人均GDP为5 000元时,人均消费水平95%的
yˆ =429.897-4.7*x
回归系数ˆ1 =-4.7表示航班正点率 每增加1%顾客投诉次数平均下降 4.7次。
3)检验回归系数的显著性(a=0.05)
提出假设 H0:b1 = 0 H1:b1 0
计算检验的统计量
n
yi yˆi 2
se
i 1
n2
SSE n2
3035.965 19.449 8
根据显著性水平=0.05,查t分布表得t(n2)=2.2281由于t=7.435453>t(12-2)=2.2281, 拒绝H0,产量与生产费用之间存在着显著的正线性
相关关系
11.2 学生在期末考试之前用于复习的时间(单位:小时)和考 试分数(单位:分)之间是否有关系?为研究这一问题,一位 研究者抽取了由8名学生构成的一个随机样本,取得的数据如 下:
sˆ1
se
n
i 1
xi2
1 n
n i 1
xi
2
19.449
0.98589
57830.39 1 *757.92
10
t ˆ1 4.7 4.7684
sˆ1 0.98589
t ˆ1 ~ t(8) =2.201
sˆ1
t=4.7684>t=2.201,拒绝H0,回归 系数显著
要求: (1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并
说明二者之间的关系形态。
人均消费水平
14000 12000 10000
8000 6000 4000 2000
0 0
系列1
10000
20000 人均GDP
30000
40000
产量和生产费用之间存在着正的线性相关关系
(2)计算两个变量之间的线性相关系数,说明两个变量之 间的关系强度。
一元线性回归课后习题讲解
--------第九组
11.1 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:
企业编号
产量(台) 1 2 3 4 5 6 7 8 9 10 11 12
生产费用
40
130
42
150百度文库
50
155
55
140
65
150
78
154
84
165
100
170
116
167
125
20 相 25
30 35
复习时间关关
系
复习时间和考试分数存在正的线性相关关系
系列1 40
(2)计算相关系数,说明两个变量之间的关系强度。
r
n xy x y
n x2 x2 n y2 y2
r
8(20*64 16*61 ... 22*77) (20 16 ... 22)*(64 61 ... 77)
航空公司 航班正点 顾客投诉
编号
率
次数
1
81.1
21
2
76.6
58
3
76.6
85
4
75.7
68
5
73.8
74
6
72.2
93
7
71.2
72
8
70.8
122
9
91.4
18
10
68.5
125
1)绘制散点图,说明二者之间的股息形态
顾客投诉次数
140 120 100
80 60 40 20
0 0
20
40
60
航班正点率
二者之间为负的线性相关关系
系列
80
100
2)用航班正点率作自变量,建立估计的回归方程,并解释 回归系数的意义
Intercept 航班正点率
Coefficient s
429.8986352
-4.7011299
标准误差 t Stat P-value
74.97337331 5.734018 0.000437 0.985891202 -4.76841 0.001411
r
n xy x y
n x2 x2 n y2 y2
r
12(40*130 42*150 ...140*185) (40 42 ...140)*(130 150 ...185)
12*(402 422 ...1402) 20 16 222 12*(1302 1502 ...185 ) (130 150 ...185)2
复习 时间X
考试 分数Y
20 16 34 23 27 32 18 22 64 61 84 70 88 92 72 77
要求:(1)绘制复习时间和考试分数的散点图,判断二者之 间的关系形态。
分数
100 90 80 70 60 50 40 30 20 10 0
0
复
习
时
间
和
考
试
分
数
存
在
正
的
线
性
5
10 15
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义
最小二乘估计:y^= ^0+ ^1 x
{ 将表中数据代入公式得:
=0.003585
=0.118129
∴y=0.118129 + 0.003585x
y关于x的回归方程为y=0.118129 + 0.003585x表示运输距离每增加1公里, 运送时间平均增加 0.003585天。
运送时间y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形 态 (2)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实 际意义。
运送时间(天)
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态
8*(202 162 ... 222 ) 20 16 ... 222 8*(642 612 ... 772) (64 61 ... 77)2
r=0.8621
11.3、根据一组数据建立的线性回归方程 要求:
ˆ ˆ 112) ) )解解当释=释截6斜距时率的0的E意(1义的y。)意义。
180
130
175
140
185
(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
费用
产量与生产费用
200 180 160 140 120 100 80 60 40 20
0 0
20
40
60
80
100
120
140
产量
产量和费用存在正的线性相关系数
系列1 160
2)计算产量与生产费用之间的线性相关系数。
• 11.6 下面是7个地区2000年的人均国内生产总值 (GDP)和人均消费水平的统计数据:
地区
北京 辽宁 上海 江西 河南 贵州 陕西
人均GDP(元)
22 460 11 226 34 547 4 851 5 444 2 662 4 549
人均消费水平(元)
7 326 4 490 11 546 2 396 2 208 1 608 2 035
4)如果航班正点率为80%,估计顾客投诉次数
yˆ80 =429.897-4.7*80=54.2
5)求航班正点率为80%,顾客投诉次数95%的置信区间和预测区间
解:已知n=10,t(10-2)=2.306
n
se
yi yˆi 2
i 1
n2
SSE n2
3035.965 19.449 8
确定显著性水平=0.05,并根据分子自由度1和分母自 由度7-2找出临界值F =6.61
作出决策:若F>F ,拒绝H0,线性关系显著
(6)如果某地区的人均GDP为5 000元,预测其人均消费水平。
y = 734.6928+ 0.308683 x
y = 734.6928+ 0.308683 *5000=2278.1078
某地区的人均GDP为5 000元,预测其人均消费 水平为2278.1078元。
(7)求人均GDP为5 000元时,人均消费水平95%的置信区 间和预测区间。
解:已知n=7,t(7-2)=2.5706
n
yi yˆi 2
se
i 1
n2
置信区间为
SSE n2
305795.0343 61159.007 5
R2 SSR SSR 36 0.9 SST SST SSE 40
回归直线对观测值的拟合程度为0.9,说明变量Y的 变异性中有90%是由自变量x引起的。
2)计算估计标准误差se 并解释其意义
n
se
yi yˆi 2
i 1
SSE
4 0.5
n2
18 2 16
(4)计算判定系数,并解释其意义。
= 81444968.68 =0.9963 81750763.71
人均GDP对人均消费的影响达到99.6%。
(5)检验回归方程线性关系的显著性(a=0.05)。
提出假设
H0:1=0 人均消费水平与人均GDP之间的
线性关系不显著 计算检验统计量F
F SSR 1 81444968.68 1 1331.6921 SSE (n 2) 305795.03 (7 2)
6.0 5.0 4.0 3.0 2.0 1.0 0.0
0
200
400
600
800 1000 1200 1400 1600
运送距离(公里)
根据图表显示,二者可能存在正线性相关关系
(2)计算线性相关系数,说明两个变量之间的关系强度
运送距离x 运送时间y
运送距离x
1
运送时间y 0.94894
1
x与y的简单相关系数是0.9489,两 变量之间呈现高度正相关关系