统计学一元线性回归课后习题答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t(12-2)=2.2281
根据显著性水平=0.05,查t分布表得t(n2)=2.2281由于t=7.435453>t(12-2)=2.2281, 拒绝H0,产量与生产费用之间存在着显著的正线性 相关关系
11.2 学生在期末考试之前用于复习的时间(单位:小时)和考 试分数(单位:分)之间是否有关系?为研究这一问题,一位 研究者抽取了由8名学生构成的一个随机样本,取得的数据如 下:
i 1 2
n2
SSE 3035.965 19.449 n2 8
sˆ
1
19.449 0.98589 2 n 1 1 n 2 57830.39 *757.9 2 xi n xi 10 i 1 i 1
se
t
ˆ 1 sˆ
1
4.7 4.7684 0.98589
某地区的人均GDP为5 000元,预测其人均消费 水平为2278.1078元。
(7)求人均GDP为5 000元时,人均消费水平95%的置信区 间和预测区间。 解:已知n=7,t(7-2)=2.5706
se ˆ yi yi
i 1 n 2
n2
SSE 305795.0343 61159.007 n2 5
地区 北京 辽宁 上海 江西 河南 贵州 陕西 人均GDP(元) 22 460 11 226 34 547 4 851 5 444 2 662 4 549 人均消费水平(元) 7 326 4 490 11 546 2 396 2 208 1 608 2 035
要求: (1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并 说明二者之间的关系形态。
2
n xy x y
n y 2 y
2
7 *651007421 2710124051 7 *1904918867 85739 7 *1346900766 31609
2 2
0.998123
说明两个变量之间高度相关
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际 意义。
系列
二者之间为负的线性相关关系
2)用航班正点率作自变量,建立估计的回归方程,并解释 回归系数的意义
Coefficient s Intercept 429.8986352
标准误差 74.97337331
t Stat 5.734018
P-value 0.000437
航班正点率
-4.7011299
0.985891202
-4.76841
0.001411
ˆ y =429.897-4.7*x
ˆ 回归系数1 =-4.7表示航班正点率 每增加1%顾客投诉次数平均下降 4.7次。
3)检验回归系数的显著性(a=0.05)
提出假设 H0:b1 = 0 H1:b1 0 计算检验的统计量 n
se ˆ yi yi
5000 4515.5714
2
解:根据前面的计算结果,已知n=7,t(7-2)=2.5706
se ˆ yi yi
i 1 n 2
n2
SSE 305795.0343 61159.007 n2 5
预测区间为
1 5000 4515.5714 2278.1078 2.5706*61159.007 1+ 7 13625127.29
SSR SSR 36 R 0.9 SST SST SSE 40
2
回归直线对观测值的拟合程度为0.9,说明变量Y的 变异性中有90%是由自变量x引起的。 2)计算估计标准误差se 并解释其意义
se ˆ yi yi
i 1 n 2
n2
SSE 4 0.5 18 2 16
ˆ 7 *651007421 2710124051 =0.308683 1 2 7 *1904918867 85739
ˆ 0 4515.571429 0.308683*12248.428 =734.6928
y = 734.6928 + 0.308683x
回归系数的含义:人均GDP每增加1元, 人均消费增加0.309元。
2 2 2 2
r=0.9202
(3)对相关系数的显著性进行检验( =0.05),并说明二者之 间的关系强度。
1、提出假设:H0: ;H1: 0
2、计算检验的统计量
t r n2 ~ t (n 2) 2 1 r
12 2 t 0.9202 7.435453 2 1 0.9202
2
8*(20 2 16 2 ... 22 2 ) 20 16 ... 22 8*(64 2 612 ... 77 2 ) (64 61 ... 77) 2
r=0.8621
11.3、根据一组数据建立的线性回归方程 要求: ˆ 1)解释截距 0的意义。 ˆ 1)解释斜率 1的意义。 2)当=6时的E(y)
14000 12000
人均消费水平
10000 8000 6000 4000 2000 0 0 10000 20000 人均GDP 30000 40000 系列1
产量和生产费用之间存在着正的线性相关关系
(2)计算两个变量之间的线性相关系数,说明两个变量之 间的关系强度。
r n x 2 x
将表中数据代入公式得:
{
=0.003585 =0.118129
∴y=0.118129 + 0.003585x
y关于x的回归方程为y=0.118129 + 0.003585x表示运输距离每增加1公里, 运送时间平均增加 0.003585天。
• 11.6 下面是7个地区2000年的人均国内生产总值 (GDP)和人均消费水平的统计数据:
分数
系列1
25
30
35
40
复习时间和考试分数存在正的线性相关关系
(2)计算相关系数,说明两个变量之间的关系强度。
r n x 2 x n y 2 y
2
n xy x y
2
r
8(20*64 16*61 ... 22*77) (20 16 ... 22) *(64 61 ... 77)
r n xy x y
2
n x 2 x n y 2 y
2
r
12(40*130 42*150 ... 140*185) (40 42 ... 140)*(130 150 ... 185) 12*(40 42 ... 140 ) 20 16 22 12*(130 2 150 2 ... 185 ) (130 150 ... 185)2
一元线性回归课后习题讲解
--------第九组
11.1 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:
企业编号
产量(台)
生产费用
1 2 3 4 5 6 7 8 9 1ቤተ መጻሕፍቲ ባይዱ 11 12
40 42 50 55 65 78 84 100 116 125 130 140
130 150 155 140 150 154 165 170 167 180 175 185
(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
产量与生产费用 200 180 160 140 120 100 80 60 40 20 0 0 20 40 60 80 产量 100 120 140 160 系列1
费用
产量和费用存在正的线性相关系数
2)计算产量与生产费用之间的线性相关系数。
ˆ ˆ y 10 0.5 x
1)表示在没有自变量X的影响时其他各种因素对因变 量Y的影响为10 2)斜率的意义在于:自变量X变化对Y影响程度。回 归方程中,当x增加一个单位时,y将减少0.5个单位。 3)x=6时,代入方程,则,y=10-0.5 6=7
11.4 设SSR=36,SSE=4,n=18 要求:1)计算判定系数R^2并解释其意义
复习 时间X 考试 分数Y
20
16
34
23
27
32
18
22
64
61
84
70
88
92
72
77
要求:(1)绘制复习时间和考试分数的散点图,判断二者之 间的关系形态。
100 90 80 70 60 50 40 30 20 10 0 0 5 10 15
复 习 时 间 和 考 试 分 数 存 在 正 的 线 性 20 相 关 复习时间 关 系
确定显著性水平=0.05,并根据分子自由度1和分母自 由度7-2找出临界值F =6.61 作出决策:若F>F ,拒绝H0,线性关系显著
(6)如果某地区的人均GDP为5 000元,预测其人均消费水平。
y = 734.6928+ 0.308683 x
y = 734.6928+ 0.308683 *5000=2278.1078
(4)计算判定系数,并解释其意义。
81444968.68 = =0.9963 81750763.71
人均GDP对人均消费的影响达到99.6%。
(5)检验回归方程线性关系的显著性(a=0.05)。
提出假设 H0:1=0 人均消费水平与人均GDP之间的 线性关系不显著 计算检验统计量F
SSR 1 81444968.68 1 F 1331.6921 SSE (n 2) 305795.03 (7 2)
1
2 3
81.1
76.6 76.6
21
58 85
4
5 6 7 8 9 10
75.7
73.8 72.2 71.2 70.8 91.4 68.5
68
74 93 72 122 18 125
1)绘制散点图,说明二者之间的股息形态
140 120
顾客投诉次数
100 80 60 40 20 0 0 20 40 60 航班正点率 80 100
t
ˆ 1 sˆ
置信区间为
ˆ y0 t 2 ( n 2) se 1 n
x0 x 2 n xi x 2
i 1
1 2278.1078 2.5706*61159.007 7 13625127.29 1990.74915<E(y)2565.46399 人均GDP为5 000元时,人均消费水平95%的 置信区间为[1990.74915,2565.46399]
2
1580.46315 E ( y0 ) 2975.74999
人均GDP为5 000元时,人均消费水平95%的预 测区间为[1580.46315,2975.74999]。
11.7随机抽取10家航空 公司,对其近一年的航 班正点率和顾客投诉次 数进行调查,所得数据 如下
航空公司 编号
航班正点 顾客投诉 率 次数
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形 态 (2)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实 际意义。
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态
6.0 5.0
运送时间(天)
4.0 3.0 2.0 1.0 0.0 0 200 400 600 800 1000 运送距离(公里) 1200 1400 1600
根据图表显示,二者可能存在正线性相关关系
(2)计算线性相关系数,说明两个变量之间的关系强度
运送距离x 运送距离x 1
运送时间y
运送时间y
0.94894
1
x与y的简单相关系数是0.9489,两 变量之间呈现高度正相关关系
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义 ^ ^ ^= + x 最小二乘估计:y 0 1
表示实际值与估计值之间的差异程度是0.5
11.5一家物流公司的管理人员想研究货物的运输距离和运输时 间的关系,为此,他抽出了公司最近10个卡车的运货记录的随 机样本,得到运送距离(单位:km)和运送时间(单位:天) 的数据如下表:
运送距离x 运送时间y 825 3.5 215 1.0 1070 4.0 550 2.0 480 1.0 920 3.0 1350 4.5 325 670 1.5 3.0 1215 5.0