统计学元线性回归课后习题答案公开课获奖课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第9页
11.4 设SSR=36,SSE=4,n=18 规定: 1)计算鉴定系数R^2并解释其意义
R2 SSR SSR 36 0.9 SST SST SSE 40
回归直线对观测值拟合程度为0.9,阐明变量Y变异 性中有90%是由自变量x引起。
2)计算估计原则误差se 并解释其意义
n
se
n x2 x2 n y2 y2
12(40*130 42*150 ...140*185) (40 42 ...140)*(130 150 ...185) r
12*(402 422 ...1402) 20 16 222 12*(1302 1502 ...185 ) (130 150 ...185)2
规定: (1)绘制复习时间和考试分数散点图,判断两者之间 关系形态。
分数
100 90 80 70 60 50 40 30 20 10 0
0
•
5
10
15
20 25
30
35
复习时间
复习时间和考试分数存在正线性有关关系
系列1 40
第7页
(2)计算有关系数, 阐明两个变量之间关系强度。
r
n xy x y
n
n
xi yi
n
xi
n
yi
ˆ1
i 1
i1 i1
n
n
xi2
n
xi 2
i 1
i1
ˆ0 y ˆ1x
ˆ1
7 *651007421 2710124051
7 *1904918867 857392
=0.308683
ˆ0 4515.571429 0.308683*12248.428
r=0.9202
第4页
(3)对有关系数明显性进行检查( =0.05),并阐明两者之 间关系强度。
1.提出假设:H0:
;H1:
0
2.计算检查记录量
t r n 2 ~ t(n 2) 1 r2
t 0.9202 12 2 7.435453 1 0.92022
t(12-2)=2.2281
根据明显性水平=0.05, 查t分布表得t(n2)=2.2281由于t=7.435453>t(12-2)=2.2281, 拒绝H0, 产量与生产费用之间存在着明显正线性有 关关系
r
n xy x y
n x 2 x2 n y 2 y2
7 *651007421 2710124051
0.998123
7 *1904918867 857392 7 *1346900766 316092
阐明两个变量之间高度有关
第17页
(3)运用最小二乘法求出估计回归方程, 并解释回归系数实际意义。
i 1
= 81444968.68 =0.9963 81750763.71
人均GDP对人均消费影响抵达99.6%。
第19页
(5)检查回归方程线性关系明显性(a=0.05)。
提出假设 H0: 1=0 人均消费水平与人均GDP之间线性
关系不明显 计算检查记录量F F SSR 1 81444968.68 1 1331.6921
第15页
规定: (1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并
阐明两者之间关系形态。
人均消费水平
14000 12000 10000
8000 6000 4000 2000
0 0
系列1
10000
20000 人均GDP
30000
40000
产量和生产费用之间存在着正线性有关关系
第16页
(2)计算两个变量之间线性有关系数, 阐明两个变量之间 关系强度。
n x2 x2 n y 2 y2
r
8(20*64 16*61 ... 22*77) (20 16 ... 22) *(64 61 ... 77)
8*(202 162 ... 222 ) 20 16 ... 222 8*(642 612 ... 772) (64 61 ... 77)
SSE (n 2) 305795.03 (7 2)
确定明显性水平 =0.05,并根据分子自由度1和分母 自由度7-2找出临界值F =6.61
作出决策: 若F>F ,拒绝H0,线性关系明显
第20页
(6)假如某地区人均GDP为5 000元, 预测其人均消费水平。
y = 734.6928+ 0.308683 x
yˆ =429.897-4.7*x
回归系数ˆ1 =-4.7表达航班正点率 每增长1%顾客投诉次数平均下降 4.7次。
第26页
3)检查回归系数明显性(a=0.05)
提出假设 H0: b1 = 0 H1: b1 0
计算检查记录量
n
se
yi yˆi 2
i 1
n2
SSE n2
3035.965 19.449 8
yi
ˆ1
i 1
i1 i1
n
n
xi2
n
2 xi
i 1
i1
ˆ0 y ˆ1x
{ 将表中数据代入公式得:
=0.003585
=0.118129
∴y=0.118129 + 0.003585x
y有关x回归方程为y=0.118129 +
0.003585x表达运送距离每增长1公里,
运送时间平均增长 0.003585天。
4)假如航班正点率为80%, 估计顾客投诉次数
yˆ80 =429.897-4.7*80=54.2
5)求航班正点率为80%, 顾客投诉次数95%置信区间和预测区间
解: 已知n=10,t
(10-2)=2.306
n
se
yi yˆi 2
i 1
n2
SSE n2
3035.965 19.449 8
置信区间为
140
185
第2页
(1)绘制产量与生产费用散点图, 判断两者之间关系形态。
费用
产量与生产费用
200 180 160 140 120 100 80 60 40 20
0 0
系列1
20
40
60
80
100
120
140
160
产量
产量和费用存在正线性有关系数
第3页
2)计算产量与生产费用之间线性有关系数。
r
n xy x y
两者之间为负线性有关关系
系列
80
100
第25页
2)用航班正点率作自变量, 建立估计回归方程, 并解释回归 系数意义
Intercept 航班正点率
Coefficient s
429.8986352
-4.7011299
标准误差 t Stat P-value
74.97337331 5.734018 0.000437 0.985891202 -4.76841 0.001411
yˆ80 t 2 (8)se
1
10
x0 x 2
n
xi x 2
i 1
计算得 37.66 E( y0 ) 70.619
第28页
已知n=10, t
• 航空
• 用户
企业
航班正点 率
投诉
编号
次数
1
81.1
21
2
76.6
58
3
76.6
85
4
75.7
68
5
73.8
74
6
72.2
93
7
71.2
72
8
70.8
122
9
91.4
18
第24页
1)绘制散点图, 阐明两者之间股息形态
顾客投诉次数
140 120 100
80 60 40 20
0 0
20
40
60
航班正点率
se
i 1
n2
置信区间为
SSE n2
305795.0343 61159.007 5
yˆ0 t 2 (n 2)se
1
n
x0 x 2
n
xi x 2
i 1
2278.1078 2.5706*61159.007 1 5000 4515.57142
7 13625127.29
1990.74915<E(y)2565.46399
第11页
运送时间(天)
(1)绘制运送距离和运送时间散点图, 判断两者之间关系形态
6.0 5.0 4.0 3.0 2.0 1.0 0.0
0
200
400
600
800 1000 1200 1400 1600
运送距离(公里)
根据图表显示, 两者也许存在正线性有关关系
第12页
(2)计算线性有关系数, 阐明两个变量之间关系强度
人均GDP为5 000元时, 人均消费水平95%
置信区间为[1990.74915, 2565.46399] 第22页
解: 根据前面计算成果,已知n=7,t
(7-2)=2.5706
n
yi yˆi 2
se
i 1
n2
预测区间为
SSE n2
305795.0343 61159.007 5
2278.1078 2.5706*61159.007 1+ 1 5000 4515.57142
• 运输距离 x
• 运输时间y
• 运输距 离x
1
x与•y简运 间输 y朴时有关系0.数948是94 0.9481 9, 两变量
之间展现高度正有关关系
第13页
(3)运用最小二乘法求出估计回归方程, 并解释回归系数实际意义。 最小二乘估计: y^= ^0+^ 1 x
n
n
xi yi n
n xi
第5页
11.2 学生在期末考试之前用于复习时间(单位:小时)和考试 分数(单位:分)之间与否有关系? 为研究这一问题,一位研 究者抽取了由8名学生构成一种随机样本,获得数据如下:
复习 时间X
考试 分数Y
20 16 34 23 27 32 18 22 64 61 84 70 88 92 72 77
第6页
825 215 1070
550 480
920 1350 325 670 1215
• 运输 时间y
3.5 1.0
4.0
2.0 1.0
3.0
4.5 1.5 3.0
5.0
(1)绘制运送距离和运送时间散点图, 判断两者之间关系形态 (2)计算线性有关系数, 阐明两个变量之间关系强度。 (3)运用最小二乘法求出估计回归方程, 并解释回归系数实际意义。
r=0.8621
第8页
11.3.根据一组数据建立线性回归方程
1规)定解:释截ˆ距0
1)解释斜率
ˆ1意意义义。。
2)当=6时E(y)
yˆ 10 0.5xˆ
1)表达在没有自变量X影响时其他多种原因对因变量 Y影响为10 2)斜率意义在于:自变量X变化对Y影响程度。回归 方程中,当x增长一种单位时,y将减少0.5个单位。 3)x=6时,代入方程,则,y=10-0.5 6=7
y = 734.6928+ 0.308683 *5000=2278.1078
某地区人均GDP为5 000元, 预测其人均消费水 平为2278.1078元。
第21页
(7)求人均GDP为5 000元时, 人均消费水平95%置信区间 和预测区间。
解: 已知n=7,t
(7-2)=2.5706
n
yi yˆi 2
一元线性
第1页
11.1 从某一行业中随机抽取12家企业,所得产量与生产费用数据如下:
企业编号 产量(台) 生产费用
1
40
130
2
42
150
3
50
155
4
55
140
5
65
150
6
78
154
7
84
165
8
100
170
9
116
167
10
125
180
11
130
175
12
sˆ1
se
n
i 1
xi2
1 n
n i 1
xi
2
19.449
0.98589
57830.39 1 *757.92
10
t ˆ1 4.7 4.7684
sˆ1 0.98589
t ˆ1 ~ t(8) =2.201
sˆ1
t=4.7684>t
系数明显
=2.201, 拒绝H0, 回归
第27页
第14页
• 11.6 下面是7个地区人均国内生产总值(GDP)和人 均消费水平记录数据:
• 地域
北京 辽宁 上海 江西 河南 贵州 陕西
人均GDP(元)
22 460 11 226 34 547 4 851 5 444 2 662 4 549
人均消费水平(元)
7 326 4 490 11 546 2 396 2 208 1 608 2 035
yi yˆi 2
i 1
SSE
4 0.5
n2
18 2 16
表达实际值与估计值之间差异程度是0.5
第10页
11.5一家物流企业管理人员想研究货品运送距离和运送时间关 系,为此,他抽出了企业近来10个卡车运货记录随机样本,得 到运送距离(单位: km)和运送时间(单位: 天)数据如下表:
• 运输 距离x
=734.6928
y = 734.6928 + 0.308683x
回归系数含义: 人均GDP每增长1元,人
均消费增长0.309元。
第18页
(4)计算鉴定系数, 并解释其意义。
n
n
R 2
SSR
yˆ i y 2
i 1
1
yi yˆ 2
i 1
SST
n
yi y 2
n
yˆi y 2
i 1
7 13625127.29
1580.46315 E( y0 ) 2975.74999
人均GDP为5 000元时, 人均消费水平95%预测 区间为[1580.46315, 2975.74999]。
第23页
11.7随机抽取10家航 空企业, 对其近一年航 班正点率和顾客投诉次 数进行调查, 所得数据 如下