回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

答案:②
4.已知 x 与 y 之间的一组数据: x 0 1 2 3 y 1 3 5 7 则 y 与 x 的线性回归方程为 y=bx+a 必过 点 .
解析:回归直线方程必过点( , ),又 0+1+2+3 1+3+5+7 = 1 . 5, = 4, 故 y 与 x 的线性回 4 4 归方程必过点(1.5,4). 答案:(1.5,4)
15
20
25 365
30
35
40
45
330 345
405 445
450 455
施化肥量x
水稻产量y
15
20
25
365
30
35
40
45
330 345
405 445
450 455
y
500 450 400 350 300 10
水稻产量
··
20
·
·
· · ·
施化肥量
30
40
50
x
1、定义:
自变量取值一定时,因变量的取值带有一定 随机性的两个变量之间的关系叫做相关关系。 注 1):相关关系是一种不确定性关系; 2): 对具有相关关系的两个变量进行统计 分析的方法叫回归分析。
施化肥量x 水稻产量y
15
20
25 365
30
35
40
45
330 345
405 445
450 455
1)、求水稻产量y与施肥量x之间的回归直线方程; 2)、估计当施肥量为70时水稻的产量是多少?
i
xi yi xiyi
7
1 15 330 4950
2 20 345 6900 x=30
3 25 365
4 30 405
i=1
【例 1】下表提供了某厂节能降耗技术改造后生 产甲产品过程中记录的产量 x(吨)与相应的生产 能耗 y(吨标准煤)的几组对应数据: x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求 出 y 关于 x 的线性回归方程 y=bx+a; (3)已知该厂技改前 100 吨甲产品的生产能耗 为 90 吨标准煤,试根据(2)求出的线性回归方程, 预测生产 100 吨甲产品的生产能耗比技改前降低 多少吨标准煤?
解:(1)由题设所给数据,可得散点图如图所示.
(2)由对照数据, 计算得 ∑ 2=86,
=1 4 =1 4
3+4+5+6 =4.5, 4
2 .5+3+4+4.5 =3 .5, 4
已知∑ xi yi=66.5,所以,由最小二乘法确定的回归方程的系数为 b=

4 =1 4
-4
2
∑ 2 -4
=1
66.5 -4 ×4. 5×3 .5 =0 .7,a= 86-4 ×4. 52
答案:C
3.在建立两个变量 y 与 x 的回归模型中,分别选择 了 4 个不同模型,它们的相关指数 r 如下,其中拟合 得最好的模型为 . ①模型 1 的相关指数 r 为 0.75 ②模型 2 的相关指数 r 为 0.90 ③模型 3 的相关指数 r 为 0.25 ④模型 4 的相关指数 r 为 0.55
������ =1 7 ������ =1 7 ������ =1
1
1
∑ ������������2=212+232+252+272+292+322+352=5414, ∑ xiyi=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18542. ∑ ������������2=72+112+212+242+662+1152+3252=124393,
解析:①⑤属于函数关系,②③④属于相关关系. 答案:D
2.对变量 x,y 有观测数据(xi ,y i)( i=1,2,…,10),得散点 图(如图 1); 对变量 u,v 有观测数据 (ui,vi)( i=1,2,…,10),得散点图(如图 2) .由这两个散点 图可以判断( )
图1 图2 A.变量 y 与 x 正相关,v 与 u 正相关 B.变量 y 与 x 正相关,v 与 u 负相关 C.变量 y 与 x 负相关,v 与 u 正相关 D.变量 y 与 x 负相关,v 与 u 负相关

2948.66 =0.8639. 3520.92
由于 r=0.8639>0.75, ∴ x 与 y 具有线性相关关系.
1.在下列各量与量之间的关系中是相关关系的是 ( ) ①正方体的体积与棱长之间的关系; ②一块农田的小麦的产量与施肥量之间的关系; ③人的身高与年龄之间的关系; ④家庭的收入与支出之间的关系; ⑤某家庭用水量与水费之间的关系. A.②③ B.③④ C.④⑤ D.②③④
· · · · · · ·· · · · ·· · · ·· · · · · · · · · · · · · ·· · · ·
x
O
所求得的回归直线方程,在何种情况下才能 探索: 对相应的一组观测值具有代表意义呢?
称:
r
i 1 n
( xi x )( yi y )
2 n 2 i 1
������=1 7
7
∴ r=
∑ ������������ ������������ -7������������
7
2 7 2 2 2 ( ∑ ������������ -7������ )( ∑ ������������ -7������ ) ������=1 ������=1
=
18542-7×27.4×81.3 (5414-7×27.42 )× (124393-7×81. 32 )
-b =3 .5-0 .7×4.5=0.35.
因此,所求的线性回归方程为 y=0.7 x+0.35. (3)由(2) 的回归方程及技改前生产 100 吨甲产品的生产能耗,得降低的 生产能耗为 90-(0.7×100+0 .35)=19.65(吨标准煤).
二、相关系数
问题: 如图是一组观测值的散点图,能否用线性回 归方程来表示其分布规律? y
5 35 445
6 40 450
7 45 455
9125 12150 15575 18000 20475 y=399.3 ∑ xiyi=87175
i=1
7
∑xi2=7000
i=1 7
∑ yi2=1132725
i=1 7
7
b=(∑ xiyi – n x y)/(∑xi2 - n x 2)
i=1
=(87175-7×30×399.3)/(7000-7×302)≈4.75 a= y - b x=399.3 - 4.75 × 30 ≈257 所求的回归直线方程为:y=4.75x+257
i x ) ( yi y )
i 1

xi yi n x y
2 n 2 2 i 1
n

( xi n x )( yi n y )
i 1
n
2
为样本相关系数(简称相关系数) 用来衡量y与x之间的线性相关程度。
变量之间线性相关系数 r 的取值范围为[1,1],|r|值越接近 1,变量之间的线性相关程度越 高,|r|值越接近于 0,变量之间的线性相关程度 越低. 当 r>0 时,b>0,两个变量的值总体上呈现 出同时增减的趋势,此时称两个变量正相关;当 r<0 时,b<0,一个变量增加,另一个变量有减少 的趋势,称两个变量负相关;当 r=0 时,称两个变 量线性不相关. 通常当|r|>0.75 时,认为两个变量有很强的 线性相关关系.
水稻产量
··
20
·
·
· · ·
施化肥量
30 40 50
x 发现:图中各点,大致分布在某条直线附近。
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
2、回归直线方程: 1、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。 2、对两个变量进行的线性分析叫做线性回归分析。 例1:在7块并排、形状大小相同的试验田上进行 施肥 对水稻产量影响的试验,得到如下所示的一组数据:
【例 2】关于两个变量 x 和 y 的 7 组数据如下 表所示: 2 2 2 2 2 3 3 x 1 3 5 7 9 2 5 1 3 1 2 2 6 y 7 1 2 1 1 4 6 5 5 试判断 x 与 y 之间是否有线性相关关系?
解:������ = 7(21+23+25+27+29+32+35)≈27.4, ������ = 7(7+11+21+24+66+115+325)≈81.3,
2、现实生活中存在着大量的相关关系。
如:人的身高与年龄; 产品的成本与生产数量;
商品的销售额与广告费;
家庭的支出与收入。等等
探索:水稻产量y与施肥量x之间大致有何规 律?
施化肥量x
水稻产量y
15
20
25
365
30
35
40
45
330 345
405 445
450 455 散点图
y
500 450 400 350 300 10
回归分析
一、变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间 的函数关系是 y = x2 确定性关系 问题2:某水田水稻产量y与施肥量x之间是否 有一个确定性的关系? 例如:在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得
到如下所示的一组数据:
施化肥量x 水稻产量y
相关文档
最新文档