相关关系和最小二乘法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5
n
代入公式,得 b=-3.2,所以,a= y -b x =40, 故线性回归方程为 y=-3.2x+40.
答案 y=-3.2x+40
题型三 利用线性回归方程对总体进行估计 例 3 下表提供了某厂节能降耗技术改造后在生产甲产品过 程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几 组对照数据. x y 3 2.5 4 3 5 4 6 4.5
思维启迪:画散点图,对变量的相关关系作出评估;求线性 回归方程,由线性回归方程进行回归分析预测.
解 (1)散点图如下图:
3+4+5+6 2.5+3+4+4.5 (2) x = =4.5, y = =3.5, 4 4
i 1 4 i 1
∑ xiyi=3×2.5+4×3+4×5+6×4.5=66.5, =
③ 填序号). 乘法的思想得拟合程度最好的直线是___(
解析 由题意知 x =4, y =6, ∑ (xi- x )(yi- y ) 8 = i 1 ∴b= = , n 2 5 ∑ ( x - x ) i =
i 1 n
2 8 2 ∴a= y -b x =- ,∴y= x- ,故选③. 5 5 5
4.对变量 x, y 有观测数据(xi, yi)(i= 1,2,„,10),得散点 图 (1);对变量 u, v 有观测数据(ui,vi)(i= 1,2,„,10), 得散点图(2).由这两个散点图可以判断( )
答题模板 12.线性回归问题 试题: (12 分)某电脑公司有 6 名产品推销员,其工作年 限与年推销金额的数据如下表: 推销员编号 工作年限 x/年 推销金额 y/万元 1 3 2 2 5 3 3 6 3 4 7 4 5 9 5
(1)以工作年限为自变量 x,推销金额为因变量 y,作出 散点图; (2)求年销售金额 y 关于工作年限 x 的线性回归方程; (3)若第 6 名推销员的工作年限为 11 年,试估计他的年 推销金额.
探究提高:从本题可以看出,求线性回归方程,关键在于 正确求出系数 a,b,由于计算量较大,所以计算时要仔细 谨慎,分层进行,避免因计算产生失误,特别注意,只有 在散点图大体呈线性时,求出的线性回归方程才有意义.
变式训练 2 在 2009 年春节期间,某市物价部门对本市五个 商场销售的某商品一天的销售量及其价格进行调查,五个 商场的售价 x 元和销售量 y 件之间的一组数据如下表所示: 价格 x 销售量 y 9 11 9.5 10 10 8 10.5 6 11 5
“是”与“否”)
解析
从散点图看,散点图的分布成团状,无任何规
律,所以两个变量不具有线性相关关系.
题型二 如下:
求线性回归方程
例 2 某地 10 户家庭的年收入和年饮食支出的统计资料
年收入 x(万元) 年饮食支出 y (万元) 关关系;
2
4
4
6
6
6
7
7
8
10
0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3
A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关, u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关
解析 图(1)中的数据随着 x 的增大 y 减小, 因此变量 x 与变 量 y 负相关;图(2)中的数据随着 u 的增大,v 也增大,因此 u 与 v 正相关.
答案 C
5.(2010· 湖南)某商品销售量 y(件)与销售价格 x(元/件)负相 关,则其回归方程可能是 A.y=-10x+200 C.y=-10x-200 B.y=10x+200 D.y=10x-200 ( A )
解析 由于销售量 y 与销售价格 x 成负相关,故排除 B、 D.C 中 y 值恒为负,不符合题意,故选 A.
0 2.2
1 4.3
3 4.8
4 6.7
从散点图分析,y 与 x 线性相关,且 y=0.95x+a,则 a 的
3.已知 x,y 之间的一组数据如下表: x y 2 3 3 4 4 6 5 8 6 9
对于表中数据,现给出如下拟合直线:①y=x+1; 8 2 3 ②y=2x-1;③y= x- ;④y= x,则根据最小二 5 5 2
通过分析,发现销售量 y 与商品的价格 x 具有线性相关关 系,则销售量 y 关于商品的价格 x 的线性回归方程为 ∑ xiyi- n x y i=1 ____________.(参考公式:b= n 2 ,a= y -b x ) 2 ∑ xi -n x =
i 1 n
2 解析 ∑ x y = 392 , x = 10 , y = 8 , ∑ x i i i =502.5, = = i 1 i 1
(2)回归方程 方程 y=bx+a 是两个具有线性相关关系的变量的一组数据 (x1,y1),(x2,y2),„,(xn,yn)的回归方程,其中 a,b 是待 定参数.
n n xiyi-n x y ∑ (xi- x )(yi- y ) ∑ = = i 1 i 1 b = = n n 2 2 2 ∑ x - n x ∑ ( x - x ) i i i=1 i=1 a= y -b x
题型分类 深度剖析
题型一 利用散点图判断两个变量的相关关系 例 1 山东鲁洁棉业公司的科研人员在 7 块并排、形状大小 相同的试验田上对某棉花新品种进行施化肥量 x 对产量 y 影响的试验,得到如下表所示的一组数据(单位:kg). 施化肥量 x 棉花产量 y 15 330 20 345 25 365 30 405 35 445 40 450 45 455

6
(1)n=6,∑ xi=21,∑ yi=426, x =3.5, y =71, = =
i 1 i 1
6
6
6 2 ∑xi =79,∑ xiyi=1 i= 1 i= 1 6
481,
b=
i= 1
∑xiyi-6 x y
i 1 2 2 ∑ x - 6 x i = 6
1 481-6×3.5×71 = =-1.82, 79-6×3.52
2 2 2 2 2 ∑ x i =3 +4 +5 +6 =86, =
4
i= 1 ∴b= 4
∑xiyi-4 x · y
2 2 ∑ x - 4 x i = i 1
4
66.5-4×3.5×4.5 = =0.7, 86-4×4.52
a= y -b x =3.5-0.7×4.5=0.35. ∴所求的线性回归方程为 y=0.7x+0.35. (3)现在生产 100 吨甲产品用煤 y=0.7×100+0.35=70.35(吨), ∴90-70.35=19.65(吨). ∴比技改前大约降低 19.65 吨标准煤.
10 2 ∵ x =6, y =1.83,∑ xi =406,∑ xiyi=117.7, i= 1 i= 1 10
10
∑ xiyi-10 x y = i 1 ∴b= 10 2 ≈0.172, 2 ∑ xi -10 x =
i 1
a= y -b x ≈1.83-0.172×6=0.798. 从而得到线性回归方程为 y=0.172x+0.798. (2)某家庭年收入为 9 万元时,其年饮食支出约为 y=0.172×9+0.798=2.346(万元).
探究提高:散点图是由大量数据点分布构成的,是定义在 具有相关关系的两个变量基础之上的, 对于性质不明确的 两组数据可先作散点图, 直观地分析它们有无关系及关系 的密切程度.
变式训练 1 根据两个变量 x,y 之间的观测数据画成散点图
否 .(填 如图所示, 这两个变量是否具有线性相关关系______
审题视角
规范解答 解
(1)先用散点图判断 x、y 的线性相关关系;
a= y -b x =71+1.82×3.5=77.37, ∴线性回归方程为 y=a+bx=77.37-1.82x. (2)因为单位成本平均变动 b=-1.82<0, 且产量 x 的计量 单位是千件,所以根据回归系数 b 的意义有: 产量每增加一个单位即 1 000 件时,单位成本平均减少 1.82 元. (3)当产量为 6 000 件时,即 x=6,代入线性回归方程, 得 y=77.37-1.82×6=66.45(元) ∴当产量为 6 000 件时,单位成本大约为 66.45 元.
探究提高:利用线性回归方程可以对总体进行预测估计,线 性回归方程将部分观测值所反映的规律进行延伸, 是我们对 有线性相关关系的两个变量进行分析和控制的依据, 依据自 变量的取值估计和预报因变量的值, 在现实生活中有广泛的 应用.
变式训练 3 某企业上半年产品产量与单位成本资料如下: 月份 1 2 3 4 5 6 (1)求出线性回归方程; (2)指出产量每增加 1 000 件时,单位成本平均变动多少? (3)假定产量为 6 000 件时,单位成本为多少元? 产量(千件) 2 3 4 3 4 5 单位成本(元) 73 72 71 73 69 68
(1)根据表中数据,确定家庭的年收入和年饮食支出的相 (2)如果某家庭年收入为 9 万元,预测其年饮食支出.
思维启迪:画出散点图,判断其线性相关性,求出线 性回归方程.

(1)由题意知,年收入 x 为解释变量,年饮食支出 y 为预
报变量,作散点图如图所示.
从图中可以看出,样本点呈条状分布,年收入和年饮食支出 有比较好的线性相关关系,因此可以用线性回归方程刻画它 们之间的关系.
§10.3 变量间的相关关系 基础知识 自主学习
要点梳理 1.两个变量的线性相关 若两个变量 x 和 y 的散点图中,所有点看上去都在一条直 线附近波动,则称变量间是线性相关的. 2.回归方程 (1)最小二乘法 n 个点 (x1, y1),(x2, y2),„,(xn, yn),用表达式 [y1- (a + bx1)]2+ [y2- (a+ bx2)]2+„+ [yn- (a+ bxn)]2 来刻画这 些点与直线 y= a+ bx 的接近程度,使得上式达到最小值 的直线 y= a+ bx 就是我们所要求的直线,这种方法称为 最小二乘法.
解析 将 y=24.8 代入,得 x≈185.03.
百度文库
2.已知 x,y 的取值如下表所示: x y
2.6 值为________ .
0+1+3+4 解析 x = =2, 4 2.2+4.3+4.8+6.7 y= =4.5, 4 样本中心为(2,4.5),又样本中心在回归直线上. 所以 4.5=0.95×2+a,即 a=2.6.
.
[难点正本 疑点清源] 1.相关关系与函数关系的区别 相关关系与函数关系不同.函数关系中的两个变量间是一 种确定性关系.例如正方形面积 S 与边长 x 之间的关系 S =x2 就是函数关系.相关关系是一种非确定性关系,即相 关关系是非随机变量与随机变量之间的关系.例如商品的 销售额与广告费是相关关系.两个变量具有相关关系是回 归分析的前提.
(1)画出散点图; (2)判断是否具有相关关系.
思维启迪:(1)用 x 轴表示化肥施用量,y 轴表示棉花产量, 逐一画点. (2)根据散点图,分析两个变量是否存在相关关系.
解 (1)散点图如图所示
(2)由散点图知,各组数据对应点大致都在一条直线附 近,所以施化肥量 x 与产量 y 具有线性相关关系.
2.对回归分析的理解 回归分析是处理变量相关关系的一种数学方法,它主要解 决三个问题: (1)确定两个变量之间是否有相关关系, 如果有就找出它们 之间贴近的数学表达式; (2)根据一组观察值, 预测变量的取值及判断变量取值的变 化趋势; (3)求出线性回归方程.
基础自测 1.人的身高与手的扎长存在相关关系,且满足 y=0.303x- 31.264(x 为身高,y 为扎长,单位: cm) ,则当扎长为 24.8 cm 时,身高约为__________ 185.03 cm.
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的 线性回归方程 y=bx+a; (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准 煤.试根据(2)求出的线性回归方程,预测生产 100 吨甲产 品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
相关文档
最新文档