两个变量之间的相关关系
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.线性相关 (1)回归直线 如果两个变量散点图中点的分布从整体上看大致在 一__条__直__线__附近,那么称这两个变量之间具有线性相关关系,这 条直线叫做回归直线.
(2)回归方程与最小二乘法 假设我们已经得到两个具有线性相关关系的变量的一组数
据(x1,y1),(x2,y2),…,(xn,yn),用 Q=(y1-bx1-a)2+(y2 -bx2-a)2+…+(yn-bxn-a)2 表示点到直线 y=bx+a 的“整体 距离”,当 Q 最小时,a,b 的值可由下列公式给出:
10
10
10
x =159.8, y =172,x2i =265 448,y2i =312 350,xiyi=287 640
i=1
i=1
i=1
设所求的回归直线方程为y^ =bx+a,其中 a,b 的值使 Q=
10
(yi-bxi-a)2 的值最小.
i=1
10
xiyi-10 x y
i=1
b^ =
i
12 3
4
5
xi
24 6
8
10
yi
64 134 205 285 360
xiyi
128 536 1 230 2 280 3 600
x =6, y =209.6,
5
5
x2i =220,xiyi=7 774
i=1
i=1
∴b^ =7 7742-205-×56××62209.6=1 44086=37.15. ∴a^=209.6-37.15×6=-13.3. 于是所求的回归直线的方程为y^ =37.15x-13.3.
一般规律吗? (2)求回归直线方程; (3)预测当钢水含碳量为 1.6%时,应冶炼多少分钟?
思路点拨:先画出散点图,求出回归直线方程,再进行预 测.
【解析】(1)以 x 轴表示含碳量,y 轴表示冶炼时间,可作 散点图,如图所示:
从图中可以看出,各点散布在一条直线附近,即它们线性 相关.
(2)列出下表,并用科学计算器进行计算:
2.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升) 与消光系数如下表:
尿汞含量 x 2 4 6 8 10 消光系数 y 64 134 205 285 360 如果 y 与 x 之间具有线性相关关系,求回归直线的方程.
【解析】由散点图可知 y 与 x 线性相关,设回归直线方程为y^ =b^ x+a^ 列表:
错解:借助散点图可知两者是相关关系,故求回归直线方 程有意义.
错因分析:利用散点图判断相关性时,要将点的坐标尽量 画准确.
正解:以 x 轴为年平均气温,y 轴为年降雨量,可得相应的 散点图如图所示:
因为图中各点并不在一条直线的附近,所以两者不具有相 关关系,没必要用回归直线进行拟合,即使用公式求得回归直 线也是没有意义的.
题型三 利用回归直线方程对总体进行估计 【例 3】 炼钢是一个氧化降碳的过程,钢水含碳量的多少 直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的 关系.如果已测得炉料熔化完毕时,钢水的含碳量 x 与冶炼时 间 y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:
x/0.01% 104 180 190 177 147 134 150 191 204 121 y/min 100 200 210 185 155 135 170 205 235 125 (1)作出散点图,你能从散点图中发现含碳量与冶炼时间的
程
为
__y^_=__b^_x_+__a^_______________.
通过上述求 Q 最小值而得到回归直线的方法,即使得样本
数据的点到回归直线的距离的___平__方__和__最__小_____的方法叫做最
小二乘法.
自主探究 1.回归直线通过样本点的中心,对照平均数与样本数据之 间的关系,你能说说回归直线和散点图中各点之间的关系吗?
房屋面积 x/m2 115 110 80 135 105 销售价格 y/万元 24.8 21.6 19.4 29.2 22 (1)画出数据对应的散点图; (2)判断新房屋的销售价格和房屋面积之间是否具有相关关 系?如果有相关关系,是正相关还是负相关?
【解析】(1)数据对应的散点图如图所示:
(2)通过以上数据对应的散点图可以判断,新房屋的销售价 格和房屋的面积之间具有相关关系,且是正相关.
这种线性关系,但让人感觉可靠性不强.实际上,我们希望找
到一条直线,“从整体上看各点与此直线的距离和最小”,即
最贴近已知的数据点,最能代表变量 x 与 y 之间的关系,记此 直线方程为:y^ =a+bx *
这里在 y 的上方加记号“^ ”,是为了区别实际值 y,表示当 x 取值 xi(i=1,2,…,n)时,y 相应的观察值为 yi,而直线上对 应于 xi 的纵坐标是y^ i=a+bxi,*式叫做 y 对 x 的回归直线方程.a, b 叫做回归系数.要确定回归直线方程,只要确定回归系数 a,
b.
(2)回归直线方程求解的方法步骤 根据最小二乘法的思想和公式,利用计算器或计算机,可
以方便地求出回归方程.
(3)利用回归直线对总体进行估计 利用回归直线,我们可以进行预测,若回归直线方程为y^ = bx+a,则 x=x0 处的估计值为:y^ 0=bx0+a.
特别提示:进行回归分析,通常先进行相关性检验,若能 确定两个变量具有线性相关关系,再去求其线性回归方程,否 则所求方程毫无意义.
(2)回归直线方程是y^ =1.23x+0.08. 当 x=10 时,y^ =1.23×10+0.08=12.38,即估计使用 10
年时维修费用是 12.38 万元.
误区解密 【例 4】 下表是某地的年降雨量与年平均气温,两者是相 关关系吗?求回归直线方程有意义吗? 年平均气 温/℃ 12.51 12.84 12.84 13.69 13.33 12.74 13.05 年降雨 量/mm 748 542 507 813 574 701 432
≈1.27,
10
xi2-10 x 2
i=1
a^= y -b^ x ≈-30.95, 即所求的回归直线方程为y^ =1.27x-30.95. (3)当 x=160 时,y^ =1.27×160-30.95≈172,即大约冶炼
172 min.
方法点评:回归直线可以模拟两个变量之间的相关关系.我 们可以利用回归直线方程进行运算,如求函数值、研究增减性 等,通过这些运算结果进行合理的预测.这也正是回归分析的 意义所在.
n
xi- x yi- y
n
xiyi-n x y
b^ =i=1
i=1
=
,
n
n
wk.baidu.comi- x 2
xi2-n x 2
i=1
i=1
a^ =
y -b^ x
.
其中 x =1ni=n1xi, y =1ni=n1yi,
这
样
,
回
归
方
程
的
斜
率
为
^
b
,
截
距
为
^
a
,
回
归
方
【答案】 (1)建立直角坐标系,两轴的长度单位可以不一致. (2)将 n 个数据点(xi,yi)(n=1,2,3,…,n)描在平面直角坐 标系中. (3)描的点可以是实心点,也可以是空心点. (4)画回归直线时,一定要画在多数点经过的区域.实际画 线时,先观察有哪两个点在直线上即可. (5)具体作回归直线时,用一把透明的直尺边缘在这些点间 移动,使它尽量靠近或通过大多数点,然后画出直线.
【答案】假设样本点为(x1,y1),(x2,y2),…,(xn,yn),
记 x =1ni=n1xi, y =1ni=n1yi,则( x , y )为样本点的中心,回归直
线一定过这一点,对于单变量样本数据而言,平均数是样本 数据的中心,类似地,对于双变量样本点而言,回归直线是 样本点的中心.
2.怎样画出散点图和回归直线?
题型二 求回归方程 【例 2】 每立方米混凝土的水泥用量 x(单位:kg)与 28 天 后混凝土的抗压强度 y(单位:kg/cm2)之间的关系有如下数据:
求两变量间的回归直线的方程.
思路点拨:按照求回归直线方程的步骤和公式,写出回归 直线方程.
【解析】列表如下
∴b^ =1825198436-001-2×122×052×05722.6=144334070≈0.304, a^= y -b^ x =72.6-0.304×205=10.28, 于是所求的回归直线的方程是y^ =0.304x+10.28.
3.假设关于某设备的使用年限 x 和所支出的维修费用 y(万 元)有如下的统计资料:
使用年限 x 2 3 4 5 6 维修费用 y 2.2 3.8 5.5 6.5 7.0 若由资料知 y 对 x 呈线性相关关系.试求: (1)线性回归方程y^ =bx+a 的回归系数 a,b; (2)估计使用年限为 10 年时,维修费用是多少?
预习测评 1.下列变量之间的关系不是相关关系的是( ) A.球的体积与半径的关系 B.人体的脂肪含量与年龄之间的关系 C.人的身高与体重之间的关系 D.降雨量与农作物产量之间的关系
【答案】A
2.有五组变量: ①汽车的重量和汽车每消耗 1 升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身 体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里 耗油量.其中两个变量成正相关的是( )
i1
2
3
4
5
6
7
8
9
10
xi 104 180 190 177 147 134 150 191 204 121
yi 100 200 210 185 155 135 170 205 235 125
xiyi 10400 36000 39900 32745 22785 18090 25500 39155 47940 15125
要点阐释 回归直线方程问题 (1)回归直线方程的思想方法 ①回归直线:观察散点图的特征,发现各点大致分布在通 过散点图中心的一条直线附近.如果散点图中点的分布从整体 上看大致在一条直线附近,我们就称这两个变量之间具有线性 相关关系, 这条直线叫回归直线.
②显见,根据不同的标准可画出不同的直线来近似地表示
2.求回归直线方程的步骤: (1)将已知的数据列表,列出 xi,yi,并求出 x2i ,y2i ,xiyi.
n
xiyi-n x ·y
自学导引
1.变量之间的相关关系 如果两个变量中一个变量取值一定时,另一个变量的取值 带有一定的_随__机__性___,那么这两个变量之间的关系,叫做相关 关系.如果散点图中点的分布是从左下角到右上角的区域,那
么这两个变量的相关关系称为___正_____相关,如果散点图中点 的分布是从左上角到右下角的区域,那么这两个变量的相关关 系称为_____负___相关.
课堂总结 1.变量相关关系又分为两种: (1)正相关:两个变量具有相同的变化趋势,一个变量增大 时,另一个变量也有增大的趋势;一个变量减小时,另一个变 量也有减小的趋势. (2)负相关:两个变量具有相反的变化趋势,一个变量增大 时,另一个变量有减小的趋势;一个变量减小时,另一个变量 有增大的趋势.
典例剖析 题型一 相关关系 【例 1】 下列关系中,带有随机性相关关系的是_②__④_____. ①正方形的边长与面积之间的关系; ②水稻产量与施肥量之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系. 思路点拨:根据线性相关的概念逐个判断.
1.以下是在某地搜集到的不同楼盘新房屋的销售价格 y(单 位:万元)和房屋面积 x(单位:m2)的数据:
【解析】(1)列表如下:
i
1
2
xi
2
3
yi
2.2
3.8
xiyi
4.4
11.4
x2i
4
9
345 456 5.5 6.5 7.0 22.0 32.5 42.0 16 25 36
5
5
x =4, y =5,x2i =90,xiyi=112.3
i=1
i=1
于是有b^ =1129.03--55××442×5=1120.3=1.23, a^= y -b^ x =5-1.23×4=0.08
A.①③ B.②④ C.②⑤ D.④⑤
【答案】C
3.已知 x 与 y 之间的一组数据: x0123 y1357
则 y 与 x 的线性回归方程y^ =bx+a 必过点( ) A.(1,2) B.(1.5,0) C.(2,2) D.(1.5,4)
【答案】D
4.设有一个回归方程y^=2-5.5x,当变量 x 减少一个单位 时,y 平均___增__加___5_.5__个_____单位.