变量间的相互关系复习 通用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所以,该研究所得到的2回归方程是可靠的。
题型训练
1.某考察团对全国10个城市的职工人均工资水平x(千元)与居
民人均消费水平y(千元)进行统计调查,y与x具有相关关系,
回归方程为 yˆ =0.66x+1.562,若某城市居民人均消费水平为
7.675千元,估计该城市人均消费额占人均工资收入的百分比约
为(
12
8
发芽数
23
25
30
26
16
y(颗)
该农科所确定的研究方案是:先从这五组数据中选取2组,用 剩下的3组数据求线性回归方程,再对被选取的2组数据进行检 验. (1)求选取的2组数据恰好是不相邻2 (2)若选取的是12月1日与12月5日的两组数据,请根据12月
2日至12月4日的数据,求出y关于x的线性回归方程 yˆ bˆx aˆ
4.回归分析 对具有相关关系的两个变量进行统计分析的方法叫做回归分析. 通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定 性.
(1)回归分析是对具有相关关系的两个变量进行统计分析的方 法.两个变量具有相关关系是回归分析的前提. (2)散点图是定义在具有相关系的两个变量基础上的,对于性 质不明确的两组数据,可先作散点图,在图上看它们有无关系, 关系的密切程度,然后再进行相关回归分析. (3)求回归直线方程,首先应注意到,只有在散点图大致呈线 性时,求出的回归直线方程才有实际意义,否则,求出的回归直 线方程毫无意义.
解析: (1)散点图如下图:
(2) n xi yi 3 2.5 4 3 5 4 6 4.5 66.5 i 1
x 3 4 5 6 4.5 4
y 2.5 3 4 4.5 3.5 4
n
x
2 i
32
42
52
62
86
i 1
所以由最小二乘法确定的回归方程的系数为:
4
bˆ i1
月份的日期数.
每种情况都是可能出现的,事件A包括的基本事件有6种.
所以P(A)=6/10=3/5.所以选取的2组数据恰好是不相邻2天数
据的概率是3/5.
(2)由数据,求得 x12, y 27
由公式,求得 bˆ5,aˆybˆx3
2 所以y关于x的线性回归方程为
yˆ
5
x
3.
(3)当x=10时,y ˆ5103222,22232
点评:利用回归直线方程可以进行预测估计总体,回归直线方 程将部分观测值所反映的规律进行延伸,是我们对有线性相关 关系的两个变量进行分析和控制,依据自变量的取值估计和预 报因变量的基础和依据,有广泛的应用.
变式探究
3.以下是某地搜集到的新房屋的销售价格 y和房屋的面积x的数
据:
房屋面积(m2) 115
110
80
135 105
销售价格(万元)24.8 21.6 18.4 29.2 22
(1 (2 (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
解析:(1)数据对应的散点图如下图所示:
( 2)x
1 5
5 i 1
xi
109,
y
23.2,
lxx
1 5
5 i 1
( xi
x)2
1570, lxy
n
n
(xi x)(yi y)
xi yi nxy
bˆ i1 n
(xi x)2
i1 n
xi2
2
nx
i1
i1
x1 n
n i1
xi,
y1 n
n i1
yi
b ˆ 叫做回归方程的斜率,aˆ 是纵截距
基础自测
1.(2009年宁夏海南卷)对变量x,y有观测数据(xi,yi) (i=1,2,…,10),得散点图1;对变量u、v有观测数据(ui,vi) (i=1,2,…,10)得散点图2.由这两个散点图可以判断( )
1 5
5 i 1
( xi
x)( yi
y)
308
设 所 求 回 归 直 线 方 程 为 yˆ bx a.
则 b lxy 308 0.1962, lxx 1580
a y bx 23.2 109 308 1.8166. 1570
故 直 线 方 程 为 y 0.1962 x 1.8166.
i1
5
x
2 i
2
5x
10 20
0.5
i1
aˆ y b x 0 .4
所以年推销金额y关于工作年限x的线性回归方程为
yˆ0.5x0.4
回归方程的应用
(2009年威海模拟)某车间为了规定工时定额,需 要确定加工零件所花费的时间,为此作了四次试验,得到的数
零件的个数x(个)
2
3
加工的时间y(小时) 2.5
3
4
5
6
y
2.5 3
4
4.5
(1) (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回
yˆ bˆx aˆ (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根 据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗 比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
第十三章 概率与统计 第十节 变量间的相互关系
课前自主学案
知识梳理
1.相关关系 当自变量一定时,因变量的取值带有一定的随机性的两个变量 之间的关系称为相关关系. 2.散点图 将两个变量所对应的点描在直角坐标系中,这些点组成了变量 之间的一个图,称为变量之间的散点图.如果变量之间存在某种 关系,这些点会有一个集中趋势,这种趋势通常可以用一条光 滑的曲线来近似,这样近似的过程称为曲线拟合. 3. 若两个变量的散点图中,所有点看上去都在一条直线附近波动, 则称变量间是线性相关的.若所有点看上去都在某条曲线(不是直 线)附近波动,则称此相关为非线性相关的.如果所有的点在散点 图中没有任何关系,则称变量间是不相关的.
A.直线l1和l2有交点(s,t B.直线l1和l2相关,但是交点未必是点(s,t C.直线l1和l2 D.直线l1和l2
解析:由 yˆbˆxa ˆ,a ˆybˆx可知, 当 x x, yˆ y ,故回 归方程过定点 ( x , y ) ,甲同学得回归直线l1过点(s,t),乙同
学得回归直线l2也过(s,t),所以l1与l2有交点(s,t). 答案: A
解析:1)x 100 12 17 17 8 8 12 100,
变式探究
2.某电脑公司有6名产品推销员,其工作年限与年推销金额如下 表:
推销员编号
1
2
3
4
5
工作年限x/年 3
5
6
7
9
推销金额y/万元 2
3
3
4
5
求年推销金额y关于工作年限x的线性回归方程
解析:
n i1
xi yi
112, x
6,
y
17 5
,
5 i1
x
2 i
200,
n
b
xi yi 5x y
(2009年聊城一模)某农科所对冬季昼夜温差大 小与某反季节大豆新品种发芽多少之间的关系进行分析研究, 他们分别记录了12月1日至12月5日的每天昼夜温差与实验室 每天每100颗种子中的发芽数,得到如下资料:
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差x(℃) 10
11
13
解析:(1)散点图如右图
(2)由表中数据得
4
xi yi n
i 1 4
x 3.5, y 3.5, xi2 54, i 1
bˆ 0.7, aˆ 1.05 yˆ 0.7 x 1.05.回归直线如图中所示
将x=10代入回归直线方程,得 y =0.7×10+1.05=8.05(小
时),∴预测加工10个零件需要8.05小时.
变式探究
1. (1 (2 (3 (4)城镇居民的消费水平与平均工资之间的关系. 其中,具有相关关系的是_______(写出你认为正确的题序号)
答案是:(1)(3)(4)
求回归直线方程
下表提供了某厂节能降耗技术改造后生产甲产品
过程中记录的产量x(吨)与相应的生产能耗y (吨标准煤)的几
组对应数据. x
A.83%
B.72%
C.67%
D.66%
解析:当 =7.675时,x≈9.262, ∴7.675/9.262≈82.9%,约为83% . 答案: A
2.为了分析某个高三学生的学习状态,对其下一阶段的学习提 供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行 分析.下面是该生7次考试的成绩.
A.变量x与y正相关,u与v B.变量x与y正相关,u与v C.变量x与y负相关,u与v D.变量x与y负相关,u与v负相关
解析:由图1可知,各点整体呈递减趋势,x与y负相关;由图2 可知,各点整体呈递增趋势,u与v正相关. 答案: C
2.
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题
转化为确定性问题进行研究.
5. 回归直线
(1)最小二乘法:使样本数据的点到回归直线的距离的平方
和最小的方法,叫做最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:
(x1,y1),(x2,y2),(x3,y3),…,(xn,yn),其回归方为 yˆ bˆx aˆ ,其中
是待定系数.则 aˆ , bˆ 是待定系统。则
(3)据(2),当x=150(m2) ,销售价格的估计值为:
y 0 . 1 9 6 2 1 5 0 1 . 8 1 6 6 3 1 . 2 4 6 6 ( 万 元 )
题型展示台
为了考察两个变量x和y之间的线性相关关系,甲、 乙两同学各自独立地做了10次和15次试验,并利用线性回归方 法,求得回归直线为l 1和l 2,已知在两个人的试验中发现对 变量x的观察数据的平均值恰好相等,都为s,对变量y的观察数 据的平均值也恰好相等,都为t,那么下列说法中正确的是( )
4
4
回 归 方 程 为 yˆ 7 x 2 3 44
答案:yˆ 7 x 23
44
课堂互动探究
相关关系的判断
下列两个变量之间的关系是相关关系的是( )
A. B. C. D.
解析:A、B、D中两个变量的关系是确定的,所以是函数关 系,C中的两个变量间是相关关系,对于日照时间一定的水稻, 仍可以有不同的亩产量.故选C . 答案: C
xiyi 4x.y
4
xi2
2
4x
66.8564444.5.523.50.7
i1
aˆ ybˆx3.50.74.50.35
故线性回归方程为: y0.7x0.35
(3)根据回归方程的预测,现在生产100吨产品消耗的标准 煤的数量为0.7×100+0.35=70.35
故耗能减少了90-70.35=19.65(吨标准煤).
解析:回归直线斜率为80,所以x每增加1, yˆ 增加80,即劳动
生产率提高1千元时,工资提高80元. B
3
源自文库
3
解析:
xiyi 434, x 7, y 18,
x
2 i
179
i1
i1
3
bˆ
xiyi 3x y
i1 3
x
2 i
3
x
2
7. 4
i1
aˆ y bˆ x 1 8 7 7 2 3 .
数学 88 83 117 92 108 100 112 物理 94 91 108 96 104 101 106
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;
(2)已知该学生的物理成绩y与数学成绩x是线性相关的,若 该学生的物理成绩达到115分,请你估计他的数学成绩大约是 多少?并请你根据物理成绩与数学成绩的相关性,给出该生在 学习数学、物理上的合理建议.
(3)若由线性回归方程得到的估计数据与所选出的检验数据 的误差均不超过2颗,则认为得到的线性回归方程是可靠的, 试问(2)中所得到的线性回归方程是否可靠?
解析:(1)设抽到不相邻的两组数据为事件A,因为从5组数据
中选取2组数据共有10种情况:(1,2)(1,3)(1,4)(1,5)
(2,3)(2,4)(2,5)(3,4)(3,5)(4,5),其中数据为12
其中正确的命题为( )
A.①③④
B.
C.③④⑤
D.②③⑤
解析:有些变量不具有相关关系,①错误;圆的周长与半径是 函数关系,②错误. 答案: C
3.工人工资y(元)依劳动生产率x(千元)变化的回归方程为 yˆ
=50+80x,下列判断正确的( A.劳动生产率为1000元时,工资为130 B.劳动生产率提高1000元时,工资提高80 C.劳动生产率提高1000元时,工资提高130 D.当月工资250元时,劳动生产率为2000元
3
4
5
4
4.5
(1)在给定的坐标系中画出表中数据的散点图
(2)求出y关于x的线性回归方程 yˆ bx aˆ ,并在坐标系
中画出回归直线;
(3)试预测加工10个零件需要多长时间?
n
xi yi nxy
(注:bˆ
i1 n
xi2
2
nx
,aˆ ybx)
i1
分析:(1)将表中的各对数据在平面直角坐标系中的描点,得 到散点图. (2)按求回归直线方程的步骤和公式,写出回归直线方程. (3)利用回归直线方程分析.