变量间的相关关系
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
xi yi nx y
b i1 n
i 1 n
(xi x)2
xi2 nx 2
i1
i1
a y bx
利用公式可求得年龄和人体脂肪含量
的样本数据的回归方程为
yÙ = 0.577x - 0.448
由此我们可以根据一个人的年龄预测
其体内脂肪含量的百分比的估计值.若某人
65岁,则其体内脂肪含量的百分比约为多
少?
0.577×65-0.448=345037.1
30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
脂肪含量
小结
1.求样本数据的线性回归方程,可按 下列步骤进行:
第一步,计算平均数 x , y
第二步,求和 第三步,计算
n
n
, xi yi
xi 2
400
10
200
5
0
0
0
20
40
60
80
0
5
10
15
观察左面散点图,发现这些点大致
分布在一条直线附 近。
像这样,如果散点图中点的分布从 整体上看大致在一条__直__线__附近,我们 就称这两个变量之间具有线性相 关关系, 这条直线叫做_回__归__直__线__。
散点图 说明
1).如果所有的样本点都落在某一函数曲线上, 就用该函数来描述变量之间的关系,即变量之 间具有函数关系. 2).如果所有的样本点落在某一函数曲线附近, 变量之间就有相关关系。
变量之间的相关关系
两个变量间存在着某种关系,带 有不确定性(随机性),不能用函数
关变系精量确地间表的达出相来,关我们关说这系两个
变量具有相关关系.
初步探索,直观感知
探究一: 两个变量间的相关关系
问题1、对于两个变量之间的关系, 我们之前学过,函数关系是一种确定性 关系。那么下列变量与变量之间哪些是 函数关系,哪些是相关关系?
40 35 30 25 20 15 10 5 0
20 25 30 35 40 45 50 55 60 65 年龄
初步探索,直观感知
问题3 下面两个散点图中点的分
布有什么不同?
种植西红柿,施肥量与产量
年龄与脂肪含量之间的散点图
之间的散点图
40
1200
35
1000
30
25
800
20
系列6010
系列1
15
年龄 23 27 39 41 45 49 50 脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
根据上述数据,人体的脂肪含量与 年龄之间有怎样的关系?
脂肪含量
回归直线
脂肪含量
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
如何具体的求出这个回归直线方程呢?
整体上最接近
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
脂肪含量
回归直线
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图. (2)根据上表数据用最小二乘法求出y关于x 的线性回归方程. (3)由(2)预测技改后生产100吨甲产品的 生产能耗是多少吨标准煤?
(参考数值:3 2.5+43+54+64.5=66.5)
解:(1)根据题意,作图可得, (2)由系数公式可知,
①请正同方学形们边试长举与几面个积现之实间生的活关中系相关关 系的②例圆子的。半径与圆的周长之间的关系
③年龄与人体的脂肪含量之间的关系 ④数学成绩与物理成绩之间的关系.
相关关系
初步探索,直观感知 如何进行数据分析? 探究二:散点图
问题2、在一次对人体脂肪含量和年龄的关 系的研究中,研究人员获得了一组样本数据:
实际上,求回归直线的关键是如何用数学的方 法来刻画“从整体上看,各点与此直线的距离最 小”.
Q = (y1-bx1-a)2 + (y2-bx2-a)2 +…+ (yn-bxn-a)2 问题归结为:a,b取什么值时Q最小,即总体和最小.
这一方法叫最小二乘法
计算回归方程的斜率与截距的一般公式:
n
n
(xi x)( yi y)
3).如果所有的样本点都落在某一直线附近, 变量之间就有线性相关关系 .
散点图:用来判断两个变量是否具有相关关系.
判断下列图形中具有线性相关关系的两个 变量是
C
初步探索,直观感知 探究三:线性相关、正相关、负相关
40
180
35
160
30
140
25
120
100
20
系列1
系列1
80
15
60
10
40
5
bwenku.baidu.com
66.5 4 4.5 3.5 86 4 4.52
0.7
a 3.5 0.74.5 0.35
yˆ 所以线性回归方程为 =0.7x+0.35;
(3)x=100时, yˆ =0.7x+0.35=70.35,
所以预测生产100吨甲产品的生产能耗为70.35吨标准煤.
20
0
0
0
问题4 20
40
60
80
-10
0
10
20
30
40
(1)两个散点图的有什么共同之处?
(2)两个散点图的点的分布有什么不同?
初步探索,直观感知 探究三:线性相关、正相关、负相关
40 35 30 25 20 15 10
5 0
0
20
40
60
180
160
140
120
100 系列1
80
60
40
20
0
80
-10
0
散落在直线的附近
有相同的变化趋势
有相反的变化趋势
系列1
10
20
30
40
线性相关 正相关
负相关
初步探索,直观感知
左面的散点图中,点散布在从左下角 到右上角的区域,对于两个变量的这种相 关关系,我们将它称为正相关。
右面的散点图中,点散布在从左上角 到右下角的区域,对于两个变量的这种相 关关系,我们将它称为负相关。
i 1
i1
n
xi yi nx y
b
i1 n
,a y bx
xi2 nx 2
i1
第四步,写出回归方程
2.回归直线经过样本点中心(x, y)
高斯的假定:(平均数天然合理)
例.(广东高考)下表提供了某厂节能降耗技术 改造后生产甲产品过程中记录的产量x吨与相应 的生产能耗y(吨标准煤)的几组对照数据.