变量之间相关关系两个变量线性相关
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这些点散布在从左下角到右上角的区域,对于两个变
量的这种相关关系,我们将它称为正相关.
如果两个变量成负相关,从整体上看这两个变量的变化 趋势如何?
一个变量随另一个变量的变大而变小,散点图中的点 散布在从左上角到右下角的区域.
例1 在下列两个变量的关系中,哪些是相关关系? ①正方形边长与面积之间的关系; ②作文水平与课外阅读量之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系. ②③④
脂肪含量
40 35 30 25 20 15 10 5 0
20 25 30 35 40 45 50 55 60 65 年龄
在平面直角坐标系中,表示具有相关关系的两个变量 的一组数据图形,称为散点图.
脂肪含量
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
对一组具有线性相关关系的样本数据:(x1,y1),(x2, y2),…,(xn,yn),如何求回归方程?
yˆ bˆx aˆ
yˆ bˆx aˆ
n
( xi x )( y i y )
bˆ i 1
n
(xi x )2
i 1
n
xiyi n x y
i 1 n
,
x
2 i
nx 2
i 1
aˆ y bˆ x
2.3 变量间的相关关系
2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关
1.通过收集现实问题中两个有关联变量的数据认识变量 间的相关关系. 2.知道最小二乘法和回归分析的思想; 3.能根据线性回归方程系数公式建立线性回归方程或根 据给出的数据,应用图形计算器建立线性回归方程.
1.对于两个变量,如果当一个变量的取值一定时,另一 个变量的取值被唯一确定,则这两个变量之间的关系就 是一个函数关系.
组样本数据:
年龄 脂肪 年龄 脂肪
23 9.5 53 29.6
27 17.8
54 30.2
39 21.2
56 31.4
41 25.9
57 30.8
45 27.5
58 33.5
49 26.3
60 35.2
50 28.2
61 34.6
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均 数.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描 出样本数据对应的图形吗?
摄 ( ℃ 氏 ) 温 度 - 5 0 4 7 1 2 1 5 1 92 32 7 3 1 3 6 热 饮 杯 数 1 5 61 5 01 3 2 1 2 8 1 3 0 1 1 61 0 48 99 3 7 6 5 4
摄 ( ℃ 氏 ) 温 度 - 5 0 4 7 1 2 1 5 1 92 32 7 3 1 3 6 热 饮 杯 数 1 5 61 5 01 3 2 1 2 8 1 3 0 1 1 61 0 48 99 3 7 6 5 4
方案1.先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使 距离的和最小时,测出它的斜率和截距,得回归方程.如图 :
脂肪含量 40
35 30
25 20 15 10 5
年龄
0 20 25 30 35 40 45 50 55 60 65
方案2.在图中选两点作直线,使直线两侧的点的个数基本相同.
脂肪含量 40
35 30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
方案3.如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的 平均值作为回归直线的斜率和截距而得回归方程. 如图:
脂肪含量 40
35 30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
例2 以下是某地搜集到的新房屋的销售价格和房屋的面积 的数据:
房屋面积 61 70 (平方米)
115 110 80
135 105
销售价格 (万元)
12.2 15.3 24.8 21.6 18.4 29.2 22
画出数据对应的散点图,并指出销售价格与房屋面积这两
个变量是正相关还是负相关.
售价/售万价元
一组样本数据的平均数是样本数据的中心,那么散点 图中样本点的中心如何确定?
脂肪含量
40
35
30
25
20
15
10 5
(x ,y )
0 20 25 30 35 40 45 50 55 60 65 年龄
最小二乘法 求回归直线,使得样本数据的点到它的距离的平方和最小
的方法叫做最小二乘法.
例3 有一个同学家开了一个小卖部,他为了研究气温对 热饮销售的影响,经过统计,得到一个卖出的饮料杯数 与当天气温的对比表:
35
30
25
20
百度文库15
10
5
0
0
50
正相关
100
150
面积 /平方米
脂肪含量
年龄和人体脂肪含量的样本数据的散点图中的点的分
布有什么特点?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
这些点大致分布在一条直线附近.
我们再观察它的图象发现这些点大致分布在一条直线附近,像这样,如果散点 图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具 有线性相关关系,这条直线叫做回归直线,该直线所对应的方程叫回归方程。 那么,我们该怎样来求出这个回归方程? 请同学们展开讨论,能得出哪些具体的方案?
2.在中学校园里,有这样一种说法:“如果你的数学成绩 好,那么你的物理学习就不会有什么大问题.” 我们把数 学成绩和物理成绩看成是两个变量,那么这两个变量之间 的关系是函数关系吗? 不是
相关关系 自变量取值一定时,因变量的取值带有一定随机性的两 个变量之间的关系,叫做相关关系.
在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一
(1)画出散点图; (2)从散点图中发现气温与热饮杯数之间关系的一般规律; (3)求回归方程; (4)如果某天的气温是2℃,预测这天卖出的热饮杯数.
摄 ( ℃ 氏 ) 温 度 - 5 0 4 7 1 2 1 5 1 92 32 7 3 1 3 6 热 饮 杯 数 1 5 61 5 01 3 2 1 2 8 1 3 0 1 1 61 0 48 99 3 7 6 5 4
求样本数据的线性回归方程,可按下列步骤进行:
第一步,计算平均数 ,
第二步,求和
,
,
量的这种相关关系,我们将它称为正相关.
如果两个变量成负相关,从整体上看这两个变量的变化 趋势如何?
一个变量随另一个变量的变大而变小,散点图中的点 散布在从左上角到右下角的区域.
例1 在下列两个变量的关系中,哪些是相关关系? ①正方形边长与面积之间的关系; ②作文水平与课外阅读量之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系. ②③④
脂肪含量
40 35 30 25 20 15 10 5 0
20 25 30 35 40 45 50 55 60 65 年龄
在平面直角坐标系中,表示具有相关关系的两个变量 的一组数据图形,称为散点图.
脂肪含量
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
对一组具有线性相关关系的样本数据:(x1,y1),(x2, y2),…,(xn,yn),如何求回归方程?
yˆ bˆx aˆ
yˆ bˆx aˆ
n
( xi x )( y i y )
bˆ i 1
n
(xi x )2
i 1
n
xiyi n x y
i 1 n
,
x
2 i
nx 2
i 1
aˆ y bˆ x
2.3 变量间的相关关系
2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关
1.通过收集现实问题中两个有关联变量的数据认识变量 间的相关关系. 2.知道最小二乘法和回归分析的思想; 3.能根据线性回归方程系数公式建立线性回归方程或根 据给出的数据,应用图形计算器建立线性回归方程.
1.对于两个变量,如果当一个变量的取值一定时,另一 个变量的取值被唯一确定,则这两个变量之间的关系就 是一个函数关系.
组样本数据:
年龄 脂肪 年龄 脂肪
23 9.5 53 29.6
27 17.8
54 30.2
39 21.2
56 31.4
41 25.9
57 30.8
45 27.5
58 33.5
49 26.3
60 35.2
50 28.2
61 34.6
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均 数.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描 出样本数据对应的图形吗?
摄 ( ℃ 氏 ) 温 度 - 5 0 4 7 1 2 1 5 1 92 32 7 3 1 3 6 热 饮 杯 数 1 5 61 5 01 3 2 1 2 8 1 3 0 1 1 61 0 48 99 3 7 6 5 4
摄 ( ℃ 氏 ) 温 度 - 5 0 4 7 1 2 1 5 1 92 32 7 3 1 3 6 热 饮 杯 数 1 5 61 5 01 3 2 1 2 8 1 3 0 1 1 61 0 48 99 3 7 6 5 4
方案1.先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使 距离的和最小时,测出它的斜率和截距,得回归方程.如图 :
脂肪含量 40
35 30
25 20 15 10 5
年龄
0 20 25 30 35 40 45 50 55 60 65
方案2.在图中选两点作直线,使直线两侧的点的个数基本相同.
脂肪含量 40
35 30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
方案3.如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的 平均值作为回归直线的斜率和截距而得回归方程. 如图:
脂肪含量 40
35 30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
例2 以下是某地搜集到的新房屋的销售价格和房屋的面积 的数据:
房屋面积 61 70 (平方米)
115 110 80
135 105
销售价格 (万元)
12.2 15.3 24.8 21.6 18.4 29.2 22
画出数据对应的散点图,并指出销售价格与房屋面积这两
个变量是正相关还是负相关.
售价/售万价元
一组样本数据的平均数是样本数据的中心,那么散点 图中样本点的中心如何确定?
脂肪含量
40
35
30
25
20
15
10 5
(x ,y )
0 20 25 30 35 40 45 50 55 60 65 年龄
最小二乘法 求回归直线,使得样本数据的点到它的距离的平方和最小
的方法叫做最小二乘法.
例3 有一个同学家开了一个小卖部,他为了研究气温对 热饮销售的影响,经过统计,得到一个卖出的饮料杯数 与当天气温的对比表:
35
30
25
20
百度文库15
10
5
0
0
50
正相关
100
150
面积 /平方米
脂肪含量
年龄和人体脂肪含量的样本数据的散点图中的点的分
布有什么特点?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
这些点大致分布在一条直线附近.
我们再观察它的图象发现这些点大致分布在一条直线附近,像这样,如果散点 图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具 有线性相关关系,这条直线叫做回归直线,该直线所对应的方程叫回归方程。 那么,我们该怎样来求出这个回归方程? 请同学们展开讨论,能得出哪些具体的方案?
2.在中学校园里,有这样一种说法:“如果你的数学成绩 好,那么你的物理学习就不会有什么大问题.” 我们把数 学成绩和物理成绩看成是两个变量,那么这两个变量之间 的关系是函数关系吗? 不是
相关关系 自变量取值一定时,因变量的取值带有一定随机性的两 个变量之间的关系,叫做相关关系.
在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一
(1)画出散点图; (2)从散点图中发现气温与热饮杯数之间关系的一般规律; (3)求回归方程; (4)如果某天的气温是2℃,预测这天卖出的热饮杯数.
摄 ( ℃ 氏 ) 温 度 - 5 0 4 7 1 2 1 5 1 92 32 7 3 1 3 6 热 饮 杯 数 1 5 61 5 01 3 2 1 2 8 1 3 0 1 1 61 0 48 99 3 7 6 5 4
求样本数据的线性回归方程,可按下列步骤进行:
第一步,计算平均数 ,
第二步,求和
,
,