《变量间的相关关系》课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

25
准确吗?怎样的 20
方法是最好的? 15 10
5
我们把由一个变量的变化 0 去推测另一个变量的方法 称为回归方法。
脂肪含量 20 25 30 35 40
年龄 45 50 55 60 65
(二)回归直线
我们上面给出的几种方案可靠性都不是很强,人 们经过长期的实践与研究,已经找到了计算回归方程 的斜率与截距的方法:
57.557-1.648×(-3)≈63(杯)
练习:根据下表,求回归方程.
1、列表
2、代入公式计算 3、
1.利用最小二乘估计时,首先要作出数据的散点图,利 用散点图观察数据是否具有线性关系
2.散点图呈现线性关系时,利用最小二乘公式求出方程
练习P92、第1,2题 作业P94、第2, 3题
数学 成绩
物理成绩
学习 兴趣
花费 时间
其他 因素
如果单纯从数学对物理的影响来考虑,就是考虑 这两者之间的相关关系
我们在生活中,碰到很多相关关系的问题:
商品销售收入 粮食产量
? 广告支出经费
? 施肥量
?
付出
收入
人体脂肪含量
? 年龄
以上几种问题中的两个变量之间的相关关 系,我们都可以根据自己的生活,学习经验作出 相应的判断,“规律是经验的总结”,不管你多 有经验,只凭经验办事,还是很容易出错的,在寻 找变量间的相关关系时,我们需要一些更为科学 的方法来说明问题.
40
35
递增我们叫它
30
们正相关
25
20
递减我们叫它
15
们负相关
10
5
年龄
O
20 25 30 35 40 45 50 55 60 65
从散点图可以看出:所有的点大致在一条直线附近
波动,我们称这两个变量间存在线性相关关系,这
条直线叫做回归直线(regression line)
从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的 位置散布在从左下角到右上角的区域。称它们成正相关。 但有的两个变量的相关,如下图所示:
以上公式的推导较复杂,故不作推导,但它的原 理较为简单:即各点到该直线的距离的平方和最 小,这一方法叫最小二乘法。
人体的脂肪含量与年龄的相关关系 的线性回归方程是:
(1)预测:一个人37岁时,他的体内脂肪 含量可能是多少?
(2)比较前面表格中给出的数值,你有 什么体会?
例.下表是某小卖部6天卖出热茶的杯数(y)与当天气温(x)的对比表:
35源自文库30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
方案3、如果多取几对点,确定多条直线,再求出 这些直线的斜率和截距的平均值作为回归 直线的斜率和截距。而得回归方程。 如图
• 我们还可以找到
更多的方法,但 40 这些方法都可行 35
吗?科学吗?
30
2.3.1-2
前面我们学习了怎样对收集来的数据进行分析:
频率分布图
集中趋势 离散程度
下面我们来介绍一中更为常见的分析方法:
小学明也不,你物是好数理学数学怎不学成么好,物绩样的理不? 太好, 也?不??太?好?.啊.. .
你认为老师的说法对吗?
事实上,我们在考察数学成绩对物理成绩影响的 同时,还必须考虑到其他的因素:爱好,努力程度。
如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越 少。
作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗1升汽油所行使的 平均路程,称它们成负相关. O
如果可以求出这条直线的方程(回归方程), 那么我们就可以比较清楚的了解年龄与体内脂 肪含量的相关性.这条直线就可以作为两个变量 具有线性相关关系的代表
说明:各个年龄阶段的脂肪数据是这个年龄样本的平均数
根据上述数据,人体的脂肪含量与年龄之间有 什么样的关系?
从上表发现,对某个人不一定有此规律,但对很多
个体放在一起,就体现出“人体脂肪随年龄增长而增加” 这一规律.而表中各年龄对应的脂肪数是这个年龄人群的 样本平均数.我们也可以对它们作统计图、表,对这两个 变量有一个直观上的印象和判断.
方案1、先画出一条直线,测量出各点与它的 距离,再移动直线,到达一个使距离的
和最小时,测出它的斜率和截距,得回归
方程。
脂肪含量
40
35
如图 :
30
25
20
15
10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
方案2、在图中选两点作直线,使直线两侧 的点的个数基本相同。
脂肪含量 40
(1)试用最小二乘法求出线性回归方程; (2)如果某天的气温是-3℃,请预测这天可能会卖出热茶多少杯 解 (1)作散点图如图所示
由散点图知两个变量是线 性相关的,计算各种数据 如下表
于是: 则:
分步计算 减少出错
于是,线性回归方程为 y=57.557-1.648x
2)由回归方程知,当某天的气温是-3℃ 时,卖出的热茶杯数为
在寻找变量间的相关关系时,统计同样发 挥了非常重要的作用,我们是通过收集大量的 数据,对数据进行统计分析的基础上,发现其中 的规律,才能对它们之间的关系作出判断.下面 我们通过具体的例子来分析
在一次对人体脂肪含量和年龄的关系研究中, 研究人员获得了一份样本数据:
年龄 23 27 39 41 45 49 50 53 54 56 57 58 脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 年龄 60 61 脂肪 35.2 34.6
实际上,求回归直线的关键是如何用数学的方 法来刻画”从整体上看,各点到此直线的距离最 小”.
于是得计算回归方程的斜率和截距的一般公式.
n
n
y (xi x)(yi y)
xi
nx y
i
b i1 n
(xi x)2

i1 n
xi2 nx2
,
i1
i1
a ybx
下面我们以年龄为横轴, 脂肪含量为纵轴建立直 40 角坐标系,作出各个点, 35 称该图为散点图。
30
25
脂肪含量
如图:
20
15
10
5
年龄
O
20 25 30 35 40 45 50 55 60 65
通过分析、观察可以看到:随着年龄的增长,人体脂肪 含量越高,这表明两个变量之间的确存在一定的关系。
脂肪含量
相关文档
最新文档