2.3变量间的相关关系(公开课)精编版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
且所求回归直线方程是: yˆ bx a ,其中 a,b 是
待定系数. 当自变量x取xi(i=1,2,…,n)时可以得到回归直
线上的点的纵坐标为:yˆi bxi a(i 1, 2,, n)
它与样本数据yi的偏差是: yi yˆi yi (bxi a)
(x1,y1)
(x2,y2)
(xn,yn)
问题就归结为:
当 a, b 取什么值时 Q 最小.
Q ( y1 bx1 a)2 ( y2 bx2 a)2 L ( yn bxn a)2
运算不方便
n
求 (yi yˆi )2的最小值 i1
避免相互抵消
n
求 yi yˆi 的最小值 i1
各点与直线 的整体偏差
n
求 ( yi yˆi ) 的最小值 i1
解(1)作出散点图:
30 25 20 15 10
5 0
0
5
10
15
(2)列表如下:
i
1
2
3
xi
3
7
11
yi
10
20
24
xiyi
30
140
264
xi2
9
49
121
3
3
xi yi 434. x 7, y 18. xi2 179;
i1
i1
(3)代入公式
3
xi yi 3x y

i 1 3
n
n
(xi x )( yi y)
xi yi nx y
b i1
n
(xi x )2
i 1
i1 n xi2 nx 2

i 1
a y bx.
推导公式的计算比较复杂,这里不作推导.
但是,我们可以解释一下得出它的原理.
假设我们已经得到两个具有线性相关关系的样本 的一组数据:(x1,y1),(x2,y2),…,(xn,yn),
i 1
i 1
3.代入公式求 aˆ 和 bˆ
4.列出直线方程
练习
2、已知x,y的取值如下表所示:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从散点图分析,y与x线性相关,且 yˆ =0.95x+a,以此预测
当x=5时,y=___7_._3_5____.
3.下表提供了某厂节能降耗技术改造后生产甲产品过程 中记录的产量x(吨)与相应的生产能耗y(吨标准煤) 的几组对照数据
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x 的线性回归方程(3×2.5+4×3+5×4+6×4.5=66.5) (3)已知该厂技术改造前100吨甲产品能耗为90吨标煤; 试根据(2)求出的线性回归方程,预测生产100吨甲产 品的生产能耗比技术改造前降低多少吨标煤?
解:(1)散点图,如图所示.
【知识归纳】
1、知识:
2、思想方法:
(1)散点图: (2)正相关、负相关: (3)线性相关关系:
(1)最小二乘法: (2)转化与化归;
数形结合;
(4)回归方程的系数公式:
n
n
y (xi x)(yi y)
xi
n xy
i
b i1 n
i1 n
,
(xi x)2
不同点:函数关系是一种确定的关系; 相关关系是一种非确定关系.
两个变量之间的关系
变 有关系 量 关 系 没关系
函数关系 相关关系
练习:下列各变量之间是相关关系的序号是 ②③⑤ .
①路程与时间、速度的关系; ②人的身高和年龄的关系; ③粮食产量与施肥量的关系; ④圆周长与半径的关系; ⑤广告费支出与销售额的关系. ⑥中国足球队的成绩和中国乒乓球队的成绩
xi2 n x 2
i1
i1
a y bx
,
斜率
(xi x )2
xi2 nx 2
i 1
i 1
a y bx
截距
n
n
y (xi x)(yi y)
xi
n xy
i
b i1 n
i1 n
,
(xi x)2
xi2 n x 2
i1
i1
a y bx
回归直线方程y=bx+a 必过样本点的中心 (x,y)
例题:求三点(3,10),(7,20),(11,24)的 线性回归方程.
2.3变量间的相关关系
问题引入:
有些教师常说:“如果你的数学成绩好,那 么你的物理学习就不会有什么大问题” 按照这种 说法,似乎学生的物理成绩与数学成绩之间也存 在着某种关系。你如何认识它们之间存在的关系?
数学成绩
物理成绩
学习兴趣
学习时间
其他因素
结论:变量之间除了函数关系外,还有

相关关系与函数关系的异同点: 相同点:均是指两个变量的关系.
一次对人体的脂肪含量和年龄关系的调查,如图:
年龄 23
27
39
41
45
49
50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53
54
56
57
58
60
61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
根据上述数据,人体的脂肪含量和年龄之间有怎样的关 系?
如何求线性回归直线方程?
为研究学生数学和物理成绩的关系,随机抽取班
级5个学生的数学和物理成绩如下表:
学生 学科
A
B
源自文库
C
D
E
数学 80 75 70 65 60
物理 70 66 68 64 62





回归直线

^y =^b x+^a
人们经过长期的实践与研究,已经得出了计算 回归方程斜率与截距的一般公式:
这种通过求:
Q ( y1 bx1 a)2 ( y2 bx2 a)2 ( yn bxn a)2
的最小值而得到回归直线的方法,即求样本数据的点到
回归直线的距离的平方和最小的方法叫做最小二乘法.
n
n
(xi x )( yi y )
xi yi nx y
b i1 n
i1 n
xi2 3x 2
i 1
434 3 7 18 1.75 179 3 49
所求线性回归方程为:
aˆ y - bˆx 18 - 7 1.75 5.75
yˆ 1.75x 5.75.
求解线性回归问题的步骤:
1.列表 i, xi , yi , xi yi ,,xi2画散点图.
n
n
2.计算: x, y, xi2 , xi yi
40 35 30 25 20 15 10 5 0
0
1200 1000 800 600 400 200
0 0
20
40
60
5
10
系列1 80
系列1 15
如果散点图中点的分布从整体上看大致在 一条直线附近我们就称这两个变量之间具 有线性相关关系,这条直线叫做回归直线, 这条直线的方程叫做回归方程
另外,散点散布在从左下角到右上角的区 域,称这两个变量的相关关系为正相关; 反之称为负相关.
摄氏温度 26 18 13 10 4 -1 热饮杯数 20 24 34 38 50 64
为了了解热饮销量与气温的大致关系,我们以 气温为横轴,热饮销量为纵轴,建立直角坐标 系,
散点图
y
60
50
40
30
20 10
O
-5
5
10 15 20 25 30 35
气温
气温越高, 卖出去的热饮杯数越少。
观察这些散点图,说说它们的异同点。
通过统计图、表,可以使我们对两个变量之间的关系 有一个直观上的印象和判断。
下面我们以年龄为横轴,脂肪含量为纵轴建立 直角坐标系,作出各个点,称该图为散点图。
如图:
脂肪含量 40
35
30
25
20
15
10
5
年龄
O
20 25 30 35 40 45 50 55 60 65
有一个同学家开了一个小超市,他为了研究气 温对热饮销销售的影响,经过统计,得到一个 卖出的热饮杯数与当天气温的对比表:
相关文档
最新文档