变量间的相关关系公开课ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
40 35 30 25 20 15 10 5 0 0 20 40 60 80 系列1
1200 1000 800 600 400 200 0 0 5 10 15 系列1
9
如果散点图中点的分布从整体上看大致在 一条直线附近我们就称这两个变量之间具 有线性相关关系,这条直线叫做回归直线, 这条直线的方程叫做回归方程 另外,散点散布在从左下角到右上角的区 域,称这两个变量的相关关系为正相关; 反之称为负相关.
ˆi yi (bxi a) y
(xn,yn)
它与样本数据yi的偏差是: yi
(x1,y1)
(x2,y2)
13
问题就归结为: 当 a, b 取什么值时 Q 最小.
n
Q ( y1 bx1 a)2 ( y2 bx2 a)2 ( yn bxn a)2
运算不方便
(1)最小二乘法:
(2)转化与化归; 数形结合;

b
( x x )( y y ) x y n x y
i 1 i i 2 ( x x ) i i 1 n
n
n

i 1
i
i
2 2 x n x i i 1
n
,
a y bx
25
15

b
( x x )( y y ) x y n x y
i 1 i i
n
n
(x x )
i 1 i
n

i 1
i
i
2
x n x
i 1 2 i
n
,
2
a y bx
y) 回归直线方程y=bx+a 必过样本点的中心 ( x,
16
例题:求三点(3,10),(7,20),(11,24)的 线性回归方程.
解(1)作出散点图:
30 25 20 15 10 5 0 0 5 10 15
17
(2)列表如下:
i xi 1 3 2 7 3 11
(3)代入公式
yi xiyi x i2
3 i 1
10 30 9
20 140 49
3 i 1
24 264 121
ˆ b
x y 3x y
i 1 i i 2 2 x 3 x i i 1 3
21
3.下表提供了某厂节能降耗技术改造后生产甲产品过程 中记录的产量x(吨)与相应的生产能耗y(吨标准煤) 的几组对照数据 x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x 的线性回归方程(3×2.5+4×3+5×4+6×4.5=66.5)
3
两个变量之间的关系
变 有关系 量 关 系 没关系 函数关系 相关关系
练习:下列各变量之间是相关关系的序号是 ②③⑤ . ①路程与时间、速度的关系; ②人的身高和年龄的关系; ③粮食产量与施肥量的关系; ④圆周长与半径的关系; ⑤广告费支出与销售额的关系. ⑥中国足球队的成绩和中国乒乓球队的成绩
4
一次Βιβλιοθήκη Baidu人体的脂肪含量和年龄关系的调查,如图:
年龄 脂肪 年龄 脂肪 23 9.5 53 29.6 27 17.8 54 30.2 39 21.2 56 31.4 41 25.9 57 30.8 45 27.5 58 33.5 49 26.3 60 35.2 50 28.2 61 34.6
根据上述数据,人体的脂肪含量和年龄之间有怎样的关 系? 通过统计图、表,可以使我们对两个变量之间的关系 有一个直观上的印象和判断。
12
假设我们已经得到两个具有线性相关关系的样本
的一组数据:(x1,y1),(x2,y2),…,(xn,yn),
ˆ 且所求回归直线方程是: y
待定系数.
bx a ,其中 a, b 是
当自变量x取xi(i=1,2,…,n)时可以得到回归直
线上的点的纵坐标为: y ˆi
bxi a(i 1, 2, , n)
n n ( xi x )( yi y ) xi yi nx y b i 1 n i 1n , 2 2 2 ( xi x ) xi nx i 1 i 1 a y bx .
推导公式的计算比较复杂,这里不作推导. 但是,我们可以解释一下得出它的原理.
n
ˆi )2的最小值 求(yi y
i 1
避免相互抵消 各点与直线 的整体偏差
n
ˆi 的最小值 求 yi y
i 1
ˆi ) 的最小值 求 ( yi y
i 1
14
这种通过求:
Q ( y1 bx1 a) ( y2 bx2 a) ( yn bxn a)
(3)已知该厂技术改造前100吨甲产品能耗为90吨标煤;
试根据(2)求出的线性回归方程,预测生产100吨甲产
品的生产能耗比技术改造前降低多少吨标煤?
22
解:(1)散点图,如图所示.
23
24
【知识归纳】
1、知识: 2、思想方法:
(1)散点图:
(2)正相关、负相关: (3)线性相关关系: (4)回归方程的系数公式:
2 2
2
的最小值而得到回归直线的方法,即求样本数据的点到 回归直线的距离的平方和最小的方法叫做最小二乘法.
b
斜率


(x
i 1 n
n
i
x )( yi y )
i
(x
i 1

x y
i 1 n i
n
i
nx y , nx
2
x)
2
x
i 1
2
i
a y b x
截距
摄氏温度
热饮杯数
26
20
18
24
13
34
10
38
4
50
-1
64
为了了解热饮销量与气温的大致关系,我们以 气温为横轴,热饮销量为纵轴,建立直角坐标 系,
7
散点图
y
60 50 40
30
20 10 气温
O
-5
5
10
15 20 25
30 35
气温越高, 卖出去的热饮杯数越少。
8
观察这些散点图,说说它们的异同点。
5
下面我们以年龄为横轴,脂肪含量为纵轴建立 称该图为散点图。 直角坐标系,作出各个点,
如图:
脂肪含量
40 35 30 25
20
15 10 5 年龄 20 25 30 35 40
O
45 50 55 60 65
6
有一个同学家开了一个小超市,他为了研究气 温对热饮销销售的影响,经过统计,得到一个 卖出的热饮杯数与当天气温的对比表:
3
2 x xi yi 434. x 7, y 18. i 179;
434 3 7 18 1.75 179 3 49
ˆ 18-7 1.75 5.75 ˆ y - bx a
所求线性回归方程为:
ˆ 1.75x 5.75. y
18
求解线性回归问题的步骤: 2 xi 画散点图. 1.列表 i, xi , yi , xi yi ,, 2.计算:
2.3变量间的相关关系
1
问题引入:
有些教师常说:“如果你的数学成绩好,那 么你的物理学习就不会有什么大问题” 按照这种 说法,似乎学生的物理成绩与数学成绩之间也存 在着某种关系。你如何认识它们之间存在的关系?
数学成绩 学习兴趣
物理成绩
学习时间
其他因素
。 2
结论:变量之间除了函数关系外,还有
相关关系与函数关系的异同点: 相同点:均是指两个变量的关系. 不同点:函数关系是一种确定的关系; 相关关系是一种非确定关系.
10
如何求线性回归直线方程?
为研究学生数学和物理成绩的关系,随机抽取班
级5个学生的数学和物理成绩如下表:
学生 学科 数学
A
80 70
B
75 66
C
70 68
D
65 64
E
60 62
物理
散 点 图
^ y =^ b x+^ a
回归直线
正 相 关
11
人们经过长期的实践与研究,已经得出了计算 回归方程斜率与截距的一般公式:
x, y ,
x , x y
i 1 2 i i 1
n
n
i i
ˆ ˆ 和b 3.代入公式求 a 4.列出直线方程
19
练习
20
2、已知x,y的取值如下表所示: x y 0 2.2 1 4.3 3 4.8 4 6.7
从散点图分析,y与x线性相关,且
ˆ =0.95x+a,以此预测 y
7.35 当x=5时,y=__________.
相关文档
最新文档