《线性回归方程》课件1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14 12 10 8 6 4 2 0 0 50 100 150 200 系列1 线性 (系列1) 线性 (系列1)
y = 0.0774x - 1.0241
回归分析的基本步骤:
画散点图 求回归方程 预报、决策
问题:有时散点图的各点并不集中在一条 直线的附近,仍然可以按照求回归直线方 程的步骤求回归直线,显然这样的回归直 线没有实际意义。在怎样的情况下求得的 回归直线方程才有实际意义? 即建立的线性回归模型是否合理? 如何对一组数据之间的线性相关程 度作出定量分析?
2
yi2 2b xi yi 2a yi b2 xi2 2ab xi na 2
类似地,我们可以推得,求回归 ˆ bx a 中系数a,b的一般公式: 方程 y
b
x y nx y ( x x)( y y)
i 1 n i i 2 i
n
2
70a 1910 b 1286 当 时,Q (a,b)取最小值 a 70b 230 6 b 1.6477 解得 , a 57.5568 ˆ 1.6477 x 57.5568 所求直线方程为y ˆ 66 当x 5时,y 故当气温为 50 C时,热茶销量约为66杯。
问题:
某小卖部为了了解热茶销售量与气温 之间的关系,随机统计并制作了某6天 卖出热茶的杯数与当天气温的对照表:
气温 26 0 /C 杯数 20
18
13
10
4
-1
24 34 38 50 64 如果某天的气温是-50C,你能根据这些 数据预测这天小卖部卖出热茶的杯数吗?
为了了解热茶销量与 气温的大致关系,我们 以横坐标x表示气温, 纵坐标y表示热茶销量, 建立直角坐标系.将表 中数据构成的6个数对 表示的点在坐标系内 标出,得到下图。今 后我们称这样的图为 散点图(scatterplot).
Q ( a, b) 1286b 2 6a 2 140ab 3820b 460a 10172 把a看作常数,那么Q是关于b的二次函数记为f(b) f(b) 1286b (140a 3820)b 6a 460a 10172 140a 3820 2 1286(b b ...........) 1286 70a 1910 2 1286(b ) ........... 1286 70a 1910 当b 时,f (b)取最小值 1286
超级链接
• 1.计算公式
相关系数
r=
(x
i=1 n i=1
n
i
- x)(yi - y)
n
x y
i1
n
i i
nxy
_ _
2 2 (x x) (y y) i i i=1
n 2 _ 2 n 2 _ 2 xi n x yi n y i1 i1
2 2
把b看作常数,那么Q是关于a的二次函数记为f(a) f (a) 6a (140b 460)a 1286b 3820b 10172
2 2
140b 460 6(a a ...........) 6 70b 230 2 6(a ) ........... 6 70b 230 当a 时,f (a)取最小值 6
x y nx y
i 1 8 i i
8
x
i 1
2 i
nx
2
9611.7 8 128.875 8.9Fra Baidu bibliotek 0.0774 2 137835 8 128.875
a y bx 8.95 0.0774 128.875 -1.0241 所以,所求线性回归方程为 y 0.0774x-1.0241
线性回归方程
问题引入:
有些教师常说:“如果你的数学成绩好,那 么你的物理学习就不会有什么大问题” 按照这种 说法,似乎学生的物理成绩与数学成绩之间也存 在着某种关系。你如何认识它们之间存在的关系?
数学成绩
物理成绩 其他因素 。
学习兴趣
学习时间
结论:变量之间除了函数关系外,还有
变量之间的关系 函数关系---变量之间是一种确定 性的关系.如:圆的面积S和半径r之间 的关系. 相关关系—变量之间有一定的联 系,但不能完全的用函数来表达. 一般 来说,身高越高,体重越重,但不能用一 个函数来严格地表示身高与体重之间 的关系.(非确定性关系)
线性相关关系: 像这样能用直线方程
ˆ bx a y
近似表示的相关关系叫做线性相关关系.
如果散点图中的点分布从整体 上看大致在一条直线附近我们就称 这两个变量之间具有线性相关关系
线性回归方程: 一般地,设有n个观察数据如下:
x x1 x2 x3
y y1 y2 y3
… …
xn
yn
当a,b使
ˆ bx a 为拟合 取得最小值时,就称 y 这n对数据的线性回归方程,该方程所表 示的直线称为回归直线
问题:举一两个现实生活中的问题,问题所涉及的
变量之间存在一定的相关关系。
(1)父母的身高与子女身高之间的关系 例:
(2)商品销售收入与广告支出经费之间的关系 (3)粮食产量与施肥量之间的关系
相关关系与函数关系的异同点: 相同点:均是指两个变量的关系. 不同点:函数关系是一种确定的关系; 相关关系是一种非确定关系.
选择怎样的直线近似地表示热茶销量与气 温之间的关系? 我们有多种思考方案: (1)选择能反映直线变化的两个点,例如取 (4,50),(18, 24) 这两点的直线; (2)取一条直线,使得位于该直线一侧和 另一侧的点的个数基本相同; (3)多取几组点,确定几条直线方程,再分 别算出各条直线斜率、截距的平均值,作为 所求直线的斜率、截距; ……………… 怎样的直线最好呢?
x, y, x , xi yi
i 1 2 i i 1
n
n
3.代入公式求a,b 4.列出直线方程
例题1:下表为某地近几年机动车辆数与交通 事故数的统计资料,请判断机动车辆数与交 通事故数之间是否具有线性相关关系,求出 线性回归方程;如果不具有线性相关关系,说明 理由.
解:在直角坐标系中画出数据的散点图, 直观判断散点在一条直线附近,故具有 线性相关关系.
2。对于线性相关的两个变量用什么方法来刻 画之间的关系呢? 最小二乘法 最小二乘法估计线性回归方程:
ˆ bx a y
b
x y nx y ( x x)( y y)
i 1 n i i
n
n
x nx
i 1 2 i
2
i 1
i
i
2 ( x x ) i i 1
.
Q ( y1 bx1 a)2 ( y2 bx2 a)2 ... ( yn bxn a)2
Q ( y1 bx1 a) ( y2 bx2 a) ... ( yn bxn a)
2 2 n n n n n i 1 i 1 i 1 i 1 i 1
2 2 2
2
1286b 6a 140ab 3820b 460a 10172
ˆ bx a 与各散点 Q(a, b) 是直线 y
在垂直方向(纵轴方向)上的距离的平 ˆ bx a 方和,可以用来衡量直线 y
与图中六个点的接近程度,所以,设法 取 a , b 的值,使 Q(a, b) 达到最小值. 这种方法叫做最小平方法(又称最小 二乘法) .
它们与表中相应的实际值应该越接近越好.
所以,我们用类似于估计平均数时的 思想,考虑离差的平方和
Q(a, b) (26b a 20) (18b a 24)
2 2
(13b a 34) (10b a 38)
2
2
(4b a 50) (b a 64)
• 2.相关系数的性质 • (1)|r|≤1. • (2)|r|越接近于1,相关程度越强;|r|越接 近于0,相关程度越弱.
散点图只是形象地描述点的分布情况,要想把握其特征, 必须进行定量的研究.
小结:
1.变量之间的两种关系:确定性关系与
相关关系
相关关系与函数关系有怎样的不同?
函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一 般的情况
建构数学
1.最小二乘法: ˆ bx a 的直线拟合散点图中 用方程为 y 的点,应使得该直线与散点图中的点最接近 那么,怎样衡量直线 y ˆ bx a 与图中六 个点的接近程度呢?
ˆ y
我们将表中给出的自变量
x 的六个值
代入直线方程,得到相应的六个值: 26b a,18b a,13b a,10b a, 4b a, b a
n
,
a y bx
数学3——统计 1. 画散点图 2. 了解最小二乘法的思想 3. 求回归直线方程 4. 用回归直线方程解决应用问题
n
x
i 1
nx
2
i 1
i
i
( x x)
i 1 i
n
,
2
a y bx
以上公式的推导较复杂,故不作推导,但它 的原理较为简单:即各点到该直线的距离的平 方和最小,这一方法叫最小二乘法。
求解线性回归问题的步骤: 1.列表( xi , yi , xi yi ),画散点图. 2.计算:
14 12 10 8 系列1 6 4 2 0 0 50 100 150 200
x
i 1 8 i 1
8
i
1031, x 128.875, yi 71.6, y 8.95,
i 1 8
8
2 x i 137835, xi yi 9611.7 i 1
将它们代入*式: b