电力负荷预测第七章 回归分析预测法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性 关系
Y X
● OLS估计
残差
ˆ E Y Y
ˆ Y XB
最小二乘法
Min{E ' E} Min{(Y Y ) '(Y Y )}
求导
EE (Y XB )(Y XB ) B B (Y Y 2Y BX ) XB XB B 2(Y ) 2( X ) B 0 X X
y
趋势线
1978 x y 20 195
1979 20 210
1980 26 244
1981 35 264
1982 52 294
1983 56 314
1984 81 360
1985 131 432
1986 149 481
1987 163 567
1988 232 655
1989 202 704
解:
(1)绘制散点图; ˆ ˆ ˆ (2)建立一元线性回归模型 y 0 a bx 0 ; (3)计算回归系数
主要内容
1.模型描述 2.参数估计 3.相关系数 4.显著性检验 5.预测及预测区间的确定 6.算例
1.模型描述
因变量 自变量
yi a bxi i
i 1, n
——一元线性回归模型
xi: 影响因素(可以控制或预先给定);
ε:各种随机因素对y的影响的总和,服从正态分布 ,即
ε~N(0, σ 2);
ˆ B ( X ) 1 X X Y
矩阵求导, 参看线性代数
所以
2. 多元线性回归模型的检验(R、F、t、DW)
(1)R检验
——通过复相关系数检验一组自变量X1,X2,…,Xm变 与因变量y之间的线性相关程度的方法,~。也称复相 关系数检验法。
na b xi yi a xi b xi xi yi
2
ˆ n xiyi xi yi b n xi 2 ( xi ) 2
y b. x ˆ ˆ a
i
i
n
n
3.相关系数——选择主要因素作模型的自变量的依据
●离差平方和的分解
离差——在一元线性回归模型中,观察值yi的取值是上下波动的,
●相互联系——先相关分析,后回归分析。
相 关 分 析
判断关联关系
初级
回 归 分 析
可建模推算预测
高级
●相关分析是回归分析的基础;
●序列相关并不一定能建立回归模型;
4.相关分析与回归分析的作用
●对数量关系的研究分析,深入认识现象之间 的相互依存关系。 ●通过对回归模型,进行预测和预报。
●用于补充缺少的资料。
Байду номын сангаас
● │R│<0.3或 R2 <0.09
说明自变量对x的变动对总离差的影响低于9%。低度相关;
● 0.3 ≤ │R│<0.7
说明自变量对x的变动对总离差的影响在9%~50%之间。中度相关;
4.显著性检验
●目的 ——检查所建立的一元线性方程,是否符合变量之间
的客观规律性,两变量之间是否具有显著的线性相关 关系?
第七章 回归分析预测法
一.概述 二.一元线性回归模型预测 三.多元线性回归模型预测 四.虚拟变量回归模型预测 五.非线性回归模型预测 六.自回归模型预测
教学要求
●清楚回归分析预测法的适用对象; ●清楚回归分析与相关分析的区别;
●掌握一元线性回归模型的参数估计与检验;
●了解多元线性回归模型的参数估计与检验; ●了解带虚拟变量的回归模型的应用条件; ●清楚非线性回归模型的建模方法;
ˆ b--直线yi的斜率,表示自变量增加(或减少)一个单位,因 ˆ 变量yi的相应增加(或减少)多少; b>0,x与y正相关;b<0,x与y负相关;
2.OLS参数估计(Ordinary Least Square )
●基本思想:
通过数学模型,配合一条较为理想的趋势线, 使得 原序列的观察值与估计值的离差平方和为最小;
( yi yi ) 2 min ˆ
t 1
n
●推导
ˆ Q ( yi yi ) ( yi a bxi ) 2
2 t 1 t 1
n
n
n Q 2 ( yi a bxi ) 0 a t 1 n Q 2 ( yi a bxi ) xi 0 b t 1
这种波动现象,~。
原因——自变量变动的影响,即x取值的不同;
其它因素的影响(包括观察和实践中产生的误差等);
对1个观察值,离差为 yi y 2 对n个观察值,离差为 ( yi y ) 记Lyy ( yi y )2 为总离差
Lyy ( yi y )
2
[( yi y i ) ( y i y )]
i i i i
n2
i
或 Sy 当x≥30,
ˆ (y y )
i
n2
y 0 t (n 2) S 0
2
y 0 z (n 2) S 0
2
5.算例
1)配合适当的模型并进行显著性检验; 2)取α =0.05, x0=249时的预测值与预测区间 ;
y——x的散点图 800 600 400 200 0 0 50 100 150 200 250 x
●方法 ——相关系数检验法(适用于一元线性回归方程)
●问题描述 ——相关系数的绝对值大到什么程度时?才能认为两
变量之间的相关关系是显著的,回归模型用来预测是 有意义的。
●检测标准 ——与观测值的个数有关;(n) ——与不同树枝的显著性水平有关;(α )
●步骤
step1:计算R; Step2:由回归模型的自由度(n-2)和给定的显著性水平 α,从相关系数表中查出临界值Rα( n-2); Step3:判断。 若│R│ ≥ Rα( n-2),说明两变量之间线性相关
负荷的变化空间示意图
几个基本问题
1. 回归的含义 2. 相关关系的概念
3. 相关分析与回归分析的区别与联系
4. 相关分析与回归分析的作用
5. 回归分析模型的种类
1.回归的含义 回归——研究自变量与因变量之间关系形式的分析方法。
长期 预测 GDP 电量需求
短期 预测
气象因素
自 变 量
系统负荷
因 变 量
(4)检验相关系数的显著性
(5)预测 计算估计标准误差
三.多元线性回归预测模型 1.多元线性回归模型 2.多元线性回归模型的检验 3.预测区间 4.算例 5.采用excel的求解
1.多元线性回归模型——多个影响因素的影响问题
yi 1 2 xi 2 ...... imxim i
离差项的物理含义:
Q1——由客观和实验中产生误差以及其它未加控制因素
引起的(未解释部分)。即:由那些未被考虑的
随机因素的影响产生的,且无法因回归方程的
建立而消失。
Q2——由于选择自变量x并建立线性回归方程而产生的,
可用回归模型的建立加以说明(已解释部分)
●可决系数R2
回归离差 R 总离差
( yi y )
2
1
( yi yi)2 ˆ ( yi y )2
R——为可决系数的平方根,是一元线性方程中衡量两个
变量之间相关程度的重要指标。
( yi y ) 2 ˆ
i 2
R2
( y y) ( y y) ( x x)( y y ) ] ( x x) [ ( x x) ( y y) [ ( x x)( y y )] ( x x) ( y y )
5.回归分析模型的种类
●自变量多少 : 一元与多元 ●模型线性性:
线性与非线性
●含虚拟变量:
普通回归与虚拟变量回归
(自变量为数量变量和品质变量)
●含滞后量:
无自回归、自回归
二. 一元线性回归预测模型
●定义: 对两个具有线性关系的变量,配合线性回归模型,根 据自变量的变动来预测因变量的平均发展趋势的方法,为 一元线性回归预测法。
总体 方差
yi:预测目标,由于受随机因素的影响,是一个以回归直 线上对应值为中心的正态随机变量,即y~N(a+bx, σ 2 );
ˆ yi a bxi
——为一组观察值(xi,yi)的 散点状态的估计式;
ˆ yi --yi的估计值,对应与每一个自变量xi , 都可得到一估计值;
ˆ a--直线yi 在y轴上的截距,它是xi =0时,yi的估计值;
●预测区间 ——在一定的显著性水平上,依据数理统计方法计算出包含 预测未来真实值的某一区间范围,~。,即:
y 0 t (n 2)S 0 2
1 ( x 0 x) 2 S 0 1 Sy 2 n ( xi x) 2
Sy ˆ ˆ y a y b x y
2
R2——在总的离差中,由自变量x变动所引起的百分比。
它是评价两个变量之间线性相关关系强弱的一个 重要指标。
R2
( yi y ) 2 ˆ
( yi y )
2
1
ˆ ( yi yi ) 2 ( yi y ) 2
0≤R2≤1
●相关系数R:
R
( yi y )2 ˆ
关系显著,检验通过,回归模型可用于预测;
若 │R│ < Rα( n-2),说明两变量之间线性相关 关系不显著,检验不通过,不能用于预测,需重新 加以处理;
5.预测值与预测区间
●预测值 ˆ ˆ ˆ ——在一元线性回归模型 y 0 a bx 0 中,代入给定的自变 ˆ 量x0,可求的一个对应的回归预测值 y 0 ,有时称之为 点估计值;
2 i
i i 2 i 2 i i i i 2 2 2 i i
[a bxi a bx ]2
2 2
b 2 ( xi x ) 2 ( yi y ) 2
yi y b xi x
R
ˆ ( x x )( y y ) (x x ) ( y y)
教学重点
●相关分析与回归分析的基本概念;
●一元线性回归模型的建立与参数检验;
教学难点
●相关系数的含义
●参数检验的作用
一.概述
回归分析预测法——
从各种现象的相互关系出发,通过对与预测对象有
联系的现象的变动趋势分析,推算预测对象未来状态数 量表现的一种方法。
负荷y
时间
x1 xj
影响 因素
y=f(t)—时间序列模型 y=f(x) —关联序列模型
2.相关关系的概念
●函数关系:严格的依存关系,有数学表达式。
●相关关系:非严格的,不确定的依存关系。
确定性问题 (函数关系)
不确定性问题 (相关关系)
相关关系的特点
●现象之间确定存在数量上的客观内在关系。
表现在:一个现象发生数量上的变化,要影响另一现象也相应
地发生数量上的变化。
●现象之间的依存关系不是确定的,具有一定的随机性。 表现在:给定自变量的一个数值,因变量晖有若干数值和它对
2
2
为0, 证明(略)
2
( yi y i ) ( yi y ) 2 ( yi yi )( yi y ) ( yi y i ) 2 ( yi y ) 2 Q1 Q2
Q1 ( yi y i ) 2 剩余离差(或残差平方和) Q2 ( yi y ) 2 回归离差(或回归平方和)
R=0
说明回归离差为0,即自变量x的变动对总离差毫无影响。零相关;
●
│R│ =1
说明回归离差等于总离差,即总离差的变化完全由自变量变化所引 起的。完全相关(退化成函数关系)
●
0< │R│ <1
说明自变量对x的变动对总离差有部分影响。普通相关;
● │R│ >0.7或 R2 >0.49
说明自变量对x的变动对总离差的影响占一半以上。高度相关;
i i
2
2
——积差法计算公式
i
i
——可不需要先求出回归模型中的剩余离差来求, 直接从样本数据中计算得到,实际工作中带 来方便。
若代入平均数,则R的计算变为
R n xi ( xi )
2
n xi yi xi yi
2
2
n yi ( yi )
2
R的讨论(-1≤R≤1 )
●
R为正则正相关 R为负则负相关
应,且因变量总是遵循一定规律围绕着这些数值的平 均数上下波动。
3.相关分析与回归分析的区别与联系
●相同点:研究及测度2个及以上变量之间的关系。
●不同点: 相关分析
①2个随机变量及以上紧密程度。
直线相关—相关系数
曲线相关—相关指数 多元相关—复相关系数
②不分自变量与因变量。
回归分析
①几个随机变量与其它几个普通变量之间的数量变动关系。 ②需区分自变量与因变量。
Y X
● OLS估计
残差
ˆ E Y Y
ˆ Y XB
最小二乘法
Min{E ' E} Min{(Y Y ) '(Y Y )}
求导
EE (Y XB )(Y XB ) B B (Y Y 2Y BX ) XB XB B 2(Y ) 2( X ) B 0 X X
y
趋势线
1978 x y 20 195
1979 20 210
1980 26 244
1981 35 264
1982 52 294
1983 56 314
1984 81 360
1985 131 432
1986 149 481
1987 163 567
1988 232 655
1989 202 704
解:
(1)绘制散点图; ˆ ˆ ˆ (2)建立一元线性回归模型 y 0 a bx 0 ; (3)计算回归系数
主要内容
1.模型描述 2.参数估计 3.相关系数 4.显著性检验 5.预测及预测区间的确定 6.算例
1.模型描述
因变量 自变量
yi a bxi i
i 1, n
——一元线性回归模型
xi: 影响因素(可以控制或预先给定);
ε:各种随机因素对y的影响的总和,服从正态分布 ,即
ε~N(0, σ 2);
ˆ B ( X ) 1 X X Y
矩阵求导, 参看线性代数
所以
2. 多元线性回归模型的检验(R、F、t、DW)
(1)R检验
——通过复相关系数检验一组自变量X1,X2,…,Xm变 与因变量y之间的线性相关程度的方法,~。也称复相 关系数检验法。
na b xi yi a xi b xi xi yi
2
ˆ n xiyi xi yi b n xi 2 ( xi ) 2
y b. x ˆ ˆ a
i
i
n
n
3.相关系数——选择主要因素作模型的自变量的依据
●离差平方和的分解
离差——在一元线性回归模型中,观察值yi的取值是上下波动的,
●相互联系——先相关分析,后回归分析。
相 关 分 析
判断关联关系
初级
回 归 分 析
可建模推算预测
高级
●相关分析是回归分析的基础;
●序列相关并不一定能建立回归模型;
4.相关分析与回归分析的作用
●对数量关系的研究分析,深入认识现象之间 的相互依存关系。 ●通过对回归模型,进行预测和预报。
●用于补充缺少的资料。
Байду номын сангаас
● │R│<0.3或 R2 <0.09
说明自变量对x的变动对总离差的影响低于9%。低度相关;
● 0.3 ≤ │R│<0.7
说明自变量对x的变动对总离差的影响在9%~50%之间。中度相关;
4.显著性检验
●目的 ——检查所建立的一元线性方程,是否符合变量之间
的客观规律性,两变量之间是否具有显著的线性相关 关系?
第七章 回归分析预测法
一.概述 二.一元线性回归模型预测 三.多元线性回归模型预测 四.虚拟变量回归模型预测 五.非线性回归模型预测 六.自回归模型预测
教学要求
●清楚回归分析预测法的适用对象; ●清楚回归分析与相关分析的区别;
●掌握一元线性回归模型的参数估计与检验;
●了解多元线性回归模型的参数估计与检验; ●了解带虚拟变量的回归模型的应用条件; ●清楚非线性回归模型的建模方法;
ˆ b--直线yi的斜率,表示自变量增加(或减少)一个单位,因 ˆ 变量yi的相应增加(或减少)多少; b>0,x与y正相关;b<0,x与y负相关;
2.OLS参数估计(Ordinary Least Square )
●基本思想:
通过数学模型,配合一条较为理想的趋势线, 使得 原序列的观察值与估计值的离差平方和为最小;
( yi yi ) 2 min ˆ
t 1
n
●推导
ˆ Q ( yi yi ) ( yi a bxi ) 2
2 t 1 t 1
n
n
n Q 2 ( yi a bxi ) 0 a t 1 n Q 2 ( yi a bxi ) xi 0 b t 1
这种波动现象,~。
原因——自变量变动的影响,即x取值的不同;
其它因素的影响(包括观察和实践中产生的误差等);
对1个观察值,离差为 yi y 2 对n个观察值,离差为 ( yi y ) 记Lyy ( yi y )2 为总离差
Lyy ( yi y )
2
[( yi y i ) ( y i y )]
i i i i
n2
i
或 Sy 当x≥30,
ˆ (y y )
i
n2
y 0 t (n 2) S 0
2
y 0 z (n 2) S 0
2
5.算例
1)配合适当的模型并进行显著性检验; 2)取α =0.05, x0=249时的预测值与预测区间 ;
y——x的散点图 800 600 400 200 0 0 50 100 150 200 250 x
●方法 ——相关系数检验法(适用于一元线性回归方程)
●问题描述 ——相关系数的绝对值大到什么程度时?才能认为两
变量之间的相关关系是显著的,回归模型用来预测是 有意义的。
●检测标准 ——与观测值的个数有关;(n) ——与不同树枝的显著性水平有关;(α )
●步骤
step1:计算R; Step2:由回归模型的自由度(n-2)和给定的显著性水平 α,从相关系数表中查出临界值Rα( n-2); Step3:判断。 若│R│ ≥ Rα( n-2),说明两变量之间线性相关
负荷的变化空间示意图
几个基本问题
1. 回归的含义 2. 相关关系的概念
3. 相关分析与回归分析的区别与联系
4. 相关分析与回归分析的作用
5. 回归分析模型的种类
1.回归的含义 回归——研究自变量与因变量之间关系形式的分析方法。
长期 预测 GDP 电量需求
短期 预测
气象因素
自 变 量
系统负荷
因 变 量
(4)检验相关系数的显著性
(5)预测 计算估计标准误差
三.多元线性回归预测模型 1.多元线性回归模型 2.多元线性回归模型的检验 3.预测区间 4.算例 5.采用excel的求解
1.多元线性回归模型——多个影响因素的影响问题
yi 1 2 xi 2 ...... imxim i
离差项的物理含义:
Q1——由客观和实验中产生误差以及其它未加控制因素
引起的(未解释部分)。即:由那些未被考虑的
随机因素的影响产生的,且无法因回归方程的
建立而消失。
Q2——由于选择自变量x并建立线性回归方程而产生的,
可用回归模型的建立加以说明(已解释部分)
●可决系数R2
回归离差 R 总离差
( yi y )
2
1
( yi yi)2 ˆ ( yi y )2
R——为可决系数的平方根,是一元线性方程中衡量两个
变量之间相关程度的重要指标。
( yi y ) 2 ˆ
i 2
R2
( y y) ( y y) ( x x)( y y ) ] ( x x) [ ( x x) ( y y) [ ( x x)( y y )] ( x x) ( y y )
5.回归分析模型的种类
●自变量多少 : 一元与多元 ●模型线性性:
线性与非线性
●含虚拟变量:
普通回归与虚拟变量回归
(自变量为数量变量和品质变量)
●含滞后量:
无自回归、自回归
二. 一元线性回归预测模型
●定义: 对两个具有线性关系的变量,配合线性回归模型,根 据自变量的变动来预测因变量的平均发展趋势的方法,为 一元线性回归预测法。
总体 方差
yi:预测目标,由于受随机因素的影响,是一个以回归直 线上对应值为中心的正态随机变量,即y~N(a+bx, σ 2 );
ˆ yi a bxi
——为一组观察值(xi,yi)的 散点状态的估计式;
ˆ yi --yi的估计值,对应与每一个自变量xi , 都可得到一估计值;
ˆ a--直线yi 在y轴上的截距,它是xi =0时,yi的估计值;
●预测区间 ——在一定的显著性水平上,依据数理统计方法计算出包含 预测未来真实值的某一区间范围,~。,即:
y 0 t (n 2)S 0 2
1 ( x 0 x) 2 S 0 1 Sy 2 n ( xi x) 2
Sy ˆ ˆ y a y b x y
2
R2——在总的离差中,由自变量x变动所引起的百分比。
它是评价两个变量之间线性相关关系强弱的一个 重要指标。
R2
( yi y ) 2 ˆ
( yi y )
2
1
ˆ ( yi yi ) 2 ( yi y ) 2
0≤R2≤1
●相关系数R:
R
( yi y )2 ˆ
关系显著,检验通过,回归模型可用于预测;
若 │R│ < Rα( n-2),说明两变量之间线性相关 关系不显著,检验不通过,不能用于预测,需重新 加以处理;
5.预测值与预测区间
●预测值 ˆ ˆ ˆ ——在一元线性回归模型 y 0 a bx 0 中,代入给定的自变 ˆ 量x0,可求的一个对应的回归预测值 y 0 ,有时称之为 点估计值;
2 i
i i 2 i 2 i i i i 2 2 2 i i
[a bxi a bx ]2
2 2
b 2 ( xi x ) 2 ( yi y ) 2
yi y b xi x
R
ˆ ( x x )( y y ) (x x ) ( y y)
教学重点
●相关分析与回归分析的基本概念;
●一元线性回归模型的建立与参数检验;
教学难点
●相关系数的含义
●参数检验的作用
一.概述
回归分析预测法——
从各种现象的相互关系出发,通过对与预测对象有
联系的现象的变动趋势分析,推算预测对象未来状态数 量表现的一种方法。
负荷y
时间
x1 xj
影响 因素
y=f(t)—时间序列模型 y=f(x) —关联序列模型
2.相关关系的概念
●函数关系:严格的依存关系,有数学表达式。
●相关关系:非严格的,不确定的依存关系。
确定性问题 (函数关系)
不确定性问题 (相关关系)
相关关系的特点
●现象之间确定存在数量上的客观内在关系。
表现在:一个现象发生数量上的变化,要影响另一现象也相应
地发生数量上的变化。
●现象之间的依存关系不是确定的,具有一定的随机性。 表现在:给定自变量的一个数值,因变量晖有若干数值和它对
2
2
为0, 证明(略)
2
( yi y i ) ( yi y ) 2 ( yi yi )( yi y ) ( yi y i ) 2 ( yi y ) 2 Q1 Q2
Q1 ( yi y i ) 2 剩余离差(或残差平方和) Q2 ( yi y ) 2 回归离差(或回归平方和)
R=0
说明回归离差为0,即自变量x的变动对总离差毫无影响。零相关;
●
│R│ =1
说明回归离差等于总离差,即总离差的变化完全由自变量变化所引 起的。完全相关(退化成函数关系)
●
0< │R│ <1
说明自变量对x的变动对总离差有部分影响。普通相关;
● │R│ >0.7或 R2 >0.49
说明自变量对x的变动对总离差的影响占一半以上。高度相关;
i i
2
2
——积差法计算公式
i
i
——可不需要先求出回归模型中的剩余离差来求, 直接从样本数据中计算得到,实际工作中带 来方便。
若代入平均数,则R的计算变为
R n xi ( xi )
2
n xi yi xi yi
2
2
n yi ( yi )
2
R的讨论(-1≤R≤1 )
●
R为正则正相关 R为负则负相关
应,且因变量总是遵循一定规律围绕着这些数值的平 均数上下波动。
3.相关分析与回归分析的区别与联系
●相同点:研究及测度2个及以上变量之间的关系。
●不同点: 相关分析
①2个随机变量及以上紧密程度。
直线相关—相关系数
曲线相关—相关指数 多元相关—复相关系数
②不分自变量与因变量。
回归分析
①几个随机变量与其它几个普通变量之间的数量变动关系。 ②需区分自变量与因变量。