用电量需求模型分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用电量需求模型分析

摘要:主成分回归法是采用多元统计中的主成分分析方法,是对高维变量系统进行最佳综合与简化,同时也客观地确定各个指标的权重,避免主观随意性,将多元问题综合成几个单一指标形式,是一种较好的建模方法。运用主成分分析法,提取影响用电需求的主要变量,建立用电量需求预测模型,并进行了实证运用。

关键词:主成分回归法;用电量;预测模型

Abstract: Using the principal component analysis method of multivariate statistic analysis, the Principal Component Regression (PCR) method optimally summarizes and simplifies the multivariable system, and objectively determines the weight of every index, avoiding subjectivity. The PCR method, which is good for modeling, was used to select the main variables affecting power demand, and to establish models for power demand forecasting. The application of the models is also introduced.

Key words: Principal Component Regression (PCR) method; power consuming amount; forecasting model.

引言

从社会经济的角度看,用电量是一个综合性很强的社会经济指标,反映了地区宏观经济的发展水平,是各行各业发展状况的一个景气指标。用电量的变化,是众多变化因素共同作用的结果。在对用电需求进行预测的时候,我们很难考虑到影响用电量变化的所有因素以及这些因素对用电量变化的影响程度。通常的做法是,选取主要影响因素,通过分解它们,达到预计的目标结果。这样的过程,其实就是提取主要变量,建立预测模型的过程。

数理统计提供了许多建立计量模型的方法,根据用电需求预测的具体情况,我们选用主成分分析法来建立需求模型,并将此方法过程实证运用。主成分分析法的工作目标,就是要在力保数据信息丢失最小的原则下,对高维变量空间进行降维处理;即在保证数据信息损失最小的前提下,经线性变换和舍弃一小部分信息,以少数的综合变量取代原始采用的多维变量。

1、 用主成分分析法构造回归模型

选取11个影响用电量需求的产品,这些产品的产量情况见表1

先将原始数据矩阵(包括因变量y)进行标准化处理。这是主成分分析的一个明显特征。每个主分量依赖于测量初始变量所用的尺度,当尺度改变时会得到不同的特征值,为了消除尺度影响,抽象出数据本质特征,需对初始变量进行标准化处理,使其方差为1。标准化处理方法如下。

s x x y i i /⎪⎭

⎝⎛-=-

(1)

式中,-

x 为样本均值;s 为样本标准差

在11个自变量所构成的相关矩阵的基础上计算其特征值,结果如表2。 如果按95%的信息选取主分量则可以选取两个主分量,即第一主分量(特征值为9. 4396)和第二主分量(特征值0. 5763),这两个主分量已经几乎包含了11个变量的全部信息量。

这两个特征值所对应的特征向量值为:

第一特征向量: (0. 3143, 0. 3026, 0. 3101, 0. 2783, 0. 2519, 0. 3109,

0. 3115, 0. 3076, 0.3034, 0. 3145, 0. 3050)

第二特征向量: (-0. 052, 0. 2945, -0.047,0.3696,0.7203, -0.1922, -0.1390, -0.2420,-0.3366, -0.1475, -0.0540)

表1 影响用电需求的11个主要产品的产量、用电量数据

相应得到两个新因子:

1z =0. 31431x ′+0. 30262x ′+0. 31013x ′+0.27834x ′+0. 25195x ′+0. 31096x ′+0. 31157x ′+0.30768x ′+0.30349x ′+0.314510x ′+0.305011x ′

2z =-0. 0521x ′+0. 29452x ′-0. 0473x ′+0·36964x ′+0. 72035x ′ -0. 19226x ′-0. 13907x ′-0. 24208x ′-0. 33669x ′-0. 147510x ′ -0. 054011x ′

由此,将11维变量降为2维,从而简化了回归分析的结构。将已标准化后的变量1x ′、2x ′…11x ′的代入1z 、2z 的表达式中,得到新的数据矩阵:(1i z 、

2i z ) (i=1, 2,…23)。将i y 值(用电量值,已作标准化变换处理)和新的数据1i z 、2i z 进行回归处理,得到如下的线性回归方程:

21049.0064.0z z y -=' (2) 式中,1z 、2z 是第一、第二主分量。复相关系数R=0. 9662。

主成分分析在简化结构、消除变量之间的相关性方面起到了明显的效果,但也给回归模型的解释带来一定的复杂性,因为主分量是原始变量的线性组合,最终仍需回到原始变量中去,才能给回归模型赋予经济意义上的解释,当然,这些线性系数可以看作权重系数,在某种意义上,这些权反映了各个变量的相对重要性的数量。

表2 11个自变量所构成的相关矩阵的特征值

2、用主成分分析筛选变量

为了使用电需求回归模型在实际中得到解释,使模型本身易于作结构分析、控制和预测,最好从原始变量所构成的子集合中选择最佳变量,构成最佳变量子集合。用主成分分析筛选变量,可以用较少的工作量来选择变量,获得选择变量子集合的效果。由特征值表可以看出最近一个特征值近似为零,该特征值所对应的特征向量为:(0. 2923, -0. 3325, 0. 2871, 0. 0291, 0. 1332, 0.5532, -0.3877, 0.0333, -0.0118, -0.4870,-0.087)

由于特征值近似于零,表示该主分量对总体的贡献最小(几乎没有贡献),而由此特征值所对应的特征向量中第六个分量所占的权数最大(0.5532),即是说在贡献最小的因子中所起主要作用的是第六个分量,据此剔除第六分量,即

x,

6

剔除的原则是:把特征向量中具有最大分量所对应的变量删除掉。

在11个变量当中,剔出第六个变量后,还剩10个变量,以此10个变量再做成分分析,得到表3中的特征值。

表3 筛选所得的10个自变量所构成的相关矩阵的特征值

最后一个特征值近似为零,该特征值所对应的特征向量为:

(0.61324, -0.47955, 0.07374, 0.01766, 0. 22703, -0.32605, 0.14907,

-0.18893,-0.41470, -0.01236)

此特征向量中,第一个分量所占的权数(0.6132)最大,按剔除原则,应该剔

相关文档
最新文档