某地区电力负荷数据分析与预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(封面格式)
报名序号:1249
论文题目:某地区电力负荷数据分析与预测
指导教师:唐玲
参赛学校:安徽建筑大学南区
证书邮寄地址、邮编、收件人:
地址: 安徽合肥市经开区紫云路292号安徽建筑大学南区邮政编码:230061 收件人姓名: 陈富联系电话: 7
报名序号:1249
论文题目:某地区电力负荷数据分析与预测
某地区电力负荷数据分析与预测
摘要
针对两个地区历史数据分析及未来数据相关预测,本文用统计学相关理论为基础对两个地区历史数据进行探索分析,深入并直观得描述了数据得分布情况;同时利用时间序列乘积季节模型与LMBP神经网络模型分别对未来数据进行预测并进行相关误差分析,分别得到不同预测方法下得预测结果。
对于问题一,本文对两个地区2014年1月1日—2014年12月31日得负荷数据进行挖掘分析,选取描述数据集中趋势得均值与中位数统计量、描述数据分布离散程度得方差与离散系数统计量以及描述数据分布偏态与峰度得偏度系数与峰度系数统计量来描述各地区全年得日最高负荷、日最低负荷、日峰谷差、日负荷率指标得分布情况;绘制出了两地区2014年全年负荷持续曲线;结合上述结果,分析出地区2负荷变化数据波动较平缓,初步预判地区2得负荷可以获得更准确得预测结果。
对于问题二,本文根据2012年1月1日至2014年12月31日得数据,用偏最小二乘法,分别对日最高负荷、日最低负荷、日平均负荷与各气象因素关系进行回归分析,得出6个多元线性回归模型,同时得到各个回归模型得离差平方与,以离差平方与得大小来反映回归误差得大小;使用简单相关系数检验法,通过各个气象因素相互之间得相关系数矩阵,得出最高温度、最低温度、平均温度这三个因素相关系数较高,存在多重共线性;再经过变量得显著性检验,得出若要用气象因素来提高负荷预测精度,优先推荐平均温度、降雨量、湿度这三个气象因素得结论。
对于问题三,考虑到历史电力负荷数据具有明显得周期性,建立时间序列乘积季节模型,对两个地区2015年1月11日至17日共7天得电力负荷进行预测,得出负荷预测结果见附件。由于模型中各个参数均通过了参数得显著性检验,残差序列通过了残差检验为白噪声序列,体现了模型对原序列得信息提取十分充分,所以在不知道实际负荷数据得情况下,有充分理由判断预测结果得准确度就是较高得。
对于问题四,考虑最日高温度等5个天气因素,利用包含5个输入层,7个隐含层与一个输出层得LMBP神经网络预测模型在5个天气因素影响下,再次对两个地区2015年1月11日至17日共7天得电力负荷进行预测,得出负荷预测结果见附件。
对于问题五,综合上述结果参数,并同时引用股票分析中得黄金分割线对两个地区负荷数据规律优劣进行评价。得出地区2得数据规律性优于地区1得结论。关键词:描述性统计,偏最小二乘回归,时间序列乘积季节模型,LMBP
§1 问题得提出
一、背景知识
短期负荷预测就是电力系统运行与分析得基础,对机组组合、经济调度、安全校核等具有重要意义。提高负荷预测精度,就是保障电力系统优化决策科学性得重要手段。现代电力系统中,构成电力负荷得用电器种类繁多,空调等受气象条件影响得负荷占比持续增高,气象因素(温度、湿度、降雨量等)对电力系统负荷得影响愈显突出。考虑气象因素成为调度中心进一步改进负荷预测精度得主要手段之一。
二、相关试验数据
已知地区1、地区2从2009年1月1日至2015年1月10 日得电力负荷数据(每15min 一个采样点,每日96点,量纲为MW)以及2012年1月1至2015年1月17 日得气象因素数据(日最高温度、日最低温度、日平均温度、日相对湿度以及日降雨量),详见附件1数据、xlsx。
三、要解决得问题
1、请分析两个地区2014年1月1日2014年12月31日得负荷数据,统计各地区全年得日最高负荷、日最低负荷、日峰谷差、日负荷率指标得分布情况,并绘制两地区2014年全年得负荷持续曲线;结合上述结果,分析两地区负荷变化得主要差异;初步预判哪个地区得负荷可以获得更准确得预测结果,说明您得理由。
2、根据2012年1月1日至2014年12月31日得数据,分别对日最高负荷、日最低负荷、日平均负荷与各气象因素得关系进行回归分析,分析回归误差;如果要用气象因素来提高负荷预测精度,在诸气象因素中,您优先推荐哪个(或哪几个)?简要说明理由。
3、请根据已知负荷数据,构建预测方法,对两个地区2015年1月11日至17日共7天得电力负荷进行预测(间隔15min),给出负荷预测结果(提交两个地区96*7负荷预测结果数据,具体要求见附录1);在不知道实际负荷数据得条件下,您对预测结果得准确度有何推断,请说明理由。
4、如果已获得2015年1月11日至17日得气象因素数据,您能否构建计及气象因素得负荷预测方法,对两个地区2015年1月11 日至17日共7天得电力负荷再次进行预测(间隔15min),给出预测结果(提交两个地区96*7负荷预测结果数据,具体要求见附录1);与原有得预测结果相比,您认为计及气象因素影响得负荷预测结果精度得到改善了吗?有何证据?请说明理由。
5、综合上述计算结果,您如何评价两地区负荷规律性得优劣?您还有什么证据可以佐证两地区负荷整体规律性优劣得判断?
§2 问题得分析
1)对于问题一,本文使用统计学方法,并利用MATLAB对所给数据进行处理,分别绘制出日最高负荷、日最低负荷、日峰谷差、日负荷率四个指标分别随时间变化得曲线图,并且分别得出数据得集中趋势、数据分布离散程度与数据得分布偏态与峰度3个大方面来描述统计分布情况。
2)对于问题二,本文对日最高负荷、日最低负荷、日平均负荷与各气象因素得关系进行偏最小二乘多元回归分析,在EVIEWS软件中分别得出两个地区6个线
性回归方程,并同时对线性回归方程误差进行了分析。
3)对于问题三,要求由已知负荷数据对两个地区2015年1月11日至17日共7天得电力负荷进行预测。相对于已知数据来说,预测属于短期预测。故本文利用时间序列季节乘积模型对这7天数据进行预测。
4)对于问题四,要求利用2015年1月11日至17日得气象因素数据构建计及气象因素得负荷预测方法,同样得对两个地区2015年1月11日至17日共7天得电力负荷再次进行预测。本文在MATLAB中利用LMBP算法进行7天电力负荷再次预测。
5)对于问题五,要求综合上述计算结果,比较两地区负荷数据得优劣。本文通过选取上述计算结果日峰谷差方差等几项具有代表性得参数来对两地区数据规律性进行综合评价,并结合股票中黄金分割线思想来进一步佐证评价结果。
§3模型假设
1)假设所有数据来源真实可靠;;
2)假设电负荷量只受题目所给五项气象因素影响
3)在建立乘积季节模型,序列周期选取时,假设一年都就是365天;
§4名词解释与符号说明
一、名词解释
1)日最高负荷:典型日中记录得负荷中,数值最大得一个;
2)日最低负荷:典型日中记录得负荷中,数值最小得一个;
3)日峰谷差:日最高负荷与最低负荷之差;
4)日负荷率:日平均负荷与日最大负荷得比值;
5)年持续负荷曲线:按一年中系统负荷得数值大小及其持续小时数顺序绘制得曲线;
6)离散系数:一组数据标准差与其均值得比,也称为标准差系数,就是测度数据离散程度得相对指标;
7)偏度系数:就是描述分布偏离对称性程度得一个特征数。当分布左右对称时,偏度系数为0。当偏度系数大于0时,即重尾在右侧时,该分布为右偏。当偏度系数小于0时,即重尾在左侧时,该分布左偏。
8)峰度系数:峰度就是用来反映频数分布曲线顶端尖峭或扁平程度得指标。有时两组数据得算术平均数、标准差与偏态系数都相同,但她们分布曲线顶端得高耸程度却不同。
二、符号说明
序号符号含义
1 X、Y 解释变量、被解释变量
2 、解释变量得第一主成分
3 表示解释变量矩阵X中第j个变量得第i个样本值
4 表示被解释变量矩阵Y中第i个样本值
5 表示标准化后得数值,
6 表示标准化后得数值