风电功率波动性的分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): B
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):东北电力大学
参赛队员(打印并签名) :1. 张盛梅
2. 齐天利
3. 孔晖
指导教师或指导教师组负责人(打印并签名):张杰
日期2014 年 8 月 20日赛区评阅编号(由赛区组委会评阅前进行编号):
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):
风电功率波动性的分析
摘要
风电机组的发电功率主要与风速有关,由于风的不确定性、间歇性以及风电场内各机组间尾流的影响,使得风力发电机不能像常规发电机组那样根据对电能的需求来确定发电。
研究风电功率的波动特性,不论对改善风电预测精度还是克服风电接入对电网的不利影响都有重要意义。
对于问题1a,我们利用MATLAB软件做出了3日内的功率波动图,发现功率的波动曲线上下不断震荡,所以我们采用一段数据来进行分析(即从波谷到波峰再到波谷),利用MATLAB软件拟合工具箱中的dfittool对数据进行曲线拟合,并选出几种较为符合的概率分布,根据对数似然函数值的大小确定最佳的概率分布。
对于问题1b,利用MATLAB软件编程,将数据每天筛选出一个数据,利用SPSS软件对数据绘制P-P图,并与选出的最好的概率分布图作比较,求出其分布参数。
对于问题2,将数据每隔12个数据筛选出一个数据,并用问题1a的方法绘制曲线拟合和概率分布的比较,选出最好的概率分布,并计算每种分布下的数值特征。
对于问题3,首先利用MATLAB软件绘制出时间窗宽分别为5s和1min时的功率波动图,发现两者的概率的波动情况基本相同,分别计算两种情况下的信息波动率以及信息波动损失率,得出结论为两者的波动基本相同,但是时间窗宽为5s时会有局部信息损失。
对于问题4,我们筛选出时间窗宽为1min、5min、15min的数据,并利用MATLAB软件进行曲线拟合以及概率分布的拟合,并计算出每种概率分布下的特征值,用相同的方法求1min和5min时的信息波动率,计算得出信息波动损失率为0.27%。
对于问题5,采用灰色预测模型对数据进行预测。
利用5min和15min的功率预测之后的功率走向,并分析方法的优缺点。
论文的创新之处有:
模型中利用MATLAB软件编程的方法进行数据的筛选,可以筛选出任意时间窗宽的数据。
关键词:风电机组;概率分布;功率预测;SPSS
1.问题的重述
风电机组发出的功率主要与风速有关。
由于风的不确定性、间歇性以及风电场内各机组间尾流的影响,使得风电机的功率并不稳定。
风电功率的随机波动被认为是对电网带来不利影响的主要因素,研究风电功率的波动特性,不论对改善风电预测精度还是克服风电接入对电网的不利影响都有重要意义。
附件给出了某风电场中20台1.5MW风电机组30天的风电功率数据(单位为kW,间隔为5s),请做如下分析。
1.任选5个风电机组:
a)在30天的范围内,分析机组i的风电功率P i5s(t k) 波动符合哪几种概率分布?分别计算数值特征并进行检验,推荐最好的分布并说明理由。
比较5个机组分布的异同。
b)用以上确定的最好的概率分布,以每日为时间窗宽,对5个风电功率分别计算30个时段的概率分布参数并做出检验;试比较不同机组(空间)、不同时段(时间)风电功率波动的概率分布以及与30天总体分布之间的关系,由此说明了什么?
2.在风电场实际运行中,由于数据存储和管理等方面的限制,难以集中记录全部风电机组功率的秒级数据。
通常用分钟级间隔乃至更长间隔的数据来描述风电功率波动。
试从上述5台机的风电功率数据中提取出间隔为1分钟的数据序列P i m(t k)。
对于这5个序列,再做题1a)的分析。
3.试分析用P i m(t k)代替P i5s(t k)时,损失了那些风电功率波动信息?如何度量?有何影响?从上述全部计算中你能得出什么一般性的结论?
4.设全场20台风电机的总功率PΣ(t)=ΣP i(t),试计算时间间隔为1分钟、5
分钟和15分钟的总功率序列P
Σm(t
k
),PΣ5m(t k),PΣ15m(t k),分析其波动的概率分
布数值特征。
若以P
Σ5m(t
k
)代替PΣm(t k)来表征全场风电功率波动,损失了什么信
息?如何度量?有何影响?
5.如果分别采用PΣ5m(t k)和PΣ15m(t k)作为样本来预测未来4小时(每15分钟一个点)风电场的总功率,请设计合适的预测模式(可取适当时段的数据作为历史数据建模,后续数据作为实际风电功率用于检验预测误差),分别给出不少于7天的滚动预测结果,分析比较2种方式的预测误差。
2.问题的分析
对于问题1a,我们利用EXCEL软件筛选出数据丢失最少的五组数据进行研究,从附件中的数据我们可以看出是很多次风的波动引起的数据的变化,我们采用一次风的波动(即从风速的波谷到波峰再到波谷)来研究风电机i功率的分布规律。
利用MATLAB软件拟合工具箱中dfittool对数据进行曲线拟合,并分析确定最符合的概率分布。
对于问题1b,我们将采样时间间隔改为1分钟,利用MATLAB编程进行数据的筛选,将筛选出来的数据用上一问中选出最好的概率分布在SPSS上绘制P-P 图,并研究每日的概率分布规律以及总体之间的关系。
对于问题2,利用MATLAB软件每隔12个数据筛选出一个数据,然后用和问题1a同样的方法绘制概率分布图的拟合以及特征值的计算。
对于问题3,首先绘制出时间窗宽为5s 和1min 时的功率波动图,根据图像的变化直观判断,然后定义信息波动率来计算两种情况下的变化值,进而比较不同时间窗宽对信息波动率的影响。
对于问题4,我们选取20台机组的相同时间段进行数据的筛选,将筛选出来的数据进行曲线拟合和概率分布的拟合,并计算各种分布下的特征值,以及用同样的方法计算信息波动损失率。
对于问题5,我们采用灰色模型进行功率的预测,利用5min 和15min 的功率预测之后的功率走向,并分析方法的优缺点。
3.模型的假设与符号说明
3.1 模型的假设
(1)假设模型所采取的数据均准确,附件中所给定的数据也均为准确数据; (2)假设采样间隔改变时不影响数据的准确性;
(3)假设附件中丢失的数据对统计结果及概率分布没有影响。
3.2 符号说明
符号
含义
)(5k s i t P 采样间隔为5秒时风电机组i 的功率 )(k m i t P 采样间隔为1分钟时风电机组i 的功率 )(k m t P ∑ 采样间隔为1分钟时全场的风电功率 )(5k m t P ∑
采样间隔为5分钟时全场的风电功率 )(15k m t P ∑
采样间隔为15分钟时全场的风电功率
r C
信息波动率
4.模型的建立与求解
4.1 问题1的模型建立与求解 4.1.1 问题1a 的模型建立与求解
对于风电机的选取,我们利用EXCEL 软件筛选出数据丢失最少的五组数据,分别为7、9、11、13、14组风电机组。
对于数据的选取,首先利用MATLAB 软件对机组7功率数据中1-3天的数据进行曲线拟合,得到结果见图1。
x 10
4
020*******
8001000x
y
图1 机组7风电功率1~3日曲线拟合图
由图1可以看出,风电机组的功率随着风速的变化而变化,其功率是随时间在不断波动的。
因此我们选取风速波动的中的一次完整波动进行研究,即选取附件数据中由波谷到波峰再到波谷的一段数据。
对选定的数据进行曲线拟合,利用MATLAB 概率密度拟合工具箱dfittool 得出五台风电机组的功率概率直方图及正态分布、t 分布、log-logistic 分布、Weibull 分布的概率分布图分别见图2-图6。
-4
Data
D e n s i t y
图2 机组7的概率分布图
机组7的这四种概率分布是数据较为接近的分布,这四种概率分布的数值特征可以通过MATLAB 计算得出,结果见表1。
表1 机组7概率分布的数值特征
从表1中数据我们可以看出,四种概率分布的数值特征差别不大,正态分布的方差最小,Log-Logistic 分布的对数似然函数值最大,从图像上来看,也可以看出Log-Logistic 分布的拟合效果最好,所以,我们推荐机组7的概率分布为Log-Logistic 分布。
-4
Data
D e n s i t y
图3 机组9的概率分布图
机组9的概率分布比较符合t 分布、正太分布、gamma 分布以及weibull 分布,这四种分布的数值特征通过MATLAB 软件可以计算,计算结果见表2。
表2 机组9的概率分布数值特征表
从表2可以看出,Gamma 分布的方差最小,Gamma 分布的对数似然函数值也是最大的,从概率分布图中也可以看出,Gamma 分布的曲线最贴近数据的拟合曲线,所以,机组9我们推荐Gamma 分布。
-4
Data
D e n s i t y
图4 机组11的概率分布图
机组11的最符合的概率分布为正态分布、weibull 分布、logistic 分布、Birnbaum-Saunders 分布,利用MATLAB 软件计算其数值特征,计算结果见表3。
表3 机组11的概率分布的数值特征表
从表3的计算结果可以看出,Logistic 分布的方差最小,且对数似然函数值最大,从概率分布图也可以看出,Logistic 分布的概率曲线最符合数据的拟合曲线,所以对于机组11我们推荐Logistic 分布。
-4
Data
D e n s i t y
图5 机组13的概率分布图
机组13较符合的概率分布分别为t 分布、正态分布、weibull 分布、logistic 分布,通过MATLAB 计算结果见表4。
表4 机组13概率分布的数值特征表
从表4的计算结果显示出,Logistic 分布的方差最小,weibull 分布的对数似然函数值最小,结合图5的概率分布图,对于机组13我们推荐weibull 分布。
-4
Data
D e n s i t y
图6 机组14的概率分布图
机组14比较符合的概率分布有t 分布、正态分布、weibull 分布、logistic 分布,利用MATLAB 计算出结果见表5。
表5 机组14概率分布的数值特征
从表5的计算结果显示出,weibull 分布的对数似然函数值最大,结合图6的概率分布图,对于机组14,我们推荐weibull 分布。
通过上述分析,我们得到了五个机组的最适合的概率分布见表6。
表6 五个机组最符合的概率分布
4.1.2 问题1b的模型建立与求解
若以每日为时间窗宽,我们需要对数据进行筛选,筛选的原则为取每日数据的平均值作为该天的风电功率数据。
对于机组7、9、11、13、14每天筛选出一个数据,五个风电机组30天的数据见表7。
表7 五个风电机组30天数据表
对于机组7,我们选出的最好的分布为weibull分布,用SPSS软件对30天的数据绘制P-P图,并与weibull分布图作比较,绘制图见图7。
图7 机组7的weibull P-P图
机组7的分布参数计算结果见表8。
表8机组7P-P图的分布参数
上表中的形状参数是指密度函数曲线的形状,当m=1时,Weibull分布就是指数分布;当0<m<1时,图像为以f(t)轴(y轴)和t轴(x轴)为渐近的曲线;当m>1时,图像有一个峰,随着m>1的增大,峰值越高,图像越窄;标度参数是指随着该参数的减小图像变扁。
后面四个机组的分布参数具有相同的含义。
用同样的方法绘制并其他四个风电机组的P-P图,分别见图8-图11。
图8机组9的Gamma P-P图
机组9的分布参数结果见表9。
表9机组9分布参数表
图9机组11的logistic P-P图机组11的分布参数见表10。
表10 机组11的分布参数表
图10 机组13的weibull P-P图机组13的分布参数见表11。
表11 机组13的分布参数表
图11机组14的weibull P-P图
机组14的分布参数见表12。
表12 机组14的分布参数表
4.2 问题2的模型建立与求解
从上述所选择的五台风电机组发电功率数据中,在30天范围内,选取30天内所有的采样间隔为1分钟的数据进行以下建模的使用,利用MATLAB软件编程对数据进行筛选,每隔12个数据选取一个数据,源程序见附录1。
用同1a的方法对筛选后的数据进行处理,利用MATLAB软件对数据进行曲线拟合并做概率分布图的比较,机组7、机组9、机组11、机组13、机组14的概率分布图分别见图12-16。
-3
Data
D e n s i t y
图12 机组7每分钟概率分布图
机组7每分钟功率概率分布的数值特征见表13。
-3
Data
D e n s i t y
图13 机组9每分钟概率分布图
机组9每分钟功率的概率分布的数值特征见表14。
表14 机组9每分钟概率分布的数值特征
-3
Data
D e n s i t y
图14 机组11每分钟概率分布图
机组11每分钟功率的概率分布的数值特征见表15。
表15 机组11每分钟概率分布的数值特征
-3
Data
D e n s i t y
图15 机组13每分钟概率分布图
机组13每分钟概率分布的数值特征见表16。
表16 机组13每分钟概率分布的数值特征
-3
Data
D e n s i t y
图16 机组14每分钟概率分布图
机组14每分钟概率分布的数值特征见表17。
表17 机组14每分钟概率分布的数值特征
通过上面的计算,得到五个机组每分钟功率最符合的概率分布见表18。
表18 五个机组每分钟功率最符合的概率分布表
从以上的统计结果可以看出,功率分布的空间差异性体现在不同机组符合不同的概率分布,见表18。
每天的波动规律和30天总体之间的关系通过MATLAB 软件绘制功率波动图,见图17。
从图17可以看出每日的功率波动图与30天总体的功率波动图之间的波动规律大体相同,不同总体的峰值要大于每日功率的峰值。
01000
200030004000500060007000
图17 每日功率波动于30天总体功率波动对比图
4.3 问题3的模型建立与求解
4.3.1 时间间隔从5s 变为1min 功率波动的对比
以机组7为例,利用MATLAB 软件分别绘制时间间隔为5s 和1min 的功率波动图分别见图18和图19。
x
y
图18 5s 功率波动图
x
y
图19 1min 功率波动图
从图中可以看出,两者的波动规律基本相同,不过在数值上稍有差异,即时间间隔为1min 的功率波动图相比于间隔5s 的会有信息的局部损失。
4.3.2 度量损失的波动信息
通过比较分析不同时间窗宽下风机功率波动的变化情况,来度量波动信息的损失。
方差和标准差都是刻画随机变量随着期望的变化的,方差和标准差距离期望远则波动性大,反之则小。
我们定义一种波动信息率:
%100)
()(⨯-=
x E x E std C r (1)
波动信息率越小,说明波动越弱,反之,则波动越大。
利用MATLAB 软件计算五个风电机组的波动信息率见表19。
表19 时间窗宽为5s 时的五组波动信息率
用C ∆表示波动信息损失率,则
21r r C C C -=∆ (2)
其中,1r C 表示时间窗宽为5s 时的波动信息率,2r C 表示时间窗宽为1min 时的波动信息率。
则五个风电机组的波动损失率结果见表20。
表20 风电机组的波动损失率表
4.3.3 一般性结论
从上面的计算结果可以看出,时间窗宽为5s 和时间窗宽为1min 的功率波动信息率非常接近,说明两者的波动情况很相似。
但是时间窗宽为1min 的功率波动图较5s 的功率波动图会有局部损失效应。
4.4 问题4的模型建立与求解
利用MATLAB 软件对20台机组同一时间段的数据进行筛选,筛选出1min 、5min 、15min 的数据,并绘制出概率分布图分别见图20-21。
-3
Data
D e n s i t y
图20 20台机组1min 功率波动图
20台机组1min 的概率分布的数值特征见表21。
表21 20台机组1min 概率分布数值特征表
Data
D e n s i t y
图21 20台机组5min 功率波动图
20台机组5min 的概率分布的数值特征见表22。
表22 20机组5min 概率分布数值特征表
Data
D e n s i t y
图22 20台机组15min 功率波动图
20台机组15min 概率分布的数值特征见表23。
表23 20台机组15min 概率分布数值特征表
20台机组不同时间段的数值特征见表24。
表24 数值特征表
20台机组1min 功率的波动图与5min 的功率波动图见图23和图24。
x
y
图23 1min 的总功率波动图
x
y
图24 5min 总功率的波动图
计算1min 和5min 的波动信息率分别为0.39%和0.66%。
则波动信息损失率为0.27%。
4.5 问题5的模型建立与求解
该问题采用传统灰色模型GM(1.1),预测超短期的风电功率,具体方法为: 时序风电功率为 ),2(),1([00)0(P P P =对数列按照传统灰色模型GM 进行一次累加形成新数列 ),2(),1(1
1
)
1(P P P
=则 ,2,1,)()(1
)0()
1(==∑=k i P k P k
i 构造GM
模型的一阶微分方程为
b aP dt
dP =+)1()
1( (3) 则()
Y b a A T T βββ1-=⎥⎦⎤⎢⎣⎡=,其中,⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡--=)()3()2(-)1()1()1(n Z Z Z β ⎥⎥
⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎣⎡---=)()3()2()
0()0()0(n P P P Y 2
)()1()1()1(1i P i P i Z +-=)()
(
预测生成序列为:a
b e a b P i P
ai +-=+-))1(()1(ˆ)0()1(
预测的结果序列还原得:)(ˆ)1(ˆ)1(ˆ)1()1()0(i P i P i P
-+=+ 预测误差r 为:
%100)
1()1()1(ˆ)0()0()0(⨯++-+=i P i P i P r
我们选取一段数据进行建模,前面的数据作为历史数据来预测功率,后面的数据作为真实数据检验预测的误差。
利用MATLAB 软件编程,计算出利用5min 预测未来4小时的结果见表25。
表25 利用5min 预测未来4小时的功率结果表
利用15min数据预测未来4小时的结果见表26。
表26 用15min数据预测未来4小时结果表
通过比较表25和表26中的相对误差,可以看出,用5min来预测未来4小时的功率的相对误差更小,所以,用5min预测结果更理想。
利用5min和15min的功率数据预测7天的滚动功率,预测时采用灰色理论模型,将前一天的数据最为预测后一天的原始数据,进而滚动预测出连续7天的功率数据。
利用MATLAB编程计算,计算结果见附录3。
5.论文的优缺点及改进与推广方向
5.1 论文的优点
本论文具有如下优点:
(1)模型有实用性。
可以用于研究风电功率波动性的变化,以及波动性的预测。
(2)模型有创新性。
论文中对于数据的筛选利用MATLAB编程,可以筛选出任意时间窗宽的数据。
5.2 论文的不足
由于时间短加之我们知识积累的限制,论文还有一些不足之处,主要体现在:
(1)文章中对于数据的处理有不当之处,比如数据的选取具有针对性;
(2)文章中第五个问题只能对超短期的数据进行预测。
参考文献
[1] 姜启源. 数学模型(第四版)[M].北京:高等教育出版社,2011.
[2] 盛骤.概率论与数理统计北京:高教出版社,2008.6
附录
附录1筛选数据的MATLAB源程序
function aa=daniang(data)
N=length(data);
aa(1:N/12)=0;
for i=1:N/12
aa(i)=data(12*i);
end
附录2 问题5MATLAB源程序:
function
[yuce,yuce1,rho,epsilon,delta,my,yuce11,rho1,epsilon1,delta1]=mycode0 (data,data1)
x0=data;
x01=data1;
n=length(x0);
lamda=x0(1:n-1)./x0(2:n);
range=minmax(lamda);
x1=cumsum(x0);
for i=2:n
z(i)=0.5*(x1(i)+x1(i-1));
end
B=[-z(2:n)',ones(n-1,1)];
Y=x0(2:n)';
u=B\Y;
x=dsolve('Dx+a*x=b','x(0)=x0');
x=subs(x,{'a','b','x0'},{u(1),u(2),x1(1)});
yuce1=subs(x,'t',[0:n-1]);
yuce1=eval(yuce1);
digits(6),y=vpa(x);
yuce=[x0(1),diff(yuce1)];
epsilon=x0-yuce; delta=abs(epsilon./x0);
rho=1-(1-0.5*u(1))/(1+0.5*u(1))*lamda;
my=subs(x,'t',[0:n+47]);
my=eval(my);
yuce11=[x0(1),diff(my)];
lamda1=x01(1:n+47)./x01(2:n+48);
epsilon1=x01-yuce11;
delta1=abs(epsilon1./x01);
rho1=1-(1-0.5*u(1))/(1+0.5*u(1))*lamda1;
附录3 用5min和15min预测未来7天功率结果。