基于风电场功率预测的数据价值研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ResearchonDataValueBasedonWindFarm PowerPrediction
ZHAO Yue1,XU Bohan2,WANG Cong3,GAO Feng1,SONG Jie1
(1.CollegeofEngineering,PekingUniversity,Beijing100871,China;2.SchoolofStatistics,CapitalUniversityof Economicsand Business, Beijing100070, China;3.Guanghua SchoolofManagement, Peking University, Beijing 100871,China) Abstract:Theoperationofthewindpowersystem isaccompaniedbythegenerationofmassivedata,whichisanessen tialscenariofordataapplication.Theoutputofthewindpowersystem isaffectedbyfactorssuchasweatherandfluctu ateswildly.Therefore,predictingwindpoweroutputissignificantforpowersystem balanceandeconomicdispatch.In ordertoexplorethevalueofdatainwindpowersystems,thispaperestablishesanhourlevelmultiinputmultipleoutput dayaheadpredictionmodelbasedonthepowergenerationdataofwindfarms.Further,thispapersortsoutthelinkof datamodeleconomicbenefits.ItcombinesShapleyvalueingametheorytoevaluatethemodel’svalueofdatapoints andfeatures.Thispaperexploresthecharacteristicsofhighvaluedatathroughcaseanalysis.Theresultsshow that screeninghighvaluedatacanreducecostsandincreasetheefficiencyofwindpowersystems.Onthisbasis,correspond ingsuggestionsareputforwardformanagingandsharingdatainwindpowersystems. Keywords:datavalue;windfarm powerprediction;Shapleyvalue;neuralnetwork;datagovernance
收 稿 日 期 :20221215 基金项目:国家自然科学基金重点资助项目(72131001);国 家 自 然 科 学 基 金 青 年 资 助 项 目 (72101007);国 家 自 然 科 学 基 金 资 助 项 目 (12271012) 通讯作者简介:宋洁,北京大学工学院教授,博士生导 师,长 江 学 者 特 聘 教 授,研 究 方 向:运 筹 优 化,数 据 价 值。 Email: songjie@coe.pku.edu.cn。
电 力 系 统 数 据 量 庞 大 ,是 数 据 分 析 与 应 用 的 重 要场景。风电相关数据常以时间序列的形式存在, 通 常 将 风 速 或 风 电 的 历 史 数 据 与 地 理 位 置 、气 象 数 据、机组参数 整 合 分 析。在 风 能 资 源 评 估 场 景 中, 有 研 究 基 于 不 同 时 刻 风 速 数 据 ,通 过 数 值 模 拟 降 低 保真度较低数据 带 来 的 影 响 [2,3],分 析 南 海 风 能 资 源 时 空 分 布 特 征 。 在 机 组 参 数 优 化 场 景 中 ,研 究 通 过影响因 子 法 筛 选 对 参 数 影 响 较 大 的 模 态 [4],确 定参数 优 选 范 围。 在 风 电 预 测 场 景 中,研 究 使 用 Kmeans、DBSCAN等聚类方法检测 异常 值、清 洗数
为研究风电系统中数据价值,利用 数据 实现更 精准的分 析,本 文 以 风 电 功 率 预 测 这 一 场 景 为 例。 考虑 到电力 的 实 时 供 需 平 衡 和 避 免 浪 费 等 要 求,预 判能源的供应成为了必不可少的环 节,准确 预测风 电功率能够保证电网各个方面安全平 稳的 运行,改 善风电企业的经济效益。由于风电系统 受风速、地 形、气压、风机运行状况等诸多不确 定因 素的 影响, 风电功率通常呈现非平稳性和随机性 。 [6] 现有的时 间 序 列 、机 器 学 习 ,深 度 学 习 方 法 还 无 法 实 现 对 风 力 发电预测的精准预测。例如,Nfaoui等 利 [7] 用ARMA 对实 际 风 电 场 出 力 预 测 的 平 均 误 差 为 21.5%。 丁志勇等[8]通过聚类和 SVM 模型进行预测,预测精 度为 83.96%。Zang等 利 [9] 用遗传算法优化长短期 记忆网络(LSTM)参数,准确率最高为 87%。
Vol.42,No.2
工程管理科技前沿 FrontiersofScienceandTechnologyofEngineeringManagement
2023年第 2期
ห้องสมุดไป่ตู้
基于风电场功率预测的数据价值研究
赵 越1, 徐博涵2, 王 聪3, 高 锋1, 宋 洁1
(1.北京大学 工学院,北京 100871;2.首都经济贸易大学 统计学 院,北 京 100070;3.北 京 大 学 光 华 管 理 学 院, 北京 100871)
1 引 言
在 国 际 上 对 节 能 减 排 日 益 重 视 的 形 势 下 ,风 力 发电作为一种新 能 源 发 电 技 术,因 其 资 源 丰 富、污 染小等特点备受 瞩 目 。 [1] 为 了 促 进 风 电 产 业 持 续 健康发展,国家能源 局 于 2016年 11月 印 发 了 《风 电发展“十三 五 ”规 划 》,在 规 划 中 提 到,随 着 世 界 各 国 对 能 源 安 全 问 题 日 益 重 视 ,加 快 发 展 风 电 已 成 为 国 际 社 会 推 动 能 源 转 型 发 展 、应 对 全 球 气 候 变 化 的普遍共识和一致行动。
收 入 视 角 是 数 据 价 值 评 估 的 重 要 思 路 :即 加 总 全部收益中数据资产贡献的现金流。由于从实际 场 景 中 拆 分 数 据 的 回 报 较 为 困 难 ,众 多 学 者 选 择 从 数 据 挖 掘 角 度,拆 分 数 据 的 作 用。例 如,在 供 应 链 场景下,评 估 有 无 数 据 对 报 童 模 型 优 化 结 果 的 影 响,量化数 据 的 贡 献 ;在 [18,19] 医 疗 场 景 中,利 用 贝 叶 斯 框 架 计 算 数 据 为 决 策 目 标 减 少 的 不 确 定 性 ,如 完 全 信 息 价 值 (expectedvaluewithperfectinformation,
EVPPI)等指标,据此平衡数据获 取的 成本 与 收 益 辅 助决策 。 [20,21] 能 源 系 统 数 据 资 源 丰 富,获 取 成 本 低 ,更 重 要 的 是 探 索 系 统 内 哪 些 数 据 在 任 务 中 更 加 重要。沙普 利 值 (Shapleyvalue)是 由 诺 贝 尔 经 济 学奖得主劳 埃 德 · 沙 普 利 提 [22] 出,是 合 作 博 弈 论 中 经 典 的 收 益 分 配 方 法 ,其 满 足 了 现 实 收 益 分 配 场 景 中 一 系 列 公 平 性 原 则 ,被 用 于 评 估 平 台 为 多 个 利 益相关者分配数据价值 的 应 用 。 [23] 有 些 学 者 指 出 在 机 器 学 习 模 型 中 ,沙 普 利 值 的 计 算 需 要 指 数 级 别 的时间 。 [24] 为 了 应 对 计 算 复 杂 度 过 大 的 挑 战,一 些学者提出了近似计算沙普利值的算法,例如 k近 邻近似 沙 普 利 值、蒙 特 卡 洛 近 似 沙 普 利 值 。 [25,26] 在 机 器 学 习 的 基 础 上 ,一 些 学 者 提 出 使 用 强 化 学 习 (DVRL)进行数据评估,使 用数 据值 估计 器(DVE) 计 算 数 据 点 在 模 型 训 练 中 使 用 的 可 能 性 ,与 预 测 器 模型一起 自 适 应 地 学 习 数 据 值 。 [27] 然 而,数 据 价 值 研 究 多 基 于 理 论 与 算 法 设 计 ,与 实 际 场 景 结 合 较 少 ,在 风 电 预 测 领 域 尚 缺 乏 与 数 据 实 际 价 值 结 合 的 有效预测方法。
摘 要:风电系统的运行伴随着海量数据的生成,是数据应用的重要场景。风电系统的输出受 天 气 等 因 素 影 响, 波动较大,因此风电输出的预测对于电力系统平衡、经济调度意义重大。为了探索风电系统中 的 数 据 价 值,本 文 基于风电场的发电功率数据建立了小时级的多输入—多输出日前预测模型。进一步,本 文 对 数 据—模 型—经 济 收益的链路进行梳理,结合合作博弈中的沙普利值思 想,对 模 型 中 的 数 据 点 和 特 征 进 行 价 值 评 估。 本 文 通 过 算 例分析探索高价值数据的特点,结果表明筛选高价值数 据 能 够 实 现 风 电 系 统 降 本 增 效,在 此 基 础 上 为 风 电 系 统 中数据的管理与共享提出了相应的建议。 关 键 词 :数 据 价 值 ;风 电 场 功 率 预 测 ;沙 普 利 值 ;神 经 网 络 ;数 据 治 理 中图分类号:C931 文献标识码:A 文章编号:20970145(2023)02003409 doi:10.11847/fj.42.2.34
电 力 系 统 数 据 资 源 极 为 丰 富 ,蕴 含 着 巨 大 的 商 业价值和 支 持 科 学 决 策 的 信 息 ,对 [10,11] 数 据 价 值 的评估也尤为重要。数据交易与数据资产流通机 制 的 建 立 ,为 综 合 利 用 多 方 数 据 进 行 更 为 细 粒 度 的 预测提供 了 便 捷 条 件 。 [12] 然 而,数 据 较 于 传 统 要 素具有非排他、非 竞 争 等 特 性,导 致 目 前 数 据 价 值 评估尚没有形成统一范 式 。 [13] 目 前 经 济 学 中 的 数 据价 值 评 估 方 法 主 要 有 成 本 法、市 场 法、收 入 法 。 [14] 成本法通常 低 估 数 据 价 值 [15];而 数 据 市 场 建 设 尚 不 完 善 为 市 场 法 评 估 带 来 了 困 难 ,一 些 学 者 通 过 设 计 数 据 交 易 市 场 框 架 ,探 索 数 据 市 场 中 的 均 衡价格对 数 据 定 价 ,这 [16,17] 一 类 方 法 多 会 忽 视 数 据本身的信息属性。
· 34·
Copyright©博看网. All Rights Reserved.
赵 越,等:基于风电场功率预测的数据价值研究
据 。 [5] 上述研 究 都 剔 除 了 数 据 离 群 值,减 少 异 常 值对模 型 效 果 的 影 响,得 到 了 显 著 成 效。 由 此 看 来,数据质量(价值)的 提 升 是 在 应 用 中 所 需 要 的, 针对数据价值的研究对模型效果的提升有着重要 意义。但上述工作没有把数据价值估算作为一种 常态化机制,未从 数 据 点 的 贡 献 角 度 审 视 数 据,存 在遗漏重要数据点的可能性。并且海量数据中存 在大量数据质量 较 低 的 部 分,评 估 数 据 价 值,根 据 数据重要程度高效选取数据有助于提高计算效率 与预测精度。
相关文档
最新文档