基于Spark大数据平台的风功率预测模型研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 0 1 7年 l 2月 第 2 0卷 第 1 2期
De c e mbe r . 2 01 7,Vo 1 . 2 0,No .1 2
电力 大 数 据
P oW ER S YS T EM S AND BI G DATA
电 网技 术
P o w e r Gr i d T e c h n o l o g y
1 S p a r k大数 据平 台简介
S p a r k云 计 算 技 术 是 对 现 有 云 计 算 的改 进 , 它
S p a r k中的应用 , 都是 由若 干驱动程序 组成 , 这些 驱动程序都运行使用者用户构建的 m a i n函数内, 使 其 能够 在 一 个 计算 集 群 上 进行 不 同的 的并 行操 作 。
S p a r k
误差作为各个神经网络的权重的决策参数, 得到最终
的预测结 果 。将 改进 的算 法 称为 将该 方 法成 为基 于 S p a r k的菌群一 神经 网络算 法 ( B C O— N N) 。
D丑 t a
pl ' o ̄ c ¥ ¥ | ng
l 叫
T a z h y l
Ap p l i c a t i o n
 ̄ t yl t r i t o『 x M LB- l "k
参数 。之 后通过 测 试数 据集 对 整个 菌群 一神 经 网络 进 行衡量 , 将 神经 网络 的预测结果 的精确 度和均方 根
B t e - m t n ■
f q 百度文库‘ 。 。
优 化算 法与神 经网络 算法结合提 高风 电功 率预测 的能力。
关键词 : 风电 ; 大数 据 ; 电力 ; S p a r k
文章编号 : 2 0 9 6— 4 6 3 3 ( 2 0 1 7 ) 1 2— 0 0 0 1— 0 3 中图分类号 : T P 3 1 文献标 志码 : B
中 间数据 进行 存储 或 者放 弃 。并 行化 设 计 主要包 括
三部分 , 数 据分 区 、 任 务并 行 和 结果 决策 。数 据分 区 是 在算法 开始阶段 , 将输 入数据集 按照一 定 的规则 进 行分区, 作 为多个 菌群一 神经 网络 的输入 训练数 据集 和测试数 据集 。随之 每一 个 神经 网络 并 行进 行数 据
统 的数据 源 , 包括 H D F S 、 Hb a s e和 C a s s a n d r a ; A P I 是 操作 S p a r k的接 口, 可 以通 过 调 用 对应 的 A P I实 现
对输人数据流的操作转变为对 R D D的操作, 之后可
以将 R D D获 得 的输 出结 果储存在外 部存储 中。整个 计 算过程 会一直产 生 中间数据 , 可 以根据 具体需 要将
S p a r k平 台 所 有 操 作 和 调 度 的 入 口 为
在 速度 、 易 用性 和复 杂 分 析 构 建 方 面 较 现有 云计 算
S p a r k C o n t e x t, 因 而 驱 动 程 序 都 要 通 过
S p a r k C o n t e x t 来 对 S p a r k进 行 操 作 和 调 度 ,在
训练和测 试 , 迭代规定 次数之后获 得神经 网络 的相关
S p a r k的 编 程 , S p a r k主要 提供 了 S c a l a 、 J a v a 和
P y t h o n三种 编程语 言 的 A P I , 其 中又 以 S c a l a为 主 ;
S p a r k是 一个 完 整 计 算 框 架 , 既 可 以部 署 在 一 个 服 务 器上也 可 以部署 在 分布式 计 算框 架上 。 …
H D FS , Hid 口0 口S t  ̄r qt

用 的并行 框 架 , 运用 S p a r k平 台主要是为 了实现大规
模 数据 的并行化 。S p a r k进行 分布式计算 时首先需要 通过 S t r e a m i n g是将 输入数据分 解成一个个批处 理 片 段 然后再 将 这 些 数 据段 都 转 换成 S p a r k中 的 R D D 。
计算 平 台 , 因 而 它 具 有 Ma p R e d u c e的所 有 优 点 , 但
是因为 S p a r k是基于 内存 的计算 , 其 中间输 出和结 果都 是保 存 在在 内存 中 , 不需 要 对 H D F S进 行 操 作
大大 减少 了 运算 所 需 的时 间 , S p a r k包 括 主要 的 三 个组 件 , 数 据 存储 、 A P I 和资 源管 理 。数 据 存储 指 的 是S p a r k能够 兼 容 H a d o o p的 H D F S分 布式 存 储 系
框架有很大程度提高。因为 S p a r k是基于内存的计
算方 式 , 所 以运算 速 度 快使 其最 为 明显 的优 势。
S p a r k最 开始 由加 州 大 学 伯 克利 分 校 的 A MP L a b实 验室 设计 开发 的开发 , 并于 2 0 1 0年 成 为 A p a c h e公
司 开源 项 目一 部 分 。S p a r k框 架 是 基 于 H a d o o p云
进 行 初 始 化 时 能够进 行D A G S c h e d u l e r作业 的 调度 和 T a s k S c h e d u l e r 任 务 的调 度 。S p a r k是 一种 通
基于 S p a r k大 数 据 平 台 的 风 功 率 预 测 模 型 研 究
赵 志鹏 , 张海超
( 辽宁大唐 国际新 能源有 限公 司 , 辽 宁 沈 阳 1 1 0 0 1 6 )
摘 要: 引入 S p a r k云计算技 术进 行并行化计算 , 提 高处理大规模数据 的能力。改进传 统 B P神 经网络算 法, 将菌群
相关文档
最新文档