隐节点竞争BP模型

合集下载

BP神经网络教程文件

BP神经网络教程文件
传输函数,输出函数,限幅函数
将可能的无线域变换到指定的有限范围输出。
单调增函数,通常为"非线性函数"
网络输入 net W x n i xi
i 1
--神经元的输入兴奋总量是多个输入的代数和
其中
输出 y f (net)
- -单输出(标量)
--执行该神经元所获得的网络输入的变换
(1) 基本的人工神经元模型
O
l j

O
l j
神经元之间的连接强度可以随训练改变 学习、遗忘、疲劳 ----神经网络中各神经元之间连接的强弱,按外部的 激励信号做自适应变化
➢ 兴奋与抑制 信号可以起兴奋作用,也可以起抑制作用 一个神经元接受信号的累积效果(综合大小,代
数和)决定该神经元的状态(兴奋、抑制) 每个神经元可以有一个“阈值”
2. 人工神经网络与人工神经元
神经网络的计算通过网络结构实现; 不同网络结构可以体现各种不同的功能; 网络结构的参数是通过学习逐渐修正的。
(1)基本的人工神经元模型
McCulloch-Pitts神经元模型 输入信号;链接强度与权向量; 信号累积 激活与抑制
人工神经元模型的三要素 :
一组连接 一个加法器 一个激励函数
连接权值,突触连接强度
权值 权值
0,激活 0,抑制
输入信号关于神经元突触的线性加权
将神经元的输出信号限制在有限范围内
输入信号
n维输入向量x = x1,..., xn T
x是来自其它n个神经元的输出; 也可以是来自外部的输入信号
权向量
n维权向量W = 1,...,n T ,i R
相当于突触的连接强度。
传递函数 转移函数,激励 激活函数

BP神经网络算法预测模型

BP神经网络算法预测模型

BP神经网络算法预测模型
BP神经网络(Back Propagation Neural Network,BPNN)是一种常
用的人工神经网络,它是1986年由Rumelhart和McClelland首次提出的,主要用于处理有结构的或无结构的、离散的或连续的输入和输出的信息。

它属于多层前馈神经网络,各层之间存在权值关系,其中权值是由算法本
身计算出来的。

BP神经网络借助“反向传播”(Back Propagation)来
实现权值的更新,其核心思想是根据网络的输出,将错误信息以“反馈”
的方式传递到前面的每一层,通过现行的误差迭代传播至输入层,用来更
新每一层的权值,以达到错误最小的网络。

BP神经网络的框架,可以有输入层、隐含层和输出层等组成。

其中
输入层的节点数即为输入数据的维数,输出层的节点个数就是可以输出的
维数,而隐含层的节点数可以由设计者自由设定。

每一层之间的权值是
BP神经网络算法预测模型中最重要的参数,它决定了神经网络的预测精度。

BP神经网络的训练步骤主要有以下几步:首先,规定模型的参数,
包括节点数,层数,权值,学习率等;其次,以训练数据为输入,初始化
权值,通过计算决定输出层的输出及误差;然后,使用反向传播算法,从
输出层向前,层层地将误差反馈到前一层。

BP神经网络模型应用实例

BP神经网络模型应用实例

BP神经网络模型第1节基本原理简介近年来全球性的神经网络研究热潮的再度兴起,不仅仅是因为神经科学本身取得了巨大的进展.更主要的原因在于发展新型计算机和人工智能新途径的迫切需要.迄今为止在需要人工智能解决的许多问题中,人脑远比计算机聪明的多,要开创具有智能的新一代计算机,就必须了解人脑,研究人脑神经网络系统信息处理的机制.另一方面,基于神经科学研究成果基础上发展出来的人工神经网络模型,反映了人脑功能的若干基本特性,开拓了神经网络用于计算机的新途径.它对传统的计算机结构和人工智能是一个有力的挑战,引起了各方面专家的极大关注.目前,已发展了几十种神经网络,例如Hopficld模型,Feldmann等的连接型网络模型,Hinton等的玻尔茨曼机模型,以及Rumelhart等的多层感知机模型和Kohonen的自组织网络模型等等。

在这众多神经网络模型中,应用最广泛的是多层感知机神经网络。

多层感知机神经网络的研究始于50年代,但一直进展不大。

直到1985年,Rumelhart等人提出了误差反向传递学习算法(即BP算),实现了Minsky的多层网络设想,如图34-1所示。

BP 算法不仅有输入层节点、输出层节点,还可有1个或多个隐含层节点。

对于输入信号,要先向前传播到隐含层节点,经作用函数后,再把隐节点的输出信号传播到输出节点,最后给出输出结果。

节点的作用的激励函数通常选取S 型函数,如Qx e x f /11)(-+=式中Q 为调整激励函数形式的Sigmoid 参数。

该算法的学习过程由正向传播和反向传播组成。

在正向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。

每一层神经元的状态只影响下一层神经输入层 中间层 输出层 图34-1 BP 神经网络模型元的状态。

如果输出层得不到期望的输出,则转入反向传播,将误差信号沿原来的连接通道返回,通过修改各层神经元的权值,使得误差信号最小。

社含有n 个节点的任意网络,各节点之特性为Sigmoid 型。

10大经典数据分析模型

10大经典数据分析模型

10大经典数据分析模型模型分析法就是依据各种成熟的、经过实践论证的管理模型对问题进行分析的方法。

在长时间的企业管理理论研究和实践过程中,将企业经营管理中一些经典的相关关系以一个固定模型的方式描述出来,揭示企业系统内部很多本质性的关系,供企业用来分析自己的经营管理状况,针对企业管理出现的不同问题,能采用最行之有效的模型分析往往可以事半功倍。

1、波特五种竞争力分析模型XXX的五种竞争力分析模型被广泛应用于很多行业的战略制定。

XXX认为在任何行业中,无论是国内还是国际,无论是提供产品还是提供服务,竞争的规则都包括在五种竞争力量内。

这五种竞争力就是1.企业间的竞争2.潜在新竞争者的进入3.潜在替代品的开发4.供应商的议价能力5.购买者的议价能力这五种竞争力量决定了企业的盈利能力和水平。

竞争对手企业间的竞争是五种力量中最主要的一种。

只要那些比竞争对手的战略更具上风的战略才可能获得成功。

为此,公司必须在市场、价格、质量、产量、功用、服务、研发等方面建立自己的核心竞争上风。

影响行业内企业竞争的因素有:产业增加、固定(存储)成本/附加价值周期性生产过剩、产品差异、商标专有、转换成本、集中与平衡、信息复杂性、竞争者的多样性、公司的风险、退出壁垒等。

新进入者企业必须对新的市场进入者保持足够的警惕,他们的存在将使企业做出相应的反应,而这样又不可避免地需要公司投入相应的资源。

影响潜在新竞争者进入的因素有:经济规模、专卖产品的差别、商标专有、资本需求、分销渠道、绝对成本优势、政府政策、行业内企业的预期反击等。

购买者当用户分布集中、规模较大或大批量购货时,他们的议价能力将成为影响产业竞争强度的一个主要因素。

决定购买者力量的因素又:买方的集中程度相对于企业的集中程度、买方的数量、买方转换成底细对企业转换成本、买方信息、后向整合本领、替代品、克服危机的本领、价格/购买总量、产物差异、品牌专有、质量/机能影响、买方利润、决策者的激励。

bp神经网络

bp神经网络

BP神经网络框架BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。

BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。

它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。

BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。

1BP神经网络基本原理BP神经网络的基本原理可以分为如下几个步骤:(1)输入信号Xi→中间节点(隐层点)→输出节点→输出信号Yk;(2)网络训练的每个样本包括输入向量X和期望输出量t,网络输出值Y 和期望输出值t之间的偏差。

(3)通过调整输入节点与隐层节点的联接强度取值Wij和隐层节点与输出节点之间的联接强度取值Tjk,以及阈值,使误差沿梯度方向下降。

(4)经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练到此停止。

(5)经过上述训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线性转换的信息。

2BP神经网络涉及的主要模型和函数BP神经网络模型包括输入输出模型、作用函数模型、误差计算模型和自学习模型。

输出模型又分为:隐节点输出模型和输出节点输出模型。

下面将逐个介绍。

(1)作用函数模型作用函数模型,又称刺激函数,反映下层输入对上层节点刺激脉冲强度的函数。

一般取(0,1)内的连续取值函数Sigmoid函数:f x=11+e^(−x)(2)误差计算模型误差计算模型反映神经网络期望输出与计算输出之间误差大小的函数:Ep=12(tpi−Opi)2其中,tpi为i节点的期望输出值;Opi为i节点的计算输出值。

(3)自学习模型自学习模型是连接下层节点和上层节点之间的权重矩阵Wij的设定和修正过程。

工程成本风险分析与敏感性评价——基于BP模型

工程成本风险分析与敏感性评价——基于BP模型
成 成 本风 险 。 ( ) 理 方 四 监
工程 质 量 达到 国家质 量 标准 , 是工 程 质 量的 最基 本 要 求 , 是 一 个硬 性 的 指标 。 监理 人 员 的主 要职 责就 是 监督 工 程项 目
实施 的全过程 , 以保证工程项 目按时保质保量地完成并交付
使 用 。如 果监 理 人 员责 任心 差 , 有 履行 其 职 责 。 没 未对 工 程质
基于 上 文 对于 工 程项 目成本 风 险 因 素分 析 ,建 立 起 工程 项 目
成本风险故障树 ,再根据 B P算法可以反 向传播和学 习的特
点 , 学 习过 程 调 节 整个 故 障树 模 型 的 “ 值 ” 阀值 ” 建 通过 权 和“ , 立 起 工程 项 目成本 风 险 故 障 树分 析 B P模 型 。可 以有 效 地 对
度 。因此 , 出节 点 为 1 。 输 个 综 上所 述 , 文 建 立 的神 经 网 络 模 型 为 6 3 1的 神 经 网 本
络模型。
2神 经 网络 的 学 习过 程 . 根 据本 文 建 立 的 网络 结 构 , 输入 层 各 节 点 为 X, 令 , 隐含 层
a1
a2
a 3
a4 aS
a6
图 1 工 程 项 目成 本 风 险 故 障 树
量进行严格的把关, 则会增加工程成本 。例如: 在有些施工环
节要 求监 理人 员 旁站 监 督 施 工 过 程 的正 确 性 和 安 全 性 , 果 如 监 理 人 员 疏 忽 和 擅 离 职 守 就 可 能 导 致 工 程 项 目的 质 量 不 达 标 , 至造 成 不 必 要 的 人 员 伤亡 , 甚 使直 接工 程 费 、 施 费 和企 措

BP神经网络的介绍

BP神经网络的介绍

BP神经网络的简要介绍一、BP神经网络的提出;在人工神经网络发展历史中,很长一段时间里没有找到隐层的连接权值调整问题的有效算法。

直到误差反向传播算法(BP算法)的提出,成功地解决了求解非线性连续函数的多层前馈神经网络权重调整问题。

BP网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。

BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。

它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。

BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。

(如图5.2)二、BP神经网络的基本算法;BP (Back Propagation)神经网络,即误差反传误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。

输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。

当实际输出与期望输出不符时,进入误差的反向传播阶段。

误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。

周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。

具体步骤如下;1、从训练集中取出某一样本,把信息输入网络中。

2、通过各节点间的连接情况正向逐层处理后,得到神经网络的实际输出。

3、计算网络实际输出与期望输出的误差。

基于BP模型供应链金融信用风险预测论文

基于BP模型供应链金融信用风险预测论文

基于BP模型的供应链金融信用风险预测分析摘要首先构建了基于供应链金融的中小企业信用风险评价指标体系,通过bp神经网络模型对中小企业的信用风险进行分析,从而预测出中小企业未来的融资授信水平,为商业银行进行授信提供依据。

关键词供应链金融中小企业bp神经网络1引言本文主要是对中小企业贷款信用风险进行预测。

考虑到各个商业银行都积累了有关信贷业务的海量数据,本文以一些企业的贷款信息数据为对象,通过运用bp神经网络,根据中小企业信息的训练集数据找到可以描述并且可以区分数据类别的分类模型,从而通过它预测数据的类别,挖掘出有价值的信息,为商业银行供应链金融贷款风险管理起到积极的辅助作用。

2相关理论供应链金融跳出了银行授信只针对单个企业的传统局限,站在产业供应链全局的高度,切合产业经济,提供金融服务,将资金有效注入处于相对弱势的中小企业,有望成为解决国内中小企业融资难问题的一个有效途径。

bp神经网络,由信息的正向传播和误差的反向传播两个过程组成。

输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,根据信息变化能力的需求,中间层可以设计为单隐层(多隐层)结构;最后一个隐层传递到输出层各神经元的信息,由输出层向外界输出信息处理结果。

当实际输出与期望输出不符时,进入误差的反向传播阶段。

误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层反传。

通过信息正向传播和误差反向传播过程,是神经网络训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度。

3基于bp神经网络的供应链金融信用风险预测模型设计(1)评价指标的选取通过对己有的企业信用风险评价体系研究,在构建供应链金融信用风险评估指标体系时应遵循以下指导原则:全面性原则:为了全面评价中小融资企业的信用风险,在构建指标时,所选取的指标覆盖面要广,尽可能完整地反应影响企业信用的各方面因,即要全面反应企业目前信用综合水平,又要反映出企业长期的发展前景。

bp神经网络模型拓扑结构包括

bp神经网络模型拓扑结构包括

bp神经网络模型拓扑结构包括BP神经网络模型拓扑结构包括BP神经网络是一种常用的人工神经网络模型,常用于解决分类、回归和优化问题。

它由输入层、隐藏层和输出层组成,并采用反向传播算法进行训练。

首先,输入层是模型的第一层,它接受外部传入的数据。

每个输入节点代表一个特征或属性。

输入层的节点数量取决于输入数据的维度。

第二,隐藏层是模型的中间层,它用于对输入信息进行处理和转换,提取出高层次的抽象特征。

隐藏层通常包括多层,并且每一层都包含多个神经元。

最后,输出层是模型的最后一层,它根据隐藏层的输出结果进行最终预测或判断。

输出层的节点数量通常与问题的类别数相匹配。

神经网络的拓扑结构包括输入层、隐藏层和输出层之间的连接。

每个节点之间都存在权重,它表示了节点之间传递信息的强度。

权重的值通过训练过程中不断更新来优化网络的性能。

在BP神经网络中,每个节点接收到输入后,通过激活函数将输入信号转换为输出信号。

常用的激活函数有sigmoid函数、ReLU函数等。

激活函数具有非线性的特性,使得神经网络可以处理非线性问题。

BP神经网络的训练过程主要通过反向传播算法进行。

反向传播算法通过计算网络输出与真实输出之间的误差,并将误差反向传递到网络的每一层,根据误差调整每个节点之间的权重,从而优化网络的拟合能力。

除了拓扑结构之外,BP神经网络还包括其他一些重要的参数,包括学习率、动量因子和迭代次数。

学习率控制权重更新的步长,动量因子可以加速训练过程,迭代次数指定了训练的轮数。

总结起来,BP神经网络模型的拓扑结构包括输入层、隐藏层和输出层之间的连接。

每个节点通过激活函数将输入信号转换为输出信号,权重通过训练过程中的反向传播算法进行更新。

BP神经网络通过不断调整权重来优化网络的拟合能力,解决分类、回归和优化问题。

在实际应用中,合理选择拓扑结构和参数设置,可以提高网络的性能和效果。

BP神经网络预测模型

BP神经网络预测模型

BP 神经网络模型 基本原理( 1) 神经网络的定义简介神经网络是由多个神经元组成的广泛互连的神经网络, 能够模拟生物神经系统真实世界及物体之间所做出的交互反应. 人工神经网络处理信息是通过信息样本对神经网络的训练, 使其具有人的大脑的记忆, 辨识能力, 完成名种信息处理功能. 它不需要任何先验公式, 就能从已有数据中自动地归纳规则, 获得这些数据的内在规律, 具有良好的自学习, 自适应, 联想记忆, 并行处理和非线性形转换的能力, 特别适合于因果关系复杂的非确定性推理, 判断, 识别和分类等问题. 对于任意一组随机的, 正态的数据, 都可以利用人工神经网络算法进行统计分析, 做出拟合和预测.基于误差反向传播(Back propagation)算法的多层前馈网络(Multiple-layer feedforward network, 简记为BP 网络), 是目前应用最成功和广泛的人工神经网络.( 2) BP 模型的基本原理[3]学习过程中由信号的正向传播与误差的逆向传播两个过程组成. 正向传播时, 模式作用于输入层, 经隐层处理后, 传入误差的逆向传播阶段, 将输出误差按某种子形式, 通过隐层向输入层逐层返回, 并“分摊”给各层的所有单元, 从而获得各层单元的参考误差或称误差信号, 以作为修改各单元权值的依据. 权值不断修改的过程, 也就是网络学习过程. 此过程一直进行到网络输出的误差准逐渐减少到可接受的程度或达到设定的学习次数为止. BP 网络模型包括其输入输出模型, 作用函数模型, 误差计算模型和自学习模型.BP 网络由输入层, 输出层以及一个或多个隐层节点互连而成的一种多层网,这种结构使多层前馈网络可在输入和输出间建立合适的线性或非线性关系, 又不致使网络输出限制在-1和1之间. 见图( 1) .O 1 O 2 O i O m输入层输出层 隐含层 …… …… ……( 大于等于一层) W (1)…W (L)( 3) BP 神经网络的训练BP 算法通过“训练”这一事件来得到这种输入, 输出间合适的线性或非线性关系. “训练”的过程可以分为向前传输和向后传输两个阶段:[1]向前传输阶段:①从样本集中取一个样本,i j P Q , 将i P 输入网络;②计算出误差测度1E 和实际输出(1)(2)()21(...((())...))L i L iO F F F PW W W =; ③对权重值L W W W ,...,)2()1(各做一次调整, 重复这个循环, 直到i E ε<∑.[2]向后传播阶段——误差传播阶段:①计算实际输出p O 与理想输出i Q 的差;②用输出层的误差调整输出层权矩阵; ③211()2mi ij ij j E Q O ==-∑; ④用此误差估计输出层的直接前导层的误差, 再用输出层前导层误差估计更前一层的误差. 如此获得所有其他各层的误差估计;⑤并用这些估计实现对权矩阵的修改. 形成将输出端表现出的误差沿着与输出信号相反的方向逐级向输出端传递的过程.网络关于整个样本集的误差测度:i iE E =∑几点说明:一般地,BP 网络的输入变量即为待分析系统的内生变量(影响因子或自变量)数,一般根据专业知识确定。

BP模型

BP模型

采用基于BP算法的前向神经网络预测网络流量,这主要是由于前向神经网络具有可任意逼近非线性连续函数的学习能力和对杂乱信息的综合能力,其思想方法完全可移植到其它的预测方法。

网络流量的时间序列预测的神经网络模型通常可分为两种:同质模型和异质模型,同质模型直接从被预测的时间序列中提取训练样本集;异质模型则除了使用时间序列本身的数据外还需要使用其它信息作为模型的输入,这些信息可能是突发事件等。

一些研究者认为异质模型更有效,但由于这一类的信息难以采集和表达,基于可操作的建模原则,本文采用的是同质模型。

BP(Back Propagation)网络是1986年由Rumelhart和McCelland 为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。

BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。

它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。

BP神经网络模型拓扑结构包括输入层、隐层和输出层采用BP算法的前向神经网络模型一般称为 BP网络。

它由输入层、中间层和输出层组成。

中间层(隐层)可以是一层或多层。

下图所示的就是多层的BP神经网络模型,它由一个输入层、一个输出层以及多个隐含层所组成。

BP 网络的学习过程由两部分组成:正向传播和反向传播。

当正向传播时,输入信息从输入层经隐层处理后传向输出层,每一层神经元的状态只影响下一层的神经元状态。

如果在输出层得不到希望的输出,则转入反向传播,将误差信号沿原来的神经元连接通路返回。

返回过程中,逐一修改各层神经元连接的权值。

这种过程不断迭代,最后使得信号误差达到允许的范围之内。

BP 神经网络的数学模型BP 神经网络的数学表示形式如下:假设第 k 个学习样本的输入向量为X k,即X k= (X k1,X k2,…,X km) ;第k 个学习样本的期望输出向量为D k,而实际输出向量为O k,分别表示为D k=(d k1,d k2,…,d kn)和Ok=(o k1,o k2,…,o km);w ji 为前一层第i个神经元输入到后一层第 j个神经元的权值。

数学建模之BP神经网络

数学建模之BP神经网络

神经网络的应用
人工神经网络以其具有自学习、自组织、 较好的容错性和优良的非线性逼近能力,受到 众多领域学者的关注。在实际应用中,80%~ 90%的人工神经网络模型是采用误差反传算法
或其变化形式的网络模型(简称BP神经网络),
目前主要应用于函数逼近、模式识别、分类和
数据压缩或数据挖掘。
§2 BP神经网络概述
人工神经网络是根据人的认识过程而开发出的一 种算法。 假如我们现在只有一些输入和相应的输出,而对 如何由输入得到输出的机理并不清楚,那么我们可以 把输入与输出之间的未知过程看成是一个“网络”, 通过不断地给这个网络输入和相应的输出来“训练” 这个网络,网络根据输入和输出不断地调节自己的各 节点之间的权值来满足输入和输出。这样,当训练结 束后,我们给定一个输入,网络便会根据自己已调节 好的权值计算出一个输出。这就是神经网络的简单原 理。

工作过程:
从神经元各组成部分的功能来看,信息的处理与传递主
要发生在突触附近。当神经元细胞体通过轴突传到突触 前膜的脉冲幅度达到一定强度,即超过其阈值电位后, 突触前膜将向突触间隙释放神经传递的化学物质。 神经元间信息的产生、传递和处理是一种电化学活动。 神经元间的信号通过突触传递。通过它,一个神经元内 传送的冲击信号将在下一个神经元内引起响应,使下一 个神经元兴奋,或阻止下一个神经元兴奋。
常见的激活函数有以下几种类型:
1、阶梯函数 2、线性函数 3、非线性:Sigmoid函数
1 (s) 1 e s
1 (s) 1 e s
人工神经网络的分类

按网络连接的拓扑结构分类:
层次型结构:将神经元按功能分成若干层,如输入
层、中间层(隐含层)和输出层,各层顺序相连 互连型网络结构:网络中任意两个节点之间都可能 存在连接路径

神经网络算法及模型

神经网络算法及模型

神经网络算法及模型思维学普遍认为,人类大脑的思维分为抽象(逻辑)思维、形象(直观)思维和灵感(顿悟)思维三种基本方式。

人工神经网络就是模拟人思维的第二种方式。

这是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。

虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。

神经网络的研究内容相当广泛,反映了多学科交叉技术领域的特点。

主要的研究工作集中在以下几个方面:(1)生物原型研究。

从生理学、心理学、解剖学、脑科学、病理学等生物科学方面研究神经细胞、神经网络、神经系统的生物原型结构及其功能机理。

(2)建立理论模型。

根据生物原型的研究,建立神经元、神经网络的理论模型。

其中包括概念模型、知识模型、物理化学模型、数学模型等。

(3)网络模型与算法研究。

在理论模型研究的基础上构作具体的神经网络模型,以实现计算机模拟或准备制作硬件,包括网络学习算法的研究。

这方面的工作也称为技术模型研究。

(4)人工神经网络应用系统。

在网络模型与算法研究的基础上,利用人工神经网络组成实际的应用系统,例如,完成某种信号处理或模式识别的功能、构作专家系统、制成机器人等等。

纵观当代新兴科学技术的发展历史,人类在征服宇宙空间、基本粒子,生命起源等科学技术领域的进程中历经了崎岖不平的道路。

我们也会看到,探索人脑功能和神经网络的研究将伴随着重重困难的克服而日新月异。

神经网络和粗集理论是智能信息处理的两种重要的方法,其任务是从大量观察和实验数据中获取知识、表达知识和推理决策规则。

粗集理论是基于不可分辩性思想和知识简化方法,从数据中推理逻辑规则,适合于数据简化、数据相关性查找、发现数据模式、从数据中提取规则等。

神经网络是利用非线性映射的思想和并行处理方法,用神经网络本身的结构表达输入与输出关联知识的隐函数编码,具有较强的并行处理、逼近和分类能力。

在处理不准确、不完整的知识方面,粗集理论和神经网络都显示出较强的适应能力,然而两者处理信息的方法是不同的,粗集方法模拟人类的抽象逻辑思维,神经网络方法模拟形象直觉思维,具有很强的互补性。

基于BP神经网络优化算法的输变电工程造价预测模型

基于BP神经网络优化算法的输变电工程造价预测模型

第45卷第4期2023年7月沈 阳 工 业 大 学 学 报JournalofShenyangUniversityofTechnologyVol 45No 4Jul 2023收稿日期:2020-07-18.基金项目:湖南省科技计划项目(S2019RCDT2B0484).作者简介:张恒武(1967-),男,湖南株洲人,高级工程师,硕士,主要从事电网基建工程技术等方面的研究.doi:10.7688/j.issn.1000-1646.2023.04.05基于BP神经网络优化算法的输变电工程造价预测模型张恒武1,吴小忠1,沈晓隶2,伍家耀2(1 国网湖南省电力有限公司建设部,长沙410000;2 湖南经研电力设计有限公司技术经济部,长沙410000)摘 要:针对现有的输变电工程造价预测方法在复杂工况下精度低的问题,提出了一种基于BP神经网络优化算法的输变电工程造价预测模型.利用因子分析方法确定输变电工程造价数据预测的输入指标,并在传统BP神经网络模型的基础上,引入思维进化算法对BP神经网络中的权值和阈值进行优化.利用构建的预测模型预测某省级电网公司2016年度的输变电工程造价.结果表明,预测误差低于10%,平均误差低于5%.与传统的BP神经网络相比,所提预测模型具有更高的预测精度,可以较好地应用于输变电工程造价估算.关 键 词:输电工程;变电工程;造价预测;BP神经网络;优化算法;因子分析;思维进化算法;预测精度;输入指标中图分类号:TM73 文献标志码:A 文章编号:1000-1646(2023)04-0381-06CostpredictionmodelbasedonBPneuralnetworkoptimizationalgorithmforpowertransmissionandtransformationprojectsZHANGHeng wu1,WUXiao zhong1,SHENXiao li2,WUJia yao2(1.ConstructionDepartment,StateGridHunanElectricPowerCo.Ltd.,Changsha410000,China;2.TechnicalEconomicsDepartment,HunanJingyanElectricPowerDesignCo.Ltd.,Changsha410000,China)Abstract:Aimingatthelowaccuracyofexistingcostpredictionmethodsforpowertransmissionandtransformationprojectsundercomplexworkingconditions,acostpredictionmodelbasedonBPneuralnetworkoptimizationalgorithmforthepowertransmissionandtransformationprojectswasproposed.Theinputindexesforthedatapredictionofpowertransmissionandtransformationweredeterminedbyafactoranalysismethod.AccordingtothetraditionalBPneuralnetworkmodel,theweightandthresholdvaluesofBPneuralnetworkwereoptimizedbyintroducingamindevolutionalgorithm.Usingtheas proposedpredictionmodel,thecostofpowertransmissionandtransformationprojectsin2016foraprovincialpowergridcompanywaspredicted.Theresultsshowthatthepredictionerrorislessthan10%,andtheaverageerrorislessthan5%.ComparedwiththetraditionalBPneuralnetwork,theas proposedpredictionmodelhashighpredictionaccuracy,andcanbepreferablyappliedtothecostestimationofpowertransmissionandtransformationprojects.Keywords:powertransmissionproject;powertransformationproject;costprediction;BPneuralnetwork;optimizationalgorithm;factoranalysis;mindevolutionalgorithm;predictionaccuracy;inputindex 电力工业是社会经济发展的重要保障,而电力工业的建设周期较长、投资数额大,如何合理规划电力工程建设方案,有效控制输变电工程的造价预算,已成为电力工程建设领域的热门研究方Copyright ©博看网. All Rights Reserved.向[1].传统的输变电工程造价预测主要依据技术人员的分析和判断,但建设输变电工程时的情况较为复杂,单纯凭借经验估算难以得到准确的造价预测结果.电力投资公司和相关施工企业亟须一种较为准确的预测方法,能够快速、准确地预测出输变电工程的主要经济指标,以便合理规划建设方案,有效提升建设质量与效率[2-5].随着计算机领域机器学习理论的兴起,以神经网络为代表的智能算法逐步被引入到造价预测领域.郭新菊等[6]基于神经网络算法预测项目造价,并通过实际算例进行验证;徐莉等[7]采用BP神经网络算法对输变电工程造价进行分析,并将该方法应用于某地变电站造价的预测,且取得了一定的效果.但由于BP神经网络算法存在一定的限制,如算法较容易陷入局部极小值的陷阱从而难以得到全局最优解,且需要训练的次数较多,导致网络收敛的速度较慢,因此将BP神经网络直接应用于输变电工程造价的预测难以满足精度要求.针对上述问题,本文开展了深入的研究,提出了一种基于BP神经网络优化算法的输变电工程造价预测方法.1 输变电工程造价指标1 1 输变电工程造价数据特性与预处理方法输变电工程是电力系统的重要架构之一,通常可分为输电工程和变电工程.根据历史造价数据分析,输变电工程的指标较多,其中存在众多重复指标.此外,由于工程上多应用定性分析,导致所能获得的数据较少.这使得直接将数据输入预测模型会造成预测结果偏差较大,因此需要对输变电工程数据进行预处理,主要步骤如下:1)数据选择.当相同属性指标数据与内部数据均值偏差过大时,可被认为是噪声数据.此类数据将较大程度上影响预测精度,因此可以设定转换系数对噪声数据进行处理,从而完成数据替换,替换表达式为x =λ珋x (1)式中:x 为转换后的数据;λ为转换系数;珋x为数据均值.噪声偏差较小时,设定λ=1 2;噪声偏差较大时,设定λ=0 8.2)数据转化.当属性数据具有相关性时,可以利用组合变换的方法将其转化为高级属性,从而提升计算效率.3)标准化.转化完成后的数据需要实施标准化处理,本文采用z score标准化法,标准化表达式为x′=(x-μ)/σ (2)式中:μ为样本均值;σ为样本标准差.1 2 因子分析方法输变电工程造价指标数据在经过预处理后数量有一定的减少,但应用于预测时仍较为冗余.因此需要考虑进行数据降维,进一步削减指标数量,减少重复信息.本文引入因子分析方法进行数据降维,该方法可以用少量因子表征多数指标的关联.将联系紧密的变量统一归类为一种因子,并用该因子表征原始数据信息[8-9],其数学模型为x1=α11f1+α12f2+…+α1qfq+e1x2=α21f1+α22f2+…+α2qfq+e2xp=αp1f1+αp2f2+…+αpqfq+ep (3)式中:x=(x1,x2,…,xp)T为原始数据经标准化处理后的变量序列,其平均值为0;f=(f1,f2,…,fq)T为公共因子,且在分析时通常默认q<p;α为因子载荷,表示第p个原始变量在第q个主因子上的载荷情况,其值与原始变量和公共因子之间的联系呈正相关;e=(e1,e2,…,ep)T为影响xi的特殊因子,其平均值为0,且方差为常数,是呈正态分布的随机变量.1 3 公共因子分析流程与结果式(3)中公共因子的分析流程如下:1)导入原始的数据样本,计算样本的平均值与方差,对样本进行标准化处理;2)求解样本的相关系数矩阵和矩阵的特征根以及特征向量;3)给定公共因子数目并计算其共同度;4)采用方差最大的正交旋转法进行因子旋转,简化载荷矩阵结构,以便有效实现主因子的专业解释;5)对公共因子进行相应的专业解释;6)求解因子得分,即求解各变量的加权数量总和.利用KMO检验法对预处理后的输变电工程造价数据实施显著性检验,其中输电工程KMO统计量为0 879>0 5,sig.值为0 000;变电工程KMO统计量为0 823>0 5,sig.值为0 000,检验结果表明输变电工程造价数据适用于因子分析.利用PCA法求解输变电工程造价数据中的各因子特征值以及方差的贡献率,其中输电工程中前3个因子累计方差贡献率为87 63%,大于85%;变电工程中前3个因子累计方差贡献率为86 41%,大于85%,因此两工程造价数据中前3个因子可以囊括几乎所有信息,故选取此3项作为公因子.283沈 阳 工 业 大 学 学 报 第45卷Copyright©博看网. All Rights Reserved.利用最大方差法旋转求解因子,得出旋转后的公因子及其变量,在考虑其关系组合的基础上求解得到因子得分.筛选出输电工程的3个公因子为导线因子、地形因子和材料因子;变电工程的3个公因子为主要设备量价因子、建筑因子和其他因子,并且公因子所包含指标的影响程度依次减弱.经过因子分析后,可以确定输变电工程造价的主要影响因素[10],得到的输入参数和预测参数如表1所示.表1 输变电工程造价输入参数和预测参数Tab 1 Inputandpredictionparametersofpowertransmissionandtransformationprojectcost工程类型输入参数预测参数输电工程变电工程导线截面积导线质量导线价格塔材价格塔基数塔材质量土石方量混凝土量钢材质量综合地形系数电压等级变电站类型海拔主变台数主变容量主变单价断路器单价电容器数量全站面积主控楼面积混凝土量钢材质量单位长度造价单位容量造价2 输变电工程造价预测模型2 1 BP神经网络模型BP神经网络是一种反向传播神经网络,输入的信号前向传递,误差则反向进行传播.前向传递过程中,输入信号从网络的输入层输入,然后经历隐含层依次处理,直到传导至输出层.利用BP神经网络进行预测需要对网络进行训练[11-12],训练流程为:1)初始化网络模型.在分析模型输入、输出序列基础上设定网络输入层的节点数目为n,隐含层的节点数目为l,输出层的节点数目为m.初始化设定各网络链接权值为Wij和Wjk,初始化网络隐含层阈值为a,网络输出层阈值为b.同时,设定网络的学习率ξ以及相应的激励函数[13-14].2)对隐含层的输出值进行运算,预测输出H的计算表达式为Hj(=F∑ni=1Wij-a)j (j=1,2,…,l) (4)式中,F为隐含层激励函数,其表达式为F(x)=1/(1+e-x) (5)3)对输出层的输出值进行运算,预测输出O的计算表达式为Ok=∑lj=1HjWjk-bk (k=1,2,…,m) (6)4)预测运算误差.将网络实际输出O与网络预期输出Y进行比较,计算网络误差,即εk=Yk-Ok (7)5)更新网络权值.根据计算得到的网络误差更新网络的层间权值,即Wij=Wij+ξHj(1-Hj)xi∑mk=1Wjkεk (8)Wjk=Wjk+ξHjεk (9)6)更新网络节点阈值.依据网络误差对网络节点的阈值进行更新,即aj+1=aj+ξHj(1-Hj)xi∑mk=1Wjkεk(10)bk+1=bk+εk (11)7)判断迭代是否终止,若未终止,则返回步骤2).2 2 思维进化算法思维进化算法(MEA)[15]主要涵盖以下概念:1)群体和子群体.MEA进化时将每代个体集合设定为群体,并将其划分为数个子群体,主要囊括优胜子群体与临时子群体.在全局竞争中,前者记载胜利者的数据信息,后者记载竞争过程.2)公告板.公告板可以为群体内部个体与子群体的交流提供平台,记录两者的序号以对其进行区分.通过动作记录到两者具体位置,利用得分完成环境中个体动作的评价.3)趋同.趋同是MEA中的重点概念,其定义为:子群体中个体赢得竞争被称为趋同.子群体趋同时,若不再产生新的胜利者,则认为该子群体达到成熟,此时可认为趋同过程终止.子群体所经历的从产生到成熟的时期,则被称为生命期.4)异化.其定义是在全局中,子群体为获得383第4期 张恒武,等:基于BP神经网络优化算法的输变电工程造价预测模型Copyright©博看网. All Rights Reserved.胜利而进行竞争,持续寻求全局新点.在竞争时,若某个临时子群体得分大于某个成熟的优胜子群体所对应的得分,则前者取代后者,后者中的个体被释放;若某个成熟的临时子群体得分小于某个优胜子群体所对应的得分,则前者被放弃,前者中的个体也会被释放.在被替换或者废弃的子群体中,被释放的个体重新实施全局搜索,并不断建立新的临时群体.MEA的训练流程如下:1)在解空间中随机产生一定数目的个体.依照得分高低,寻找出高分的优胜个体及临时个体.2)将高分的优胜个体及临时个体挑选出来当作中心,在中心的周边生成新的个体,从而获取所需要的一定数目的优胜子群体及临时子群体.3)在获取的两种子群体内部开始施行趋同,直到其成熟,然后将其得分定义为其中最优个体的得分.4)子群体在达到成熟后,在全局公告板上公布所有子群体的得分.对子群体相互之间实施异化,不断完成群体之间的相互替换、废弃以及其内部个体释放的操作,进而获取全局中所包含的最优个体以及得分.异化结束后,需要重新在解空间中生成得到新的临时子群体以确保其总数目不变.2 3 网络优化与工作流程针对传统BP神经网络的不足,本文利用MEA优化传统BP神经网络中的权值与阈值,其流程如下:1)生成训练集与测试集.为了提升模型的泛化能力,需要生成充足的训练样本从而确保预测准确性.2)生成初始种群.利用初始种群生成函数,可以迅速生成初始种群,并将其划分为优胜子种群与临时子种群.3)趋同.子种群生成结束后需要实施趋同,引入成熟判断函数判定趋同是否实现.4)异化.趋同结束后开始异化,根据其结果增添新子群体.5)求解最优个体.当符合终止条件结束趋同和异化后,利用编码求解最优个体,从而获得相应的网络权值与阈值.6)训练神经网络.将优化得到的权值与阈值作为网络的初始权值和阈值,基于步骤1)中得到的训练集对网络实施训练操作与学习操作.7)预测.训练结束后,输入测试样本对造价数据进行预测.3 实验验证本文选取2016年度某省级国家电网公司的实际输变电工程造价数据进行实验验证,分别对其中60个输电工程与60个变电工程的造价进行预测.3 1 输电工程造价预测60个输电工程均为110kV输电线路工程,其主要经济指标的输入参数如表2所示.表2 输电工程输入参数Tab 2 Inputparametersofpowertransmissionproject参数数值导线截面积/mm2240导线质量/(t·km-1)0 96导线价格/(元·km-1)16032塔材价格/(万元·t-1)0 67塔基数6塔材质量/t51土石方量/m31176混凝土量/m3163钢材质量/t13综合地形系数1 针对输电工程造价预测建立的BP神经网络模型各层所包含的神经元结构为10 5 1,迭代上限次数设定为30,网络激励采用Sigmoid函数.经过MEA优化网络后,将60个110kV输电线路工程中的55个造价作为训练样本对网络实施训练.在训练完成后,将余下5个工程数据作为测试样本.利用预测模型对其单位长度造价进行预测,并将预测结果与传统的BP神经网络进行对比,结果如图1所示.其中BPNN表示BP神经网络,本文提出的方法表示为MEA BPNN.图1 输电工程预测结果Fig 1 Predictionresultsofpowertransmissionproject483沈 阳 工 业 大 学 学 报 第45卷Copyright©博看网. All Rights Reserved.由图1可以看出,传统BP神经网络方法对输电工程测试样本的预测误差在10%上下,平均预测误差约为9%,预测结果与实际值偏差相对较多;而本文所提方法对输电工程测试样本的预测误差不超过5%,平均预测误差约为3%,预测结果相对精确.3 2 变电工程造价预测60个工程均为220kV变电站工程,其主要经济指标的输入参数如表3所示,其中电压等级、变电站类型均为固定参数.表3 主要经济指标的输入参数Tab 3 Inputparametersofmaineconomicindexes参数数值电压等级/kV220变电站类型智能变电站海拔/m531主变台数2主变容量/kVA50主变单价/(元·(kVA)-1)360断路器单价/元427电容器数量2全站面积/m2468 36主控楼面积/m2161 82混凝土量/m3122 95钢材质量/t6 8 针对变电工程造价预测建立的BP神经网络模型各层所包含的神经元结构为12 5 1,迭代上限次数设定为30,网络激励采用Sigmoid函数.经过MEA优化网络后,将60个220kV变电工程中的55个作为训练样本.在训练完成后,将余下5个工程数据作为测试样本.利用预测模型对其单位容量造价进行预测,并将预测结果与传统的BP神经网络进行对比,结果如图2所示.图2 变电工程预测结果Fig 2 Predictionresultsofpowertransformationproject由图2可以看出,传统BP神经网络方法对于变电工程测试样本预测误差普遍超过10%,平均预测误差约为12%,预测结果与实际值偏差较大;而本文所提方法对于变电工程测试样本的预测误差不超过4%,平均预测误差约为2%,预测结果较为精确.根据预测结果可以看出,文中所提方法通过优化BP神经网络的权值和阈值,弥补了传统BP神经网络容易陷入局部最优,导致准确性降低的问题,有效实现了输变电工程造价的准确预测.4 结 论针对传统BP神经网络的不足,利用因子分析方法判断输变电工程造价的主要影响因素,筛选得到适合执行造价预测的输入指标.引入思维进化算法优化了BP神经网络的阈值和权值,并利用优化后的神经网络分别针对110kV输电线路工程和220kV变电工程构建相应的造价预测模型,从而对造价数据进行有效处理分析.从输电线路单位长度造价和变电站单位容量造价两个方面出发,最终实现输变电工程造价的准确预测.研究结果可为造价估计提供参考,有助于推动电力工程建设领域的研究和发展.参考文献(References):[1]安磊,张洁,齐霞,等.基于随机森林输变电线路工程造价估算研究[J].控制工程,2016,23(11):1841-1844.(ANLei,ZHANGJie,QIXia,etal.Transmissionlineprojectcostbasedonrandomforests[J].ControlEn gineeringofChina,2016,23(11):1841-1844.)[2]王晓建,朱婷涵,劳咏昶,等.基于人工免疫优化神经网络的输变电工程造价评估[J].浙江电力,2018,37(7):62-67.(WANGXiao jian,ZHUTing han,LAOYong chang,etal.Costevaluationofpowertransmissionandtrans formationprojectbasedonartificialimmuneoptimizationneuralnetwork[J].ZhejiangElectricPower,2018,37(7):62-67.)[3]杨凯,于波,肖艳利,等.基于GA BP神经网络的配电网工程造价预测[J].自动化仪表,2019,40(7):91-93.(YANGKai,YUBo,XIAOYan li,etal.Construc tioncostforecastofdistributionnetworkbasedonGA BPneuralnetwork[J].ProcessAutomationInstru mentation,2019,40(7):91-93.)[4]陈倩,高钰莹,易松.智能电网中隐私保护状态估计的数据混淆算法[J].电子科技,2018,31(10):22-28.(CHENQian,GAOYu ying,YISong.Dataconfusionalgorithmforprivacystateestimationinsmartgrid[J].ElectronicScienceandTechnology,2018,31(10):22-28.)[5]朱云祥,夏华丽,劳咏昶,等.BIM技术在输变电工583第4期 张恒武,等:基于BP神经网络优化算法的输变电工程造价预测模型Copyright ©博看网. All Rights Reserved.程的应用成熟度评价研究[J].浙江电力,2018,37(9):84-89.(ZHUYun xiang,XIAHua li,LAOYong chang,etal.ResearchonapplicationmaturityevaluationofBIMtechnologyinpowertransmissionandtransformationprojects[J].ZhejiangElectricPower,2018,37(9):84-89.)[6]郭新菊,邵永刚,李旭阳,等.基于BP神经网络的配电网工程造价预测模型建立与应用[J].电子设计工程,2017,25(23):63-68.(GUOXin ju,SHAOYong gang,LIXu yang,etal.EstablishmentandapplicationofcostpredictionmodelfordistributionnetworkprojectbasedonBPneuralnetwork[J].ElectronicDesignEngineering,2017,25(23):63-68.)[7]徐莉,李卓然.特高压输电线路工程造价预测模型研究:基于因子分析及BP神经网络[J].工业技术经济,2017,36(7):18-26.(XULi,LIZhuo ran.ResearchonforecastingmodelofUHVtransmissionlineprojectcost baseonfactoranalysisandBPneuralnetwork[J].JournalofIndustrialTechnological&Economics,2017,36(7):18-26.)[8]刘琰,耿庆申,王宁宁,等.基于因子分析的输电线路造价的影响因素研究[J].电气工程学报,2016,11(8):42-49.(LIUYan,GENGQing shen,WANGNing ning,etal.Studyofthefactorsinfluencingofthetransmissionlinecostbasedonfactoranalysis[J].JournalofElectricalEngineering,2016,11(8):42-49.)[9]范红军,杨中书.因子分析法在蓄电池组合筛选中的应用研究[J].电源技术,2017,41(5):748-749.(FANHong jun,YANGZhong shu.Studyonapplicationoffactoranalysismodelincombinationselectionofbatteries[J].ChineseJournalofPowerSources,2017,41(5):748-749.)[10]耿鹏云,安磊,王鑫.基于数据挖掘技术的输电工程造价预测模型的建立与实现[J].现代电子技术,2018,41(4):157-160.(GENGPeng yun,ANLei,WANGXin.Establishmentandimplementationofpowertransmissionproject’scostforecastmodelbasedondataminingtechnology[J].ModernElectronicsTechnique,2018,41(4):157-160.)[11]李升健,黄灿英,陈艳.基于改进PSO BP网络的配电网故障选线与测距[J].沈阳工业大学学报,2019,41(1):6-11.(LISheng jian,HUANGCan ying,CHENYan.FaultlineselectionandlocationfordistributionnetworkbasedonimprovedPSO BPneuralnetwork[J].JournalofShenyangUniversityofTechnology,2019,41(1):6-11.)[12]柴尔?,曾平良,马士聪,等.利用GA优化后的RS BP神经网络进行电网故障定位的方法研究[J].电力科学与工程,2019,35(9):22-28.(CHAIEr xuan,ZENGPing liang,MAShi cong,etal.ResearchonmethodoffaultlocationofpowernetworkusingGAoptimizedRS BPneuralnetwork[J].ElectricPowerScienceandEngineering,2019,35(9):22-28.)[13]谢文旺,孙云莲,易仕敏,等.一种基于改进VPGA优化Elman神经网络的电力线通信数据处理算法[J].电力系统保护与控制,2019,47(6):58-65.(XIEWen wang,SUNYun lian,YIShi min,etal.AdataprocessingalgorithmforpowerlinecommunicationbasedonElmanneuralnetworkoptimizedbyimprovedVPGA[J].PowerSystemProtectionandControl,2019,47(6):58-65.)[14]陆继翔,张琪培,杨志宏,等.基于CNN LSTM混合神经网络模型的短期负荷预测方法[J].电力系统自动化,2019,43(8):131-137.(LUJi xiang,ZHANGQi pei,YANGZhi hong,etal.Short termloadforecastingmethodbasedonCNN LSTMhybridneuralnetworkmodel[J].AutomationofElectricPowerSystems,2019,43(8):131-137.)[15]高帅,胡红萍,李洋,等.基于改进的思维进化算法与BP神经网络的AQI预测[J].数学的实践与认识,2018,48(19):151-157.(GAOShuai,HUHong ping,LIYang,etal.AQIpredictionbasedonimprovedmindevolutionaryalgorithmandBPneuralnetwork[J].MathematicsinPracticeandTheory,2018,48(19):151-157.)(责任编辑:景 勇 英文审校:尹淑英)683沈 阳 工 业 大 学 学 报 第45卷Copyright©博看网. All Rights Reserved.。

BP算法在教学评价系统中的应用

BP算法在教学评价系统中的应用
小 的经 过 非 线 形 转 换 的信 息 [ 。 1 1
贡 献率为: / =,. ) a= ∑ 1. 。 2. ,, p
设贡 献率 矩 阵 为a aa … … , ) = (, a a。
特征 向量矩 阵 为 :J ,
持 数 据 集 的 对 方 差 贡 献 最大 的 特 征 。 是 这
再 对 各 个 主 分 量 即 各 项 指 标 值 进 行 加
权求和 , 得出 最 终 综 合 评价 值Y :

设 (J i …,. i 12 … ) ,2 z ,, n。 Z , y(
Ny _i | f xz+ ,f xz+ t i …+ txz t l 2 2 fp yk
忽 BP 经 网 络 模 型 包 括 其 输 入 输 出 模 通 过 保 留 低 阶 主 分 量 , 略 高 阶 主 分 量 做 神 型, 作用 函数 模 型 误差 计 算 模 型 和 自学 习 模型 【 。 2 1
( ) 点 输 出模 型 。 I节 的 最 重要 方 面 [ 。 3 ~1
网络 的 误 差 平 方 和 最 小 。 虽然 BP网络 在现 () 差 计 算 模 型 。 3误
方 的 方: : 。! 差 平 二 , )


有 的 神 经 网 络 应 用 中 占 了 相 当大 的 比 重 ,
误 差 计 算 模 型 是 反 映 神 经 网 络 期 望 输
对样本阵元进 行如下标准化变换 :
神 经 网 络 的B P算 法为 目前 应 用较 广 泛 的 神 经 网络 模 型 之 一 。 P 法 能 学 习和 存 B 算 贮 大量 的 输 入 一 出 模式 映 射关 系 , 输 而无 需 事 前 揭 示 描 述 这 种 映 射关 系 的 数 学 方 程 。

用BP神经网络预测股票市场涨跌

用BP神经网络预测股票市场涨跌

用BP神经网络预测股票市场涨跌用BP神经网络预测股票市场涨跌引言:股票市场的涨跌一直是投资者和金融从业者关注的焦点之一。

预测股票市场的涨跌对于投资决策和风险控制有着重要的意义。

在过去的几十年里,人们尝试了各种方法来预测股票市场的涨跌,包括传统的统计模型、技术指标分析、基本面分析等。

然而,由于股票市场的复杂性和不确定性,这些方法的预测效果往往不尽如人意。

近年来,人工智能技术的迅猛发展为预测股票市场带来了新的希望。

其中,BP神经网络作为一种重要的人工神经网络模型,被广泛运用于股票市场的预测中。

一、BP神经网络的原理和特点BP神经网络是一种前向反馈的人工神经网络,由输入层、隐含层和输出层组成。

其基本原理是通过将输入信号进行加权求和并通过激活函数传递到下一层,从而逐层进行信息传递和处理,最终获得输出结果。

BP神经网络具有以下几个特点:1. 自适应学习能力:BP神经网络可以通过学习算法自适应地调整权值和阈值,从而提高预测的准确性。

2. 非线性映射能力:BP神经网络可以通过引入非线性激活函数,模拟复杂的非线性映射关系,更好地适应股票市场的涨跌特性。

3. 并行处理能力:BP神经网络的计算过程可以并行进行,充分利用计算资源提高计算效率。

4. 适应噪声和非线性问题:BP神经网络通过多层网络结构,具有一定的容错性和适应噪声的能力。

同样,其非线性映射特性使其在处理非线性问题方面更具优势。

二、BP神经网络在股票市场预测中的应用BP神经网络作为一种强大的模式识别和非线性映射工具,在股票市场的预测中已被广泛应用。

1. 数据准备与处理:股票市场的预测需要大量的历史数据作为样本进行训练。

首先,需要收集相关的股票市场数据,包括股价、成交量、涨跌幅等指标。

然后,对数据进行预处理,包括去除异常值、缺失值处理、特征标准化、数据平滑等步骤。

2. 网络模型设计:根据股票市场的特点和预测目标,设计BP神经网络的网络结构。

通常情况下,网络包括一个输入层、一个或多个隐含层和一个输出层。

BP神经网络模型

BP神经网络模型

BP网络旳原则学习算法
BP算法直观解释
◦ 情况一直观体现
◦ 当误差对权值旳偏 导数不小于零时,权值 调整量为负,实际输 出不小于期望输出, 权值向降低方向调整, 使得实际输出与期望 输出旳差降低。
e
who
e w ho
>0,此时Δwho<0
BP网络旳原则学习算法
BP算法直观解释
◦ 情况二直观体现
xx1,x2, ,xn
h h y yo o i i h y h y o o ii1 1 1 1 ,,,,h h y y o o ii2 2 2 2 ,,,,
,h ip
,h o p ,yiq
,y o q
dod1,d2, ,dq
BP网络旳原则学习算法
◦ 输入层与中间层旳连接权值: w ih ◦ 隐含层与输出层旳连接权值: w h o ◦ 隐含层各神经元旳阈值: b h ◦ 输出层各神经元旳阈值: b o ◦ 样本数据个数: k1,2, m ◦ 激活函数: f ( )
将误差分摊给各层旳全部 单元---各层单元旳误 差信号
修正各单元权 值
•学习旳过程:
• 信号旳正向传播 向传播
误差旳反
BP网络旳原则学习算法-学习过程
•正向传播:
• 输入样本---输入层---各隐层---输出层
•判断是否转入反向传播阶段:
• 若输出层旳实际输出与期望旳输出(教师信号)不 符
•误差反传
第七步,利用隐含层各神经元旳 h ( k ) 各神经元旳输入修正连接权。
和输入层
wih(k)weihhihe(k)hiw h(ihk)h(k)xi(k) wiN h1wiN hh(k)xi(k)
BP网络旳原则学习算法

MLBP模型的应用实践及实验误差对比分析

MLBP模型的应用实践及实验误差对比分析

MLBP模型的应用实践及实验误差对比分析宫振华;王嘉宁;苏翀【摘要】随着社会经济的发展,数据量在日益增加,为了能够在庞大的数据中挖掘出有价值的信息,通过历史数据的潜在规律推测未来已经成为数据挖掘领域内重要的部分.本文通过研究MLP、BP及MLBP模型并进行模型的误差对比分析,并将最优模型应用于股票预测.实验数据通过调用Python提供的Tushare财经数据接口进行股票日交易数据的爬取,应用三种模型对股票交易数据进行分析处理,不断进行调参,并将预测结果使用MSE进行误差比较,最后得出一个最优的预测值.【期刊名称】《计算机系统应用》【年(卷),期】2019(028)006【总页数】6页(P254-259)【关键词】MLBP模型;MSE误差对比分析;股票预测【作者】宫振华;王嘉宁;苏翀【作者单位】南京机电职业技术学院, 南京 211135;江苏科技大学电气与信息工程学院, 张家港 215600;南京邮电大学管理学院, 南京 210023【正文语种】中文随着经济改革开放初期[1],股份制开始诞生,我国股票发行市场随即开始萌芽.相比于美国市场,我国股票市场的起步较晚,但是经过三十多年经济的建设、证券制度和法规的逐步完善,市场已经越来越趋于成熟规范化发展.因此越来越多的人摇身变成"股民",投身于浩瀚的“股市”之中.随着中国股票市场的不断发展,上市公司数量也在逐步递增,流通于证券市场的股票数量也随之增加[2].每只股票都拥有几十个不同的层面、维度上的数据,中小股民在面对多维度,数量巨大的数据时就加大了基于股票技术层面上分析的难度.投资者在处理过多的变量时,容易造成分析过程的混乱.为了实现较为准确的股票预测,本文研究了MLP 和BP 神经网络模型,并结合两种模型构造了MLBP 模型,分别将爬取的股票历史数据作为神经网络的输入集,通过模型的调参处理,得出预测的结果.根据MSE 误差对比分析选取误差最小的作为股票预测的应用模型,并利用其找出每股变化所表现出来的动态运行规律,为股市中广大中小投资者等弱势群体服务,并指导其进行有效的价值投资[3].1 模型建立1.1 MLP 模型MLP (Multi-Layer Perception)神经网络是一种结构为层层递进的人工神经网络,一组输入变量可以被映射、传递到一组输出变量.该网络输入层、隐藏层和输出层.除了输入节点之外,每个节点自身都带有一个非线性激活函数的神经元[4].隐藏层主要实现对输入空间的非线性映射,输出层则是实现结果的线性分类.MLP 网络有输入层(最左边),隐藏层(中间两层),和输出层(最右边),MLP 只有向前传播过程.每个神经元上面都有对于一个输入的权值、一个偏置和一个激活函数.所以一个前向过程的流程就是input 输入,然后经过第一层神经元运算得到输出,然后第一层的输出作为第二层的输入运算,得到第二层的输出,直到输出层运算,最后得到结果.神经网络就是依靠这样一套机制来进行计算和预测的.神经网络模型图如图1. 图1 MLP 神经网络模型1.2 BP 模型BP(Back Propagation)前馈神经网络,是一种在MLP 神经网络基础上改进的反馈型学习网络.由两个阶段组成,第一阶段是将训练输入送入网络以获得激励响应;再将激励响应同训练输入对应的目标输出求差,获得最后两层的响应误差;第二阶段将输入激励和响应误差相乘获得权重的梯度;再将这个梯度乘上一个比例并取反后加到权重上.当整个训练网络输出层的误差缩小到期望值范围或训练次数超过阈值的时候,所有训练过程才最终结束,这就是BP 神经网络一次学习训练的全部过程.BP 神经网络算法一般由三层或多层组成,是一种多层前馈神经网络.由输入层、输出层和隐含层组成[5].由于BP 模型具有误差反向传播,能够很好的改变网络的权值和阈值,因此其具有泛化能力.80%的人工神经网络中包含了BP 网络[6,7],所以是使用最广泛的神经网络模型[8],在股票预测分析系统中也会将BP 模型作为第一选择,BP 算法的模型如图2所示.图2 BP 神经网络模型图假设输入节点xj、隐层节点yi、输出节点O1分别表示BP 神经网络三层节点.隐节点与输入节点间的权值为Wij,输出节点与隐含层节点的网络权值为Tli.BP 算法的核心是对权值Wij,Tli的调整和对阈值θ 的调整,使误差函数E沿梯度方向下降.假设在输出节点的期望输出为t1时,BP 模型的计算公式为:(1)隐含节点输出公式:其中,(2)输出节点输出公式:其中,(3)输出节点误差的公式:1.3 MLP 与BP 模型的结合BP 和MLP 组合模型即为MLBP 模型,其是在BP 模型和MLP 模型的基础上进行改进的模型,将MLP 的多个隐含层放入到BP 模型中,因此MLBP 模型是有1 个输入层,2 个隐含层和1 个输出层的反向传播神经网络.MLBP 模型的执行流程如下:(1)首先获取股票的历史数据及待预测的数据,作为模型的输入集.(2)对数据进行预处理,包括转置和归一化.(3)构建MLBP 模型,并初始化参数.(4)不断地进行调参进行训练,直到训练次数达到一定数值,保存训练数据训练出的模型(包括网络的层数、权值等参数).(5)带入待测数据,进行预测,并进行误差分析.主要MLBP 模型的流程图如图3所示.图3 MLBP 模型流程2 MSE 误差分析MSE (Mean Square Error)均方误差[9]是衡量训练模型的输出值与真实值之间平方误差的总体期望偏差,如式(4)所示.其中,为模型的输出值,θ为真实值.这里需要引入两个定义:(1)估计的偏差bias其中,期望作用在所有从随机变量采样得到的数据上,θ为真实值.如果bias为0,则称估计量是无偏的.(2)方差Var其中,µ是样本的均值.此处,可以根据式(5)、式(6)将式(4)改写为:MSE包含了偏差和方差,理想的估计具有较小的MSE或是在检查中会稍微约束它们的偏差和方差.3 实验3.1 实验过程与数据实验包括数据爬取和模型对比两部分.首先通过Python 提供的Tushare 接口[10]爬取50 天的股票数据信息,对这些数据进行转置和归一化处理,并将数据分成训练数据集和测试数据集存入数据库.随后分别使用MLP、BP 和MLBP 模型对数据库中的股票数据进行训练和预测,并根据实验数据进行模型对比.实验中的调参包括:Sigmoid 选取正切函数,初始权重的范围在[-0.1,0.1]之间,使用MSE计算误差.设训练次数记为T,T取值300 和500,学习速率记为N,N取值0.05、0.1 和0.15,动量因子记为M,M取值0.1,输入层记为I,隐含层记为H,输出层记为O,误差记为E.实验内容是根据50 天的历史数据来预测未来3 天的股票信息.表1至表3分别是MLP、BP 和MLBP的预测数据.3.2 实验结果分析在这3 种算法中,BP 和MLBP 模型计算的误差要远远小于MLP 算法,而MLBP 模型相比BP 模型误差进一步降低.因为MLBP 在训练参数和权值时用了反向传播并更新的过程,所以能够更加准确的进行预测.模型误差对比如图4所示.表1 50 天数据预测3 天数据表(MLP 模型)TNMIH OE300 0.05 0.1 50 11 340.098 724 300 0.05 0.1 50 12 3 38.812 157 300 0.1 0.1 50 11 3 39.135 687 300 0.1 0.1 50 12 3 39.954 003 300 0.15 0.1 50 11 3 39.112 046 300 0.15 0.150 12 3 38.978 727 500 0.05 0.1 50 11 3 39.642 054 500 0.05 0.1 50 12 3 40.005 675 500 0.1 0.1 50 11 3 39.343 875 500 0.1 0.1 50 12 3 38.797 833 500 0.15 0.1 50 11 3 38.724 004 500 0.15 0.1 50 12 3 39.643 545表2 50 天数据预测3 天数据表(BP 模型)TNMIH OE300 0.05 0.1 50 11 311.644 212 300 0.05 0.1 50 12 3 12.083 862 300 0.1 0.1 50 11 3 11.994 527 300 0.1 0.1 50 12 3 12.009 512 300 0.15 0.1 50 11 3 11.283 457 300 0.15 0.1 50 12 3 12.075 438 500 0.05 0.1 50 11 3 10.973 403 500 0.05 0.1 50 12 3 12.001 205 500 0.1 0.1 50 11 3 10.964 284 500 0.1 0.1 50 12 3 12.000 015 500 0.15 0.1 50 11 3 11.435 478 500 0.15 0.1 50 12 3 12.010 648表3 50 天数据预测3 天数据表(MLBP 模型)TNMIHOE300 0.05 0.1 50 11 3 8.799 246 300 0.05 0.1 50 12 3 9.003 454 300 0.1 0.1 50 11 3 8.902 763 300 0.1 0.1 50 12 3 9.010 424 300 0.15 0.1 50 11 3 8.914 257 300 0.15 0.1 50 12 3 8.294 527 500 0.05 0.1 50 11 3 8.699 253 500 0.05 0.1 50 12 3 8.783 446 500 0.1 0.1 50 11 3 9.003 788 500 0.1 0.1 50 12 3 8.293 452 500 0.15 0.1 50 11 3 8.506 454 500 0.15 0.1 50 12 3 8.911 045三种模型的误差都非常均匀,因此预测的结果具有平稳性.但是三种算法的都有的缺点是当选取的数据量特别多时,会导致训练时间过长,而较少的数据量虽然能够加快运算速度,但预测的误差会变大,因此选择合适的数据规模可以权衡误差与效率.图4 模型误差对比图4 MLBP 模型的应用4.1 股票分析平台通过对股票数据的训练和预测实验,可证明MLBP模型更能够准确的对股票数据进行分析,因此其在股票分析方面具有潜在的应用价值[11].为了能够极大地发挥该模型的作用,同时让用户更加方便的进行股票数据的分析和预测,本文将该模型应用于股票分析平台.该平台为Django 框架[12]的WEB 应用程序,以MLBP 模型作为平台的核心业务部分.另外增加了注册登录、上市公司信息、财务报表、行业分类等功能作为辅助部分.平台的用例图和功能模块图分别如图5、图6所示.图5 平台用例图4.2 平台功能设计平台包括用户、股票、企业、企业报表等实体,各个实体之间具有一定关联性包括:(1)每个用户可以查看所有股票基本信息、查看所有企业信息和所有企业报表信息.(2)每只股票对应一个企业,并且每只股票的所有信息能被所有用户查询.(3)每份企业报表都可以被所有用户查看,每份企业报表对应一个企业.(4)每个企业对应一只股票,并且拥有许多企业报表,每个企业可以被所有用户查看.实体关系(E-R)图如图7所示.图6 平台功能模块图图7 平台E-R 图4.3 平台运行平台部署在本地服务器上,通过访问项目网址可展示平台界面.平台首页如图8所示. 以股票行情预测模块为例,用户在头部输入框中输入查询的股票代码,系统后台调用财经数据接口获取交易数据,并将数据放入神经网络算法代码中处理,将各个算法的输出值使用MSE 误差估计模型进行比较,最后得出最佳的预测结果.后台将运行结果返回到前台页面展示,如图9所示.图8 平台首页图9 股票行情预测界面5 结语通过分析现今的股票市场发展,根据众多中小投资者对股市信息的预测需求,本文研究了MLP、BP和MLBP 模型,并通过实验和模型对比可知,MLP 和BP 组合模型可以进一步提高预测的准确度,降低误差率,从而使投资者可以根据预测的股票信息更清楚的进行投资决策.另外通过将MLBP 应用在WEB 程序中,更加方便了用户操作,提高了模型的应用价值.在接下来的工作中,还会继续完善MLBP 模型,在降低误差的基础上进一步提高运行速率.同时广泛爬取不同种类的股票信息,拓展股票分析平台的功能,为不同需求的用户提供多方面服务.参考文献【相关文献】1 牛新建.中原证券股票分析预测系统设计与实现[硕士学位论文].大连:大连理工大学,2009.5-62 孙睿.区间型符号数据分析在股票分析中的应用[硕士学位论文].北京:首都经济贸易大学2010.23-24.3 艾小刚.价值投资理论在A 股估值中的有效性研究[硕士学位论文].兰州:兰州大学,2014.4 姚运涛.面向股票的网络舆情信息处理与波动趋势预测[硕士学位论文].北京:北京邮电大学,2017.5 Zhang YD,Wu LN.Stock market prediction of S&P 500 via combination of improved BCO approach and BP neural network.Expert Systems with Applications,2009,36(5):8849-8854.[doi:10.1016/j.eswa.2008.11.028]6 Yin Z,Zhou ZR.A study of wind statistics through autoregressive and moving-average (ARMA)modeling.China Ocean Engineering,2001,15(1):61-72.7 Eric D,Andjelic GB,Redzepagic S.Application of MACD and RVI indicators as functions of investment strategy optimization on the financial market.Zbornik Radova Ekonomskog Fakultetau Rijeci,Časopisza Ekonomsku Teorijui Praksu,2012,27(1):171-196.8 陈伟,吴耀武,娄素华,等.基于累积式自回归动平均法和反向传播神经网络的短期负荷预测模型.电网技术,2007,31(3):73-76.[doi:10.3321/j.issn:1000-3673.2007.03.015]9 杨迪,邵玉斌,陈家福.基于MSE 准则的线性均衡器性能分析.昆明理工大学学报(理工版),2006,31(6):42-45.[doi:10.3969/j.issn.1007-855X.2006.06.010]10 邵必林,梁元欣.基于MLP 与RBF 神经网络的钼金属价格预测方法研究.中国钼业,2016,40(5):54-60.11 桂新志.数据挖掘在股票分析中的研究与应用[硕士学位论文].武汉:华中科技大学,2011.12 夏志富,王晗璐,李玉平,等.基于Django 框架的智能商务监控系统的设计.微型机与应用,2016,35(12):21-23,27.。

PSO-BP算法

PSO-BP算法

基于PSO —BP 算法的模糊神经网络成矿探测评价模型一、基本的BP 神经网络原理基本BP 算法包括两个方面:信号的前向传播和误差的反向传播,即计算实际输出时按从输入到输出的方向进行,而权值和阈值的修正从输出到输入的方向进行。

图1—1 BP 网络结构图1-1中变量含义如下所示 :j x 表示输入层第j 个节点的输入j =1,…,M ;ij v 表示隐含层第i 个节点到输入层第j 个节点之间的权值;i θ表示隐含层第i 个节点的阈值;()x φ表示隐含层的激励函数;ki w 表示输出层第k 个节点到隐含层第i 个节点之间的权值,i=1,…,q; k a 表示输出层第k 个节点的阈值,k=1,…,L;()x ψ表示输出层的激励函数;k o 表示输出层第k 个节点的输出; k T 表示输出层第k 个节点的期望输出;激励函数一般使用S 型函数,即 ()()()xex f x -+===11x ψφ ; j=0,1,2,…,M ; i=0,1,2,…,q ; k=0,1,2,…,L 。

(1)信号的前向传播过程 隐含层第i 个节点的输入i net :∑==Mj jij i x vnet 1(1—1)隐含层第i 个节点的输出i y :()⎪⎪⎭⎫⎝⎛==∑=M j j ij i x v f net f 1i y (1-2)输出层第k 个节点的输入k net :∑∑∑===⎪⎪⎭⎫⎝⎛==qi M j j ij ki i qi ki k x v f w y w net 111 (1—3)输出层第k 个节点的输出k o :()⎪⎪⎭⎫⎝⎛⎪⎪⎭⎫ ⎝⎛==∑∑==q i M j j ij ki k k x v f w f net f o 11 (1—4) (2)误差的反向传播过程误差的反向传播,即首先由输出层开始逐层计算各层神经元的输出误差,然后根据误差梯度下降法来调节各层的权值和阈值,使修改后的网络的最终输出能接近期望值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n^j=1 , 2 , … , m) 为
隐节点 j 在模式 ρ 下的输出值 ;δ P=(OpI
定义 2
0p2

Opm)T 为模式 ρ 的内部表示向量.
等势为多个隐节点在网络中具有相同的表现,即多个隐节点对同一模式产生相
表 1 BP 罔解决 XOR 问自状态对阳衰
输入模式
同的敏感性,则称这些为隐节点等势. 一些研究表明,内部表示矩阵 H 会很快趋
网络施加影响,从而期望能够使其不致于陷入或者陷入后能够跳出局部极小状态.我们从网络
的局部出发,仔细分析了神经网在局部极小状态时隐节点的特征,提出了隐节点竞争 BP 模
型,模拟试验结果非常理想.
本文收到日期 1994-09-08
554
北方交通大学学报
第 19 卷
2
隐藏层分析
隐藏层界于输入层与输出层之间,是输入模式与输出模式联系的内在表示,它既包含输入
表 2 是分别采用传统 BP 算法和隐节点竞争 BP 算法做 XOR 问题试验的十对试验结果对
照表.从表 2 可以看出,隐节点竞争 BP 算法不仅可以有效地克服局部极小问题,而且显著地
提高了学习速度.
表2


两种 BP 算法对 XOR 问固试验结果对照表


2
传统 BP 算法 隐节点竞争 BP 算法
是目前优秀的算法之一,因而得到广泛使用. 一个三层 BP 模型(图 1) 的非线性动力学描述为: 输入层节点 Oj
= Ij.
隐藏层和输出层节点: net j
式中
2: WjiO i + 屿,
OJ= 元( net). Oj 表示节点 j 的输出值冯表示输入层节点 j 的输入值; netj
表示节点 j 的净输入 ;Wji 为从节点 t 到节点 1 的权(连接强度 ) ; qj 表
示节点 j 的闰值;Jj O 为节点 j 的活动函数,是一个有界可徽的非线
性连续函数.
固 1 三层 BP 穰型
BP 模型采用梯度下降法调整权值,使各输出节点实际输出与教师信号的差平方和最小.
其学习算法即下面的广义误差 s 规则:
其中
T j - Oj)Í( πetj ) • 民=才吃,___ _ , _ " l (L.; Wkh)j (net j ).
令 d
= 1J( 子Wkßk)X i ,
0)
(7)
得Ll W ji = dO j (1 -
式 (6) 和式 (7) 反映出, 0 竞争的结果将直接向上和向下影响到上层权和下层权,使得整个网络
都表现出竞争的特性.
Peter 和 Leonard 为了解决死锁问题使用了隐节点的误差信号|岛|间竞争的形式[刀,我们
竞争形式.
参考文献
K W18 S y , Hwang J N. An A1gebraic Projection Analysis for Optimal Hidden Units Size and Leaming Rates in Back Propagation Leaming. IEEE Intemational Conference on NeuraJ Networks, 1988 ,1(1) :363-370 2 Peter A S ,
L回nard
1
M U. A Local Interaction Heuristic for Adaptive Nerwork. IEEE Intemational Conference on Neural Net-
works, 1988 ,1(1) :317-324
Hidden Unit Competition Back Propagation Model
r(
ð. Wji
=
~Pi. (TJ
> 0)
.._~~__.._.
(1)
在此 j 为输出节点
在此 j 为隐藏层节点
(2)
由于多层 BP 模型具有非常复杂的误差表面,广义 δ 规则无法保证网络能够达到能量函
数全局最小.试验表明,在不少情况下网络状态陷入了能量函数局部极小点.为了克服局部极
小问题,人们采用了很多方法,如模拟退火法、噪音法等等.这些方法的一个共性是从整体上对
于稳定,网络学习很短时间 H 便接近于一个常
量矩阵,大量的学习时间被消耗在 H 稳定之
全 局 最 小
隐节点状态
& n u ' A
u n 句 , "
输出模式
n y n u z
。 。

。 句 句 nununu OUAUAU nunUAU nynunu nuJnyny 'AOOne 3 , ---
后[1]所以内部表示矩阵 H 对神经网络所能 达到的最终状态具有重要影响,它在一定程度
征不能被网络表现出来.这就是 A. S. Peter 和 M. U. Leonard 的思想 [2] 但是他们没有明确
提出等势的概念,而称这种由等势所引起的局部极小现象为"死锁并且认为"死锁"节点互相
抑制对方表现出未被网络所表现出来的特征.
通过试验,我们证实了等势可能导致局部极小的思想.表 1 是一张两个隐节点的 BP 网解
3 75% 400
4 500 200
5 75% 300
6 500 200
7 600 200
8
9
10 75% 75%
15% 50
600 300
75% 200
75% 300
注 z 整数为收敛时的学习步数,百分数为 2000 步学习之后的模式记忆率
4
O 竞争与 8 竞争
上文所提到的隐节点竞争,均表现为隐节点的输出值 1 Oj I 之间的相互作用形式,我们称
决 XOR 问题时到达的两种状态的对照表,表的上、下两部分分别是该网络在全局最小和局部
极小状态时的隐节点状态值.从表 1 可以发现,在局部极小状态,网络的内部表示矩阵
H
=
I
rO.58 0.00 0.00 0.001 LO.60 0.00 0.00 o.ooJ'
网络的两个隐节点出现了非常明显的等势.这时隐节点在作用上只等效与一个隐节点,无法对
Lu Xianfeng
(De归rtm四t
状态(暂记此状态为 A); 保持平 =2.5 ,采用式 (5) 的竞争策略,取激烈度 Ç=0.25 , 以图 3 为初
始状态做同样的试验,只用 50 步学习,最大误差便降到 0.093; 保持市 =2.5. 采用式 (5) 的竞
争策略,取激烈 ç 试验 2
= O. 25 ,从状态
A 开始继续学习,网络很快就跳出局部极小点并且在第 220
上决定着网络是迅速收敛到期望状态,还是陷
入某个非目标状态,当出现等势现象时,等势节
1

0.00
局 部 极 小
。 。 。 。
0.05 0.60 0.00 0.00 0.00
0.13 0.10 0.56 0.56 0.56
0.58 0.00 0.00 0.00
点对同一模式表现出相似的活跃程度.如果表
示模式恃征的隐节点数目有限时,可能有些特
称这种形式为 "δ 竞争从式 (7) 看出, a 竞争只能直接影响到下层权向量,而对上层权向量的 影响则很难表现出来:由此推测, 0 竞争可能不如 O 竞争有效性高.
以图 3 所示的一个神经网为初始状态 表3 0 竞争和 8 竞争试验结果对阳衰
做 XOR 问题试验, 0 竞争只用了 50 步, 而相同条件下的 δ 竞争则用了 90 步学习 才收敛到相同的程度,同时采用 8 竞争 o
REPEAT
向前计算;
IF MaxError> 定值
EGIN
隐节点竞争;
反向误差传播;
修改权值;
END UNTIL MaxE rror<
=定值
第 4期
卢显锋等 t 隐节点竞争 BP 模型
557
5
结论
隐节点竞争机制可以有效地防止和避免网络局部极小现象,并能显著提高收敛速度-本文
通过对两种隐节点竞争形式的理论分析和试验对比,证明了 O 竞争是更为有效的一种隐节点
这种隐节点竞争形式为 "0 竞争
在图 5 所示的一个隐节点竟争 BP 网中,我们在输入层、隐藏层和输出层分别取一个节点
i 、 j 和 k , 由式 (2) 得ð. W kj = 币是Oj' 令 μ= 科晶,得
ð. W
kj = μOj
(6)
556
北方交通大学学报
第 19 卷
09飞
固 3
XOR 问团试验韧始状态
竞争则需要 100 步才收敛到相同的程度.


O 竞争
B 竞争
0 叶竞争
XOR 问题(图 3) 4-2-4 问题(图的
50
2420
90
+∞
100
+∞
以图 4 所示的一个神经网为初始状态做 4-2 一 4 编码问题试验, 0 竞争学习 2420 步网络收 敛, a 竞争则不能使其收敛,同时采用 δ 竞争和 O 竞争也不能使其收敛.试验结果对照表见表 3. 表 3 表明, 0 竞争比 8 竞争具有更高的有效性. 隐节点竞争 BP 模型的学习算法可描述为:
步学习后最大误差降到 0.05 以下.
以图 4 所示的一个神经网为初始状态做 4-2-4 编码问题试验,当1)
= O. 25
时,
传统的 BP 算法经过 55000 步学习之后,最大误差仍高达 0.745; 隐节点竞争 BP 算法在 η=
2.5 ,
Ç=0.25 时只需 2420 步学习就使网络最大误差减小到 0.099.
相关文档
最新文档