余翊森_贝叶斯框架下B-Splines滤波算法的实现及其并行化
基于多源信息相似度的微博用户推荐算法
基于多源信息相似度的微博用户推荐算法姚彬修;倪建成;于苹苹;李淋淋;曹博【期刊名称】《计算机应用》【年(卷),期】2017(37)5【摘要】针对传统的协同过滤(CF)推荐算法中存在的数据稀疏性和推荐准确率不高的问题,提出了基于多源信息相似度的微博用户推荐算法(MISUR).首先,根据微博用户的标签信息运用K最近邻(KNN)算法对用户进行分类;然后,对得到的每个类中的用户分别计算其多源信息(微博内容、交互关系和社交信息)的相似度;其次,引入时间权重和丰富度权重计算多源信息的总相似度,并根据其大小进行TOP-N用户推荐;最后,在并行计算框架Spark上进行实验.实验结果表明,MISUR算法与CF算法和基于多社交行为的微博好友推荐算法(MBFR)相比,在准确率、召回率和效率方面都有较大幅度的提升,说明了MISUR算法的有效性.%Focusing on the data sparsity and low accuracy of recommendation existed in traditional Collaborative Filtering (CF) recommendation algorithm,a micro blog User Recommendation algorithm based on the Similarity of Multi-source Information,named MISUR,was proposed.Firstly,the micro blog users were classified by K-Nearest Neighbor (KNN) algorithm according to their tag information.Secondly,the similarity of the multi-source information,such as micro blog content,interactive relationship and social information,was calculated for each user in each class.Thirdly,the time weight and the richness weight were introduced to calculate the total similarity of multi-source information,and the TOP-N recommendation was used in adescending order.Finally,the experiment was carried out on the parallel computing framework Spark.The experimental results show that,compared with CF recommendation algorithm and micro blog Friend Recommendation algorithm based on Multi-social Behavior (MBFR),the superiority of the MISUR algorithm is validated in terms of accuracy,recall and efficiency.【总页数】5页(P1382-1386)【作者】姚彬修;倪建成;于苹苹;李淋淋;曹博【作者单位】曲阜师范大学信息科学与工程学院,山东日照276826;曲阜师范大学软件学院,山东曲阜273100;曲阜师范大学信息科学与工程学院,山东日照276826;曲阜师范大学信息科学与工程学院,山东日照276826;曲阜师范大学信息科学与工程学院,山东日照276826【正文语种】中文【中图分类】TP301.6【相关文献】1.融合用户信任度和相似度的基于核心用户抽取的鲁棒性推荐算法 [J], 赵明;闫寒;曹高峰;刘昕鸿2.一种基于用户和物品相似度的融合协同过滤推荐算法 [J], 邓亚文;罗可3.基于用户习惯偏好相似度的Slope One推荐算法 [J], 杨嫘4.基于改进用户相似度的协同过滤推荐算法研究 [J], 张利5.一种基于用户偏好分析和论坛相似度计算的改进LFM推荐算法 [J], 巨星海;周刚因版权原因,仅展示原文概要,查看原文内容请购买。
改进人工鱼群算法优化小波神经网络的变压器故障诊断
改进人工鱼群算法优化小波神经网络的变压器故障诊断贾亦敏;史丽萍;严鑫【摘要】针对油浸式变压器故障类型的复杂难辨,结合油中气体分析法,提出一种基于改进人工鱼群算法优化小波神经网络的故障诊断模型.基于经典三层小波神经网络,采用粒子化的人工鱼群算法对小波神经网络输入和输出层的权值、小波神经元的伸缩和平移系数进行修正,通过引入动态反向学习策略实时优化人工鱼分布,迭代后半程采用基于柯西分布的自适应人工鱼视野范围提高算法精度.结果表明,该改进鱼群算法优化的小波神经网络相比标准粒子群算法优化小波神经网络和标准鱼群算法优化小波神经网络,诊断速度更快,准确率更高.【期刊名称】《河南理工大学学报(自然科学版)》【年(卷),期】2019(038)002【总页数】7页(P103-109)【关键词】变压器;故障诊断;小波神经网络;改进人工鱼群算法;粒子群优化算法;动态反向学习策略【作者】贾亦敏;史丽萍;严鑫【作者单位】中国矿业大学电气与动力工程学院,江苏徐州221116;中国矿业大学电气与动力工程学院,江苏徐州221116;国网上海市电力公司市北供电公司,上海200940【正文语种】中文【中图分类】TM4110 引言变压器自19世纪80年代问世以来,一直是电力系统的关键设备之一,受到了广泛关注和研究。
在整个输配电系统中,变压器作为核心组成部分占据着至关重要的地位,其性能的优劣直接影响整个供配电系统的经济效益与安全性。
在实际生产中,能否快速准确诊断或预测变压器已有故障或潜伏性故障,与电网能否安全稳定密切相关[1]。
基于油浸式变压器故障时油中会产生较多气体的油中气体分析法(dissolved gas analysis,DGA)自提出以来,已成为国内外实际应用最广泛的变压器故障诊断方法,该方法主要通过故障气体量与故障类型间数学关系进行判断,经典应用有三比值法与大卫三角法等。
近年来,许多新理论被应用于变压器故障诊断,主要有模糊算法[2]、支持向量机[3]、免疫算法[4]、粗糙集理论等,取得了一定成果。
一种新的自适应小生境粒子群优化算法
KEYWORDS: at l w ̄ ' o t zt n ( S P r ce8 q pi ai i n mi o P O);Nih ;Auo—a a td;Mut —p a u cin ce t d pe l i e kfn t o
的社 会 认 知 特性 。 如果 某粒 子发 现 一 个 当前 最 优 位 置 , 它 其
全 局 最 优 位 置 的 搜 索 。 最 后 , 过 几 个 典 型 的 多 峰 测试 函数 , 算 法 进 行 了 仿 真 验 证 。结 果 表 明 , 算 法 的 收敛 性 、 优 性 通 对 在 寻
等方面 , 算法均达到了 良好的效果 。
关键词 : 子群算法 ; 生境 ; 粒 小 自适 应 ; 峰 函数 多
第 7 第1期 2卷 0
文 章 编 号 :06— 3 8 2 1 ) 0— 15— 4 10 9 4 (0 0 1 0 7 0
计
算
机
仿
真
21年l月 0 0 0
一
种 新 的 自适 应 小 生 境 粒 子 群 优 化 算 法
宋 书强 , 叶春 明
( 上海理 工大学管理学 院, 上海 2 0 9 ) 0 0 3
ABS TRACT:n o d rt v r o h h r o n h t h S l oi m se s o b a p d i t o a n ma , I r e o o e c me t e s o t mi g t a e P O ag r h i a y t e t p e no lc l ( a ieS a pi zt nA grh Prc w r O t ao l i m, t l m mi i ot
粒 子将 迅速向其靠 拢 , 如果 该最优 位 置为一局 部最 优点 , 粒 子群 就无 法在解空间 内重新搜索 , 法将陷入局 部最优 。为 算 了提高解的质量 , 文将 小生境 思想 引入进 了微粒 群算 法 , 本 设计 出一种新 的小 生境 微粒群 优化 算法 ( N—P O)以保 持 S 微粒 群的多样 性 , 通过 3个典 型 的多峰测试 函数 , 并 进行 了 仿 真实验 , 验证 了该算法 的有效性 。
基于机器学习的毫米波MIMO系统波束成形设计
摘 要 :在 毫 米 波 大 规 模 多 输 人 多 输 出 系 统 中 .基 于 码 本 的 模 拟 预 编 码 器 联 合 最 优 化 设 计 理 论 上 可 以 通
过 穷 尽 搜 索 得 到 ,但 其 过 高 的 搜 索 复 杂 度 阻 碍 了 实 际 应 用 . 受 机 器 学 习 中 交 叉 熵 最 优 化 的 启 发 ,文 章 提 出 一 种
的 复 增 益 ,心.,和心.,则 分 别 是 该 路 径 的 发 射 方 位 角 和 到 达 方 位 角 .§,(0 ) 与 ^ ( 0 )分 别表示发射端和接
收 端 天 线 阵 列 响 应 向 量 ,当 采 用 均 匀 线 性 阵 列 时 ,天线阵列响应向量可表示为
容⑷ ==」 _ [ 1 ,# 祕 , …
M r 个向量组成•当给定F 和 W ,基 站 射 频 端 到 移 动 射 频 端 之 间 的 数 据 可 达 率 可 以 表 示 为
J?(F ,W)==log2( I d + - ^ R :'W hH F F hH hW ).
(9)
其 中 :i^ = < T2WHW 为 噪 声 相 关 矩 阵 ,| . | 表 示 矩 阵 的 行 列 式 . 本 文 联 合 设 计 {F ,VV}使 得 数 据 可 达 率 i?(F .W)最 大 化 :
收 稿 日 期 :2020-05-17 作 者 简 介 :袁 怡 圃 ( 1979 —),男 ,福 建 厦 门 人 ,讲 师 ,博 士 ,从 事 无 线 通 信 、信 号 处 理 等 研 究 . 基 金 项 目 :泉 州 师 范 学 院 大 学 生 创 新 创 业 训 练 计 划 项 目 (S201910399066)
基 于 小 规 模 M IM O 系 统 开 发 的 传 统 波 束 成 形 方 案 在 大 规 模 M IM O 系 统 中 将 面 临 高 成 本 、高功耗的 问题.该问题的一种解决方案是使用混合结构的波束成形系统.混合结构波束成形系统包含低维度的数 字 预 编 码 器 和 高 维 度 的 模 拟 预 编 码 器 ,通 过 使 用 数 量 远 少 于 天 线 数 的 射 频 链 来 实 现 成 本 和 功 耗 的 有 效 降低[23].在实 际 应 用 中 ,模 拟 预 编 码 器 一 般 由 有 限 精 度 的 相 移 器 组 成 ,其 恒 模 约 束 导 致 混 合 波 束 成 形 的 最优化设计问题难以直接解决.通常采用基于码本的搜索方法来设计模拟预编码器.理论上最佳的模拟 预 编 码 器 可 通 过 穷 尽 搜 索 法 ( exhaustive search algorithm, E S A )来 得 到 ,但 因 其 搜 索 复 杂 度 与 相 移 器 的 量 化 位 数 和 射 频 链 数 呈 指 数 关 系 ,无法在实际中应用.
基于贝叶斯估计自适应软硬折衷阈值 Curvelet 图像去噪技术
基于贝叶斯估计自适应软硬折衷阈值 Curvelet 图像去噪技术杨国梁;雷松泽【摘要】针对传统阈值图像去噪方法存在的不足,提出了基于贝叶斯估计和Curvelet变换的软硬折衷阈值图像去噪方法,自适应地对不同的Curvelet子带进行阈值化处理.实验结果表明,该方法对图像中的边缘曲线特征有更好的复原.去噪后图像的峰值信噪比值(PSNR)更高,视觉效果更好.%According to the defects of soft thresholding and hard thresholding image denoising methods,the image denoising method of soft and hard adaptive thresholding is proposed based on Curvelet transform and Bayesian estimation image denoising. Experiment results show that the new method has the advantages in denoised images with higher quality recovery of edges. It is capable for achieving the higher peak signal-to-noise ratio (PSNR) and giving better visual quality.【期刊名称】《西安工程大学学报》【年(卷),期】2011(025)006【总页数】6页(P857-861,866)【关键词】脊波变换;Curvelet变换;贝叶斯估计;图像去噪【作者】杨国梁;雷松泽【作者单位】西安工业大学计算机学院,陕西西安710032;西安工业大学计算机学院,陕西西安710032【正文语种】中文【中图分类】TN9110 引言多分辨分析小波变换[1-4]在时频域具有良好的多分辨率的特性,能够同时进行时频域的局部分析,并且能够对信号的局部奇异特征进行提取和滤波.然而小波变换由一维小波张成的,仅具有有限的方向,因此主要适用于具有各向同性奇异性的对象,对于各向异性的奇异性,如图像的边界以及线状特征等,小波并不是一个很好的表示工具.在小波理论基础上,文献[5-7]提出了一种特别适合于表示各向异性的脊波变换,是为解决二维或更高维奇异性而产生的一种新的分析工具,脊波变换能稀疏表示具有直线特征的图像,可以应用到二维图像处理的许多领域.脊波本质上是通过小波基函数添加一个表征方向的参数得到的,它具有小波的优点,同时还具有很强的方向选择和辨识能力,能够有效地表示信号中具有方向性的奇异性.为了进一步表示多维信号中更为普遍的曲线型奇异性,Donoho等人提出了曲波(Curvelet)变换理论[8-10],用多个尺度的局部直线来近似表示曲线.曲波变换可以很好地逼近图像中的奇异曲线.本文在曲波变换的基础上,利用贝叶斯估计自适应阈值结合软硬折衷阈值的去噪方法,对含噪图像进行去噪处理.实验表明,提出的方法能很好地恢复图像,特别是在噪声严重的情况下与小波去噪相比优越性显著.1 Curvelet变换1.1 Ridgelet变换若函数ψ满足容许条件,则称ψ为容许激励函数,并称为以ψ 为容许条件的Ridgelet函数[11].令u=(cosθ,sinθ),x=(x1,x2),则 Ridgelet函数为由此可知,Ridgelet函数在直线x1 cosθ+x2 sinθ=c方向上是常数,而与该直线垂直方向上是小波函数.图1显示了一个Ridgelet函数.1.2 Ridgelet离散化Ridgelet变换的快速实现可以在Fourier域中实现,在空(时)域中f的Radon变换可以通过f的二维FFT在径向上做逆的一维FFT得到,对于这个结果再进行一次非正交的一维小波变换即可得到Ridgelet的快速离散化实现.图2描述了离散Ridgelet变换的过程.图1 一个Ridgelet函数ψa,b,θ(x1,x2)的示例图2 离散Ridgelet变换过程通过Radon变换,一幅n×n的图像的像素点变为n×2n的阵列,再对n×2n阵列进行一维小波变换就得到了2n×2n阵列Ridgelet变换的结果.1.3 Curvelet变换Curvelet变换是一个多尺度、多方向的图像表示框架,是对含有曲线边缘的目标的一种有效的非自适应的表示方法,它能够同时获得对图像平滑区域和边缘区域的稀疏描述.它从Ridgelet发展而来,本质上可以看成多尺度分析下的Ridgelet实现.因此Curvelet变换时各向异性的,从而相对于小波分析提供了更为丰富的方向信息.Curvelets变换的主要步骤[9]如下:(1)子带分解:f→(p0(f),Δ1(f),Δ2(f),…);(2)平滑分割:Δs(f)→(wQΔs(f),Q∈Qs,其中wQ表示在二进制子块Q=[k1/2s,(k1+1)/2s]×[k2/2s,(k2+1)/2s]上的平滑窗函数集,wQ可以对各自带分块进行平滑;(3)正规化:gQ=2-s(TQ)-1(wQΔs(f)),Q ∈ Qs,其中,(TQ f)(x1,x2)=f(2s x1-k1,2s x2-k2)对每个子块进行归一化处理,还原为单位尺度;(4)Ridgelet分析:αμ =〈gQ,ρλ〉,μ =(Q,λ),其中,pλ是构成L2(R2)空间上正交基的函数.Curvelet具有以下性质:(4)对于含有边界光滑的二维信号有稀疏表示,逼近误差能够到达ο(M-2).(5)各向异性.Curvelet变换的实现过程如图3所示.进行Curvelet变换的基本步骤:(1)对图像进行子带分解.(2)对不同尺度的子带图像采用不同大小的分块.图3 子带的空间平滑分块过程(3)对每个子块进行Ridgelet分析.每个子块的频率带宽W、长度L近似满足关系W=L2.这种频率划分方式使得Curvelet变换具有强烈的各向异性,而且这种各向异性随尺度的不断缩小呈指数增长.(4)在进行子带分解的时候,通过带通滤波器组将目标函数f分解成从低频到高频的系列子带,以减少不同尺度下的计算冗余.如图4所示,Curvelet变换的核心部分是子带分解和Ridgelet变换.图4中p0(f)为多尺度分析后图像的低频部分,Δi(f)为高频部分.2 图像去噪实现2.1 阈值计算在贝叶斯估计理论框架下,假设图像的Curvelet系数服从高斯分布(均值为0,方差为),即图4 图像Curvelet变化前后的各子带变化过程框架对于给定的参数σX,需要找到一个使贝叶斯风险r(T)=E(^X-X)2=Ex Ey|x(^X-X)2最小(^X为X的贝叶斯估计)的阈值T.用T*=argmin rT(T)表示优化阈值.其中σ2为加入的高斯噪声方差,σx为不带噪声信号的标准方差.T是对T*=argmin rT(T)的近似,最大偏差不超过1%.2.2 参数估计对式(4)中的参数进行估计.噪声方差的估计公式为由于=+σ2,又因为可由式(6)估计噪声方差σ2用一个具有鲁棒性的中值估计器[13]估计.2.3 软硬阈值折衷法定义当a分别取0和1时,式(8)即成为硬阈值和软阈值估计方法.对于一般的0<a<1来讲,该方法估计数据Wδ的大小介于软硬阈值方法之间,叫做软硬折衷法.在阈值估计器中加入a因子:a取值为0,则等价于硬阈值方法;a取值为1,则等价于软阈值方法在0与1之间适当调整a的大小,可以获得更好的去噪效果.在此实验中,暂取a=0.5.2.4 Curvelet图像去噪的主要算法步骤和实验结果(1)对含噪声图像进行多尺度分解,得到各级子带细节(高频部分);(2)对各高频子带进行二维Curvelet分解;(3)根据式(5)估计噪声方差;(4)根据式(6)计算图像每个子带的方差;(5)根据式(7)为图像的每个子带计算相应的阈值;(6)用得到的阈值对各层的高频系数进行软硬折衷阈值化去噪;(7)对各高频子带做二维Curvelet逆变换并重构原始图像.针对该方法进行实验并且比较相关实验结果:本文主要采用峰值信噪比(PSNR)来衡量灰度图像的去噪性能.实验使用的峰值信噪比公式为其中 f'为处理后的图像的灰度,f为原始图像的灰度,N为图像像素的个数.算法实验选取了256×256,施加不同级别高斯噪声(σ =10,20,30)的图像.对离散小波变换和Curvelet变换的分解和重构是四层.实验结果如图5(σ =20)所示.(1)从人眼识别角度看,本文提出的方法效果比较明显,Curvelet变换在均匀区域的去噪结果比离散小波变换的结果要平滑,在各种噪声水平下其去噪效果都比其他相关方法要好;(2)从量化数据上看,本文方法计算得到的峰值信噪比参数值比其他去噪算法要高,见表1.表1 不同方法的去噪结果比较(PSNR)σ 噪声图像 DWT全局阈值去噪Curvlet全局阈值去噪Curvlet全局软硬折衷去噪本文方法去噪10 28.129 3 28.990 930.492 31.065 8 32.805 6 2 22.155 7 26.395 7 28.101 28.332 6 29.439 6 3 18.638 4 23.304 8 24.550 3 25.377 5 26.691 5(3)对Curvelet变换具有平移不变性和良好的方向选择性等优点以及自适应软硬折衷阈值处理的特点所决定.3 结束语本文基于Curvelet变换提出了一种根据贝叶斯估计计算阈值并以软硬折衷的方式对图像噪声去除的方法,该方法去除噪声较彻底,边界、纹理等特征保留较好.通过本文的方法进行的实验结果表明,提出的方法在去除噪声的同时,能更好地保留图像的细节.去噪后的图像峰值信噪比值高,视觉效果较好.参考文献:图5 Barbara图像及其去噪结果[5] STARCK JL,CANDESE J,DONOHOD.The curvelet transform for image denosing[J].IEEE Transaction on Image Processing,2002,11(6):131-141.[6] CANDESEmmanuel J,DONOHODavid L.Continuous curvelet transform:Resolution of thewavefront set[EB/OL].(2003-05-06)[2004-08-15].http://www-stat.stanford.edu/~donoho/Reports/2003/ContCurveletTransform-I.pdf.[7] DONOHOD L.Ridgelet functions and orthonormal ridgelets [J].Journal of Approximation Theory,2001;111(2):143-179.[8] CANDESEmmanuel J,DONOHODavid L.Curvelets a surprisingly effective nonadaptive representation for objectswith edges[EB/OL].(1999-12-16)[2004-09-20].http://www.acm.caltech.edu/~emmanuel/papers/Curvelet-SMStyle.pdf.[9] CANDESE J,DONOHO D L.Continuous Curvelet transform:reso-lution of the wavefront set[EB/OL].(2003-05-06)[2004-08-15].http://www.acm.caltech.edu/~emmanuel/publication.html.[10] CANDESE J,DONOHO D L.Fast discrete curvelet transform [R].California:California Institute of Technology,2005.[11] CANDESE J.Ridgelet:theory and application[D].Stanford:Department of Statistic,Stanford University,1998.[12] CHEN Y,HAN C.Adaptivewavelet thresholding for Image denoising[J].Electronics Letters,2005,41(10):586-587.[13] DONOHOD L,JONHNSTONE IM.Ideal spatial adaptation via wavelet shrinkage[J].Biometrika,1994,81(3):425-455.【相关文献】[1] MALLAT S.A wavelet tour of signal processing[M].2nd ed.Beijing:China Academic Press,1999:67-216.[2] MALLAT S.A theory formultiresolution signal decomposition:the wavelet representation[J].IEEE Trans PAMI,1989,11(7):674-693.[3]SARKAR TK,SUC.A tutorialonwavelets from an electricalengineering perspective,Part2:the continuous case[J].IEEEAntennas &Propa-gation Magazine,1988,40(6):36-48.[4]焦李成,谭山.图像的多尺度几何分析:回顾和展望[J].电子学报,2003,31(12A):1 975-1 981.。
关于《初等数论》的教学体会
2015年4月上旬刊关于《初等数论》的教学体会余黄生苏又(广西师范大学数学与统计学院广西桂林541004)【摘要】本文结合自己的教学实践,针对学生的学习特点,就如何提高初等数论的教学质量谈几点体会。
【关键词】初等数论教学实践教学体会【基金项目】(20150101-20161231)广西高校科学技术研究项目“相关数不相等的最优变重量光正交码的组合构造”(KY2015LX015)。
【中图分类号】G64【文献标识码】A 【文章编号】2095-3089(2015)04-0126-01初等数论是研究整数最基本的性质,是一门十分重要的数学基础课,看起来似乎很简单,但真正要把它学好、教好并不容易,尤其是习题很不好做。
本文结合自己的教学实践,针对学生的学习特点,就如何提高初等数论的教学质量谈几点体会。
一、强调课程重要性学习一门课程时,很多学生都不清楚所学课程在实际生活中有什么作用,所学课程与其它各领域有什么联系,从而缺乏积极性,所以在初等数论第一节课中教师应该讲述初等数论的重要性:初等数论广泛应用于密码学、物理学、化学、计算机科学、通讯、动物学甚至音乐等领域;初等数论不管是知识上还是思想方法上都与中学数学有着密切的联系,对学生以后从事中学数学教育职业将有很大的帮助。
二、精选教学内容由于初等数论这门课程历史悠久,教材内容相对陈旧,因此有必要在基本结构中对现行教材中的内容进行适当的增减,要删除那些繁琐的、对后续学习意义不大的内容,对有些冗长的定理证明也可不作要求,只介绍结论。
三、激发学习兴趣学生是学习的主体,学生学习的主动性源于学生的兴趣。
在教学过程中,教师应该充分激发学生的学习兴趣。
首先,教师介绍概念和结论时,适当介绍其相关应用和数学史等,例如介绍欧拉函数概念时,应介绍欧拉函数在离散数学、计算机科学和RSA 公开密钥密码体制等领域中的应用;第二,介绍数论中的未解之谜,例如哥德巴赫猜想———每个大于2的偶数均能写成两个素数之和,目前最好的结果是陈景润在1996年证明了所有充分大的整数都能表示一个素数和至多两个素数乘积之和;第三,介绍一些数学家故事,例如介绍法国数学家费马的生平事迹和主要成就;第四,介绍我国古代的数学成就,例如《九章算术》、《孙子算经》、《周髀算经》等名著,魏晋数学家刘徽的“割圆术”、南宋数学家秦九韶的“大衍总数术”等成就,从而激发学生的学习兴趣。
二阶领导跟随多智能体系统事件触发一致性
第31卷第1期2021年3月湖南工程学院学报Journal of Hunan Institute of EngineeringVol.31.No.1March 2021罗毅平,蔡聪,肖星,林国汉(湖南工程学院电气与信息工程学院,湘潭411104)摘要:针对一类时滞二阶多智能体系统领导跟随模型,研究了在无向拓扑结构下一类二阶多智能体系统领导跟随一致性控制问题.考虑系统内部非线性因素,在给定事件触发策略的条件下,设计了与时滞相关的控制器,通过矩阵不等式等分析技术,利用lyapunov-krasovskii 稳定性定理得到了该系统实现一致性的充分条件.最后,在仿真阶段验证了控制器设计的合理性.关键词:事件触发;二阶多智能体系统;一致性;输入时滞;非线性中图分类号:TP13∶TP18文献标识码:A文章编号:1671-119X (2021)01-0001-07收稿日期:2020-09-26项目基金:国家自然科学基金资助项目(11972156);湖南省自然科学基金资助项目(2017JJ4004);湖南省研究生科研创新项目(CX20190958);湖南省教育厅科研资助项目(19A117).作者简介:罗毅平(1966-),男,博士,教授,研究方向:复杂网络、多智能体系统.二阶领导跟随多智能体系统事件触发一致性0前言多智能体系统一致性在许多领域有着广泛的应用,如电网[1]、无人机编队[2-3]、生物系统[4]等领域.由于其通信成本低、效率高,受到了大量科研人员的关注,成为了控制领域的研究热点.大量科研人员投入到智能体的研究热潮中,并通过不同的角度、不同的模型充分地研究一阶多智能体系统,并获得了许多成果[5-7].然而在上述成果中,考虑的都是一阶智能体系统.但在实际应用中,大多数都是二阶甚至高阶系统,仅仅考虑位移一致性是远远不够的,特别是同时受位置和速度控制的智能体,比如编队控制中的无人机,必须同时保证智能体的位移和速度一致,才能精确地保证状态一致.Ren 等[8]也指出二阶智能体系统与一阶系统不同,生成树的存在并不是二阶智能体系统实现一致的充要条件.由此表明,将一阶一致性算法简单地应用在二阶系统上是不合适的,换句话说,从一阶系统扩展到二阶系统,并不是在一阶模型上的简单延伸,因此,研究二阶系统是非常有挑战性的,也是很有必要的.近年来,已有许多学者对二阶多智能系统的一致性控制进行了研究[9-12],研究内容主要围绕一致性算法展开,一般来说,二阶智能一致性算法分为无领导跟随一致性算法和只有一个领导者的领导跟随一致性算法.例如文献[9-10],就是通过无领导跟随一致性算法解决了二阶系统达成一致性问题.文献[11-12]讨论了在一个领导者的情况下,跟随者在控制协议作用下追踪领导者,最后与领导者状态达成一致.需要注意的是在上述文献中都是基于多智能体系统是线性的前提下进行研究的.然而,在智能体系统模型中各个智能体内部诸因素之间更多地呈现出一种非线性关系,如在无人机编队控制系统中,各个无人机内部因素肯定是一个非线性因素.因此,研究带有非线性因素的智能体系统是非常有实际意义的.为了解决非线性因素对一致性问题带来的影响,Li 等[13]利用Lipschitz 公式对非线性因素进行线性化处理,最后得出多智能体系统达成二阶一致的充分条件,在Li 的基础上,Wang 等[14]研究了非均匀扰动的二阶非线性系统的一致性问题,提出线性化处理的前提,并不再要求非线性函数满足任何全局Lipschitz 条件,这也大大弱化了线性化处理的要求.这样,线性化处理很快地被湖南工程学院学报2021年引入到多智能体系统控制中,并迅速地产生了大量研究成果.然而,上述研究成果都没有考虑系统中的时延.由于智能体之间需要相互通信,这样智能体之间的信息传输就不可避免的产生时间延迟.时延的产生必将影响系统的稳定性和控制性能.目前,已有许多论文研究了带有时滞的多智能体系统一致性控制问题,如Li等[15]研究离散系统中的步长和时滞参数一致性,给出了系统达成一致的参数集,并证明了该研究结果也适用于具有输入时滞的系统中.需要指出的是,以上分析带有时滞的多智能体一致性控制的文献中,都只是关注一阶系统的一致性.涉及时延二阶系统中的一致性控制这方面的研究很少.Ma等[16]研究在不确定时滞下,二阶智能体系统鲁棒一致性,但仅限于非领导跟随模型.目前,具有时滞的二阶智能体系统仍有许多问题需要更深入地研究.在研究智能体通信时滞的同时,还需要考虑智能体之间信息传输的通道信道容量,由于通信资源是有限的,所以每个智能体与相邻智能体之间的通信不可能一直持续.为了节约通信成本,许多科学家提出采样数据控制.传统的采样系统是通过预先设定采样周期,同步触发控制器更新[17-18],由于其设计的便利性,得到了广泛应用.传统的采样控制设计重点在于采样周期取值,若采样的周期过短,则会造成通信资源大量浪费,并且产生数据冗余,阻塞信道.相反,周期设定过长,系统的控制性能将大大降低.因此时间触发通信系统的采样周期设定是保守的,资源利用率较低.为了提高通信资源利用率,提出事件触发通信方式来提高通信资源利用率,并减少通信负担[19-20].不同于时间触发方案,事件触发不需要预先设定触发周期,而是设定一个系统可承受的误差阈值,一旦智能体的局部误差超过这一阈值,控制器才进行更新.这样大大减少了通信资源损耗,并有效地缓解通信通道的阻塞,同时又保证了控制性能.近年来科研人员对事件触发机制进行了充分的研究,并迅速产生大量的成果[21-24].Liu等[21]基于无向拓扑结构下,提出事件触发机制,研究了一阶系统的平均一致性.Yang等[22]则研究了高阶系统下基于观测器的领导跟踪输出一致性问题,并同时考虑事件触发方案.在二阶系统中,Xie等[23]分别通过集中式事件触发策略和分散式事件触发策略对二阶领导跟随系统的一致性问题进行了研究,然而,Xie等人并没有考虑系统时滞和系统的非线性因素,而现实应用系统中,往往这二者都同时存在,然而在现有的二阶一致性文献中,几乎都没有将二者同时考虑在内,现有的方法可能无法同时处理系统中的时滞与非线性项.受上述启发,本文研究一类同时具有输入时滞和非线性动力学因素的二阶多智能体系统的事件触发一致性控制问题,本文的贡献有三个方面:首先,本文研究的是一类二阶领导跟随模型,在考虑了系统固有的非线性动力学因素基础上,同时考虑输入时滞对系统的影响.其次,针对具有输入时滞和非线性因素的二阶领导跟随模型,获得了实现事件触发策略下该系统一致性的充分条件,并排除了Zeno行为,有效地降低了通信成本.最后,在仿真结果中验证了领导者的加速度设定的大小对系统稳定性产生影响.1预备知识与系统描述1.1图论知识由N个智能体和1个领导者构成的无向拓扑连通图,其中-G=G⋃{0},其中{}0相当于领导者,而G={V,E}表示N个跟随者所构成的拓扑图,V= {1,2,⋯,N}称为顶点集,如果节点i与j之间存在一条边,则称为i,j相邻.边集E={(i,j)∈V×V;i,j相邻}. A=[]a ij N×N是N个多智能体的邻接矩阵,若i,j相邻,则a ij>0,反之,a ij=0.如果(i,j)∈E,则可以称j 是i的邻居.第i节点的邻居集可以用N i= {j∈V|(j,i)∈E,j≠i}表示.此外我们定义一个度矩阵为D=dig{d1,d2,⋯,d N}.如果领导者{}0能够连接到i,则d i>0,反之,d i<0,其中d i=∑j∈N ia ij,并且定义拉普拉斯矩阵L=D-A.为了方便问题描述,给出以下定义:R n和R n×m 分别代表n维实数矩阵和n×m实数矩阵,I和0分2第1期别表示为合适维度的单位矩阵和零矩阵.1N 表示所有元素为1的列向量,sup 表示最小上确界.1.2系统问题描述领导者的动力学行为:{ẋ0(t )=v 0(t )v̇0(t )=p (t )+f (v 0(t ),t ) (1)跟随者的动力学行为:{ẋi (t )=v i (t )v̇i (t )=u i (t ) + p (t )+f (v i (t ),t ) (2)其中t ∈(-τ,+∞),x i (t ),v i (t )∈R N ,分别代表跟随多智能体i 的位置、速度状态量.x 0(t )、v 0(t )分别代表领导者的位置、速度状态量.p (t ) ∈R N 代表智能体i 的驱动函数以及u i (t )∈R N代表智能体i 的控制输入.f (v i (t ),t )、f (v 0(t ),t )代表跟随者智能体i 的动力学特性的连续可微非线性向量函数和领导者的动态输入.定义1二阶领导跟随系统如果满足下列条件就说明该系统(1)(2)达到一致性.lim x →∞x i (t )- x 0(t )=0lim x →∞v i(t )- v 0(t )=0i =1,2,⋯,N引理1对于任意具有合适维度的向量x ,y 以及合适维度的对称正定矩阵Z ,都具有下列不等式:±x T y ≤x T Zx +y T Z -1y引理2具有合适维度的矩阵A 、B 、C 、D ,利用克罗内克积公式,可以得到:(1)(A +B )⊗C =A ⊗C +B ⊗C (2)(A ⊗B )T =A T ⊗B T(3)(A ⊗B )(C ⊗D )=(AC )⊗(BD )引理3舒尔定理:下列对称线性不等式:éëêùûús (x )z (x )z T (x )c (x )>0等价于下列式子:s (x )>0,c (x )-z T(x )s -1(x )z (x )>0c (x )>0,s (x )-z (x )c -1(x )z T (x )>0假设1非线性函数f (v i (t ),t )是连续可微的向量函数,存在一个正的标量ρ,使得满足下列不等式:||f (v i(t ),t )-f (v j(t ),t )≤ρ||v i(t )-v j(t )2主要结果在本篇文章中,将通过设计合适的控制器以及提出集中式事件触发机制来解决在无向连接拓扑图下的二阶领导跟随系统(1)(2)的一致性问题.2.1集中式事件触发控制策略在假设控制器输入时滞为固定常时滞下,提出集中式事件触发策略,智能体在满足事件触发条件时触发通信采样,一般来说,事件触发条件是一个包含全局状态测量误差阈值的不等式,当实际测量误差超过这一阈值便触发控制器更新.其触发函数具体表达式在式(6)中给出.为了解决系统(1)(2)的一致性问题,设计的控制器目的为了解决控制输入常时滞与智能体内部的非线性因素的影响,其具体控制协议如(3)式:u i (t )=κ(∑j ∈Niaij(x j (t k -τ)-x i (t k -τ)+v j (t k -τ)-v i (t k -τ))-b i (x i (t k -τ)-x j (t k -τ)+v i (t k -τ)-v 0(t k -τ)))∀t ∈[t k ,t k +1) (3)其中,κ代表控制增益,且κ>0,τ为大于0的常数,代表控制器输入时滞,a ij >0为智能体i ,j 相连的耦合强度,b i >0以及j ∈N i .t k ,t k +1分别代表第k 次、第k +1触发时刻.T k =t k +1-t k 代表的是采样周期,当t ∈[t k ,t k +1),每个智能体i 在这一期间广播其状态x i (t k )、x 0(t k )、v i (t k )和x 0(t k ),即在两次相邻触发时刻之间,系统的控制输入保持不变.将(3)式中控制器带入(2)式,设ξi (t )=x i (t )-x 0(t ),ηi (t )=v i (t )-v 0(t ).e 1(t )=ξ(t k )-ξ(t ),e 2(t )=η(t k )-η(t ),其中误差量e 1(t ),e 2(t )∈R N .将误差量代入,并令e (t )=[]e T 1(t ),e T2(t )T,再设置y (t )为[]ξT(t ),ηT (t )T,所以我们得到:ẏ(t )=Cy (t )+Fy (t -τ)+He (t -τ)+F ˉ (4)其中对应的矩阵表达式如下:C =éëêùûú0I N 00F =éëêùûú00-κ(L +B )-κ(L +B )H =éëêùûú00-κ(L +B )-κ(L +B )F ˉ=éëêùûú0f -1N ⊗f 0罗毅平,等:二阶领导跟随多智能体系统事件触发一致性3湖南工程学院学报2021年2.2事件触发机制触发函数:g (t ,e (t ))=e T (t )Qe (t )-k 1∗y T (t )M 1y (t ) -k 2∗y T (t -τ)M 2y (t -τ)-k 3∗e T (t -τ)M 3e (t -τ) (5)触发条件为:g (t ,e (t ))=0(6)在式(5)(6)中,其中k 1、k 2、k 3都是大于0的常数,Q 、M 1、M 2、M 3为合适维度的矩阵.在式(6)中的集中式触发条件,实际上是设定了一个全局状态误差阈值e (t ),也称为系统(1)(2)在一致性下所能忍耐的最大误差值,一旦系统误差超过此值,系统一致性便会被破坏,为了维持系统一致性的稳定,此刻事件机制会迅速触发控制器(3)更新输入,此刻测量误差将重置为0.定理1对于无向连通拓扑下的二阶多智能体系统(1)(2),如果存在正定对称矩阵P ,R ,Q ,W 和矩阵M 1,M 2,M 3,使得下列线性矩阵不等式成立,当触发函数(5)在满足触发条件(6)下将触发控制器(3)更新,该系统达成一致性.J =éëêêùûúúJ 11J 12J 13∗J 22J 23∗∗J 33<0 (7)J 11=C T P +PC +R +τC T WC -τ-1W +PR -1P +τC T WQ -1WC +ρR +ρW +τρQ +2τρP +k 1∗M 1J 12=τC T WF +τ-1W +PF J 13=PH +τC T WHJ 22=-R -τ-1W +τF T WF +τF T WP -1WF +k 2∗M 2J 23=τF T WHJ 33=-Q +τH T WH +τH T WP -1WH +k 3∗M 3上式子中k 1,k 2,k 3均大于0,当g (e (t ),t )渐近于0时,所有跟随者的控制器将会被触发,每个多智能体的控制输入将会被更新.证明:对于闭环系统(4),构造李雅普诺夫函数如下:v (t )=y T (t )Py (t )+∫t -τty T(s )Ry (s )d s +∫t -τt eT(s )Qe (s )d s +∫-τ∫t +θtẏT(s )Wy ̇(s )d s d θ(8)对时间t 求导后再根据Jensen 不等式可得:v̇(t )≤y ̇T (t )Py (t )+y T (t )Py ̇(t )+y (t )Ry (t )-y (t -τ)Ry (t -τ)+e T (t )Qe (t )-e T (t -τ)Qe (t -τ)+τẏT (t )Wy ̇(t )-τ-1(y (t )-y (t -τ))T ∗W ∗(y (t )-y (t -τ)) (9)将(4)式代入(9)式后,根据引理1,并通过假设1和引理2中的克罗内克积公式可以将带有||Fˉ的式子进行转化,最后为了方便计算,设定δ(t )=[]y T (t )y T (t -τ)e T (t -τ)T,化简写成矩阵形式:v̇(t )≤δT (t )J ˉδ(t )+ e T (t )Qe (t )(10)其中J ˉ=éëêêêêùûúúúúJˉ11J 12J 13∗J ˉ22J 23∗∗J ˉ33Jˉ11=C T P +PC +R +τC T WC -τ-1W +PR -1P +τC T WQ -1WC +ρR +ρW +τρQ +2τρPJˉ22=-R -τ-1W +F T WF +τF T WP -1WF Jˉ33=-Q +τH T WH +τH T WP -1WH 在t ∈(t i k ,t i k +1)时,我们可知:e T (t )Qe (t )<k 1∗y T (t )M 1y (t )+k 2∗y T (t -τ)M 2y (t -τ)+k 3∗e T (t -τ)M 3e (t -τ)(11)根据式(11)可以得到v ̇(t )≤δT (t )Jδ(t )≤0,因此闭环系统(4)渐近稳定一致,这也意味着跟随者智能体位移,速度状态与领导者的差值在全局状态误差阈值e (t )范围内,即满足定义1中lim x →∞x i (t )- x 0(t )=0,lim x →∞v i (t )- v 0(t )=0.证明成立.另外需要注意的,除了保证系统(1)(2)在控制器(3)下达成一致性外,还需要确保在时间轴上没有事件的累积点,即没有Zeno 行为,这点可以通过严格采样周期T k 来保证,以下给出定理2.定理2对于二阶多智能体系统(1)(2),假设无向拓扑图论G 是连通的,在任意初始条件下,控制协议(3)与集中式事件触发策略(5)(6)渐进解决了多智能体系统的一致性问题,另外,通过式(12)计算采样周期的最小值,闭环系统不会出现Zeno 行为.θˉ≥{p 1 y (t )+p 2 y (t -τ)+p 3 e (t -τ)}×{ C μ1+ F μ2+ H ε1+ Fˉ}-1(12)4第1期证明如下:我们从触发函数(6)中可以得到:e (t )≤p 1 y (t )+p 2 y (t -τ)+p 3e (t -τ)(13)其中:p 1=λmax (M 3/Q ),p 2=λmax (M 2/Q ),p 3=λmax (M 3/Q )从(5)式中,我们可以得到 ẏ(t )≤ C y (t )+ F y (t -τ)+H e (t -τ)+ Fˉ(14)为了得到采样区间的正下界,计算了t >t k 时的测量误差e (t )的上界,又因为测量误差e ̇(t )<-y ̇(t ), e (t )≤-∫t kt y ̇(t )d s .所以:e (t )≤(t -t k){ C y (t )+ F y (t -τ)+H e (t -τ)+ Fˉ}(15)定义2:μ1=sup t ≥0 y (t ),μ2=sup t ≥0 y (t -τ),ε1=sup t ≥0 e (t -τ).上式(15)可以变成:e (t )≤(t -t k ){ C μ1+ F μ2+ H ε1+Fˉ}(17)联立式(13)、式(16)可以得到:t -t k ≥{p 1 y (t )+p 2 y (t -τ)+p 3 e (t -τ)}*{ C μ1+ F μ2+ H ε1+ Fˉ}-1(18)3数值仿真在本章节中,主要通过数值仿真来验证该集中式事件触发协议的有效性.该仿真研究的是由1个领导者和5个跟随者构成的多智能体系统,其智能体系统拉普拉斯矩阵L 和局部度B 如下所示.系统的无向拓扑图如图1所示,其中0代表领导者,数字1~5代表跟随者智能体.L =éëêêêêêêêêùûúúúúúúúú5-30-20-33000006-4-2-20-49-300-2-35B =éëêêêêêêêêùûúúúúúúúú200000300000200000200图1智能体系统的无向连接拓扑图为了验证系统(1)(2)在控制协议(3)作用下能够达成一致性,我们设定智能体的初始状态,各智能体的位移分别:x 0(t )=1.2683 ,x 1(t )=2.7346,x 2(t )=-2.432,x 3,(t )=4.8951,x 4(t )=7.1191,x 5(t )=-4.732.各智能体速度分别为:v 0(t )=-2.71,v 1(t )=0.7329,v 2(t )=-3.1691, v 3(t )=4.112,v 4(t )=2.7316,v 5(t )=-8.511对于系统中的非线性参数,我们设定为f (v i (t ),t )=sin(10t )-0.12v i (t ),输入时滞τ=0.01.系统中领导者的加速度p (t )=0.2t sin(10t ).控制器参数k =7.68,定理1中的参数k 1=k 2=k 3=9.4.其仿真图如图2~图5所示.通过仿真验证了本文思路的可行性.Time(sec)Time (sec )456图2智能体位移状态变化图罗毅平,等:二阶领导跟随多智能体系统事件触发一致性5湖南工程学院学报2021年图3智能体速度状态变化图图4测量误差范数 e (t )变化Time(sec)Time (sec )456图5事件触发时间间隔图4结束语本文研究的是一类二阶多智能体领导跟随一致性控制问题,给出了该系统达成一致性的充分条件.该系统同时考虑了输入时滞和存在非线性因素的情况,基于李雅普诺夫稳定性理论与矩阵不等式设计了与时滞相关的控制器,并利用事件触发机制,有效地降低了通信成本,提高了资源利用率和系统的控制性能.最后数值仿真验证了该方法的可行性,然而考虑到每个智能体在执行任务供给的能量有限,如何权衡能量的消耗与性能的优化是我们下一步需要进行研究和解决的问题.参考文献[1]Mengchen Z ,Ning W ,Meijuan W ,et al .Design of Self-adaption Protection Scheme for Micro-grid Based on Multi-agent [J ].Journal of Yanshan University ,2019.[2]Neto AMDS ,Romero RAF .A Decentralized Approachto Drone Formation Based on Leader-Follower Technique [C ]//2019Latin American Robotics Symposium (LARS ),2019Brazilian Symposium on Robotics (SBR )and 2019Workshop on Robotics in Education (WRE ).2019.DOI :10.1109/LARS-SBR-WRE48964.2019.00069.[3]Li X ,Er MJ ,Yang G ,et al .Bearing-Based FormationManoeuvre Control of Nonholonomic Multi-agent Sys-tems [J ].International Journal of Systems Ence ,2019,50(3):1-10.[4]Kaur G ,Burroughs AM ,Iyer LM ,et al .Highly-Regulat-ed ,Diversifying NTP-based Biological Conflict Systems with Implications for Emergence of Multicellularity [J ].eLife Ences ,2020,9.[5]Wang H ,Yu W ,Wen G ,et al .Fixed-Time Consensus ofNonlinear Multi-Agent Systems with General Directed Topologies [J ].IEEE Transactions on Circuits and Sys-tems II:Express Briefs ,2019,66(9):1587-1591.[6]Hu T ,He Z ,Zhang X ,et al .Leader-Following Consensusof Fractional-or der Multi-agent Systems Based on Event-Triggered Control [J ].Nonlinear Dynamics ,2020,99(3):2219-2232.[7]Sinha A ,Mishra R K .Consensus in First Order NonlinearHeterogeneous Multi-agent Systems with Event-Based Sliding Mode Control [J ].International Journal of Con-trol ,2020,93(4):858-871.[8]Ren W ,Beard R W .Consensus Seeking in Multiagent Sys-tems Under Dynamically Changing Interaction Topologies [J ].IEEE Transactions on Automatic Control ,2005,50(5):655-661.6第1期[9]Ge S Y,Zhou Y J,Jiang G P,et al.Prescribed-Time Leader-Following Consensus Tracking Control for Second-Order Multi-Agent Systems[C]//2019Chinese Automa-tion Congress(CAC).2019.DOI:10.1109/CAC48633.2019.8996401.[10]Guo W,Jinhu L,Chen S,et al.Second-Order Tracking Control for Leader-Follower Multi-Agent Flocking in Di-rected Graphs with Switching Topology[J].Systems&Control Letters,2011,60(12):1051-1058.[11]Liu K,Ji Z,Ren W.Necessary and Sufficient Condi-tions for Consensus of Second-Order Multiagent Sys-tems Under Directed Topologies Without Global GainDependency[J].IEEE Transactions on Cybernetics,2017,47(8):2089-2098.[12]Zheng D,Zhang H,Andrew Zhang J,et al.Consensus of the Second-order Multi-Agent Systems Under Asyn-chronous Switching with a Controller Fault[J].Interna-tional Journal of Control Automation&Systems,2019,17(1):136-144.[13]Li H,Liao X,Chen G.Leader-Following Finite-Time Consensus in Second-order Multi-Agent Networks withNonlinear Dynamics[J].International Journal of Con-trol Automation and Systems,2013,11(2):422-426.[14]Wang C,Ji H.Robust Consensus Tracking for a Class of Heterogeneous Second-Order Nonlinear Multi-AgentSystems[J].International Journal of Robust&Nonlin-ear Control,2015,25(17):3367-3383.[15]Li X,Liu J C,Li X G.Consensus of First-Order Dis-crete-time Multi-Agent Systems with Time Delays[J].Journal of the Franklin Institute,2019,356(10):5315-5331.[16]Ma D,Tian R,Zulfiqar A,et al.Bounds on Delay Con-sensus Margin of Second-Order Multi-Agent SystemsWith Robust Position and Velocity Feedback Protocol[J].IEEE Transactions on Automatic Control,2019,64(9):3780-3787.[17]Yan X S,Wang Q L,Sun C Y,Self-triggered Consensus Control for Linear Multi-Agent Systems With Input Sat-uration[J].自动化学报英文版,2020,15(1):150-157.[18]Duan G,Xiao F,Wang L.Hybrid Event-and Time-Trig-gered Control for Double-Integrator Heterogeneous Net-works[J].Ence China(Information ences),2019,62(2):73-84.[19]Cameron,Nowzari,et al.Event-Triggered Communica-tion and Control of Networked Systems for Multi-agentConsensus[J].Automatica,2019,105(105):1-27.[20]Zhang A,Zhou D,Yang P,et al.Event-Triggered Fi-nite-time Consensus with Fully Continuous Communica-tion Free for Second-Order Multi-Agent Systems[J].In-ternational Journal of Control Automation&Systems,2019,17(4):836-846.[21]Liu Z,Chen Z,Yuan Z.Event-Triggered Average-Con-sensus of Multi-Agent System with Weighted and DirectTopology[J].Journal of Systems Science&Complexi-ty,2012,25(5):845-855.[22]Yang Q,Li J,Wang B.Leader-Following Output Con-sensus for High-order Nonlinear Multi-agent Systems byDistributed Event-triggered Strategy Via Sampled DataInformation[J].IEEE Access,2018,7:70799-70810.[23]Xie D,Yuan D,Lu J,et al.Consensus Control of Sec-ond-order Leader-Follower Multi-agent Systems withEvent-Triggered Strategy[J].Transactions of the Insti-tute of Measurement and Control,2013,35(4):426-436.Event-triggered Consensus of Second-order Leader-followerMulti-agent SystemLUO Yi-ping,CAI Cong,XIAO Xing,LIN Guo-han(College of Electrical and Information Engineering,Hunan Institute of Engineering,Xiangtan411104,China)Abstract:The problem of leader-following consensus control for a class of second-order multi-agent system in undirected topology is studied.A delay-related controller is designed for the leader-following model of a class of second-order multi-agent system with delay,considering the internal nonlinear factors of the system and under the condition of given event triggering strategy.Through matrix inequality and other analysis tech-niques,sufficient conditions for the consistency of the system are obtained by using lyapunov-KrasovskII sta-bility theorem.Finally,the rationality of controller design is verified in the simulation stage.Keywords:event-triggered;second-order multi-agent system;consensus;time-delay;nonlinear罗毅平,等:二阶领导跟随多智能体系统事件触发一致性7。
2020年第43卷总目次
Ⅲ
船用锅炉汽包水位内模滑模控制………………………………………………… 段蒙蒙ꎬ甘辉兵 ( 3. 83 )
三峡升船机变频器 IGBT 路故障诊断 ……………………… 孟令琦ꎬ高 岚ꎬ李 然ꎬ朱汉华 ( 3. 89 )
定航线下考虑 ECA 的船舶航速多目标优化模型 …………… 甘浪雄ꎬ卢天赋ꎬ郑元洲ꎬ束亚清 ( 3. 15 )
改进二阶灰色极限学习机在船舶运动预报中的应用………… 孙 珽ꎬ徐东星ꎬ苌占星ꎬ叶 进 ( 3. 20 )
Ⅱ
规则约束下基于深度强化学习的船舶避碰方法
………………………………… 周双林ꎬ杨 星ꎬ刘克中ꎬ熊 勇ꎬ吴晓烈ꎬ刘炯炯ꎬ王伟强 ( 3. 27 )
船用起重机吊索张力建模与计算机数值仿真 ………………………… 郑民民ꎬ张秀风ꎬ王任大 ( 4. 94 )
约束规划求解自动化集装箱码头轨道吊调度 ………………………… 丁 一ꎬ田 亮ꎬ林国龙 ( 4. 99 )
航海气象与环保
162 kW 柴油机排气海水脱硫性能
基于模糊 ̄粒子群算法的舰船主锅炉燃烧控制 ……… 毛世聪ꎬ汤旭晶ꎬ汪 恬ꎬ李 军ꎬ袁成清 ( 1. 88 )
多能源集成控制的船舶用微电网系统频率优化……………… 张智华ꎬ李胜永ꎬ季本山ꎬ赵 建 ( 1. 95 )
基于特征模型的疏浚过程中泥浆浓度控制系统设计………… 朱师伦ꎬ高 岚ꎬ徐合力ꎬ潘成广 ( 2. 74 )
基于卷积神经网络的航标图像同态滤波去雾 …………………………………………… 陈遵科 ( 4. 84 )
船用北斗导航系统终端定位性能的检测验证 …………………………………………… 吴晓明 ( 4. 89 )
并行分布式lms自适应滤波器的fpga实现
LMS 自适应滤波器由可变权值的 FIR 滤波器和权值更新 模块组成,在负反馈回路中通过 LMS 算法调整 FIR 滤波器 的系数,假设 X(n) 为输入信号,y(n) 为输出信号,d(n) 为理 想信号,e(n) 为误差函数。对于一个长度为 M 的 LMS 自适 应滤波器,可以得到第 n 次迭代的输出信号:
Key words: adaptive filter; LMS; FPGA; distributed algorithm; fir; LUT
0 引言
自适应滤波器可以根据输入信号动态调整滤波器系数以 改变滤波器性能,拥有良好的动态滤波能力,因此被广泛应 用在数字信号处理的各种领域,如信道均衡、噪声消除、信 号预测等领域 。 [1-2] 自适应滤波器由可变权值的 FIR 滤波器 和权值更新模块组成,通过自适应算法更新滤波器系数 [3]。 其中,最小均方误差(LMS)算法是最常用的自适应滤波器 算法,拥有较好的收敛性能而且更加简单。
作者简介:郭语青 (1998—),男,上海人,本科。研究方向:数字信号处理及 FPGA 设计。
— 42 —
2019 年第 22 期
信息与电脑 China Computer & Communication
算法语言
y(n)=W(n)X(n)
(1)
其中,W(n)=[w0(n),x(n-1),…, x(n-M+1] 分别是权值向量和第 n 次迭代的输入信号,于是可
(Shanghai University of Engineering Science, Shanghai 201620, China)
Abstract: FPGA has many advantages over traditional ASIC, and its importance in this field is also increasing. In order to ensure the efficient implementation of adaptive digital filter based on LMS in hardware, the implementation scheme with no multiplication structure has better effect. The complexity of FPGA implementation of adaptive digital filter depends on the number of operations of multiplication and accumulation (MAC). Using parallel distributed algorithm can significantly reduce the complexity of hardware implementation and reduce the use of logical resources by using LUT instead of multiplication and accumulation. At the same time, using the advantages of FPGA parallel processing can improve the running speed. The proposed method is proved to be effective and superior by software simulation.
压气机叶片一次加工合格率预测
压气机叶片一次加工合格率预测张 旭1,童一飞2*,胡骥川2(1.中国航发南方工业有限公司,湖南株洲 412002; 2.南京理工大学机械工程学院,江苏南京 210094)摘要:压气机叶片被广泛用于航空、能源等领域的气体压缩设备中,也被应用于农业装备中,以提高零部件的加工效率和质量,提高整机的可靠性和耐用性。
因此,其设计和加工的精度要求较高。
开展压气机叶片一次加工合格率预测技术研究,提出了PSO-BP预测模型,提高了网络的全局搜索能力以避免局部最优解,从而提升预测的准确度。
实验结果表明,PSO-BP模型的预测精度明显高于传统BP神经网络模型,预测的最大误差百分比为1.24%,平均误差百分比为0.24%,预测准确度达到96.67%。
关键词:压气机叶片;一次合格率;合格率预测;PSO-BP模型0 引言压气机叶片通常用于航空、能源等领域的气体压缩设备中,也应用于农业装备中,以提高零部件的加工效率和质量[1],提高整机的可靠性和耐用性。
作为航空发动机的核心部件,叶片的质量很大程度上决定了发动机的性能,因此压气机叶片的质量尤为重要。
一次加工合格指的是压气机叶片柔性加工单元完成对叶片的加工之后未经过返工返修,第一次检验就能合格的压气机叶片。
而一次加工合格率指的是一次加工合格的压气机叶片占加工单元产出的比率。
本文以F型号叶片为例,对压气机叶片柔性加工单元所产出叶片的一次加工合格率进行预测,根据预测结果采取相应的预防性措施,减小压气机叶片加工单元产出叶片的品质出现重大问题的概率。
目前,产品质量合格率预测方法主要分为传统质量预测方法和人工智能方法2个大类。
传统的质量预测方法主要是基于统计过程控制的方法,人工智能方法的典型代表则是用神经网络预测产品合格率。
在人工智能方法预测产品合格率预测方面,Apriori 算法和FP-Growth算法是2种关联性规则分析的经典算法。
为了解决Apriori算法运行效率不高的缺点,Toivonen H[2] 探究得出以采样思想算法为基础,分析和阐述数据之间的关联性规则,从而实现算法运行的并行化。
ChenMobius通信系统的FPGA硬件实现与应用
Keywords : Chen-Mobius transform , system, realization DSPBuilder, Quartus Ⅱ ,
Chen-Mobius communication MATLAB\SIMULINK, FPGA
VI
华侨大学硕士学位论文
原创性声明
本人声明兹呈交的学位论文是本人在导师指导下完成的研究成 果。论文写作中不包含其他人已经发表或撰写过的研究内容,如参考 他人或集体的科研成果,均在论文中以明确的方式说明。本人依法享 有和承担由此论文所产生的权利和责任。 学位论文作者签名: 日期:
communication system is built and simulated by them, including design synthesis 、pin assignments 、simulation analysis and timing analysis etc; At last, the Chen-Mobius multiple-carriers communication system is realized on the Altera’ s Stratix FPGA development board. On otherhand, the speech signal is encrypted and deciphered respectively by the modulation system and demodulation system in Chen-Mobius single-channel communication system. The speech encryption diplex operation system based on Chen-Mobius
融合协同过滤的神经Bandits推荐算法
第62卷 第1期吉林大学学报(理学版)V o l .62 N o .12024年1月J o u r n a l o f J i l i nU n i v e r s i t y (S c i e n c eE d i t i o n )J a n 2024d o i :10.13413/j .c n k i .jd x b l x b .2022439融合协同过滤的神经B a n d i t s 推荐算法张婷婷1,2,欧阳丹彤1,2,孙成林3,白洪涛1,2(1.吉林大学计算机科学与技术学院,长春130012;2.吉林大学符号计算与知识工程教育部重点实验室,长春130012;3.吉林大学白求恩第一医院内分泌与代谢科,长春130021)摘要:针对数据稀疏性和 冷启动 对协同过滤的限制以及现有的协同多臂老虎机算法不适用于非线性奖励函数的问题,提出一种融合协同过滤的神经B a n d i t s 推荐算法C O E E N e t .首先,采用双神经网络结构学习预期奖励及潜在增益;其次,考虑邻居协同作用;最后,构造决策器进行最终决策.实验结果表明,该方法在累积遗憾上优于4种基线算法,推荐效果较好.关键词:协同过滤;多臂老虎机算法;推荐系统;冷启动中图分类号:T P 301 文献标志码:A 文章编号:1671-5489(2024)01-0092-08N e u r a l B a n d i t sR e c o m m e n d a t i o nA l go r i t h m B a s e d o nC o l l a b o r a t i v eF i l t e r i n gZ H A N G T i n g t i n g 1,2,O U Y A N G D a n t o n g 1,2,S U N C h e n g l i n 3,B A IH o n gt a o 1,2(1.C o l l e g e o f C o m p u t e rS c i e n c e a n dT e c h n o l o g y ,J i l i nU n i v e r s i t y ,C h a n gc h u n 130012,C h i n a ;2.K e y L a b o r a t o r y o f S y m b o l i cC o m p u t a t i o na n dK n o w l ed g eE n g i ne e r o fM i n i s t r y o f E d u c a t i o n ,J i l i nU n i v e r s i t y ,C h a n gc h u n 130012,C h i n a ;3.D e p a r t m e n t o f E nd o c r i n o l o g y a n d Me t a b o l i s m ,F i r s tH o s p i t a l of J i l i nU n i v e r s i t y ,C h a n gc h u n 130021,C h i n a )A b s t r a c t :A i m i n g a t t h e p r o b l e m s o f t h e l i m i t a t i o n s o fd a t a s p a r s i t y an d c o l ds t a r t o nc o l l a b o r a t i v e f i l t e r i n g a n d t h e i n a p p l i c a b i l i t y o f t h e e x i s t i n g c o l l a b o r a t i v em u l t i -a r m e dB a n d i t a l g o r i t h mt on o n l i n e a r r e w a r d f u n c t i o n s ,w e p r o p o s e dan e u r a lB a n d i t r e c o mm e n d a t i o na l g o r i t h m C O E E N e t ,w h i c hc o m b i n e d c o l l a b o r a t i v e f i l t e r i n g .F i r s t l y ,i t a d o p t e dad u a l n e u r a l n e t w o r ks t r u c t u r e t o l e a r ne x pe c t e dr e w a r d s a n d p o t e n t i a l g a i n s .S e c o n d l y ,w e c o n s i d e r e d t h e c o l l a b o r a t i v e ef f e c t o f n e igh b o r s .Fi n a l l y ,a d e c i s i o n -m a k e rw a s c o n s t r u c t e d t o m a k e t h e f i n a l d e c i s i o n .T h ee x p e r i m e n t a l r e s u l t s s h o wt h a t t h e p r o po s e d m e t h o di s s u p e r i o r t o t h e f o u r b a s e l i n e a l g o r i t h m s i n c u m u l a t i v e r e gr e t ,a n d h a s a g o o d r e c o mm e n d a t i o ne f f e c t .K e y w o r d s :c o l l a b o r a t i v e f i l t e r i n g ;m u l t i -a r m e dB a n d i t a l g o r i t h m ;r e c o mm e n d a t i o n s y s t e m ;c o l d s t a r t 收稿日期:2022-11-16.第一作者简介:张婷婷(1998 ),女,汉族,硕士研究生,从事机器学习和数据挖掘的研究,E -m a i l :t i n g t i n gz 98@163.c o m.通信作者简介:白洪涛(1975 ),男,汉族,博士,教授,从事机器学习和并行计算方法的研究,E -m a i l :b a i h t @jl u .e d u .c n .基金项目:吉林省自然科学基金(批准号:20210101181J C ).随着互联网经济的迅速发展,每天都有海量信息呈现在人们眼前.对于电子商务㊁视频㊁音乐㊁新闻等平台,促进用户消费以将其提供的内容或物品转化为价值至关重要.对于用户,打开某平台就能快速找到自己感兴趣的内容,降低搜寻信息成本,是一种基本需求.基于此,针对个性化推荐[1]的研究备受关注.协同过滤[2-4]作为最常用的传统推荐算法,通过群体中个体的行为特征找出一组与目标用户相似的邻居用户,并利用这种相似性进行推荐,通过持续的协同作用,可获得越来越精准的推荐效果.但协同过滤算法自身存在一些不足,即稀疏性[5-6]和冷启动问题[7-8].在实际推荐场景中,用户和物品规模非常庞大,用户通常只对小部分物品有涉猎(评分),大部分用户之间没有相同评分项或相同评分项很少,这种数据的稀疏性限制了用户间相似性的计算,即使可计算,可靠性也难以保证.冷启动问题本质上也是数据稀疏问题的一种极端表现,即当新用户进入推荐系统后,由于其提供的评分信息有限,因此系统难以找到相似用户从而进行协同推荐.新物品同理,由于用户都未对其进行评分,因此即使确定了相似用户,也无法获知这些用户对新物品的评分情况.除对上述问题的考虑,推荐系统还应尽可能兼顾推荐的多样性和广度,即探索-利用(e x pl o r a t i o n a n d e x pl o i t a t i o n )问题.利用表示对于已知用户感兴趣的物品要尽力迎合,探索则表示推荐给用户其未涉猎过的物品以探索其新兴趣.多臂老虎机(m u l t i -a r m e dB a n d i t )算法[9]是强化学习领域的一个解决探索-利用问题的有效方法,可在每轮推荐中平衡探索与利用的关系.在多臂老虎机算法中,每轮向用户呈现一组物品,通过一定策略选择一个物品并获得相应奖励,问题的目标是最大化累计奖励.传统的多臂老虎机算法未考虑用户和物品特征,且对不同用户均采用相同的推荐策略.为更好利用内容(物品)和用户信息使其适应个人用户,L i n U C B 算法[10]将新闻的个性化推荐建模为上下文多臂老虎机问题,并基于上下文信息计算预期奖励为用户进行推荐,同时根据用户反馈调整选择策略.但L i n U C B 算法假设上下文与奖励呈线性关系,这种假设在现实世界中可能并不正确[11].为学习非线性奖励函数,N e u r a l U C B 算法[12]利用深度神经网络的强大表示能力学习潜在奖励函数,并采用U C B (u p pe r c o nf i d e n c eb o u n d )算法选择臂.不同于N e r u a l U C B 算法,E E -N e t [13]舍弃U C B 算法,采用了一种新的神经探索策略,利用神经网络学习与奖励估计相比的潜在增益.基于上下文的多臂老虎机算法充分适应了用户的个性化需求,但未考虑相似用户在推荐中的重要性.针对该问题,已出现一些融合协同过滤与上下文多臂老虎机算法的研究[14-16].文献[14]基于目标物品动态地对用户聚类,在推荐时进行集体决策,并根据反馈调整用户聚类,但用户聚类在物品间是独立的,针对不同物品需分别计算,在用户和物品规模较大时无法保证实时推荐;文献[16]在L i n U C B 算法基础上加入相似用户的协同作用,并利用当前用户与选定用户的相似性控制协同强度,但受限于L i n U C B 算法对线性奖励函数的假设,无法很好适应非线性奖励的情况.本文基于上述研究,提出一种融合协同过滤的神经B a n d i t s 推荐算法(c o l l a b o r a t i v ee x p l o r a t i o n -e x pl o i t a t i o nn e t ,C O E E N e t ),该算法采用深度神经网络学习潜在奖励函数,并采用探索神经网络学习与奖励估计相比的潜在增益,同时引入协同作用,利用用户特征及历史行为寻找与当前用户相似的邻居用户,进而对目标物品进行集体决策.最后在实验中,从食谱数据集中构建用户㊁菜品特征,采用C O E E N e t 为用户选择菜品进行推荐,并从累积遗憾角度与其他基线算法进行对比,验证了本文算法的有效性.1 预备知识1.1 基于用户的协同过滤假设推荐系统中存在用户集合U 和物品集合I ,用户和物品分别表示为u i (i =1,2, ,n )和i j (j =1,2, ,m ),s c o r e i ,j 表示用户i 对物品j 的评分情况.在每次推荐前,对每个候选物品j ,采用余弦相似度计算当前用户与其他用户的相似程度s i m i ,j :s i m i ,j =u i ㊃u ju i ˑ u j.(1)根据所有用户u ɪU 对目标物品的评分情况,计算当前用户u i 对目标物品的喜爱程度:p i ,j =ðu t ɪUsi m i ,tˑr t ,j ðu t ɪUsi m i ,t,(2)39 第1期 张婷婷,等:融合协同过滤的神经B a n d i t s 推荐算法其中r t ,j 表示奖励.通过计算当前用户对物品集中每个物品的喜爱程度,可对物品进行降序排列,选取评分最高的N 个物品进行推荐.1.2 通用上下文多臂老虎机框架在上下文多臂老虎机算法中,若已知推荐总轮数T [10],则在第t (t =1,2, ,T )轮推荐过程中进行如下操作:1)算法观察用户特征u t 并呈现给用户一组可供选择的臂A t 及它们的特征向量x t ,a ,该特征向量结合了用户特征和臂的特征,这里称为上下文;2)根据一定的选择策略,为用户选择臂a t ɪA t ,并获得真实世界中的实时反馈(奖励)r t ,a t ;3)算法使用新的观测值(x t ,a ,a t ,r t ,a t)改进选择策略.根据选择策略的不同,奖励估计函数也不同,但可以概括为p t ,a t =h (x t ,a t )+ηt ,a t,(3)其中:h (x t ,a t)表示第t 轮中用户u t 选择臂a t 的潜在奖励,该函数可能是线性的,也可能是非线性的;ηt ,a t 表示E (ηt ,a t)=0的噪声参数.T 轮累积遗憾定义为R T =E ðTt =1(p *t ,a t -r t ,a t[]),(4)其中p*t ,a t=a r g m a x a t ɪA tp t ,a t.算法的目标为最小化累积遗憾.2 算法设计算法1 C O E E N e t .输入:用户集合U ={u 1,u 2, ,u n };臂集合A ={x 1,x 2, ,x m };推荐轮数T ;3个网络的迭代次数T 1,T 2,T 3;邻居用户数M ;3个网络的学习率η1,η2,η3;初始化:θ10,θ20,θ3步骤1)f o r t =1,2, ,T d o步骤2) f o r e a c h x t ,i in A d o 步骤3) 计算f 1(x t ,i ;θ1t -1),f 2(∇θf 1(x t ,i ;θ1t -1);θ2t -1)步骤4) 计算c s c o r e t ,i =C S (∇θf 1(x t ,i ;θ1t -1))步骤5) 计算p t ,i =f 3(f 1(x t ,i ;θ1t -1),f 2(∇θf 1(x t ,i ;θ1t -1);θ2t -1)c s c o r e t ,i ;θ3t -1)步骤6) e n d f o r步骤7) x t =a r g m a x x t ,i ɪA tpt ,i 步骤8) 选择x t 并观察真实世界奖励r t 步骤9) θ1t ,θ2t ,θ3t =G r a d i e n t D e s c e n t (θ1t -1,θ2t -1,θ3t -1,{x τ}t τ=1,{r τ}t τ=1,{c s c o r e τ}t τ=1)步骤10)e n d f o r步骤11)p r o c e d u r eC S (∇θf 1,u i )步骤12) f o r e a c h u j in U d o 步骤13) s i m i ,j =(∇θf 1,u i (㊃;θ1)-∇θf 1,u j (㊃;θ1))T (∇θf 1,u i (㊃;θ1)-∇θf 1,u j (㊃;θ1))步骤14) e n d f o r步骤15) N e g i ={}步骤16) 选择T o p -M 用户加入N e g i步骤17) c s c o r e i =ðu j ɪN e gi(s i m i ,j ˑ(f 1,u j (x t ;θ1,j )+f 2,u j (∇θf 1,u j(㊃;θ1);θ2,j )))步骤18)r e t u r nc s c o r e i .算法1包含4部分:第一部分为利用网络,用于估计预期奖励;第二部分为探索网络,用于学习与奖励估计相比的潜在增益;第三部分为协同过滤模块,用于计算相似用户的协同作用;第四部分为决49 吉林大学学报(理学版) 第62卷策器,用于将前三部分的输出适当结合,从而进行最终决策.图1为网络整体结构,表1对网络结构中各部分的输入㊁输出进行了具体说明,算法1中G r a d i e n t D e s c e n t 为梯度下降算法.图1 C O E E N e t 网络结构F i g.1 S t r u c t u r e o fC O E E N e t 表1 C O E E N e t 网络结构信息T a b l e 1 S t r u c t u r e i n f o r m a t i o no fC O E E N e t模块输入输出标签利用网络x t ,if1(x t ,i ;θ1t -1)r t ,i探索网络∇θf 1(x t ,i ;θ1t -1)f 2(∇θf 1(x t ,i ;θ1t -1))r t ,i -f1(x t ;θ1t -1)协同过滤模块∇θf 1(x t ,i ;θ1t -1)c s c o r e i决策器f 1;f2;c s c o r e i f 3(f 1,f2,c s c o r e i )pi 2.1 利用网络利用网络是一个用于学习关于上下文潜在奖励函数的神经网络,用f 1(㊃;θ1)表示.在第t 轮中,利用网络表示为f 1(x t ,i ;θ1t -1),θ1t -1为网络最后一层的参数,其上标为网络标识,下标表示最后一次对参数进行更新的轮数.对于臂x t ,i (i ɪ[m ]),利用网络对其潜在奖励进行估计,在选定该臂后,会得到一个现实世界的真实反馈r t ,基于此可对利用网络进行梯度下降对参数θ1进行拟合.2.2 探索网络文献[13,17]已经证明,给定臂的上下文x t ,i ,其预期收益f 1(x t ,i )与实际收益r t ,i 有1-δ的概率在置信区间ψ(∇θf 1(x t ,i ;θ1t -1))内,公式如下:r t ,i -f 1(x t ,i )ɤψ(∇θf 1(x t ,i ;θ1t -1)),(5)其中r t ,i -f 1(x t ,i )为与奖励估计相比的潜在增益,ψ(∇θf 1(x t ,i ;θ1t -1))为关于∇θf 1(x t ,i ;θ1t -1)的置信上界函数,δ一般为一个很小的常数.设y t ,i =r t ,i -f1(x t ,i ),当y t ,i 很大时,表示当前臂的收益估计与实际收益相差较大,算法更倾向于赋予该臂更大的奖励值,使其有更大概率进行探索;当y t ,i 很小时,表示当前臂的收益估计已接近实际收益,算法会尽量避免探索该臂.不同于传统置信上界算法通过岭回归等方式推导置信区间,探索网络采用一个神经网络对潜在增益进行拟合.由于开发网络的参数梯度同时包含臂的特征和开发网络的判别信息,因此探索网络以∇θf 1(x t ,i ;θ1t -1)作为输入[13],并将网络输出f 2(∇θf 1(x t ,i ;θ1t -1);θ2t -1)与潜在收益r t ,i -f1(x t ,i )相比对探索网络进行拟合.2.3 协同过滤模块在推荐场景中,为每个用户u ɪU ,U =n 构建探索和利用网络,并对利用网络最后一次更新的参数梯度∇θf 1,u i (㊃;θ1,i)进行保存.对于用户u i ,在第t 轮推荐中,利用不同用户在利用网络上的参数梯度计算相似度.采用欧氏距离衡量相似度,公式如下:s i m i ,j =(∇θf 1,u i (㊃;θ1)-∇θf 1,u j (㊃;θ1))T (∇θf 1,u i (㊃;θ1)-∇θf 1,u j(㊃;θ1)).(6) 选取相似度最高的M 个用户加入邻居用户集N e g i ,用户u j 对目标物品x t 的协同分数c s c o r e i ,j59 第1期 张婷婷,等:融合协同过滤的神经B a n d i t s 推荐算法定义为目标物品在该用户利用和探索网络的输出之和与该用户和当前用户u i 的相似度乘积,用公式表示为c s c o r e i ,j =s i m i ,j ˑ(f 1,u j (x t ;θ1,j )+f 2,u j (∇θf 1,u j(㊃;θ1);θ2,j )).(7)当前用户u i 的协同分数定义为其所有邻居用户的协同分数之和,计算公式为c s c o r e i =ðu j ɪN e gi(s i m i ,j ˑ(f 1,u j (x t ;θ1,j )+f 2,u j (∇θf 1,u j(㊃;θ1);θ2,j ))).(8)2.4 决策器在第t 轮中,给定臂x t ,i ,经利用网络㊁探索网络和协同过滤模块,得到3个输出:潜在奖励估计f 1(x t ;θ1t -1)㊁潜在奖励增益f 2(∇θf 1(x t ,i ;θ1t -1);θ2t -1)及当前用户与邻居用户的协同分数c s c o r e i .决策器的任务是对以上3个输出进行合理组合,以平衡探索与利用的关系,同时控制协同过滤的强度.设决策器为x t ,i 的最终分数p t ,i 关于f 1(x t ,i ;θ1t -1),f 2(∇θf 1(x t ,i ;θ1t -1);θ2t -1),c s c o r e i 的函数,公式为p t ,i =f 3(f 1(x t ;θ1t -1),f 2(∇θf 1(x t ,i ;θ1t -1);θ2t -1),c s c o r e i ).(9)对于第t 轮中提供的m 个臂x t ,i ɪA t ,i ɪ[m ],选择其中分数最高的一个臂,选择策略表示为x t =a r g m a x x t ,i ɪA tf 3(f 1(x t ,i ;θ1t -1),f 2(∇θf 1(x t ,i ;θ1t -1);θ2t -1),c s c o r e i ).(10) 可采用神经网络对f 1,f2,c s c o r e i 进行拟合,同时基于不同推荐场景对探索利用的不同倾向性和对协同过滤强度的弹性控制而需要手动设置f 1,f 2,c s c o r e i 权重的现实需求,本文将分别考虑决策函数为线性和非线性的情况.1)线性决策函数:f 3定义为关于f 1,f2,c s c o r e i 的线性函数,表示为p t ,i =αf 1+βf 2+γc s c o r e i ,(11)其中α,β,γ作为权重参数,由使用者自行设置.2)非线性决策函数:使用一个神经网络表示f 3,将问题建模为二元分类问题.该网络以f 1(x t ,i ;θ1t -1),f 2(∇θf 1(x t ,i ;θ1t -1);θ2t -1),c s c o r e i 为输入,输出p t ,i 表示臂x t ,i 为最优选择的概率.3 实 验本文在真实数据集上模拟推荐过程,并与其他基线算法进行比较,以验证本文算法C O E E N e t 的有效性.采用l 轮内的累积遗憾作为评价指标,实验结果表明,在食物推荐问题中,本文算法较其他算法性能有一定提升.3.1 数据集本文在食谱网站爬取3526名用户信息,以及这些用户在过去一段时间内对菜品的评分情况共340734条,并收集了评分中所涉及的共9766道菜品的信息.用户信息包含i d㊁性别㊁年龄㊁地址㊁自定义喜好等信息,菜品信息包含i d ㊁名称㊁烹饪工艺(炒㊁蒸㊁煎㊁炸等)㊁难易程度㊁口味等信息.评分情况定义为(用户i d ,菜品i d ,评分)的三元组形式,其中评分包含极差㊁差㊁一般㊁推荐㊁非常推荐5个等级.由于菜品集中存在大量菜品仅有极少数用户对其进行评分,而且用户群体在这些菜品上的评分大概率无法覆盖每个评价等级,从而影响数据平衡性.因此,本文首先对菜品热度按照评分数量进行排序,选择前1000道热门菜品加入菜品数据集d i s h .d a t ,同时将为这些菜品打分的2871位用户加入用户数据集u s e r .d a t ,并收集这些用户对菜品的打分信息加入评分数据集r a t i n g .d a t .3.2 特征构建每个用户由100多个分类的原始特征向量表示,其中包含:1)用户基本信息,i d ㊁性别(二类)㊁年龄(离散为7个等级);2)地理特征,主要分布于中国各地100多个城市及地区;3)用户自定义喜好信息,主要包括甜㊁辣㊁麻等14种分类.菜品同理,每个菜品都以相同方式构建约1000个分类的原始特征向量表示,其中包含:1)菜品基本信息,i d ㊁烹饪工艺㊁难易程度等;2)用户评价标签,由用户历史评价数据中抽取得到的约1000个标签表示.本文将用户和菜品特征编码为固定长度的二进制向量,用户和菜品的特征分别由156个和1153个条目的特征向量表示.69 吉林大学学报(理学版) 第62卷本文方法为所有用户单独构建模型进行个性化推荐,算法中的上下文信息只需对菜品信息进行表征而无需包含用户自身信息,故用户对菜品的评分信息定义为(用户i d ,菜品特征,评分)的形式,其中一条数据表示用户与系统的一次交互.由于大部分用户的评分记录数较少,无法支持独立训练模型,因此本文对用户采用K -M e a n s 方法[18-19]进行聚类,进一步将用户规模缩减至20大类,以该类别中所有用户的特征均值作为该类用户特征.3.3 离线模拟在线推荐在线推荐模型将预期收益最高的前若干物品展示给用户,并基于用户的实时反馈调整模型参数,使其在后续推荐中逐渐适应用户需求.由于无法实时获得用户的反馈信息,因此本文将在上述离线数据集上模拟在线推荐过程,验证本文算法的推荐效果.通过数据集中用户对菜品的评分信息模拟用户和菜品之间的交互情况,在利用网络和探索网络中,评分可作为用户对相应菜品的实时奖励,在决策器中,设定评分不超过3时表示奖励为0,否则奖励为1.在每轮中,随机向用户展示10道菜品,其中包含9道评分不超过3的菜品以及1道评分大于等于3的菜品,每道菜品对应的上下文为当前菜品的特征向量.3.4 基线算法为更好地评估本文算法在推荐问题中的性能,本文选择4种算法作为基线算法,分别是L i n U C B ,N e u r a l U C B ,N e u r a l -E p s i l o n 和E E -N e t .1)L i n U C B :假设奖励函数为关于上下文的线性函数,并采用岭回归和置信上界算法共同确定所选臂.2)N e u r a l U C B :使用神经网络学习奖励函数,并采用置信上界算法选择臂.3)N e u r a l -E p s i l o n :使用神经网络学习奖励函数,以1-ε的概率选择当前与其奖励最大的臂,并以ε的概率进行探索.4)E E -N e t :用一个神经网络学习奖励函数,用另一个神经网络学习潜在的奖励增益,并结合两个网络的输出共同决策.3.5 评价指标本文采用T 轮推荐内的累积遗憾作为算法评价指标,计算公式为C u mR e g T =E ðTt =1(p *t ,a t-p t []),(12)其中p*t ,a t=a r g m a x a t ɪA tp t ,a t,p t 为第t 轮的真实奖励.算法以最小化T 轮内的累积遗憾为优化目标,累积遗憾越小,算法性能越优异.3.6 实验结果分析利用网络结构定义为一个二层的神经网络,隐藏层节点数为100.探索网络结构为二层神经网络,其隐藏层节点数也为100.在协同过滤模块中,考虑当前用户的3个邻居用户的协同作用.线性决策器公式为p t ,i =f 1+f 2+r ˑc s c o r e i ,其中利用网络输出f 1和探索网络输出f 2的权值均为1以模拟U C B 策略,并通过调节协同作用强度r 调整邻居用户评分c s c o r e i 对最终推荐的影响.非线性决策器定义为二层神经网络,隐藏层节点数为50.图2和图3分别为决策器是线性和非线性情况下的累积遗憾比较结果.由图2和图3可见,本文算法C O E E N e t 在r e c i p e 数据集上的性能优于基线算法.由于食谱数据集中上下文与奖励预期并不是简单的线性关系,故L i n U C B 算法在该问题中并不适用.N e u r a l U C B 和N e u r a l -E p s i l o n 算法使用神经网络学习奖励预期,E E -N e t 算法采用一个神经网络学习奖励预期,并采用另一个神经网络学习潜在增益,三者都能较好适应非线性奖励函数的情况.本文算法在很好拟合非线性函数的同时考虑邻居用户的协同作用,进一步提升了推荐效果,且对于线性决策器,随协同强度增加,推荐效果有一定提升.79 第1期 张婷婷,等:融合协同过滤的神经B a n d i t s 推荐算法图2 线性决策器在食谱数据集上的累积遗憾比较F i g .2 C u m u l a t i v e r e g r e t c o m pa r i s o no f l i n e a r d e c i s i o n -m a k e r o n r e c i pe d a t a s e ts 图3 非线性决策器在食谱数据集上的累积遗憾比较F i g .3 C u m u l a t i v e r e g r e t c o m pa r i s o no f n o n l i n e a r d e c i s i o n -m a k e r o n r e c i pe d a t a s e t s 综上所述,本文针对推荐系统中用户和物品频繁变动导致的数据稀疏和 冷启动 限制了传统协同过滤的发展及现有考虑到协同作用的多臂老虎机算法并不适用于非线性奖励函数场景的问题,提出了一种融合协同过滤的神经B a n d i t s 算法C O E E N e t ,采用利用网络学习关于用户和物品特征的奖励函数,采用探索网络学习与奖励估计相比的潜在增益,同时加入邻居用户的协同作用,并构造决策器进行最终决策.针对数据稀疏性问题,不同于协同过滤,本文算法并不简单依赖对相同物品的评分判定用户间的相似性,而是基于用户对上下文中各特征的关注度进行计算.在针对新用户的推荐问题中,本文根据用户特征寻找邻居用户并进行协同推荐,同时多臂老虎机算法还可帮助用户在尽量少的次数内快速试探用户喜好,并根据用户反馈挑战模型参数,改善推荐效果.最后,通过平衡探索网络和利用网络的结果以及控制协同作用的强度,可有效保证推荐中用户自身的决定性作用以及推荐的多样性.在真实数据集上将本文算法与基线算法进行比较,实验结果表明,本文算法在推荐问题上有效.参考文献[1] 刘华玲,马俊,张国祥.基于深度学习的内容推荐算法研究综述[J ].计算机工程,2021,47(7):1-12.(L I U H L ,MA J ,Z HA N G G X.R e v i e w o f S t u d i e s o n D e e p L e a r n i n g -B a s e dC o n t e n t R e c o mm e n d a t i o n A l g o r i t h m s [J ].C o m p u t e rE n g i n e e r i n g ,2021,47(7):1-12.)[2] G O LD BE R GD ,N I C HO L SD ,O K IB M ,e t a l .U s i n g C o l l a b o r a t i v eF i l t e r i n g t o W e a v e a n I n f o r m a t i o nT a p e s t r y [J ].C o mm u n i c a t i o n s o fA C M ,1992,35(12):61-70.[3] S C HA F E RJB ,F R A N K OW S K I D ,H E R L O C K E RJ ,e t a l .C o l l a b o r a t i v eF i l t e r i n g R e c o mm e n d e r S y s t e m s [M ].B e r l i n :T h eA d a pt i v eW e b ,2007:1-108.[4] 杨莉云,颜远海.融合标签和属性信息的混合推荐算法[J ].吉林大学学报(信息科学版),2022,40(4):644-651.(Y A N G L Y ,Y A N Y H.H y b r i d R e c o mm e n d a t i o n A l g o r i t h m B a s e do n T a g sa n d A t t r i b u t e s [J ].J o u r n a l o f J i l i nU n i v e r s i t y (I n f o r m a t i o nS c i e n c eE d i t i o n ),2022,40(4):644-651.)[5] S A RWA RB ,K A R Y P I SG ,K O N S T A NJ ,e t a l .I t e m -B a s e dC o l l a b o r a t i v eF i l t e r i n g R e c o mm e n d a t i o nA l g o r i t h m s [C ]//H y pe r m e d i a T r a c k o ft h e10t hI n t e r n a t i o n a l W o r l d W i d e W e b C o nf e r e n c e .N e w Y o r k :A C M ,2001:285-295.[6] P A P A G E L I S M ,P L E X O U S A K I SD ,K U T S U R A ST.A l l e v i a t i n g t h e S p a r s i t y P r o b l e mo f C o l l a b o r a t i v eF i l t e r i n gU s i n g T r u s t I n f e r e n c e s [C ]//P r o c e e d i n gs o f t h e 10t hI n t e r n a t i o n a lC o n f e r e n c eo n W o r l d W i d e W e b .N e w Y o r k :A C M ,2005:224-239.[7] S U X Y ,K HO S H G O F T A A RT M.AS u r v e y o fC o l l a b o r a t i v eF i l t e r i n g T e c h n i q u e s [C ]//A d v a n c e d i nA r t i f i c i a l I n t e l l i ge n c e .N e w Y o r k :A C M ,2009:1-19.[8] 赵越,武志昊,赵苡积.基于特征与域感知的点击率预估方法[J ].计算机工程,2022,48(3):60-68.(Z HA O Y ,WU Z H ,Z HA O Y J .C T R P r e d i c t i o n M e t h o d B a s e do n F e a t u r ea n d D o m a i n P e r c e p t i o n [J ].C o m p u t e rE n g i n e e r i n g,2022,48(3):60-68.)89 吉林大学学报(理学版) 第62卷[9] L A T T I MO R E T ,S Z E P E S V ÁR IC .B a n d i tA l g o r i t h m s [M ].C a m b r i d g e :C a m b r i d g e U n i v e r s i t y P r e s s ,2020:1-513.[10] L IL H ,C HU W ,L A N G F O R D J ,e t a l .A C o n t e x t u a l -B a n d i t A p p r o a c h t o P e r s o n a l i z e d N e w s A r t i c l e R e c o mm e n d a t i o n [C ]//P r o c e e d i n gso ft h e19t hI n t e r n a t i o n a lC o n f e r e n c eo n W o r l d W i d e W e b (WWW 10).N e w Y o r k :A C M ,2010:661-670.[11] V A L K O M ,K O R D A N ,MU N O S R ,e ta l .F i n i t e -T i m e A n a l y s i so f K e r n e l i s e d C o n t e x t u a lB a n d i t s [C ]//P r o c e e d i n g so ft h e T w e n t y -N i n t h C o n f e r e n c eo n U n c e r t a i n t y i n A r t i f i c i a lI n t e l l i g e n c e (U A I 13).A r l i n g t o n :A U A IP r e s s ,2013:654-663.[12] Z HO U DR ,L IL H ,G U Q Q.N e u r a l C o n t e x t u a l B a n d i t sw i t hU C B -B a s e dE x p l o r a t i o n [C ]//P r o c e e d i n g s o f t h e 37t h I n t e r n a t i o n a l C o n f e r e n c e o n M a c h i n eL e a r n i n g (I C M L 20).N e w Y o r k :A C M ,2020:11492-11502.[13] B A N Y K ,Y A N Y C ,B A N E R J E E A ,e t a l .E E -N e t :E x p l o i t a t i o n -E x p l o r a t i o nN e u r a lN e t w o r k s i nC o n t e x t u a l B a n d i t s [E B /O L ].(2021-10-07)[2022-03-10].h p p t s ://a r x i v .o r g/a b s /2110.03177.[14] L IS ,K A R A T Z O G L O U A ,G E N T I L E C .C o l l a b o r a t i v e F i l t e r i n g B a n d i t s [C ]//P r o c e e d i n gs o ft h e 39t h I n t e r n a t i o n a lA C M S I G I R C o n f e r e n c eo n R e s e a r c h a n d D e v e l o pm e n ti nI n f o r m a t i o n R e t r i e v a l (S I G I R 16).N e w Y o r k :A C M ,2016:539-548.[15] G E N T I L EC ,L IS ,Z A P P E L L A G.O n l i n eC l u s t e r i n g o fB a n d i t s [C ]//P r o c e e d i n g so ft h e31s tI n t e r n a t i o n a l C o n f e r e n c e o n M a c h i n eL e a r n i n g.N e w Y o r k :A C M ,2014:757-765.[16] 王宇琛,王宝亮,侯永宏.融合协同过滤与上下文信息的B a n d i t s 推荐算法[J ].计算机科学与探索,2019(3):361-373.(WA N G YC ,WA N G B L ,HO U Y H.B a n d i t sR e c o mm e n d a t i o n A l g o r i t h m B a s e do nC o l l a b o r a t i v e F i l t e r i n g a n d C o n t e x tI n f o r m a t i o n [J ].J o u r n a lo fF r o n t i e r so fC o m p u t e rS c i e n c ea n d T e c h n o l o g y ,2019(3):361-373.)[17] B A N Y K ,H EJR ,C U R T I S SB ,e t a l .M u l t i -f a c e tC o n t e x t u a lB a n d i t s :A N e u r a lN e t w o r kP e r s p e c t i v e [C ]//P r o c e e d i n g s o f t h e 27t hA C MS I G K D DC o n f e r e n c e o nK n o w l e d g eD i s c o v e r y D a t aM i n i n g (K D D 21).N e wY o r k :A C M ,2021:35-45.[18] S C H E L L E K E N SV ,J A C Q U E SL .Q u a n t i z e dC o m p r e s s i v e K -M e a n s [J ].I E E ES i g n a l P r o c e s s i n g L e t t e r s ,2018,25(8):1211-1215.[19] 邬春明,齐森南.改进K -M e a n s 聚类的自适应加权K 近邻指纹定位算法[J ].重庆邮电大学学报(自然科学版),2021,33(6):946-954.(WU C M ,Q IS N.A d a p t i v e W e i g h t e d K -N e a r e s t N e i g h b o r F i n g e r p r i n t L o c a t i o n A l g o r i t h m B a s e d o n I m p r o v e d K -M e a n s C l u s t e r i n g [J ].J o u r n a l o f C h o n g q i n g U n i v e r s i t y o f P o s t s a n d T e l e c o mm u n i c a t i o n s (N a t u r a l S c i e n c eE d i t i o n ),2021,33(6):946-954.)(责任编辑:韩 啸)99 第1期 张婷婷,等:融合协同过滤的神经B a n d i t s 推荐算法。
求解动态优化问题的多种群骨干粒子群算法
求解动态优化问题的多种群骨干粒子群算法陈健;申元霞;纪滨【摘要】To solve the challenges of outdated memory and diversity loss in Dynamic Optimization Problem(DOP), this paper proposes an improved Multi-swarms Bare Bones Particle Swarm Optimization(MBBPSO). First of all, the particles of environment survey are set to detect timely the change of environment in MBBPSO, which avoids incorrect information guiding the direction of swarms'evolution. After the change of environment, MBBPSO reinitialize all swarms by using the information which every swarm explores in last environment which enhances fast tracking ability of the excellent solution to the current environment. When the swarm falls into a standstill, MBBPSO designs newly methods to enhanceparticles'activation and use the multi-swarms measure to maintain the whole swarm's diversity. The simulation experi-ment results show that MBBPSO has stronger competitiveness in dynamic environment.%针对动态优化问题(Dynamic Optimization Problem,DOP)中所面临的过时记忆和多样性丧失的挑战,提出了一种改进的多种群骨干粒子群优化算法(Multi-swarms Bare Bones Particle Swarm Optimization,MBBPSO).通过设置环境勘探粒子及时检测环境的变化,避免了错误信息误导种群的进化方向;环境改变后,利用上一个环境搜索的信息初始化新的种群,提高MBBPSO快速追踪到当前环境的优秀解的能力;当种群陷入停滞时,采用新的进化方程以加强粒子的活性和多种群策略维持群体的多样性.仿真实验表明,MBBPSO在解决动态环境问题中具有较强的竞争力.【期刊名称】《计算机工程与应用》【年(卷),期】2017(053)019【总页数】7页(P45-50,108)【关键词】动态优化问题;骨干粒子群算法;过时记忆;多样性丧失;多种群【作者】陈健;申元霞;纪滨【作者单位】安徽工业大学计算机科学与技术学院,安徽马鞍山 243032;安徽工业大学计算机科学与技术学院,安徽马鞍山 243032;安徽工业大学计算机科学与技术学院,安徽马鞍山 243032【正文语种】中文【中图分类】TP301.6粒子群优化算法(Particle Swarms Optimization,PSO)是美国社会心理学学家Kennedy和电气工程师Eberhart于1995首先提出的[1]。
多频未知时变扰动下的结构微振动鲁棒自适应控制
第 36 卷第 5 期2023 年10 月振 动 工 程 学 报Journal of Vibration EngineeringVol. 36 No. 5Oct. 2023多频未知时变扰动下的结构微振动鲁棒自适应控制方昱斌1,朱晓锦2,杨龙飞1,许志超1,田梦楚1,张小兵3(1.南京理工大学智能制造学院,江苏南京 210094; 2.上海大学机电工程及自动化学院,上海 200072;3.南京理工大学能源与动力工程学院,江苏南京 210094)摘要: 本文针对多频窄带未知和时变扰动,基于内模原理和Y⁃K参数化方法,提出一种反馈鲁棒自适应振动的主动控制算法。
该算法通过设计PID中央鲁棒控制器,有效解决了次级通道模型未知情况下的鲁棒控制器参数设计问题。
同时提出一种变步长最小均方(Variable Step Size Least Mean Square,VSSLMS)方法,可以在保证稳态误差的基础上大幅提升收敛速度,并通过系统辨识实验验证了所提VSSLMS方法相较于其他VSSLMS算法在收敛性能上的优越性。
通过结构微振动主动控制实时实验,对比验证了单独采用滤波x最小均方(Least Mean Square,LMS)自适应控制算法、基于LMS算法的鲁棒自适应控制算法和基于VSSLMS算法的鲁棒自适应控制算法的抑振效果。
实验结果表明,本文基于VSSLMS算法的鲁棒自适应控制算法在面向双频正弦窄带扰动以及其频谱、幅值突变情况时,都具有较好的收敛性和鲁棒性。
关键词:振动主动控制;Y⁃K参数化;变步长(VSS); LMS算法;鲁棒自适应中图分类号: TB535;O327 文献标志码: A 文章编号: 1004-4523(2023)05-1309-09DOI:10.16385/ki.issn.1004-4523.2023.05.015引言在高分遥感探测领域中,卫星结构微振动会引发空间相机产生视线抖动和像移,继而降低成像质量和分辨率,其影响不能忽视[1⁃2]。
多种任务调度混合的ib-lbm并行优化方法
Abstract: When using Immersed Boundary-Lattice Boltzmann Method(IB-LBM)to solve the flow field,in order to obtain more accurate results,a larger and denser flow field grid is often required,which results in a long time of simulation process. In order to improve the efficiency of the simulation,according to the characteristics of IB-LBM local calculation,combined with three different task scheduling methods in OpenMP,a parallel optimization method of IB-LBM was proposed. In the parallel optimization,three task scheduling modes were mixed to solve the load imbalance problem caused by single task scheduling. The structural decomposition was performed on IB-LBM,and the optimal scheduling mode of each structure part was tested. Based on the experimental results,the optimal scheduling combination mode was selected. At the same time,it could be concluded that the optimal combination is different under different thread counts. The optimization results were verified by speedup,and it could be concluded that when the number of threads is small,the speedup approaches the ideal state;when the number of threads is large,although the additional time consumption of developing and destroying threads affects the optimization of performance,the parallel performance of the model is still greatly improved. The flow field simulation results show that the accuracy of IB-LBM simulation of fluid-solid coupling problems is not affected after parallel optimization.
基于图正则化的贝叶斯宽度学习系统
第4卷第1期智能科学与技术学报V ol.4No.1 2022年3月Chinese Journal of Intelligent Science and Technology March 2022 基于图正则化的贝叶斯宽度学习系统段俊伟1,许林灿1,全渝娟1,陈龙2,陈俊龙3(1. 暨南大学信息科学技术学院,广东广州 510632;2. 澳门大学科技学院,澳门 999078;3. 华南理工大学计算机科学与工程学院,广东广州 510006)摘 要:作为一种前馈神经网络,宽度学习系统因其精度高、训练速度快且能有效代替深度学习方法而备受研究者的关注。
然而,宽度学习系统存在对网络中的特征节点个数比较敏感且求伪逆方式易使模型出现过拟合等问题。
为此,在宽度学习系统中引入贝叶斯推断和图正则化。
一方面,通过引入先验知识进行贝叶斯学习可以有效提高权重的稀疏性,提高模型的稳定性;另一方面,加入图正则化可充分考虑数据内在的图信息,进一步提高模型的泛化能力。
在UCI数据集和NORB数据集上对所提模型进行性能评估,实验结果表明,所提的基于图正则化的贝叶斯宽度学习系统模型能进一步提高宽度学习系统的分类精度且具有更好的稳定性。
关键词:宽度学习系统;贝叶斯推断;图正则化;模式识别中图分类号:TP181文献标志码:Adoi: 10.11959/j.issn.2096−6652.202203Graph-regularized Bayesian broad learning systemDUAN Junwei1, XU Lincan1, QUAN Yujuan1, CHEN Long2, CHEN C.L. Philip 31. College of Information Science and Technology, Jinan University, Guangzhou 510632, China2. Faculty of Science and Technology, University of Macau, Macau 999078, China3. School of Computer Science and Engineering, South China University of Technology, Guangzhou 510006, ChinaAbstract: As a feed forward neural network, broad learning system (BLS) has attracted much attention because of its high accuracy, fast training speed, and the ability to effectively replace deep learning methods. However, it is sensitive to the number of feature nodes and the pseudo-inverse method is likely to result in the problem of over fitting for BLS mod-el. To address the above issues, Bayesian inference and graph regularization was introduced in to the BLS model. By in-troducing the prior knowledge for Bayesian learning, the sparsity of the weights and the stability of the model could be effectively improved; while the graph information mining from the data could be fully considered to improve the genera-lization ability of the model by regularization. The UCI and NORB dataset were adopted for evaluating the performance of the proposed model. The experiment results demonstrated that the proposed graph-regularized Bayesian broad learning system model can further improve the accuracy of classification and has better stability.Key words: board learning system, Bayesian inference, graph regularization, pattern recognition收稿日期:2021−02−01;修回日期:2021−04−17通信作者:全渝娟,Tquanyj@基金项目:国家重点研发计划基金资助项目(No.2018YFC2002500);广东省基础与应用基础研究基金资助项目(No. 2021A1515011999);广州市科技创新发展专项资金项目(No.201902010041)Foundation Items: The National Key Research and Development Program of China (No.2018YFC2002500), The Guangdong Basic and Applied Basic Research Foundation (No.2021A1515011999), The Guangzhou Science and Technology Innovation and Devel-opment Special Fund Project (No.201902010041)·110·智能科学与技术学报第3卷0引言目前,利用人工智能技术快速准确地获取数据并进行分析与处理已成为被广泛关注的问题之一[1-2]。
一种线上贝叶斯压缩水下成像方法及系统、设备和介质[发明专利]
专利名称:一种线上贝叶斯压缩水下成像方法及系统、设备和介质
专利类型:发明专利
发明人:郭企嘉,杨偲昀,周天
申请号:CN202111514936.2
申请日:20211213
公开号:CN114296087A
公开日:
20220408
专利内容由知识产权出版社提供
摘要:本发明提出了一种线上贝叶斯压缩水下成像方法及系统、设备和介质,该方法通过引入状态转移方程建立源向量各快拍之间的结构关系,结合波束形成模型,构建转移概率密度和似然概率密度,给出超参数的估计公式,包括稀疏超参数、噪声不确定度和转移矩阵,并采用锯齿滞后周期性更新机制结合Kalman滤波‑RTS平滑实现源向量的高精度重构。
该方法具有非迭代特征,以快拍或时间序列推进估计进程,具有收敛性保证,算法同时兼具低计算量和计算量可预测性,尤其适用于水下成像系统在线工作。
申请人:哈尔滨工程大学
地址:150000 黑龙江省哈尔滨市南岗区南通大街145号
国籍:CN
代理机构:哈尔滨市阳光惠远知识产权代理有限公司
代理人:孙莉莉
更多信息请下载全文后查看。
基于改进粒子群算法的过程神经网络训练
基于改进粒子群算法的过程神经网络训练刘志刚;杜娟;许少华;李盼池【摘要】Aiming at the problem that it is difficult for BP algorithm to converge because of more parameters in training of process neural networks based on orthogonal basis expansion, a modified particle swarm algorithm is presented which combines the quantum theory and is to train the process neural network. Each particle has the double chain structure. The positions of particles are encoded by the probability amplitudes of quantum bits. The movements and mutations of particles are performed by quantum rotation gate and quantum non-gate. The algorithm has the abilities of population search for quantum swarm particle and global convergence, which overcomes the complex compute and easily plunges into local minimums about BP algorithm. Taking the pattern classification of two groups of two-dimensional trigonometric functions as an application, the simulation results show that the algorithm has not only fast convergence but also good optimization ability.%针对过程神经元网络由于模型参数较多,正交基展开后的BP算法不易收敛的问题,结合量子理论,提出一种改进的粒子群算法,并用于过程神经元网络的训练.算法中粒子采用双链结构,用量子位的概率幅对粒子位置编码,通过量子旋转门和量子非门完成粒子的更新与变异,可发挥量子粒子群的群体搜索能力和全局收敛性,有效克服BP算法计算复杂、容易陷入局部最小值等缺陷.以两组二维三角函数的模式分类问题为例,验证算法有效性.结果表明该方法不仅收敛速度快,而且寻优能力强.【期刊名称】《科学技术与工程》【年(卷),期】2011(011)012【总页数】5页(P2675-2679)【关键词】过程神经元网络;粒子群;正交基变换;量子位;学习算法【作者】刘志刚;杜娟;许少华;李盼池【作者单位】东北石油大学计算机与信息技术学院,大庆,163318;东北石油大学计算机与信息技术学院,大庆,163318;东北石油大学计算机与信息技术学院,大庆,163318;东北石油大学计算机与信息技术学院,大庆,163318【正文语种】中文【中图分类】TP183过程神经元网络(Process Neural Network,PNN)是近几年提出的一种新的人工神经网络模型[1],输入/输出均可为时变函数,聚合运算可同时反映多输入时变信号的空间聚合和对时间过程效应的累积。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学士学位论文BACHELOR DISSERTATION论文题目贝叶斯框架下B-Splines滤波算法的实现及其并行化学生姓名余翊森学号2010021070030专业电子信息工程学院电子工程学院指导教师唐续指导单位电子科技大学2014年6月4日摘要摘要在理论上贝叶斯滤波可以解决非线性状态估计问题,但在大多数实际应用场景下,状态变量的概率密度函数无解析表达式。
这使得贝叶斯滤波中的相关积分运算难以开展。
为解决非线性状态估计的问题,学界已提出了诸如扩展卡尔曼滤波,无迹卡尔曼滤波,基于序贯蒙特卡洛(sequential Monte Carlo,SMC)的算法等多种方法,但它们仍存在种种不足。
本文研究的贝叶斯框架下的B-Splines滤波算法,该算法利用B-Splines对状态变量的概率密度函数,转移概率函数进行拟合重构,从而使相关函数以B-Splines的形式参与到贝叶斯滤波的相关运算中。
由于其函数形式是多项式,其积分操作十分方便。
同时,在对概率密度函数进行拟合时对系统不需要任何线性假设。
这使贝叶斯滤波在非线性状态估计问题中得以用非SMC的算法实现。
并且,该算法不存在基于SMC的算法中存在的粒子贫化退化的问题。
从仿真结果来看,其估计精度高于粒子滤波等SMC算法。
该算法中存在大量向量和矩阵操作,对算法进行并行化可使其运行速度大大提高。
本文中采用开源开发工具GPUmat实现了算法的并行化。
仿真结果显示,相对于非并行的实现方式,在现有的并行化方法下,单次循环的加速比可达27.8.关键词:贝叶斯滤波,非线性估计,B-Splines,GPUmat,并行化IABSTRACTABSTRACTTheoretically,Bayesianfiltering can solve nonlinear state estimate problems,how-ever in most practical cases,there is no exact analytic expression for the probability den-sities of the unknown state,which makes the integral in Baysianfiltering process hard to accomplished.To solve this problem,many methods have been brought up such as ex-tended Kalmanfilter(EKF),unscented Kalmanfilter(UKF)and various sequential Monte Carlo(SMC)filters.But there are still imperfections inherently within those algorithms.In this paper,a B-Splines basedfiltering algorithm under the Bayesian framework is ing B-Splines to reconstruct the probability densities of the unknown state and the transition probability function,the reconstructed functions can be applied to the Bayesianfiltering.As the B-Splines are polynomials offixed order,the involved integral operations can be implemented easily.Meanwhile,due to no linear assumptions are required,this algorithm can be used to address nonlinear state estimate problems and implement Bayesianfiltering without SMC methods.Furthermore,this algorithm is free from particle impoverishment and degradation which is inherently in various sequential Monte Carlofilters.Current simulation results shows,its estimate accuracy are higher than sequential Monte Carlofilters like particlefilter.In the proposed algorithm,there exist many operations involved with vectors and matrices.Therefore,the algorithm can be greatly sped up if it runs parallelized.In this paper,we use open source SDK GPUmat to implement the parallelization of the algorithm.Test results show,in the current implementation,a27.8speed-up ratio for each loop can be obtained.Keywords:Bayesianfiltering,nonlinear estimate,B-Splines,GPUmat,parallelizationIII目录第1章概述 (1)1.1贝叶斯滤波 (1)1.2B-Splines (2)1.3贝叶斯框架下B-Splines滤波算法 (2)1.4算法并行化 (3)1.5研究意义及国内外研究现状 (3)1.6本文工作及章节安排 (4)第2章贝叶斯滤波 (5)2.1离散时间随机系统的模型 (5)2.2贝叶斯滤波 (5)2.2.1状态预测 (6)2.2.2状态更新 (6)2.2.3本章小结 (6)第3章B-Splines原理 (7)3.1B-Spline基函数 (7)3.1.1节点 (7)3.1.2由节点生成B-Spline基函数 (9)3.2由B-Spline基函数构造B-Splines (10)3.3B-Splines的相关性质 (11)3.3.1B-Spline基函数的非负性 (11)3.3.2B-Splines的积分与微分 (12)3.4多维B-Splines (12)3.5利用B-Splines进行函数拟合 (12)3.5.1节点类型的选取 (13)3.5.2均匀B-Splines用于函数拟合 (13)3.5.3B-Splines用于函数拟合的局限性 (14)3.5.4本章小结 (14)第4章贝叶斯框架下的B-Splines滤波算法 (15)V4.1状态预测 (15)4.1.1节点选取 (15)4.1.2节点更新 (16)4.1.3预测概率密度函数 (17)4.2状态更新 (18)4.3本章小结 (19)第5章算法实现及其并行化 (20)5.1函数的拟合重构 (20)5.1.1坐标变换 (21)5.1.2采样点的选取 (21)5.1.3系数矩阵Θ的构造 (22)5.2状态预测 (23)5.2.1状态转移函数 (24)5.2.2拟合方法 (26)5.2.3数值方法 (29)5.3状态更新 (30)5.4GPUmat实现并行化 (31)5.5本章小结 (32)第6章仿真算例 (33)6.1函数拟合算例 (33)6.1.1算例描述 (33)6.1.2误差分析 (33)6.2目标跟踪算例 (35)6.2.1算例描述 (35)6.2.2仿真结果及误差分析 (35)6.2.3并行化加速效果 (37)6.2.4本章小结 (39)第7章总结与展望 (40)7.1总结 (40)7.2展望 (40)7.2.1算法实现方式的多样性 (40)7.2.2多维场景下的数值方法 (41)VI参考文献 (42)致谢 (43)外文资料原文 (44)外文资料译文 (47)VII第1章概述第1章概述对于含有系统噪声及观测噪声的离散时间随机系统,根据观测值来估计未知状态变量的滤波算法一直是学术界关注的热点。
贝叶斯滤波作为一种应用广泛的状态估计算法,在理论上其适用于线性及非线性动力系统。
对于线性系统,以最小均方误差为最佳准则的卡尔曼滤波可视为贝叶斯滤波的一个特例[1]。
而对于非线性系统,大多数现实问题中的状态变量的概率密度函数,其解析表达式难以获得,这制约了贝叶斯滤波的应用。
不过在过去的数十年里,为解决非线性状态估计的问题,学术界已提出了诸如扩展卡尔曼滤波[2],无迹卡尔曼滤波[3],基于序贯蒙特卡洛(SMC)[4][1]的算法等多种方法,但它们仍存在种种不足[5]。
在贝叶斯框架下利用B-Spline滤波算法的思路于2007年首次被K.Punithakumar和T.Kirubarajan提出[6],数年来该团队不断完善这一算法,业已取得一些成果[7][8][5]。
该算法克服了基于序贯蒙特卡洛的算法(如粒子滤波)所带来的粒子贫化退化问题[1][4],适用于非线性非高斯状态估计问题,并且在估计精度上优于其他诸多非线性估计算法[5],应用前景广阔。
不过这一算法并未得到广泛的应用。
国内外尚无其他团队有相关方向的论文发表,且从已发表的文献来看,所有相关文献中对贝叶斯框架下B-Splines滤波算法的理论基础均有介绍,但对算法的实现着墨甚少,这在一定程度上制约了该算法的推广。
接下来简要介绍该算法的理论背景。
1.1贝叶斯滤波贝叶斯滤波[4]是一种估计未知的真实状态的概率密度函数的统计方法,根据观测值来修正并估计状态变量。
它分为两个步骤。
状态预测步骤根据已经获得的状态变量的后验估计概率密度函数,或者初始的概率密度函数,依状态转移函数来预测下一时刻状态变量的概率密度函数。
状态更新步骤当接收到本时刻的观测值后,再对预测的概率密度函数进行修正。
在状态预测部分,有函数的积分操作,而在状态更新部分,也需要用含概率密度函数的积分项对后验估计进行归一化。
贝叶斯滤波是一种理论框架,其实施1电子科技大学学士学位论文的主要困难在于,当难以获得参与积分运算的函数的解析表达式时,相关积分操作将无法获得解析解。
1.2B-SplinesB-Splines[9]源于数值分析领域,是贝塞尔曲线的一种特殊形式。