基于Q2算法的固定迟滞问题离散化求解

合集下载

核磁共振T_2谱优化反演方法

核磁共振T_2谱优化反演方法
M N 2 f( E1 , E2 , …, E N ) = ∑[ A echo j -∑ E i e - T2 i ] → min j =1 i =1
Hale Waihona Puke jT i中, 当 k = 0 时, βk - 1 = 0, 当 k > 0 时, 有 βk - 1 = ‖ g ‖2 ( gk - gk - 1 ) T gk ( FR ) ; = ( PRP 算法 或 β k -1 k -1 2 k -1 2 ‖ g ‖2 ‖ g ‖2 算法, 本文采用该算法) ;
( 1 ) 正演模型生成了无噪声理论回波串, 反演结果 和构造的 T2 谱对比见图 1 。可以看出, 反演的 T2 谱 与构造的 T2 谱几乎完全吻合。这表明, 该方法可以
2616







10 卷
准确地反演无噪声理论回波数据的 T2 谱。
-6 正演和反演的参数如下:T2 范围为 50 × 10 s ~
k k 5) 确 定 搜 索 步 长 λk , 使 f ( e + λk P ) = k 2
(2) 式( 2 ) 中各符号意义同式( 1 ) 。 2. 2 T2 谱的非负约束方法 从物理意义上说, 式 ( 1 ) 或式 ( 2 ) 中的 E i 应该 是非负值, 但在利用式 ( 2 ) 优化过程中 E i 有可能是 e i 为任意 负值。为了进行非负约束, 可以令 E i = e , 实数, 式( 2 ) 变为:
。在地面地球物理中是目前唯一能直接寻找
[ 2]
评价地下水的方法 杂岩性
[ 4]
。 在低阻油层[3]、 水淹层、 复
[ 5 —6 ] 、 复杂储集空间和复杂特性流体储层

基于Q学习算法的作业车间动态调度

基于Q学习算法的作业车间动态调度

基于Q 学习算法的作业车间动态调度①王维祺, 叶春明, 谭晓军(上海理工大学 管理学院, 上海 200093)通讯作者: 王维祺, E-mail: *****************摘 要: 近年来, 在基于Q 学习算法的作业车间动态调度系统中, 状态-行动和奖励值靠人为主观设定, 导致学习效果不理想, 与已知最优解相比, 结果偏差较大. 为此, 基于作业车间调度问题的特质, 对Q 学习算法的要素进行重新设计, 并用标准算例库进行仿真测试. 将结果先与已知最优解和混合灰狼优化算法、离散布谷鸟算法和量子鲸鱼群算法在近似程度、最小值方面进行比较分析. 实验结果表明, 与国内求解作业车间调度问题的Q 学习算法相比, 该方法在最优解的近似程度上显著提升, 与群智能算法相比, 在大多数算例中, 寻优能力方面有显著提升.关键词: 智能制造; 作业车间调度; Q 学习算法引用格式: 王维祺,叶春明,谭晓军.基于Q 学习算法的作业车间动态调度.计算机系统应用,2020,29(11):218–226. /1003-3254/7579.htmlJob Shop Dynamic Scheduling Based on Q-Learning AlgorithmWANG Wei-Qi, YE Chun-Ming, TAN Xiao-Jun(College of management, University of Shanghai for Science and Technology, Shanghai 200093, China)Abstract : In recent years, in the job shop dynamic scheduling system based on Q-learning algorithm, the state action and reward value are set subjectively by human beings, which leads to the unsatisfactory learning effect. Compared with the known optimal solution, the result deviation is larger. For this reason, based on the characteristics of job shop scheduling problem, the elements of Q-learning algorithm are redesigned, and simulation test is carried out with standard case library.The results are compared with the known optimal solution, the hybrid Gray Wolf algorithm, the discrete cuckoo algorithm and the quantum whale swarm algorithm in terms of approximation and minimum. The experimental results show that compared with the Q-learning algorithm for solving the job shop scheduling problem in China, this method is significantly improved in the approximate degree of the optimal solution, and compared with the group intelligence algorithm, in most cases, the optimization ability is significantly improved.Key words : intelligent manufacturing; job shop scheduling; Q-learning algorithm2018年, 我国工业增加值在GDP 中所占百分比为33.9%, 与1952年的17.6%相比, 在66年间增加了约两倍, 这说明我国工业的总体规模完成了从小变大的历史性突破. 就目前而言, 我国制造业在生产能力利用效率方面仍然处于比较低的水平. 这是因为传统制造业的生产调度模式已无法适应供应链体系的快速变化. 因此, 要对生产车间调度模式进行深入研究, 将传统的生产车间调度模式向智能化和高效化的方向发展.智能和高效的生产调度模式不仅仅与机器和工件所处的状态有关, 还与在加工过程中所存在的多种客观因素有关. 我国正在大力支持对数字化车间的建设,解决制造设备在制造能力方面的自治问题. 如今, 国内计算机系统应用 ISSN 1003-3254, CODEN CSAOBNE-mail: ************.cn Computer Systems & Applications,2020,29(11):218−226 [doi: 10.15888/ki.csa.007579] ©中国科学院软件研究所版权所有.Tel: +86-10-62661041① 基金项目: 国家自然科学基金(71840003); 上海理工大学科技发展基金(2018KJFZ043)Foundation item: National Natural Science Foundation of China (71840003); Science and Technology Development Fund of University of Shanghai for Science and Technology (2018KJFZ043)收稿时间: 2019-12-15; 修改时间: 2020-01-21, 2020-03-03; 采用时间: 2020-03-20; csa 在线出版时间: 2020-10-29各生产加工企业以实现《智能制造2025》目标为契机, 大力推进生产调度智能化, 建立智能型工厂.本文针对车间调度问题的特点对Q学习算法的主要要素进行重新设计, 使其与求解车间调度问题相适应, 并将设计好的算法对作业车间调度问题的标准化算例进行测试, 评估该方法的合理性.1 国内外研究综述作业车间调度涉及时间和资源约束下的活动排序以满足给定的目标[1]. 由于目标冲突、资源有限以及难以准确建模模拟真实场景, 因此是一个复杂的决策活动. 在制造环境中, 调度活动映射到操作和资源到机器.调度器的目的是确定每个操作的开始时间, 以便在满足容量和技术约束的同时实现期望的性能度量. 在当今高度竞争的制造环境中, 明确需要能够在可接受的时间范围内产生良好解决方案的健壮和灵活的方法.对解空间的搜索过程以识别最优调度的算法的计算时间随着问题大小呈指数增加.近五年来, 国内外针对作业车间调度问题的研究主要聚焦在两个方向, 一是通过自适应搜索的方法对该问题进行求解. 二是使用机器学习工具来研究调度过程, 以获得任何新问题的调度.1.1 自适应搜索方法国外肯定了运用智能算法对求解作业车间生产调度(Job-shop Scheduling Problem, JSP)问题具有十分重要的作用. 其中, Kurdi等[2]在遗传算法中加入了新岛模型, 解决了目标为最大完工时间的作业车间调度问题, 但在其他优化问题中尚未验证其有效性; Asad-zadeh等[3]用并行人工蜂群算法(PABC)求解作业车间生产调度问题, 该算法收敛速度非常快, 且求解质量高; Silva等[4]用转移瓶颈程序来解决车间作业调度问题, 尽管最小化了生产时间, 但是难以在寻求全局解决办法方面实现多样化; Mudjihartono等[5]提出了将粒子群算法加入到遗传算法中, 设计出能够实现并行编程的新算法, 该算法求解效果较好, 但在非并行算法中, 由于问题大小的增加使得整个算法的求解速度大大减慢.国内关于求解JSP调度问题的主要方法同样是利用群智能优化算法. 其中, Shen等[6]将处理调度问题的处理时间不确定性考虑在内, 建立了不确定机会约束模型. 结果表明, 对于不确定性作业车间调度问题, 萤火虫优化算法可以得到比粒子群优化算法更好的结果;沈桂芳等[7]将随机均匀设计法(RUDHS)与协调搜索优化算法相结合, 对JSP典型测试用例进行了仿真, 其结果表明, RUDHS算法具有更高的效率; 杨小东等[8]对作业车间调度问题, 提出了分布式算法(TSEDA), 为了保证解决方案的可行性, 采用了编码和解码的机制;顾文斌等[9]用生物启发的方法对粒子群优化算法进行改进, 使作业车间调度的最大总处理时间最小; 施文章等[10]将模拟退火方法引入到布谷鸟搜索算法中, 并在标准车间调度问题中使用改进的作业车间调度问题; Li等[11]对传统的TLBO进行了改进, 以提高对JSP的解决方案的多样化和集约化, 计算时间有待提升;陈宇轩[12]通过区间数对不确定过程的加工时间进行表征, 研究了具有不确定加工时间特征的柔性作业车间调度问题; Zeng等[13]将区间数理论引入遗传算法的变异过程中, 用改善后的遗传算法求解柔性作业车间调度问题; 钱晓雯[14]提出一种基于可变邻域搜索的动态焰火算法, 用于求解具有最小化最大完工时间为特征的作业车间调度问题(JSP). 在标准算例集中, 该算法具有一定的鲁棒性, 提高了优化精度和收敛性; Zhang 等[15]研究了在具有动态性的制造环境中的柔性装配作业车间调度问题, 发现约束规划是解决此问题的有效方法, 其解的适应性优于混合整数线性规划以及静态和动态情况下的所有调度规则.1.2 主动调度算法与机器学习工具相结合的方法相对于作业序列优化, 近年来关于主动调度算法与机器学习工具相结合的国内外相关文献较少. 曹琛祺等[16]通过对调度队列进行变换, 将原来排序的调度问题转化为了可分类的调度问题, 构造出基于人工神经网络的分类器. 对于新的调度实例, 使用训练好的分类器来导出优先级, 然后使用优先级来获得调度序列; Tselios等[17]提出一个混合方法来处理作业车间调度问题. 该方法包括3个阶段: 第一阶段利用遗传算法产生一组初始解, 在第二阶段作为递归神经网络的输入.在第三阶段, 使用自适应学习速率和类似禁忌搜索的算法, 以改进递归神经网络返回的解; Shahrabi等[18]提出了一种基于可变邻域搜索(VNS)的调度方法. 考虑到事件驱动策略, 为了在任何重新调度点获得VNS 的适当参数, 使用Q学习算法进行强化学习; Waschneck 等[19]将谷歌的深度强化学习网络应用于作业车间生产调度, 实现了工业4.0的生产控制; Kuhnle等[20]设计了2020 年 第 29 卷 第 11 期计算机系统应用一种用于自适应订单调度的强化学习算法, 提出了强化学习算法在车间生产系统中的评价方法和准则.2 作业车间调度问题描述与定义JSP 问题可描述为: n 个工件在指定的m 台机器上进行加工, 工件可用一个集合workpiece (WP)表示, 机器可用一个集合machine (MC)表示. 各工件在各机器上的工序事先给定, 目标是使得某些加工性能指标达到最优. 本论文用于衡量加工性能的指标是使最大完工时间最小化.为了确保作业车间能够正常运行, 设定的约束条件有: 各工件经过其准备时间后即可开始加工; 在每个加工阶段, 有且仅有一台机器对同一个工件进行加工,每个工件也只能是由一台机器对其进行加工; 一个操作一旦开始就不允许中途间断, 整个加工过程中机器均有效; 各工件必须按事先规定的工艺路线对其进行加工; 不考虑工件的优先权; 各工件的操作需等待.Z =min(C max )(1)C ik −T ik +M (1−S ihk )≥C ih(2)C jk −C ik +M (1−X i jk )≥T jk(3)C jk ≥0(4)S ihk ,X i jk ∈{0,1}(5)i ,j ∈{1,2,···,n }(6)h ,k ∈{1,2,···,m }(7)其中, 式(1)为目标函数Z , C max 用来表示最大完工时间makespan; 第一个约束条件为式(2), 用来表示工序之间的先后约束关系, C ik 表示第i 个工件在第k 台机器上的完工时间, T ik 表示第i 个工件在第k 台机器上的加工时间, M 为一个无穷大数, S ihk 表示工件i 在机器h 和机器k 上加工的先后顺序, 若机器h 先于机器k 加工工件i , S ihk 取值为1, 否则为0, C ih 表示第i 个工件在第h 台机器上的完工时间; 第二个约束条件式(3)表示工序无抢占行为, C jk 表示第j 个工件在第k 台机器上的完工时间, X ijk 表示工件i 和工件j 在同一台机器K 上进行加工的先后顺序, 若工件i 先于工件j 在机器k 上进行加工, 则X ijk 取值为1, 否则为0, T jk 表示第j 个工件在第k 台机器上的加工时间, 第三个约束条件式(4)表示总的完工时间为非零值. 第4~6个约束条件即式(5)~式(7)是具体的取值范围.3 强化学习与Q 学习算法概述3.1 强化学习定义首先, 可将机器学习领域按学习模式划分为监督学习、无监督学习以及强化学习[19]. 强化学习(Reinforce-ment Learning, RL)是机器学习的一个分支. 其次, RL 是一种以目标为导向的学习, 智能体以“试错”的方式来进行学习, 通过与环境进行交互获得奖励指导行为[20].其目标是使智能体所获得的奖励最大化.具体而言, RL 解决的问题是, 针对一个具体问题得到一个最优的策略, 既在当前状态下采取的最佳行为, 使得在该策略下获得的长期回报能够达到最大.在RL 中, 算法将外界环境以奖励量最大化的方式展现, 该算法没有直接对智能体所应该采取的动作或行为进行指导, 而是智能体通过动作所对应的奖励值的多少来采取行动.对于智能体所选择的行为, 其不只是影响到了瞬时所获得的奖励, 而且还对接下来的行为和最终获得的奖励和产生影响.3.2 强化学习模型在当前状态下, 智能体执行了一个动作, 并与环境进行交互, 然后得到下一个轮次的奖励, 以及进入到下一个轮次的状态中去, 依此循环往复.奖励: 通常记作R t , 表示第t 个时间段的返回奖励值, 是一个标量, 回报是所有即时奖励的累积和.行为: 通常记作Action, 是来自于动作空间, 可以是连续的动作, 也可以是离散动作.状态: 是指当前智能体所处的状态.策略: 是指智能体在特定状态下的行为依据, 是从状态到动作的映射, 规定了智能体应该采取的动作的概率分布. 函数定义为a =π(s ), 即输入为状态s , 输出为行为a . 作为RL 中最为重要的内容, 策略设计的质量与智能体所采取的行动以及算法的整体性能息息相关.策略可分为确定策略和随机策略. 确定策略就是某一状态下的确定动作, 而随机策略是以概率来描述,即某一状态下执行这一动作的概率, 如式(8)所示.π(a |s )=P [A t =a |S t =s ](8)如果对状态转移矩阵不加以考虑, 智能体与环境的互动接口应包括行动、即时奖励和所属的状态.如图1所示, 智能体与环境的一个交互过程可准确的表述为: 在S t 状态下执行A t 这一动作, 然后在t +1时计算机系统应用2020 年 第 29 卷 第 11 期间先得到即时奖励R t +1. 每一步, 智能体工具策略选择一个行动执行, 然后感知下一个状态和即时回报, 通过经验再修改自己的策略.S tS t +1S t +2A tR t +1A t +1R t +2图1 能体与环境的交互过程3.3 Q 学习算法概述Q 学习算法(Q Learning, QL)的伪代码如下:Q (s ,a )∀s ∈A (s )·Initialize , , arbitrarily, and Q (terminal -state , )=0Repeat(for each episode):Initialize SRepeat(for each step of episode):Choose A from S using policy derived from Q Take action A , observe R , S'Q (s ,a )←Q (s ,a )+α[R +γmax a Q (s ′,a )−Q (s ,a )]s ←s ′Until s is terminal该算法中, 采样数据阶段, 为了保证一定的探索性,采用 策略. 在更新Q 值时, 采用完全贪婪策略, 即直接选Q 值最大的动作, 与当前的行动策略无关[21].由于Q 学习算法并不关注智能体行动时所遵循的策略, 而仅仅是采取最好的Q 值, 其学习的规则与实行的规则不用, 因此, 这是一种异策略的学习算法. 学习流程如图2所示.开始结束初始化随机 Q 值启动情景据 ε-greedy 策略选择状态 s 下的行为 a 执行行为 a , 转移到新状态 s ′, 并获得奖励 r 是否是最终状态NY图2 QL 算法流程具体步骤如下:1)初始化Q 函数为某一任意值.2)根据ε贪婪策略, 在状态下执行某一行为, 并转移到新状态.3)根据式(9)更新规则更新上一状态的Q 值.Q (s ,a )=Q (s ,a )+α(r +γmax Q (s ′,a ′)−Q (s ,a ))(9)4)重复步骤2)和3), 直到达到最终状态.4 适用于作业车间调度问题的Q 学习算法4.1 策略的设定一般用于求解JSP 问题的Q 学习算法是将行为和需要加工的工件一一对应, 作为该算法的可选策略[22],以标准算例ft06为例, 如表1所示. 此外, 每个工件所对应的状态有两个, 即在加工状态和待加工状态, 因此,状态数为工件的2n . 这样设置的原因是一般用于求解JSP 问题的Q 学习算法所学习的对象是各个工件加工的顺序. 由于这与JSP 问题中工件实际所处的状态存在一定的偏差, 因而影响了调度性能.表1 一般Q 学习算法的策略设定动作加工的工件编号动作加工的工件编号Action11Action44Action22Action55Action33Action66本文提出的改进的Q 学习算法(Improved Q-Learning algorithm, IQL)所学习的对象不是各个工件加工的优先级, 而是策略选择的优先级, 通过不断试错,直接按不同策略所反馈的奖励值大小来选择策略, 从而间接地决定工件的加工顺序. 具体如表2所示, 设定5个基本动作分别对应5种不同的状态, 动作和所对应的状态共同构成了策略. 其中, Action1偏向于加工当前阶段落后的工作; Action2偏向于加工下一阶段耗时最短的工作; Action3偏向于加工当前阶段领先的工作;A c t i o n 4偏向于加工下一阶段耗时最长的工作;Action5该机器闲置.表2 改进的Q 学习算法的策略设定动作工件所处的状态Action1当前阶段落后Action2下一阶段耗时最短Action3当前阶段领先Action4下一阶段耗时最长Action5机器闲置4.2 智能体介入调度的选择分别对以下两种情况进行选择:第1种情况: 当前无可选进程.2020 年 第 29 卷 第 11 期计算机系统应用既没有空闲的机器, 或者没有处于闲置态的作业.此时不需要智能体介入调度, 各台机器只需要继续对当前工件进行当前工序的加工即可.第2种情况: 存在可选进程.既机器完成了某个工件的某道工序作业, 呈空闲状态, 且还有某些工件存在某些工序需要加工. 此时,需要智能体介入调度.4.3 智能体介入调度的选择根据作业车间调度的特点, 综合考虑了两种实际情况来对奖励制度进行设置:1)平均总的机器加工效率与奖励成正比PET=TCTS(10)如式(10)所示, 加工效率PET就是总的任务完成的时间TC与耗费时间TS的比值. 可以看出, 总的任务完成时间不变的情况下, 耗费时间越短, 加工效率越高.由于在作业车间调度问题中, 每个工件加工有给出固定的加工阶段, 即每个工件所对应的加工次序存在先后顺序, 每道工序有其固定的加工时间. 所以, 最后完成加工工作所耗费的时间肯定是大于等于固定需要的时间. 耗费时间越接近固定需要的时间, 说明浪费的时间少, 加工效率高, 得到的奖励也就越多.2)加工消耗时间与惩罚成正比这里设置了一个与加工时间成平方关系的惩罚.这是本文的关键点也是创新所在, 因为在刚开始加工时候, 需要加工的任务多, 选择多, 可以很容易把机器安排得非常紧凑, 决策显得作用并不是特别大. 但是随着加工进度推进后, 决策的难度越高, 很容易出现前面阶段调度得很好, 但是后面阶段就差了. 这里设置平方关系后, 到后面每耗费多一个时间, 扣罚是快速增长的.从而迫使智能体在加工后期也非常谨慎调度.根据奖惩制度设置的瞬间奖励更新函数如式(11)所示, 其中, JRT为剩余加工时间, 总的任务完成时间TC与剩余加工时间JRT的差值表示当前完工时间, 表示加工阶段, 当前完工时间与加工阶段的比值表示平均各阶段的完工时间, 是一个惩罚函数, 表示越是临近完工, 相应的惩罚也就越大, 调度也会变得越加谨慎.reward=reward+TC−JRTtick−0.00001×tick2(11)该奖惩制度的设置, 与一般用于求解JSP问题的Q学习算法中的奖励设置有明显的不同[23]. 通常, 在用Q学习算法求解此类问题中, 选择两种特征参数, 比如作业平均松弛时间和剩余作业的平均执行时间, 其比值的大小反映了当前的调度效率, 通过比值, 人为地将整个调度状态空间划分为一维的m个状态, 然后针对每一种状态, 指定一个具体的数值来表示奖惩. 其缺点在于忽视了车间调度规则的复杂性, 仅凭两个特征参数的比值无法对当前调度的好坏做充分的评价.JSP问题的Q学习的更新过程如式(12)所示.Q new=Q+α×[reward+TC−JRTtick−0.00001×tick2+discount factor∗Q Maxnext−Q](12) 4.4 改进的Q学习算法收敛性分析S tS t+1Q MaxS t S t+1IQL算法会创建一个Q表用来保存每个状态所对应的Q值, 由式(12)可知, 与状态所对应的Q值到得到最终值, 状态所对应的保持恒定, 否则状态的Q值就会随着状态的Q值的变化而发生改变. 由于整个过程是一个回溯的过程, 所以前面所有的动作所对应的状态都无法达到稳定值.S t+1Q new 假设下一个状态的Q值未恒定, 为了使达到稳定状态, 将式(12)进行简化, 得式(13).Q new=(1−α)Q+α×[reward+TC−JRTtick−0.00001×tick2+discount factor∗Q Maxnext](13)对式(13)进行第一次迭代, 如式(14)所示, 迭代n次后, 如式(15)所示, 收敛证明过程如式(14)~式(17)所示.Q new=(1−α)2Q+(1−α)α×[reward+TC−JRTtick−0.00001×tick2+discount factor×Q Maxnext](14)∵n→∞,(1−α)⊂(0,1)(15)∴lim n→∞(1−α)n→0(16) Q new=reward+TC−JRTtick−0.00001×tick2+discount factor×Q Maxnext=reward+TC−JRTtick−0.00001×tick2+discount factor×Q next(17)Q new此时, 收敛.计算机系统应用2020 年 第 29 卷 第 11 期5 结果分析选择标准算例库中的abz5、abz7、abz9、ft06、ft10、ft20、la01、la02、la03、la04、la06、la11、la16、la21、la26、la31、swv06、swv16、yn1、yn2和yn3共21个不同规模大小的算例, 对用于求解JSP问题的IQL算法进行验证, 将该算法中的参数: 学习率、折扣因子和贪婪因子, 分别设置为0.1、0.97和0.8.算法的运算环境为Windows 10专业版64位操作系统, Intel(R)Core(TM)i5-4300U CPU @2.50GHz处理器, 8 GB RAM. 算法的编程实现软件为Python 3.6版本, 用于测试和比较的算法均重复独立运行20次, 求得最小值和均值.为了能更好的与文献中提到的混合灰狼优化算法(Hybrid Gray Wolf Optimization, HGWO)[24]、离散布谷鸟算法(Discrete Cuckoo Search, DCS)[25]和量子鲸鱼群优化算法(Quantum Whale Swarm Optimization, QWSO)[26]进行比较, 各算法的参数设置与文献保持一致, 具体设置如下:1) HGWO: 种群规模设为30, 最大迭代次数为500,独立运行次数为30.2) DCS: 鸟窝的个数为30, 宿主发现外来鸟蛋的概率为0.25.3) QWSO: 所有鲸鱼个体先进行基本位置更新操作, 然后进行量子旋转操作, 迭代开始为其启动时机,启动概率为1.此外, 为了便于比较, 选择最小值误差率和平均值误差率这两个指标来衡量不同算法的求解性能. 最小值误差率为该算法所求的最小值与已知最优解的差与已知最优解之比, 用来衡量算法所能求得的最优解与已知最优解的接近程度, 该值越小, 说明算法求解的寻优质量越优. 平均值误差率为该算法所求的平均值与已知最优解的差与已知最优解之比, 用来衡量各个算法在独立运行20次后的平均值与已知最优解的接近程度, 该值越小, 表明算法求解的总体质量越优.5.1 回报函数曲线变化分析以算例ft06、ft10和ft20为例, 回报函数曲线变化如图3~图5所示, 在迭代近6000次后, 回报函数均趋于稳定状态, 且在训练过程中曲线无明显波动, 说明学习过程比较平稳, 并与数据规模无关.5.2 寻优收敛曲线分析与文献[19]进行对比, 以ft06、ft10、ft20算例为例, 如图6~图8所示, 可以看出IQL算法在收敛速度上有显著提高.与3种群智能算法进行对比, 以ft10算例为例, 寻优曲线变化如图9所示, IQL算法的收敛速度远低于群智能算法, 这说明还有进一步提高的可能性.250200150100500200040006000800010 000奖励值迭代次数图3 算例ft06的回报函数曲线变化590058005700560055000200040006000800010 000奖励值迭代次数图4 算例ft10的回报函数曲线变化620060505900575056000200040006000800010 000奖励值迭代次数图5 算例ft20的回报函数曲线变化IQL算法的收敛速度明显慢于群智能算法, 是因为此算法的求解过程是一个对策略的选择不断进行探索, 不断试错的过程, 学习的目标是使奖励值最大所对应的策略, 是间接寻优的过程. 而群智能算法则是以寻找最优解为其目标, 通过对数据进行编码, 以一定规则进行寻优后解码, 是直接寻优的过程.86787062540200040006000800010 000最大完工时间(s)迭代次数IQLQL图6 算例ft06的Q学习算法收敛对比2020 年 第 29 卷 第 11 期计算机系统应用105010301010990970200040006000800010 000最大完工时间 (s )迭代次数IQL QL图7 算例ft10的Q 学习算法收敛对比13211301128112611241200040006000800010 000最大完工时间 (s )迭代次数IQL QL图8 算例ft20的Q 学习算法收敛对比1480135012201090960200040006000800010 000最大完工时间 (s )迭代次数IQL QL QWSO图9 算例ft10的3种群智能算法的寻优曲线变化5.3 求解结果对比分析5.3.1 IQL 算法与已知最优解的对比分析从表3中可以看出, IQL 算法的最小值误差率(IQLmin error rate)为0的有4个算例, 在3%以内的算例有7个, 在5%以内的算例有11个, 在10%以内的算例有16个, 约占所有算例的76%. 图12为算例ft10的调度结果.5.3.2 IQL 算法与QL 算法的对比分析表4为这两种算法的最小值误差率(min error rate)、平均值误差率(avg error rate), 分别对这两种指标进行方差分析.首先, 对最小值误差率和平均值误差率进行配对样本T 检验, 结果如表5所示, 以小值误差率的检验结果为例, 均值X 约为–0.130, 标准差SD 为0.142, 成对差分均值的标准误S E 为0.031, 置信区间C I 为[–0.195, –0.065], α值小于0.05说明IQL 算法与QL 算法在求解质量上具有显著差异, 配对T 检验的t 值为负数(–4.183), 说明IQL 算法在寻优质量上显著优于QL 算法. 具体而言, 如表5所示, 求解质量提升率超过5%的有12个算例, 超过10%的有7个算例, 超过20%的有6个算例.表3 IQL 算法与已知最优解的对比实例尺寸C *IQLmin error rate(%)abz510×101234 3.08abz720×1565614.18abz920×1567910.46ft066×6550.00ft1010×10930 4.41ft2020×511657.12la0110×5666 1.35la0210×5655 4.58la0310×55978.88la0410×55900.00la0615×59260.00la1120×51222 2.29la1610×10945 2.54la2115×101110 4.32la2620×10126913.48la3130×1017847.40swv0620×15167822.23swv1650×1029240.00yn120×208889.94yn220×209099.94yn320×2089319.84表4 IQL 算法与QL 算法在误差率上的方差分析结果指标¯XSD SE t n αMin error rate –0.1300.1420.031–4.183200.000Avg error rate –0.1500.1410.031–4.857200.000同理, 从平均值误差率的配对样本T 检验结果可以看出, IQL 算法在总体性能上显著优于QL 算法.5.3.3 IQL 算法与HGWO 算法、DCS 算法和QWSO 算法的对比分析HGWO 算法、DCS 算法和QWSO 算法的最小值误差率和平均值误差率以文献[24–26]中的数据为准,与IQL 算法的结果进行配对样本T 检验, 结果如表6所示, 以最小值误差率的检验结果为例, 在与HGWO 算法的比较中, α大于0.05, t 值为1.093, 说明IQL 算法与HGWO 算法在求解结果上无显著差异; 与DCS 算法和QWSO 算法的比较中, α值均小于0.05, 说明求解结果存在着显著差异, t 值均为负数, 说明IQL 算法在求解质量上显著优于DCS 算法和QWSO 算法. 具体而言, 如表6所示, 求解质量优于HGWO 算法的有9个算例, 约占所有算例的42.86%; 求解质量优于DCS 算法的有15个算例, 约占所有算例的71.43%; 求计算机系统应用2020 年 第 29 卷 第 11 期。

按时间抽选的基2FFT算法

按时间抽选的基2FFT算法

按时间抽选的基2FFT算法基2FFT算法(Fast Fourier Transform,快速傅里叶变换)是一种高效的算法,用于在计算机上计算离散傅里叶变换(Discrete Fourier Transform,DFT)。

它的核心思想是利用分治策略和递归操作,在O(nlogn)的时间复杂度下完成离散傅里叶变换。

基2FFT算法的关键步骤如下:1. 将输入的序列划分为两个子序列:偶数位置和奇数位置上的元素分别组成两个子序列。

2. 对这两个子序列分别进行离散傅里叶变换,得到两个新的子序列。

3. 将两个新子序列的元素按照原始顺序交替排列,得到最终的结果。

基于以上步骤,可以利用递归操作来实现基2FFT算法。

具体的实现过程如下:1. 如果输入序列的长度为1,则不需要进行任何操作,直接返回该序列作为结果。

2. 如果输入序列的长度大于1,则按照上述步骤进行分割和计算。

3. 首先将输入序列分为偶数位置和奇数位置上的元素组成的两个子序列。

4. 对这两个子序列分别递归调用基2FFT算法,得到两个新的子序列。

5. 将两个新子序列的元素按照原始顺序交替排列,得到最终的结果。

基2FFT算法的时间复杂度分析如下:假设输入序列的长度为n,则每一层递归的时间复杂度为O(n),总共有logn层递归。

因此,基2FFT算法的总时间复杂度为O(nlogn)。

基2FFT算法在信号处理、图像处理等领域具有广泛的应用。

它可以高效地计算离散傅里叶变换,将时域信号转换为频域信号,从而实现信号分析、频谱分析和频域滤波等操作。

同时,基于基2FFT算法的快速傅里叶变换还能够应用于多项式乘法、高效计算卷积等问题的求解。

总之,基2FFT算法是一种高效的离散傅里叶变换算法,通过利用分治策略和递归操作,能够在O(nlogn)的时间复杂度下完成计算。

它在信号处理和图像处理等领域有着重要的应用价值。

基2FFT算法(Fast Fourier Transform,快速傅里叶变换)是离散傅里叶变换(Discrete Fourier Transform,DFT)的一种高效计算方法。

(完整word版)按时间抽取的基2FFT算法分析

(完整word版)按时间抽取的基2FFT算法分析

第四章 快速傅里叶变换有限长序列可以通过离散傅里叶变换(DFT)将其频域也离散化成有限长序列.但其计算量太大,很难实时地处理问题,因此引出了快速傅里叶变换(FFT). 1965年,Cooley 和Tukey 提出了计算离散傅里叶变换(DFT )的快速算法,将DFT 的运算量减少了几个数量级。

从此,对快速傅里叶变换(FFT )算法的研究便不断深入,数字信号处理这门新兴学科也随FFT 的出现和发展而迅速发展。

根据对序列分解与选取方法的不同而产生了FFT 的多种算法,基本算法是基2DIT 和基2DIF 。

FFT 在离散傅里叶反变换、线性卷积和线性相关等方面也有重要应用。

快速傅里叶变换(FFT )是计算离散傅里叶变换(DFT )的快速算法。

DFT 的定义式为)(k X =)()(10k R W n x N N n knN∑-= 在所有复指数值knN W 的值全部已算好的情况下,要计算一个)(k X 需要N 次复数乘法和N -1次复数加法。

算出全部N 点)(k X 共需2N 次复数乘法和)1(-N N 次复数加法。

即计算量是与2N 成正比的。

FFT 的基本思想:将大点数的DFT 分解为若干个小点数DFT 的组合,从而减少运算量。

N W 因子具有以下两个特性,可使DFT 运算量尽量分解为小点数的DFT运算:(1) 周期性:k N n N kn N nN k N W W W )()(++== (2) 对称性:k N N k NW W -=+)2/(利用这两个性质,可以使DFT 运算中有些项合并,以减少乘法次数。

例子:求当N =4时,X(2)的值)()]3()1([)]2()0([)()]3()1([)]2()0([)3()2()1()0()()2(04240464442404324对称性-=周期性W x x x x W x x W x x W x W x W x W x W n x X n n +++++=+++==∑=通过合并,使乘法次数由4次减少到1次,运算量减少。

求解二维磁弹性问题的一种数值方法――差分正交离散(DOD)法

求解二维磁弹性问题的一种数值方法――差分正交离散(DOD)法

第卷 第 期 年 月 文章编号:1007-791X (2008) 02-0153-06燕山大学学报求解二维磁弹性问题的一种数值方法 ——差分正交离散(DOD)法田振国 ,白象忠( 摘 燕山大学 建筑工程与力学学院,河北 秦皇岛 )要:通过运动方程、物理方程、几何方程及电动力学方程给出了载流薄板在机械场、电磁场作用下的基本方程,以二维平板磁弹性问题为例,建立差分格式,得到了一系列的非线性常微分方程组。

利用准线性叠代式 对非线性微分方程组进行线性化处理,最后利用正交离散法得到了该问题的解。

本文建立的载流板壳二维磁弹 性问题的数值计算方法——差分正交离散法(DOD 法)不仅对二维问题有效,同样也为三维磁弹性的边值问题 的解决奠定了理论基础。

关键词:差分正交离散法;磁弹性;二维问题;数值方法;耦合场 中图分类号:O343 文献标识码:A引言磁弹性理论是近年来在国内外新兴起的一个 力学分支,是一个引人注意的前沿性的课题。

它是 研究构件受到电磁场作用时和作用后产生的变形、 内力、动态特性、组织和性能改变等各种物理现 象。

电磁结构的磁弹性非线性问题的研究同现代技 术部门的一系列问题都有着紧密的联系, 在现代高 科技中占有重要的位置, 其理论研究又是弹性体耦 合场理论的一个分支。

对磁弹性问题的理论和实际应用的研究在几 个发达的国家,如美国、英国、日本、亚美尼亚和 乌克兰等国也才刚刚起步。

各国的科学家们正致力 于这方面的研究, 在非线性的电磁耦合理论框架上 已形成了一些基本的理论模型,如 、 、 、周又和、郑晓静 和 、 的研究成果, 、题解的研究较少, 更少见到实际应用方面的研究成 果。

国内外一些学者尽管在理论上解决了部分对可 变形物体的电磁-力耦合问题的描述 , 然而由于 其数学模型具有高度的非线性性质, 即便有简单力 学解的结构在电磁场作用下的耦合效应的确定也 是相当复杂的。

因而求得二维乃至于三维问题的解 析解仍具有难以克服的困难。

数字PI调节器

数字PI调节器
采样环节可表示为带放大的零阶保持器。
Tsam—转速环采样周期。
系统模型中
转速、电流调节器均采用数字式PI调节器
采样环节可表示为带放大的零阶保持器。
式中Tsam—转速环采样周期。
系统简化
若采用工程设计法,将电流内环校正为典I系统,则可将系统简化如下图3-19所示:
•电流内环的等效传递函数
其中,电流反馈系数换成电流存储系数K
离散系统的开环脉冲传递函数
•w变换过程
如果要用利用连续系统的对数频率法来设计调节器参数,应先进行w变换,即令

•系统w’域模型——虚拟频率传递函数
再令
为虚拟频率,则开环虚拟频率传递函数为
虚拟频率传递函数特性的参数
开环放大系数
转折频率为(单位为s-1)
当控制对象及采样频率确定后,Kz、2、3、4均为已知常数,但1和K0待定。
(2)数字系统设计方法
先将系统对象离散化,按数字系统直接设计数字调节器。
数字系统分析方法有:
z变换方法w变换方法扩展w变换方法
z变换方法
w变换方法
扩展w变换方法
•双闭环直流调速系统的数字调节器设计原则
在直流调速系统中,电枢电流的时间常数较小,电流内环必须有足够高的采样频率,而电流调节算法一般比较简单,采用较高的采样频率是可能的。因此电流调节器一般都可以采用间接方法设计,即先按连续控制系统设计,然后再将得到的调节器数字化。
结构清晰,P和I两部分作用分明,参数调整简单明了,但需要存储的数据较多。
积分部分:
比例部分:
PI调节器的输出
增量式PI调节器算法
PI调节器的输出
•限幅值设置
与模拟调节器相似,在数字控制算法中,需要对u限幅,这里,只须在程序内设置限幅值um,当u(k)>um时,便以限幅值um作为输出。

基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制

基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制

基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制作者:张正义赵学艳来源:《南京信息工程大学学报》2021年第05期摘要针对随机线性离散时间系统,利用Q学习算法求解无限时域的随机线性二次最优追踪控制(SLQT)问题.首先,假设通过命令生成器生成追踪所需的参考信号,并建立一个由原随机系统和参考轨迹系统组成的增广系统,把最优追踪问题转化为最优调节问题的形式.其次,为了在线求解随机系统的最优追踪问题,将随机系统转为确定性系统,并根据增广系统定义随机线性二次最优追踪控制的Q函数,在无需知道系统模型参数的情况下在线求解增广随机代数方程(GSAE).再次,证明了Q学习算法和增广随机代数方程的等价性,给出了Q学习算法实现步骤.最后,给出一个仿真实例说明Q学习算法的有效性.关键词随机系统;Q学习算法;最优追踪控制;随机代数方程中图分类号O232;TP13文献标志码A收稿日期2021-09-12资助项目国家自然科学基金(61873099,62073144);广东省自然科学基金(2020A1515010441);广州市科技计划(202002030158,202002030389)作者简介张正义,男,硕士生,研究方向为自适应动态规划、最优控制、强化学习***********************赵学艳(通信作者),女,副教授,硕士生导师,主要从事随机系统和非线性系统的稳定性与镇定,复杂系统的建模、分析和控制的研究******************.cn1华南理工大学自动化科学与工程学院,广州,5106400引言最优控制的目标是找到最优的控制策略,使得被控系统达到指定目标状态的同时,使系统预定义的性能指标为最小.最优控制问题主要有两个研究方向,分别是最优调节问题和最优追踪问题.对于線性系统的二次调节(Linear Quadratic Regulator,LQR)问题,传统方法通常是通过离线求解其对应的代数里卡蒂(Riccati)方程,这种方法需要完全已知系统参数的全部动力学信息[1-2].但是,在实际情况下,系统动力学信息完全已知的条件难以满足,传统方法不可能得到解析解.所以,通常需要在系统参数未知的情况下在线求解最优控制器,因此利用自适应动态规划(Adaptive Dynamic Programming,ADP)和神经网络方法求解最优控制在近些年备受关注.自适应动态规划[3]是在系统参数未知或系统参数不确定的情况下设计系统的控制器,不需要提前知道系统动力学信息,充分利用系统的状态信息在线求解最优控制.近些年来,ADP方法在离散系统和连续系统中有了广泛的应用.文献[4]针对连续时间线性系统提出了自适应动态规划方法,在系统参数矩阵部分未知的情况下得到最优控制器;文献[5]进一步针对连续时间线性系统提出了一种自适应策略迭代方法,在系统参数完全未知的情况下得到最优控制器;文献[6]针对线性离散时间系统的追踪问题使用强化Q学习方法,在系统参数完全未知的情况下求解最优控制器.随机系统控制理论由于其自身的学术难度以及广泛的应用领域,已成为控制理论的重要组成部分与研究热点[7-8],尤其是随机系统的最优控制问题受到越来越多的关注.与确定性问题相似,随机系统的线性二次最优控制问题(Stochastic Linear Quadratic,SLQ)的可解性等价于随机代数Riccati方程的可解性,文献[9]研究了线性终端状态约束下不定随机线性二次最优控制问题,文献[10]研究了具有乘性噪声的随机离散系统的带约束线性二次最优控制问题,但是文献[9-10]需要完全已知的系统参数信息.因此,文献[11]针对随机连续时间系统在系统参数部分未知的情况下提出了策略迭代方法求解随机系统的最优控制问题,文献[12]针对系统参数完全未知的随机线性离散系统提出了使用自适应动态规划的方法求解最优控制问题,文献[13]针对模型自由的随机线性离散系统提出了Q学习算法求解最优控制问题.相较于最优调节问题,最优追踪问题在现实中往往有更多的应用,例如文献[14]针对参数未知的随机离散系统提出了基于神经网络的自适应动态规划方法求解最优追踪控制问题.求解系统的最优控制问题,大多需要系统的完全动力学信息,使用Q学习算法的优点是不用直接求解复杂的随机代数方程,而是充分利用系统的状态信息在线求得系统的最优控制.受到文献[13-14]的启发,本文针对离散时间系统的随机线性二次最优追踪控制问题,提出了解决随机线性二次最优追踪控制的Q学习算法,给出算法的具体实现步骤,使用Q学习算法在线解决追踪控制问题而无需系统模型参数,最后给出仿真实例,表明系统输出可以有效地追踪参考轨迹.本文的结构安排如下:第一节对问题进行描述,定义参考信号系统,将原随机系统和参考信号系统组成增广系统,把最优追踪问题转化为最优调节问题的形式;第二节对随机系统进行了问题转变,将随机系统转化为确定性系统;第三节推导了Q函数;第四节给出算法的具体实现步骤;第五节给出仿真实例;第六节对全文进行了总结.1问题描述给定随机离散时间线性系统为2问题转换目前,确定性系统的最优追踪控制问题有着广泛的研究并且已经得到了很好的解决,随机系统因为随机参数的存在使得系统输出轨迹存在不确定性,且性能指标函数带有期望,在线算法无法实现期望功能.因此本节通过系统转变将随机系统转变为确定性系统,进而将随机系统的最优追踪控制问题转化为确定性的系统最优追踪控制问题.6结论通常来说,求解随机最优追踪控制问题需要完全的系统参数信息,本文针对离散时间系统的随机线性二次最优追踪控制问题,推导了Q学习算法,给出算法的具体实现步骤,使用Q 学习算法在线解决追踪控制问题而无需系统模型参数,最后给出仿真结果表明系统输出可以有效地追踪参考轨迹.参考文献References[1]Byers R.Solving the algebraic Riccati equation with the matrix sign function[J].Linear Algebra and Its Applications,1987,85:267-279[2]Kleinman,D.On an iterative technique for Riccati equation computations[J].IEEE Transactions on Automatic Control,1968,13(1):114-115[3]Wang F Y,Zhang H G,Liu D R.Adaptive dynamic programming:an introduction[J].IEEE Computational Intelligence Magazine,2009,4(2):39-47[4]Vrabie D,Pastravanu O,Abu-Khalaf M,et al.Adaptive optimal control for continuous-time linear systems based on policy iteration[J].Automatica,2009,45(2):477-484[5]Jiang Y,Jiang Z putational adaptive optimal control for continuous-time linear systems with completely unknown dynamics[J].Automatica,2012,48(10):2699-2704[6]Kiumarsi B,Lewis F L,Modares H,et al.Reinforcement Q-learning for optimal tracking control of linear discrete-time systems with unknown dynamics[J].Automatica,2014,50(4):1167-1175[7]Zhao X Y,Deng F Q.Divided state feedback control of stochastic systems[J].IEEE Transactions on Automatic Control,2015,60(7):1870-1885[8]Zhao X Y,Deng F Q.A new type of stability theorem for stochastic systems with application to stochastic stabilization[J].IEEE Transactions on Automatic Control,2016,61(1):240-245[9]黃玉林,张维海.约束随机线性二次最优控制的研究[J].自动化学报,2006,32(2):246-254HUANG Yulin,ZHANG Weihai.Study on stochastic linear quadratic optimal control with constraint[J].Acta Automatica Sinica,2006,32(2):246-254[10]Liu X K,Li Y,Zhang W H.Stochastic linear quadratic optimal control with constraint for discrete-time systems[J].Applied Mathematics and Computation,2014,228:264-270[11]王涛,张化光.基于策略迭代的连续时间系统的随机线性二次最优控制[J].控制与决策,2015,30(9):1674-1678WANG Tao,ZHANG Huaguang.Stochastic linear quadratic optimal control for continuous-time systems based on policy iteration[J].Control and Decision,2015,30(9):1674-1678[12]Wang T,Zhang H G,Luo Y H.Infinite-time stochastic linear quadratic optimal control for unknown discrete-time systems using adaptive dynamic programming approach[J].Neurocomputing,2016,171:379-386[13]Wang T,Zhang H G,Luo Y H.Stochastic linear quadratic optimal control for model-free discrete-time systems based on Q-learning algorithm[J].Neurocomputing,2018,312:1-8[14]Chen X,Wang F.Neural-network-based stochastic linear quadratic optimal tracking control scheme for unknown discrete-time systems using adaptive dynamic programming[J].Control Theory and Technology,2021,19(3):315-327References[1]Byers R.Solving the algebraic Riccati equation with the matrix sign function[J].Linear Algebra and Its Applications,1987,85:267-279[2]Kleinman,D.On an iterative technique for Riccati equation computations[J].IEEE Transactions on Automatic Control,1968,13(1):114-115[3]Wang F Y,Zhang H G,Liu D R.Adaptive dynamic programming:an introduction[J].IEEE Computational Intelligence Magazine,2009,4(2):39-47[4]Vrabie D,Pastravanu O,Abu-Khalaf M,et al.Adaptive optimal control for continuous-time linear systems based on policy iteration[J].Automatica,2009,45(2):477-484[5]Jiang Y,Jiang Z putational adaptive optimal control for continuous-time linear systems with completely unknown dynamics[J].Automatica,2012,48(10):2699-2704[6]Kiumarsi B,Lewis F L,Modares H,et al.Reinforcement Q-learning for optimal tracking control of linear discrete-time systems with unknown dynamics[J].Automatica,2014,50(4):1167-1175[7]Zhao X Y,Deng F Q.Divided state feedback control of stochastic systems[J].IEEE Transactions on Automatic Control,2015,60(7):1870-1885[8]Zhao X Y,Deng F Q.A new type of stability theorem for stochastic systems with application to stochastic stabilization[J].IEEE Transactions on Automatic Control,2016,61(1):240-245[9]黃玉林,张维海.约束随机线性二次最优控制的研究[J].自动化学报,2006,32(2):246-254HUANG Yulin,ZHANG Weihai.Study on stochastic linear quadratic optimal control with constraint[J].Acta Automatica Sinica,2006,32(2):246-254[10]Liu X K,Li Y,Zhang W H.Stochastic linear quadratic optimal control with constraint for discrete-time systems[J].Applied Mathematics and Computation,2014,228:264-270[11]王涛,张化光.基于策略迭代的连续时间系统的随机线性二次最优控制[J].控制与决策,2015,30(9):1674-1678WANG Tao,ZHANG Huaguang.Stochastic linear quadratic optimal control for continuous-time systems based on policy iteration[J].Control and Decision,2015,30(9):1674-1678[12]Wang T,Zhang H G,Luo Y H.Infinite-time stochastic linear quadratic optimal control for unknown discrete-time systems using adaptive dynamic programming approach[J].Neurocomputing,2016,171:379-386[13]Wang T,Zhang H G,Luo Y H.Stochastic linear quadratic optimal control for model-free discrete-time systems based on Q-learning algorithm[J].Neurocomputing,2018,312:1-8[14]Chen X,Wang F.Neural-network-based stochastic linear quadratic optimal tracking control scheme for unknown discrete-time systems using adaptive dynamic programming[J].Control Theory and Technology,2021,19(3):315-327。

面向无人机场景的深度网络模型压缩与加速设计方法

面向无人机场景的深度网络模型压缩与加速设计方法

第 22卷第 12期2023年 12月Vol.22 No.12Dec.2023软件导刊Software Guide面向无人机场景的深度网络模型压缩与加速设计方法张佳奇1,郭宣1,李魏然2,王胜科1(1.中国海洋大学信息科学与技术学院,山东青岛 266100; 2.青岛第九中学,山东青岛,266000)摘要:随着无人机应用日益广泛,无人机应用场景下的目标检测技术已在诸多领域有着重要的应用价值和迫切的应用需求。

在无人机边缘设备实时检测的场景中,由于无人机高分辨率图像存在大量的微弱目标实例,将直接降低图像分辨率,从而造成微弱目标丢失,因此输入网络时保持高分辨率信息至关重要。

为此,将高分辨率图像裁成多个图像块,将其作为网络输入,以保持网络精度的同时使其能在边缘智能设备上运行。

同时,为了加快模型推理速度,使用分组卷积与通道混洗策略对检测算法的主干网络进行轻量化设计,并使用通道注意力机制提升网络精度。

实验表明,所提方法相较于YOLOv5,在无人机数据集VisDrone与自建数据集OUC-UAV-DET上的精度分别提升2%、4%,在英伟达硬件(Xavier)上推理速度减少1 ms。

在网络剪枝层面,结合具体数据集对检测模型进行通道剪枝,能在维持算法精度的前提下将推理速度减少2 ms。

此外,对于无人机单类别检测任务,针对其目标实例尺寸相对固定的特点优化输出部分,能减少30%的模型参数量,使推理速度最多减少2 ms。

关键词:无人机;高分辨率图像;目标检测;轻量化网络;网络剪枝;模型部署DOI:10.11907/rjdk.231712开放科学(资源服务)标识码(OSID):中图分类号:TP183 文献标识码:A文章编号:1672-7800(2023)012-0056-07Compression and Acceleration Design Methods of Deep Network Modelsfor UAV ScenesZHANG Jiaqi1, GUO Xuan1, LI Weiran2, WANG Shengke1(1.School of Information Science and Technology, Ocean University of China, Qingdao 266100, China;2.Qingdao No.9 Middle School,Qingdao 266000, China)Abstract:With the increasingly widespread application of drones, target detection technology in drone application scenarios has important ap‐plication value and urgent application needs in many fields. In the scene of real-time detection of drone edge devices, due to the presence of a large number of weak target instances in the high-resolution images of drones, the image resolution will be directly reduced, resulting in the loss of weak targets. Therefore, it is crucial to maintain high-resolution information when inputting into the network. To achieve this, high-res‐olution images are cut into multiple image blocks and used as network inputs to maintain network accuracy while enabling them to run on edge intelligent devices. At the same time, in order to accelerate the model inference speed, group convolution and channel shuffling strategies are used to lightweight design the backbone network of the detection algorithm, and channel attention mechanism is used to improve network accu‐racy. The experiment shows that compared to YOLOv5, the proposed method improves accuracy by 2% and 4% on the unmanned aerial vehi‐cle dataset VisDrone and the self built dataset OUC-UAV-DET, respectively, and reduces inference speed by 1 ms on the Nvidia hardware (Xavier). At the network pruning level, combining specific datasets for channel pruning of detection models can reduce inference speed by 2 ms while maintaining algorithm accuracy. In addition, for the single category detection task of unmanned aerial vehicles, optimizing the output收稿日期:2023-07-04基金项目:国家重点研发计划项目(2018AAA0100400);山东省自然科学基金项目(ZR2020MF131,ZR2021ZD19);青岛市科技计划项目(21-1-4-ny-19-nsh);中国海洋大学社团培训项目(202265007);HY项目(LZY2022033004)作者简介:张佳奇(1999-),男,中国海洋大学信息科学与技术学院硕士研究生,研究方向为深度学习、计算机视觉;郭宣(1997-),男,中国海洋大学信息科学与技术学院硕士研究生,研究方向为深度学习、计算机视觉;李魏然(2007-),女,青岛第九中学学生;王胜科(1978-),男,博士,中国海洋大学信息科学与技术学院副教授,研究方向为深度学习、计算机视觉。

飞机蒙皮侧壁铣切时域参数模型与粒子群优化

飞机蒙皮侧壁铣切时域参数模型与粒子群优化

摘要飞机机翼蒙皮为薄壁件且涉及大量减薄工序易引起刀具 零件颤振优化工艺参数可有效抑
制颤振发生通过精铣侧壁工序研究工步间均衡分配 稳定轴 向 切 深 与 转 速 的 算 法抑 制 颤 振 并 优
化蒙皮减薄工序耗时采用双自由度动力学模型描述 小径 向 切 深 精 铣 侧 壁 工 艺 过 程以 半 离 散 方
4KMQN787RE^DNDFJ;E7U/LIMCJD7N j -QKHDCNRP;7VDNMK-QKHDCNR'NDVK;FDJE7U4KMQN787RE.CNRGQ7I><""#>6QDNC
87#0,.40*D;M;CUJXDNRFSDNDFCJQDN=XC88KL:C;JCNLDNV78VKFC87J7UJQDNNDNR:;7MKFFKFXQDMQDFKCFE J7MCIFKMIJJK;=:C;JU8IJJK;9&:JDBDGCJD7N7U:;7MKFF:C;CBKJK;FMCNKUUKMJDVK8EFI::;KFFU8IJJK;94QK C8R7;DJQB7UWC8CNMKLC887MCJD7N7UFJCW8KCYDC8MIJJDNRLK:JQCNL;7JCJD7NC8F:KKLWKJXKKNX7;SDNRFJK:F DFFJILDKL U7;JQKUDNDFQDNR BD88DNR FDLK XC88:;7MKFFJ7 FI::;KFF MQCJJK; CNL 7:JDBDGKJQKJDBK M7NFIB:JD7N7UFSDNJQDNNDNR:;7MKFF9*JX7=LKR;KK=7U=U;KKL7B T&,LENCBDM B7LK8XCFIFKLJ7 LKFM;DWKJQKUDNKBD88DNR:;7MKFF7UFDLKXC88DNFBC88LDCBKJK;MIJJDNRLK:JQ94QKJDBK=LK8CELDUUK;KNJDC8 KbICJD7NFXK;KF78VKLWEFKBD=LDFM;KJK BKJQ7LCNLJQKW8CLKLDCR;CBF7UFJCW8KMIJJDNR:;7MKFFXDJQ ;KF:KMJJ7;7JCJD7NC8F:KKLCNL8DBDJCYDC8MIJJDNRLK:JQ XK;K7WJCDNKL94CSDNR F:KKLCNLCYDC8MIJJDNR LK:JQCF7:JDBDGCJD7NVC;DCW8KFJCSDNRFJCW8KMIJJDNRW8CLK:;7UD8KF:KKLUKKLCNL:7XK;CFM7NFJ;CDNJ M7NLDJD7NFCNLJCSDNRJQK7:JDBC8FDLK XC88 BD88DNRJDBKCF7WHKMJDVKCWKJJK;MIJJDNR :C;CBKJK; M7BWDNCJD7NXCF7WJCDNKLWEIFDNR1CIFFDCNDB:;7VKL:C;JDM8KFXC;B7:JDBDGCJD7NC8R7;DJQB967BWDNKL XDJQJQKKYDFJDNRMIJJDNRJ778CNL;CLDC8BCMQDNDNRC887XCNMK7UCMK;JCDNJE:K7UXDNRFSDNUDNDFQDNR BD88DNR:;7MKFFJQK7:JDBC8MIJJDNR:;7MKFF:C;CBKJK;F7UUDNDFQDNR BD88DNRFDLKXC88XK;K7WJCDNKLWE DNJ;7LIMDNRJQKW8CLKR;C:Q=:C;JDM8KFXC;B7:JDBDGCJD7NC8R7;DJQB9

相干衍射成像原理 PPT

相干衍射成像原理 PPT
相干衍射成像原理
相干衍射成像
相干光源照明条件下,通过物波衍射或干涉光场强度分布获取波前相位 信息实现二维或者三维物体成像的技术称为相干衍射成像(CDI)。
相干衍射成像(CDI )是从衍射分布中恢复出物体原图像的过程。物波光场 的复振幅函数有振幅和相位两部分组成,物波场的衍射或干涉光场的振幅信 息一般通过感光胶片或者数字图像传感器如CCD可以方便的记录其强度分布 获得,但是图像传感器不能直接探测波前的相位信息,恢复原图像即重建物 波函数需要同时知道其振幅信息和相位信息。
基于夫琅禾费衍射的非迭代阵列抽样衍射成像
基于夫琅禾费衍射的非迭代阵列抽样衍射成像
基于夫琅禾费衍射的非迭代阵列抽样衍射成像
基于夫琅禾费衍射的非迭代阵列抽样衍射成像
基于夫琅禾费衍射的非迭代阵列抽样衍射成像
基于夫琅禾费衍射的非迭代阵列抽样衍射成像
基于夫琅禾费衍射的卷积可解阵列波前检测的原理如下所述: (1)让被测波前(具有非均匀的振幅和相位分布)先通过一个特殊设计的多针孔阵列抽样 板(CSSA); (2)被抽样波前经过一个Fraunhofer衍射到达一个图像传感器(如CCD)的记录平面,由 CCD记录该Fraunhofer衍射光场的强度分布图样并输入计算机或图像处理器; (3)对所记录的强度图样做逆傅里叶变换得到该强度图样的空间频谱函数; (4)最后再通过一个与CSSA 对应的多针孔阵列抽样板对该频谱函数进行抽样滤波就可以得 到待测抽样波前的振幅和相位分布。 被抽样波前的Fraunhofer衍射图样也可通过在CSSA和CCD之间插入一个傅里叶变换透镜并将 CCD记录面置于傅里叶变换透镜的后焦面上来获得。由于从该 Fraunhofer 衍射光场强度图样的 逆傅里叶变换中求解被测波前在数学上等价于一个解卷积过程,因此我们将以上所用多针孔抽 样板命名为卷积可解阵列抽样板并将上述波前探测方法称为卷积可解阵列抽样法。该方法完全 不需要迭代过程。相位恢复过程也只在一幅衍射强度图像中进行,不涉及多幅图像的交互处理, 可实现二维波前的实时测量。

一种求解阻塞流水车间多目标调度的离散差分进化算法

一种求解阻塞流水车间多目标调度的离散差分进化算法

一种求解阻塞流水车间多目标调度的离散差分进化算法邓冠龙;田广东;顾幸生;张淑宁【摘要】针对流水车间中产品不存在缓冲区的多目标优化问题,研究了阻塞流水车间的最大完工时间和总流程时间的最小化问题,提出了一种多目标离散差分进化(Multi-objective DiscreteDifferential Evolution,MDDE)算法搜索Pareto最优调度解.MDDE的变异个体通过非支配解或当前解的邻域随机产生,实验个体通过交叉操作产生,而选择过程则设计为一种多目标选择策略.此外,算法还混合了一种基于插入的Pareto局部搜索方法.基于标准测试算例的数值仿真实验表明,MDDE算法获得的非支配解集在Inverted Generational Distance、Set Coverage和Hypervolume性能指标上均有较好的表现.【期刊名称】《华东理工大学学报(自然科学版)》【年(卷),期】2016(042)005【总页数】8页(P682-689)【关键词】进化算法;生产调度;优化;多目标;Pareto【作者】邓冠龙;田广东;顾幸生;张淑宁【作者单位】鲁东大学信息与电气工程学院,山东烟台264025;吉林大学交通学院,长春130022;华东理工大学化工过程先进控制和优化技术教育部重点实验室,上海200237;鲁东大学信息与电气工程学院,山东烟台264025【正文语种】中文【中图分类】TP18作为车间调度中的典型难题,流水车间(Flow shop)调度问题近几十年来得到了广泛关注,并随着近年智能优化方法的普遍使用愈加成为研究热点之一[1-2]。

经典的流水车间调度问题并不考虑工件加工完毕后的存储问题,即假定在任意两台机器间有足够的容量来存储工件。

而在实际生产过程中,若存储容量不够并且下个工序的机器并未空闲,则已加工完毕的工件只能滞留在当前机器上而不能离开;若有存储容量或下个工序的机器已经就绪,则工件可以离开当前机器。

离散优化问题的启发式算法研究

离散优化问题的启发式算法研究

离散优化问题的启发式算法研究离散优化问题是数学中的一个重要分支,以在有限的数值集合中寻找最优解为目标。

启发式算法是一类解决离散优化问题的方法,主要基于经验和启发规则,在搜索过程中通过引入一定的启发信息来加速求解过程。

本文将对离散优化问题的启发式算法进行研究,探讨其原理、应用和发展前景。

一、离散优化问题的定义和特点离散优化问题可以定义为在给定的有限集合中,寻找一个特定的组合,使得满足一定的约束条件下达到最优解。

与连续优化问题相比,离散优化问题的解空间是离散的,具有离散性和复杂性的特点。

二、启发式算法的介绍启发式算法是一类基于搜索的优化方法,通过引入启发信息来指导搜索方向,从而加速求解过程。

常用的启发式算法包括遗传算法、模拟退火算法、蚁群算法等,它们在不同的问题领域和场景中得到了广泛应用,并取得了一定的成果。

三、遗传算法在离散优化问题中的应用遗传算法是一种模拟自然选择和遗传机制的优化算法,通过模拟进化过程来搜索最优解。

在离散优化问题中,遗传算法通过基因编码、选择、交叉和变异等操作来生成新的解,并通过适应度函数对解进行评估和选择,从而逐步逼近最优解。

四、模拟退火算法在离散优化问题中的应用模拟退火算法是通过模拟固体退火过程来搜索最优解的一种优化算法。

在离散优化问题中,模拟退火算法通过设置初始温度和退火率等参数,将搜索过程中允许跳出局部最优解,以一定的概率接受次优解,通过不断降低温度来逐渐收敛到最优解。

五、蚁群算法在离散优化问题中的应用蚁群算法是模拟蚂蚁寻找食物路径的行为而提出的一种优化算法。

在离散优化问题中,蚁群算法通过模拟蚂蚁在搜索过程中的信息素沉积和信息素挥发行为,引导其他蚂蚁更有可能选择更优的路径,从而找到最优解。

六、离散优化问题的启发式算法发展前景离散优化问题的启发式算法在实际应用中可以通过不断改进和优化来提高求解效率和精度。

未来,在人工智能、大数据等领域的不断发展和进步下,离散优化问题的启发式算法将更加广泛运用,为实际问题的解决提供更有效的方法和手段。

基于P-Q解耦变换的智能电网状态估计算法

基于P-Q解耦变换的智能电网状态估计算法

基于P-Q解耦变换的智能电网状态估计算法徐天福;罗庆【摘要】针对传统的电力系统状态估计算法存在计算精度低,运算时间成本高的问题,提出了一种基于P-Q解耦变换的电力系统状态估计算法.该算法将支路功率量测、负荷量测与电压电流幅值量测进行解耦.保留解耦后的非线性迭代表达式,得到变换后的功率表达式,并完成状态估计的优化计算.IEEE标准节点系统的测试计算结果表明,所提出的算法能够适用于不同网络拓扑结构的研究,并可以满足计算精度和计算时间的要求.【期刊名称】《沈阳工业大学学报》【年(卷),期】2019(041)003【总页数】6页(P251-256)【关键词】电力系统;状态估计;P-Q解耦算法;功率量测;负荷量测;IEEE标准算例;智能电网;能量管理系统【作者】徐天福;罗庆【作者单位】国网江西省电力公司赣州供电公司, 江西赣州 341000;国网江西省电力公司赣州供电公司, 江西赣州 341000【正文语种】中文【中图分类】TM744随着我国电力系统电网结构的优化和调整,输电线路电压等级的提高、协调电网的安全稳定运行成为了目前电力系统主要关注的焦点之一[1-3].为了保证电网安全稳定运行,需要对整个电力系统进行精确控制.电力系统能量管理系统EMS结合了计算机技术,可实现电网的信息化调度[4-5].而电力系统状态估计则是EMS技术的基础与核心,其通过状态估计,能够降低量测系统的投资,计算出未测量的电气量,同时,还可以利用两侧系统的冗余信息,提高测量精度[6-7].目前,配电网系统中广泛使用的是基于最小二乘法或者最小加权值的电力系统状态估计算法[8-10],例如基于电力系统潮流分析的状态估计算法[11-12]以及考虑电力系统抗差性的功率支路算法[13-14]等.以上算法能够对不同的配电网络进行计算,但由于其计算复杂、时间成本高,难以满足智能电网对状态估计实时处理能力的要求.基于上述问题,本文提出了一种基于P-Q解耦的,能够有效提高电力系统状态估计计算效率的算法.该算法在对量测量进行变换的同时,能够保留现有的非线性分析,从而完成了雅克比矩阵的稀疏化,且提高了电力系统状态估计的求解速度与准确性.本文以IEEE标准算例验证了该算法的收敛情况及有效性.1 P-Q解耦变换算法基于P-Q解耦变化的基本思想是将电力系统的有功功率和无功功率相加,通过补偿电压幅值迭代实现方程的可靠求解[15-17],解耦迭代方程为(1)式中:U为节点电压;θ为相角;ΔP、ΔQ分别为有功功率和无功功率的变化量;J为雅克比矩阵.传统的P-Q解耦法思路是将有功功率与无功功率相加,从而补偿电导对功率的作用,并讨论对功率和节点电压幅值的影响.通过补偿电压幅值迭代带来的有功功率变化实现功率解耦方程的可靠求解.本文状态估计算法在P-Q解耦公式的基础上,将量测数据做保留非线性变换,从而进一步简化计算过程、提高状态估计速度.以网络节点电压幅值、相角对其初值的变化量为状态变量,实现状态估计简化求解.1.1 负荷量测变换对于节点i,按照P-Q分解法可得其节点功率的表达式为(Gij+Bij)sin θij](2)式中:Gij、Bij为节点导纳矩阵;θij=θi-θj.有功功率为(3)按照式(1)将节点功率补偿解耦,在实际量测量中减去保留非线性表达式中各个迭代项之后可得(4)式中:PL为负荷有功功率;PC为有功功率迭代量;QL为负荷无功功率;Q0为迭代初始值;‴Δ为保留非线性变换后的误差量.设置初始条件为(5)将非线性变换二项式系数设为初始条件下功率解耦迭代系数,可得节点电压和相角之间的关系矩阵为(6)(7)式中,a∶b表示a可以用表达式b来计算.1.2 支路功率量测变换同样将支路功率解耦,对支路功率量测进行非线性变换,可得变换后的量测量为(8)(9)将二次项变换系数作为初始条件下的迭代系数可得(10)(11)式中,Yc为线路对地导纳.1.3 电压电流量测变换电压量测值和状态变量之间为线性关系,无需进行变换.电流量测值可以转换为支路的有功与无功功率量,可按照上文所述方法进行对应的量测变换,即(12)2 解耦状态估计求解2.1 状态估计模型状态估计量测方程表示为z=h(x)+v(13)式中:z为给定的量测矢量;x为待求解的n维状态矢量,h(x)为以状态量x及导纳矩阵建立的量测函数向量;v为量测误差.状态估计的目标函数为min K(x)=[z-h(x)]TR-1[z-h(x)](14)式中,R为状态估计的协方差矩阵.求解非线性方程极值的必要条件为=0(15)对式(15)的右侧进行数学变换可得(16)式中,H为量测雅克比矩阵,化简后可得HT(x)R-1[z-h(x)]=0(17)利用牛顿法对式(17)进行求解可得f(x)=HT(x)R-1[z-h(x)]=0(18)-HT(x)R-1H(x)(19)迭代表达式为Δz(k)=z-h(x(k))(20)将迭代形式化简为Δx(k)=(HTR-1H)-1HTR-1Δz(k)(21)x(k+1)=x(k)+Δx(k)(22)迭代收敛条件为或者|J(x(l))-J(x(l+1))|<εJ.根据式(6)、(7)、(10)和(11)可知(23)同时满足(24)因此,经过P-Q解耦变换之后得到的雅克比矩阵为一个稀疏矩阵,即(25)化简得(26)根据式(26)可得结构变换后的信息矩阵为(27)将信息矩阵G代入迭代式(26)求解可得LTr-1LΔx(U)k+1=LTr-1[zPQ,U-hPQ,U(k)](28)MTr-1MΔx(θ)k+1=MTr-1[zP-hP(k)](29)最后,按照式(22)对方程进行迭代求解,直到满足收敛条件为止.2.2 计算流程图本文以初始量测值为状态变量,通过P-Q解耦和保留非线性处理实现了状态估计的快速求解,具体程序流程图如图1所示.图1 P-Q解耦算法流程图Fig.1 Flow chart of P-Q decoupling algorithm与传统的WLS算法相比,本文提出的基于P-Q解耦法智能电网状态估计算法计算过程简单,收敛性好,且计算时间成本低,能够适应不同节点网络的计算需求,因此,对于提升电力系统自动化水平具有重要意义.3 算例分析本文利用IEEE标准9节点、30节点和57节点系统来证明本算法对不同网络的适用性.算例在MATPOWER工具包中的IEEE标准算例基础上进行,实验过程中量测数据是在潮流分析的基础上,通过迭加正态分布的随机数方法获得,其中,迭加的随机数期望为0,方差为0.02,误差小于1.0×10-4时停止迭代.本文以平均相对误差计算状态估计结果的正确性,其表达式为(30)式中:为P-Q解耦法状态估计计算结果;y为状态变量的真实值;N为状态变量总数.同时,采用Matlab内置的运行时间函数对程序的运行时间进行计算.3.1 IEEE标准9节点网络图2为IEEE标准9节点网络拓扑图,其中,G代表发电机节点,数字为母线编号,节点5,6,8为负荷节点,由黑色箭头标记.电压计算结果如图3所示,节点电压状态估计值平均相对误差为9.47×10-6,计算时间约为0.04 s.图2 IEEE标准9节点网络拓扑图Fig.2 IEEE standard 9-node network topology图3 9节点网络电压计算结果Fig.3 Computing results of voltage in 9-node network由状态估计计算结果可知,系统总有功功率为320 MW,无功功率为34.9 MVar;复合消耗的总有功功率为315 MW,无功功率为115.0 MVar;线路损耗有功功率4.95 MW,无功功率51.31 MVar.表1为网络主要参数计算结果.表1 9节点网络主要参数计算结果Tab.1 Computing results of main parameters for 9-node network变量最小值最小值编号最大值最大值编号电压幅值0.958p.u.21.003p.u.6电压相角-4.35°29.67°2有功损耗2.46MW8~9线路无功损耗16.74MVar8~2线路3.2 IEEE标准30节点网络图4为IEEE标准30节点网络拓扑图.其中,包含发电机节点6个,负荷节点21个.节点电压计算结果如图5所示.节点电压状态估计值平均相对误差为7.467×10-5,计算时间约为0.03 s.图4 IEEE标准30节点网络拓扑图Fig.4 IEEE standard 30-node network topology图5 30节点网络电压计算结果Fig.5 Computing results of voltage in 30-node network由状态估计计算结果可知,系统总有功功率为192.5 MW,无功功率为99.3 MVar;复合消耗总有功功率为191.1 MW,无功功率为106.4 MVar;线路损耗有功功率2.32 MW,无功功率9.01 MVar.表2为网络主要参数计算结果.表2 30节点网络主要参数计算结果Tab.2 Computing results of main parameters for 30-node network变量最小值最小值编号最大值最大值编号电压幅值0.961p.u.81.001p.u.1电压相角-3.96°191.48°13有功损耗0.29MW2~6线路无功损耗2.10MVar12~13线路3.3 IEEE标准57节点网络图6为IEEE标准57节点系统网络拓扑图,该系统包含7个发电机节点,42个负荷节点,变压器节点17个.节点电压计算结果如图7所示,其中,平均相对误差为0.001 7,计算时间约为0.13 s.图6 IEEE标准57节点网络拓扑图Fig.6 IEEE standard 57-node network topology由状态估计计算结果可知,系统总有功功率为128.87 MW,无功功率为312.2 MVar;负荷消耗的总有功功率为114.07 MW,无功功率为310.2 MVar;线路损耗有功功率26.68 MW,无功功率112.76 MVar.表3为网络主要参数计算结果. 图7 57节点网络电压计算结果Fig.7 Computing results of voltage in 57-node network表3 57节点网络主要参数计算结果Tab.3 Computing results of main parameters for 57-node network变量最小值最小值编号最大值最大值编号电压幅值0.936p.u.311.601p.u.46电压相角-19.38°312.0°1有功损耗3.9MW1~15线路无功损耗19.96MVar1~15线路4 结论本文分析了电力系统状态估计中的P-Q解耦算法,以量测值为初始变量,在解耦过程中保留了非线性变换,使雅克比矩阵稀疏化、常数化,算法求解过程简单,实现了状态估计的快速求解.以不同的IEEE标准算例为实验对象,通过迭加正态分布随机数的方法获得量测数据,验证了计算模型的准确性和适用性.这对于提高电力系统自动化水平具有一定积极作用.参考文献( References) :【相关文献】[1]汤涌,郭强,周勤勇,等.特高压同步电网安全性论证 [J].电网技术,2016,40(1):97-104. (TANG Yong,GUO Qiang,ZHOU Qin-yong,et al.Security evaluation for UHV synchronized power grid [J].Power System Technology,2016,40(1):97-104.)[2]翟化欣.层次分析法和神经网络的电网安全评估 [J].现代电子技术,2016,39(21):168-171. (ZHAI Hua-xin.AHP and neural network for power grid safety assessment [J].Modern Electronics Technique,2016,39(21):168-171.)[3]童晓阳,王晓茹.乌克兰停电事件引起的网络攻击与电网信息安全防范思考 [J].电力系统自动化,2016,40(7):144-148.(TONG Xiao-yang,WANG Xiao-ru.Inference and countermeasure presupposition of network attack in incident on ukrainian power grid [J].Automation of Electric Power System,2016,40(7):144-148.)[4]胡勇.主动配电网用户侧能量管理系统设计与实现 [J].电力系统保护与控制,2016,44(16):149-155.(HU Yong.Design and implementation of user energy management system on active distribution network [J].Power System Protection and Control,2016,44(16):149-155.)[5]鲁文,李卫星,杜红卫,等.主动配电网综合能量管理系统设计与应用 [J].电力系统自动化,2016,40(8):133-139.(LU Wen,LI Wei-xing,DU Hong-wei,et al.Design and application of integrated energy management system in active distribution network [J].Automation of Power System,2016,40(8):133-139.)[6]黄小娟.PMU在电力系统状态估计中的应用 [D].成都:西南交通大学,2016.(HUANG Xiao-juan.The application of PMU in state estimation of power system[D].Chengdu:Southwest Jiaotong University,2016.)[7]董今妮,孙宏斌,郭庆来,等.面向能源互联网的电气耦合网络状态估计技术 [J].电网技术,2018(2):53-58.(DONG Jin-ni,SUN Hong-bin,GUO Qing-lai,et al.State estimation of combined electric-gas networks for energy internet [J].Power System Technology,2018(2):53-58.)[8]蔡昌春,丁晓群,王斌.基于改进最小二乘法的电力系统状态估计 [J].浙江电力,2006,25(4):6-9.(CAI Chang-chun,DING Xiao-qun,WANG Bin.State estimation of power system basedon improved least-squears algorithm [J].Zhejiang Electric Power,2006,25(4):6-9.) [9]孙一冰.分布式动态状态估计算法及其在电力系统中的应用 [D].济南:山东大学,2017. (SUN Yi-bing.Distributed dynamic sate estimation agorithm and application in pwer system [D].Jinan:Shandong University,2017.)[10]何光宇,常乃超,董树锋,等.基于集合论估计的电网状态辨识建模 [J].电力系统自动化,2016(5):25-31.(HE Guang-yu,CHANG Nai-chao,DONG Shu-feng,et al.Power system state identification based on set theory estimation part one modeling [J].Automation of Electric Power System,2016(5):25-31.)[11]侯方迪.基于总体误差下降指标和MIQP模型的参数辨识方法研究 [D].杭州:浙江大学,2017. (HOU Fang-di.Research on parameter identification method based on global error descent index and MIQP model [D].Hangzhou:Zhejiang University,2017.)[12]刘峰.EMS中状态估计模块生产运行及实用化问题分析 [J].电力自动化设备,2007,27(4):118-123.(LIU Feng.Operation and practicability of state estimation module in EMS [J].Electric Power Automation Equipment,2007,27(4):118-123.)[13]兰华,李积捷.电力系统状态估计算法的研究现状和展望 [J].电力系统保护与控制,2007,35(10):78-82.(LAN Hua,LI Ji-jie.Status quo and prospect of algorithm of power system state estimation [J].Power System Protection and Control,2007,35(10):78-82.)[14]刘柳,高会生,李成.电力SCADA系统传输网安全性评估模型 [J].电子科技,2012,25(12):116-119.(LIU Liu,GAO Hui-sheng,LI Cheng.Security assessment model of power SCADA system networks [J].Electronic Science and Technology,2012,25(12):116-119.)[15]刘颖.基于抗差最小二乘法的谐波状态估计方法研究 [D].保定:华北电力大学,2012.(LIU Ying.Research on harmonic state estimation method based on robust least square method [D].Baoding:North China Electric Power University,2012.)[16]Martin K E,Benmouyal G,Adamiak M G,et al.IEEE standard for synchrophasors for power systems [J].IEEE Transactions on Power Delivery,2006,13(1):73-77.[17]Meliopoulos A P S,Cokkinides G,Huang R,et al.Smart grid technologies for autonomous operation and control [J].IEEE Transactions on Smart Grid,2011,2(1):1-10.。

基于Q2算法的固定迟滞问题离散化求解

基于Q2算法的固定迟滞问题离散化求解

基于Q2算法的固定迟滞问题离散化求解
周颢;邵晨曦;白方周
【期刊名称】《自动化学报》
【年(卷),期】2002(028)004
【摘要】迟滞问题是指系统的状态变化不仅与当前状态有关,还与系统的过去状态有关.考虑了对固定迟滞问题进行定性仿真求解,通过分析该类问题的可离散化特性,将问题求解范围从连续时间转化到离散时间点上来考虑.并改进了定性与定量相集成的仿真方法--Q2算法,增加了反映延迟性质的过去约束,通过当前约束和过去约束在系统中传播定量信息,从而完成固定迟滞问题的定性仿真.
【总页数】5页(P610-614)
【作者】周颢;邵晨曦;白方周
【作者单位】中国科学技术大学计算机科学技术系,合肥,230027;中国科学技术大学计算机科学技术系,合肥,230027;中国科学技术大学计算机科学技术系,合
肥,230027
【正文语种】中文
【中图分类】TP391.9
【相关文献】
1.基于Z变换的连续域数学问题离散化求解方法研究 [J], 何静;
2.基于离散化和遗传算法的皮革制造中的排样问题 [J], 张玉萍;宋键;蒋寿伟
3.基于混合遗传算法的固定货架拣选问题求解 [J], 郭春花;胡咏梅;付延安;姜晓娜
4.求解多目标社区发现问题的离散化随机漂移粒子群优化算法 [J], 李萍;汪芬;陈祺东;孙俊
5.基于热导率离散化新算法的体点导热问题的优化(英文) [J], 杜文静;王沛丽;宋立鹏;程林
因版权原因,仅展示原文概要,查看原文内容请购买。

离散lqr黎卡提方程推导

离散lqr黎卡提方程推导

离散lqr黎卡提方程推导离散LQR是一种广泛应用于控制系统中的最优控制方法。

其基本思想是通过调整控制器的参数,使得系统的性能指标达到最优。

这里的性能指标通常是根据系统的状态和输入来定义的,例如控制误差或能量消耗。

为了推导离散LQR黎卡提方程,我们首先需要定义系统的动态方程和性能指标。

假设离散时间系统的状态方程可以用以下形式表示:x(k+1) = A*x(k) + B*u(k)其中,x(k)为系统的状态向量,u(k)为控制输入向量,A和B为系统的状态转移矩阵。

为了描述系统的性能指标,我们引入一个离散时间二次型函数:J = ∑[x(k)'*Q*x(k) + u(k)'*R*u(k)]其中,Q和R为正定对称矩阵,分别表示状态和输入的权重。

这个二次型函数表示了系统状态和输入的加权和,我们希望通过调整控制器参数,使得这个二次型函数达到最小值。

为了推导离散LQR黎卡提方程,我们首先需要定义系统的性能指标。

假设系统的状态方程和性能指标分别为:x(k+1) = A*x(k) + B*u(k)J = ∑[x(k)'*Q*x(k) + u(k)'*R*u(k)]其中,x(k)为系统的状态向量,u(k)为控制输入向量,A和B为系统的状态转移矩阵,Q和R为正定对称矩阵。

接下来,我们引入一个辅助变量P(k),表示系统状态的协方差矩阵。

通过求解P(k)的递推关系式,我们可以得到离散LQR黎卡提方程的推导。

假设我们已经知道P(k+1)的值,我们可以通过以下递推关系式求解P(k)的值:P(k) = Q + A'*P(k+1)*A - A'*P(k+1)*B*(R + B'*P(k+1)*B)^(-1)*B'*P(k+1)*A其中,^(-1)表示矩阵的逆运算。

最终,我们可以得到离散LQR黎卡提方程的形式:K = (R + B'*P(0)*B)^(-1)*B'*P(0)*A其中,K为最优控制器的参数矩阵。

离散区间二型Tagaki-Sugeno模型时滞系统广义耗散控制设计

离散区间二型Tagaki-Sugeno模型时滞系统广义耗散控制设计

离散区间二型Tagaki-Sugeno模型时滞系统广义耗散控制设计王雪飞;周绍生【摘要】对带有时变时滞和外部扰动的一类离散区间二型Tagaki-Sugeno(T-S)模型非线性系统,研究了其广义耗散性能分析与状态反馈控制器的设计问题.与一型T-S模糊系统相比,区间二型模糊系统能更好地处理隶属函数中的不确定信息.首先,通过模型转换的方法,对系统的滞后状态进行变换,从而将时变时滞的不确定性从原系统中分离出.根据转换后的仅含定常时滞和具有有界误差范数的两个子系统,利用时滞依赖的李雅普诺夫-克拉索夫斯基泛函方法推导出了使系统渐近稳定并具有广义耗散性能的充分条件.接着,设计了保证闭环系统渐近稳定并具有广义耗散性能指标的状态反馈控制器.最后由数值仿真验证了设计方法的有效性.【期刊名称】《控制理论与应用》【年(卷),期】2018(035)009【总页数】9页(P1293-1301)【关键词】离散控制系统;T-S模型;区间二型模糊系统;广义耗散性能;模型转换;时滞【作者】王雪飞;周绍生【作者单位】杭州电子科技大学自动化学院,浙江杭州310018;杭州电子科技大学自动化学院,浙江杭州310018【正文语种】中文【中图分类】TP2731 引言(Introduction)继模糊集合理论引入后,L.A.Zadeh于1975年又提出了二型模糊集合的概念[1].由于二型模糊集合是在一型集合基础上的扩维运算,原本单一的模糊变量被两个不同层次上的隶属函数所取代,为复杂非线性系统的建模和控制引入了更多的自由度,因而二型模糊集合在处理多重不确定信息上具备更强的能力.然而,二型集合计算复杂,建模困难,控制系统实时运行中并不常见,为了能弥补这一缺陷同时又能很好的处理系统中的不确定信息,进一步引入了区间二型模糊集合的概念[2],J.M.Mendel在一篇综述[3]中对这一概念进行了详细的阐述.另一方面,由一系列IF-THEN规则描述的T–S模糊模型,由于能很好的表示非线性系统的局部线性输入输出关系,成为了非线性系统建模的有效工具.因此,基于T–S模型的区间二型模糊系统的稳定性分析和控制器设计问题便成为了控制领域的研究热点[4–7].文献[5]考虑了内嵌在系统不确定域中的信息,利用二型模糊隶属函数的特性引入了松弛矩阵,得到了使系统稳定且保守性更小的约束条件.文献[7]将状态空间进行分解,通过构造满足不确定性条件的矩阵,并采用矩阵分解技巧,解决了系统中出现的参数不确定性和随机扰动,从而建立了此类区间二型伊藤随机系统渐近稳定的充分条件.实际的工业生产过程或通信网络中,时延现象广泛存在.T–S模糊系统中存在的时滞尤其是时变时滞会给系统的静态和动态特性造成很大的负面影响.有关时滞系统的研究非常广泛[8–10],文献[9]中基于T–S模型离散系统,利用小增益定理以及时滞分解的方法设计出了使模糊系统渐近稳定的控制器.为了克服非线性扰动的影响,增强系统的鲁棒性,各类保性能控制的问题也引起了许多研究者的关注[11–13],文献[13]对具有时变时滞的离散T–S模型随机系统的耗散性能进行了分析,利用模型转化的方法并结合基依赖的李雅普诺夫–克拉索夫斯基泛函(Lyapunov-Krasovskii function,LKF),给出了系统时滞依赖的耗散性充分条件. 与耗散性能相比,文献[12]中提出的广义耗散性能的概念更具有一般性,涵盖了文献中常见的几种重要的性能指标.受文献[13]方法的启发,本文基于具有时变时滞和外部扰动的区间二型离散T–S模型非线性系统,在LKF方法的基础上,利用模型转换的方法,研究了系统广义耗散性能的稳定性分析和镇定问题,并给出了使闭环系统渐近稳定的充分条件.2 系统描述和预备知识(System formulation and preliminaries)考虑如下由IF-THEN规则描述的区间二型T–S离散时滞系统:其中:x(k)∈Rn是系统状态向量;u(k)∈Rm是控制输入向量;ω(k)∈Rq是外部扰动向量;z(k)∈Rq是被控输出向量;d(k)是系统存在的时变时滞且满足16dm6d(k)6dM,正整数dm和dM分别代表时滞的下界和上界;{ψ(l),l=−dM,−dM+1,···,0}是初始条件序列;是第i个模糊规则中前提变量fα(x)隶属的区间二型模糊集,i=1,2,···,s,α=1,2,···,j;Ai,Adi,Bi,Ci,Ddi,Di,Fi是具有适当维数的常数矩阵.第i个规则的激活强度由表示,其中:分别表示函数fα(k)的上下隶属度并且满足和则分别代表上下隶属函数.故对于所有的规则i有.区间二型离散时滞模糊系统(Σ0)可描述为其中式(3)中,组合系数满足故有.接下来,考虑如下的状态反馈控制器:其中Kj是第j个规则中状态反馈控制器的增益矩阵,类似于式(2)的形式,最终的状态反馈控制器为将控制器表达式(4)带入系统表达式(2)中得到区间二型闭环离散系统(Σ)为其中Aij=Ai+BiKj.下面引入闭环离散系统广义耗散性能的概念:假设1 假设矩阵R,R1,R2,R3满足以下条件:定义1 在假设1的情况下,对于闭环系统(5),如果存在标量ρ,对任意的N>0和ω(k)∈L2[0,∞),满足以下不等式:则称该系统是广义耗散的,其中注1 广义耗散性的概念在文献[12]中被首次提出,该性能指标是定义在连续线性马尔科夫跳变时滞系统上的,文献[14]将该性能指标应用在离散时滞神经网络系统,与文献[14]中的定义类似,本文对区间二型离散时滞系统研究了该性能指标的控制问题.注2 根据文献[12]的表述,通过对参数矩阵R,R1,R2,R3赋不同的值,式(6)可以分别表示H∞性能、L2−L∞性能、无源性、严格(Q,S,R)耗散性等性能指标.对于系统(2)和(5)中的时变时滞d(k),作者采用一种与文献[13,15]类似的方法进行估计,即用一种模型转化的方法来处理d(k)中的不确定性.即时滞x(k−d(k))可表示为其中.注3 通过这种操作,时滞状态x(k−d(k))被分成2个部分.其中,确定部分可以视为x(k−d(k))的估计值,而不确定部分则可以视为x(k−d(k))的估计误差.令,通过简单的计算可得其中为了简化式子的复杂度,令结合式(7),原系统(Σ0)转化为以下两个相互关联的子系统其中算子∆d则表示式(8)中δ(k)到ωd(k)的映射关系.由此产生的子系统(Σ1)只包括两个已知的常时滞,而不确定的时变时滞d(k)则转移到了子系统(Σ2)中.注4 这种通过模型转化来处理时变时滞d(k)的方法,文献[15]在分析不确定时滞系统的稳定性问题时进行了详细的阐述:该方法较其他方法的优势以及对d(k)估计误差的分析可见文献[13]中的注4和Example 2.引理1[16](Jensen不等式) 对于任意正定矩阵M∈Rn×n,整数标量τ1和τ2满足τ2>τ1,向量函数x(k)∈Rn,有以下不等式成立:引理2[13] 若子系统(Σ1)的一个LKF为Vs(k),则存在合适维数的正定矩阵S,使得原系统(Σ0)的一个LKF可表示为且若Vs(k)和S满足则原系统(Σ0)是渐近稳定的.3 耗散性分析(Stability analysis)为了简化分析,首先作如下定义:由假设1知,R>0且R160,因此,总是存在矩阵,使得下面等式成立:定理1 给定满足假设1的矩阵R,R1,R2,R3,正整数dm,dM以及标量0<λ<1,当控制输入u=0时,系统(Σ0)渐近稳定且具有广义耗散性能的充分条件是:存在正定矩阵P,P1,P2,S,Q1,Q2使得如下线性矩阵不等式成立:其中:证为系统(Σ1)选择一个LKF其中:计算Vs(k)沿着系统(Σ0)轨迹的增量,且有其中:基于引理2,系统(Σ0)的一个LKF可构造为则其中:结合定义1,其中应用舒尔补引理,由式(11)–(12)可得i<0.因此,根据(14)可知总存在充分小的正实数c,使得Ωi6−cI,则令根据不等式(15),有根据定义1,需要证明对于满足假设1的矩阵R,R1,R2,R3要满足式(6).从以下两种情况讨论:1)当R=0时,由式(16)显然知不等式(6)成立;2)当时,由假设1的4)知(∥R1∥+∥R2∥)=0,即R1=0,R2=0;由式(3)知∥Fi∥=0;由式(5)知R3>0.因此,J(k)=ωT(k)R3ω(k)>0.结合式(16),可知对任意k>0以及N>k>0,有此时,当k>d(k)时,显然得0<k−d(k)6N,故而当k6d(k)时,有−dM6−d(k)6k−d(k)60,则因此,不等式(18)对于任意k>0,N>k>0均成立.结合式(17)可知,存在一标量λ满足0<λ<1使得以下条件成立:对式(13)使用舒尔补引理并结合式(11),可得由此可知故根据式(20)–(21)可得对任意k>0,N>k>0,有由1)和2)两种情况可知零输入控制系统(Σ0)满足定义的广义耗散性能.当ω(k)≡0时,根据式(15),有由于R160,从而有∆V(k)<−c|η(k)|2.因此,当无扰动作用时,零输入系统(Σ0)是渐近稳定的.4 控制器设计(Control design)定理2 给定满足假设1的矩阵R,R1,R2,R3,正整数dm,dM以及标量0<λ<1,标量ε>0,闭环控制系统(Σ)渐近稳定且具有广义耗散性能的充分条件是:在控制器增益Kj=MjX−1作用下,存在正定矩阵P,P1,P2,S,Q1,Q2,适维矩阵X,Mj使得如下线性矩阵不等式成立:,即闭环控制系统(Σ)渐近稳定且具有广义耗散性能.注5 由式(23)可知X+XT−P>0.因为P>0,故有X+XT>0,因此可以确保X−1是存在的.注6 在定理2中,建立式(23)和式(24)两个条件来取代直接令Πij<0的方法,降低了约束条件的保守性.另外,在条件中增加了一个算子ε,通过调节该算子的取值,可以降低由不等式放缩而带来的保守性.5 数值实例(Numerical examples)对于区间二型离散闭环控制系统(Σ),当s=2时,设ε=0.42,λ=0.5,各参数矩阵给定如下:在保证上述参数一致的情况下,给定不同的时滞下界dm,根据定理2的时滞稳定定性条件求解线性矩阵不等式,得到允许的时滞上界如表1所示.表1 允许的时滞上界dMTable 1 The allowed upper bounddMof time delaydm 1 3 5 7 9 11dM 6 8 10 10 11 12考虑广义耗散性能的特例:L2−L∞性能指标,即令由假设1可知此时F1=F2=0,根据定理2的条件结合表1,令dm=1,dM=3,通过求解LMI可得如下可行解:由定理2中Kj=MjX−1可计算出状态反馈控制器的增益矩阵为区间二型系统以及状态反馈控制器的上、下隶属函数定义如下:由此形成图1所示的不确定域(footprint of uncertainties,FOUs).图1 区间二型模糊模型不确定域Fig.1 The FOUs of the interval type–2 fuzzy sets in the model令状态初始函数为时变时滞仿真时长N=50,根据式(30)由模型变换求得的增益K1,K2,作出图2开环系统的状态响应和图3闭环系统的状态响应.由图2–3可以看出,在具有外部扰动的开环系统下,系统始终处于振荡状态.当状态反馈控制器作用在系统后,响应曲线经过一段时间趋于零点,从而使系统渐近稳定.图2 开环系统状态响应Fig.2 The state responses of the open loop system 图3 闭环系统状态响应Fig.3 The state responses of the close loop system 6 结论(Conclusions)针对区间二型离散T–S模型非线性系统,在考虑了二型隶属函数特性以及时变时滞和外部扰动的影响下,研究了系统广义耗散性能的稳定性分析和镇定问题.通过模型转换的方法,对系统的滞后状态进行合理变换,根据转换后的仅含定常时滞和含有有界误差范数的2个子系统,利用Lyapunov-Krasovski泛函方法推导出了使系统渐近稳定并具有广义耗散性能的充分条件.最后由数值仿真验证了模型变换方法的可行性和状态反馈控制器设计方法的有效性.参考文献(References):【相关文献】[1]ZADEH L A.The concept of a linguistic variable and its application to approximate reasoning–1[J].Information Sciences,1975,8(3):199–249.[2]MENDEL J M,JOHN R I B.Type–2 fuzzy sets made simple[J].IEEE Transactions on Fuzzy Systems,2002,10(2):117–127.[3]MENDEl J M.Type–2 fuzzy sets and systems:an overview[J].IEEE Computational Intelligence Magazine,2007,2(2):20–29.[4]LAMHK,LIH,DETERSC,etal.Control design for interval Type–2 fuzzy systems under imperfect premise matching[J].IEEE Transactions on Industrial Electronics,2013,61(2):956–968.[5]SHENG L,MA X Y.Stability analysis and controller design of discrete interval type–2 fuzzy systems[J].Asian Journal of Control,2014,16(4):1091–1104.[6]ZHAO T,XIAO J.A new interval type–2 fuzzy controller for stabilization of interval type–2 T–S fuzzy systems[J].Journal of the Franklin Institute,2015,352(4):1627–1648.[7]WANG C J,ZHOU S S,KONG Y Y.State feedback control of interval type–2 T–S model based uncertain stochastic systems with unmatched premises[J].Neurocomputing,2016,173(1):1082–1095.[8]WU H N,LI H X.New approach to delay-dependent stability analysis and stabilization for continuous-time fuzzy systems with timevarying delay[J].IEEE Transactions on Fuzzy Systems,2007,15(3):482–493.[9]SU X,SHI P,WU L,et al.A novel control design on discrete-time Takagi-Sugeno fuzzy systems with time-varying delays[J].IEEE Transactions on Fuzzy Systems,2013,21(4):655–671.[10]SHENG L,MA X Y.Stability analysis and controller design of interval type–2 fuzzy systems with time delay[J].International Journal of Systems Science,2014,45(5):977–993. [11]ZHOU S S,LAM J,ZHENG W X.Control design for fuzzy systems based on relaxed nonquadra tic stability and H∞performance conditions[J].IEEE Transactions on Fuzzy Systems,2007,15(2):188–199.[12]ZHANG B Y,ZHENG W X,XU S Y.Filtering of Markovian jump delay systems based on anew performance index[J].IEEE Transac-tions on Circuits and Systems I:Regular Papers,2013,60(5):1250–1263.[13]WU L,YANG X,LAM H K.Dissipativity analysis and synthesis for discrete-time T–S fuzzy stochastic systems with time-varying delay[J].IEEE Transactions on FuzzySystems,2014,22(2):380–394.[14]FENG Z,ZHENG W X.On extended dissipativity of discrete-time neural networks with time delay[J].IEEE Transactions on Neural Networks&Learning Systems,2015,26(12):3293–3300.[15]LI X,GAO H.A new model transformation of discrete-time systems with time-varying delay and its application to stability analysis[J].IEEE Transactions on Automatic Control,2011,56(9):2172–2178.[16]SHAO H,HAN Q L.New stability criteria for linear discrete-time systems with interval-like time-varying delays[J].IEEE Transactions on Automatic Control,2011,56(3):619–625. [17]TUAN H D,APKARIAN P,NARIKIYO T,et al.Parameterized linear matrix inequality techniques in fuzzy control system design[J].IEEE Transactions on FuzzySystems,2001,9(2):324–332.。

基于压缩感知的DOA估计稀疏化模型与性能分析_林波_张增辉_朱炬波

基于压缩感知的DOA估计稀疏化模型与性能分析_林波_张增辉_朱炬波

要:利用压缩感知理论解决阵列信号到达角(DOA)估计问题,具有对快拍数据量要求低、可处理相关源等优
点。将压缩感知理论应用于信源 DOA 估计的一个关键问题是建立信源信号的稀疏化模型。该文在均匀线阵模型下 系统分析了角度划分对 DOA 估计稀疏重构性能的影响,从对相关性的分析出发给出了信号的最优稀疏化模型。分 析结果表明在实际应用中基于信源信号等正弦空间稀疏化的重构模型是最优的。 实验对比了新的稀疏化模型与传统 的等角度划分方式得到的流形矩阵的可重构性能,并进行了关于信号重构和信源 DOA 估计的详细实验分析,验证 了所提模型的优越性。 关键词:压缩感知(CS);稀疏化模型;到达方向(DOA)估计;相关性 中图分类号: TN911.7 DOI: 10.3724/SP.J.1146.2013.00149 文献标识码: A 文章编号: 1009-5896(2014)03-0589-06
590
电 子 与 信 息 学 报
第 36 卷
疏的角度空间场景,给出信源数和它们的到达角。 Duarte[5]则考虑利用信号的结构稀疏逼近方法来建 立阵元接收信号的稀疏重构模型。除了上述基于单 快拍接收数据的窄带信号 DOA 估计问题外,近年 来利用多快拍数据结合压缩感知中多测量矢量 (MMV) 模 型 的 窄 带 信 号 DOA 估 计 和 宽 带 信 号 DOA 估计问题的研究也逐渐展开[6,7]。 将压缩感知理论应用于 DOA 估计问题,首先 要建立合适的角度估计的稀疏表示和重构模型,空 域稀疏化方式决定了模型的重构性能。然而到目前 为止,利用压缩感知估计信号 DOA 的文献对稀疏 化模型的建立都没有进行系统地理论阐述,通常都 是简单地采用空域等角度稀疏化方式。本文分析了 稀疏表示和重构模型对 DOA 估计性能的影响,并 在此基础之上,从相关性条件的理论分析出发给出 了信号的最优稀疏表示模型,并通过相关性条件的 理论分析和仿真实验证实,提出了在实际应用中最 优空间稀疏表示模型是等正弦空间稀疏表示模型, 该模型比传统的等角度空间稀疏化得到的流形矩阵 具有更加优越的稀疏重构性能。

关于求解二阶周期性初值问题具有极小相位延迟的P—稳定的Hybrid方法

关于求解二阶周期性初值问题具有极小相位延迟的P—稳定的Hybrid方法

关于求解二阶周期性初值问题具有极小相位延迟的P—稳定的
Hybrid方法
向开理
【期刊名称】《西南石油大学学报》
【年(卷),期】1992(000)004
【摘要】本文提出了一类求解二阶周期性初值问题y"=f(x,y)的具有极小相位延迟的P—稳定的Hybrid方法。

其精度与相位延迟的阶均比[1~3]中的同类方法高。

本文10阶方法M<sub>10</sub>(β)只须求f的二阶全导数,6阶方法
M<sub>6</sub>(β)及8阶方法M<sub>8</sub>(β,γ)不需求f的全导数。

数值结果表明,本文所构造的方法是有效的。

【总页数】13页(P135-147)
【作者】向开理
【作者单位】西南石油学院基础学科部
【正文语种】中文
【中图分类】O175
【相关文献】
1.用差分法求解二阶常微分方程初值问题 [J], 张守贵
2.用差分法求解二阶常微分方程初值问题 [J], 张守贵
3.一类具有混合边界条件的半有界弦振动初值问题求解方法 [J], 张琳
4.一种内向量选取下求解常微分方程组初值问题二步混合方法的代数稳定性 [J],
5.一类具有混合边界条件的半有界弦振动初值问题求解方法 [J], 张琳
因版权原因,仅展示原文概要,查看原文内容请购买。

二维定常Euler方程组解的衰减性估计的开题报告

二维定常Euler方程组解的衰减性估计的开题报告

二维定常Euler方程组解的衰减性估计的开题报告一、选题背景Euler方程组是描述流体力学问题的基本方程之一。

它的求解是流体力学问题的重要研究方向之一。

在实际问题中,经常需要求解二维定常Euler方程组的解,如飞机机翼气动力学、湍流模拟等。

对于这类问题,我们需要研究二维定常Euler方程组解的衰减性估计。

二、研究目的本文的研究目的是研究二维定常Euler方程组解的衰减性估计,为实际问题的数值求解提供理论依据和数值算法。

三、研究内容和方法本文将从以下几个方面进行研究:(1)建立二维定常Euler方程组的数学模型;(2)研究二维定常Euler方程组解的H 1/2 -范数衰减性估计;(3)利用数值算法验证理论结果。

本文的研究方法主要是利用偏微分方程理论和数值方法。

在理论研究方面,我们将利用偏微分方程理论中的估计方法,推导出二维定常Euler方程组解的衰减性估计。

在数值算法方面,我们将利用有限元方法、有限差分方法等数值方法,验证理论结果。

四、研究意义二维定常Euler方程组的解的衰减性估计是流体力学问题中的基础问题,对于解决实际问题的数值模拟具有重要意义。

本文研究的二维定常Euler方程组解的衰减性估计对于实际问题的数值求解有一定的帮助作用。

五、预期成果通过本文的研究,预期可以得到二维定常Euler方程组解的H 1/2 -范数衰减性估计,为实际问题的数值求解提供理论依据和数值算法。

六、进度安排(1)前期调研阶段:2022年9月至2022年10月;(2)理论推导阶段:2022年10月至2023年9月;(3)数值实验阶段:2023年9月至2024年6月;(4)论文撰写和答辩:2024年6月至2025年1月。

七、参考文献[1] 张光武,刘以下,杨云龙.Euler方程组的最大乘积解法[J].力学学报,2002,34(4):532-536.[2] Cao C, Titi E S. Global well-posedness of the three-dimensional viscous primitive equations of large scale ocean and atmosphere dynamics[J]. Annals of Mathematics, 2009, 170(2): 673-721.[3] Xie G, Wang X, Li Z. The Burgers' Equation:Solutions, Symmetries and Applications[M]. Springer, 2018.[4]蒋兆元. 偏微分方程数值解法[M]. 北京:高等教育出版社,2010.[5] Cagnol J, Rousset F. A finite volume well-balanced scheme for the Euler system of gas dynamics with gravity[J]. Journal of Computational Physics, 2007, 224(1): 322-342.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( ma :ktwid 2 3 n t c s a @ u t. d . n fb i u t.d .n E— i i n @ 6 . e x h o sc e u c z a@ sc e u c ) l e
A b t a t Ti e l g p ob e e nst tt y t m t t s a e a f c e ot u r nt sr c m —a r l m m a ha hes s e s a e r fe t d by b h c r e s a e n s t t s The q a ia i e sm ul to ft e fx d tm e lg pr bl m s d s t t s a d pa ts a e . u lt tv i a i n o h i e i —a o e i i — c s d i hi r il Di c e ia i ft o e i n l e us e n t s a tce. s r tz ton o he pr bl m S a a yz d,w h c a e tp s — i h m k s i os i
周 颢 邵晨 曦 白方周
20 2 ) 3 0 7 ( 中国科 学技术 大 学计 算机科 学 技术 系 合 肥
( ma :ktwid 2 3 n t c s a @ u t. d . n fb i u t. d .n E— i ie n @ 6 . e x h o sc e u c z a@ SC e u c ) l
b e f rU o c n i e h r b e o ic e e t e p i t .Ba e n t e Q 2 a g rt m , l o S t o sd rt e p o l m n d s r t i o n s m s d o h l o i h
to i d tm e l g s s e a e lz d. i n offxe i —a y t m c n be r a ie
Ke r s Qu l a i e s mu a in,i e i e lg, i c e e, a t c n t a n y wo d a i tv i lto f d t — a d s r t p s o s r i t t x m
ZH OU Hao SH A O Che Xi n— BA IFa ng— Zhou
( p rme to mp tr S i c n c n l g Unv st f ce c n c n lg f C i a, e e 2 0 2 ) De a t n f Co u e ce ea d Teh oo y, i e i o S i ea d Te h o o y o h n H f i 3 0 7 n r y n
m a i n t y t m ih a tc s r i t d c r n o t a n s,q lt tv i u a ton i he s s e w t p s on t a n san ur e tc ns r i t ua ia i e sm l —
连 续 时 间 转 化 到 离 散 时 间 点 上 来 考 虑 . 改 进 了 定 性 与 定 量 相 集 成 的 仿 真 方 法 —— Q2算 法 , 并 增 加 了 反 映 延 迟 性 质 的 过 去 约 束 , 过 当 前 约 束 和 过 去 约 束 在 系 统 中 传 播 定 量 信 息 , 而 完 成 固 通 从 定 迟 滞 问题 的 定 性 仿 真 .
p s o s r i t r dd d t e r s n he l t nc a tc n t a n s a e a e o r p e e tt a e y. By pr pa a i g q a ia i e i o — o g tn u ntt tv nf r
关键词
定性 仿真 , 固定 迟滞 , 离散 化 , 去 约束 过
TP 9 . 319
中图分 类号
A I C R ETE E TH o D D S M Fo R X E D I E — FI T M LA G PR o BL EM
BAS ED ON Q2ALGoRI THM 维普资讯 第 2 源自卷第 4期 自 动 化


V ol 8, o.4 _2 N
20 0 2年 7月
A C TA U TO M A T I A CA N I SI CA
J l 2 0 u y, 0 2
基 于 Q2算 法 的 固定 迟 滞 问题 离 散 化 求 解
维普资讯
摘 要 迟 滞 问 题 是 指 系 统 的 状 态 变 化 不 仅 与 当 前 状 态 有 关 , 与 系 统 的 过 去 状 态 有 关 . 虑 还 考
了对 固 定迟 滞 问题 进 行定 性 仿真 求 解 , 过 分 析 该 类 问题 的 可 离 散 化特 性 , 问题 求 解 范 围从 通 将
1 引 言
定 性 仿 真 是 定 性 推 理 的 一 种 主 要 方 法 . ies的定 性 仿 真 理 论 是 其 中 的 主 要 代 表 . Kup r 定
1 )国 家 自然 科 学 基 金 ( 9 7 0 8 资 助 694 3 ) 收 稿 日期 2 0 —4 2 0 00 —4 收 修 改 稿 日期 2 0 — 21 010—9
相关文档
最新文档