对三种典型分布式任务分配算法的分析

对三种典型分布式任务分配算法的分析
对三种典型分布式任务分配算法的分析

对三种典型分布式任务分配算法的分析

何炎祥;罗先林

【期刊名称】《小型微型计算机系统》

【年(卷),期】1997(018)011

【摘要】本文先分析了基于图论的分配算法,整数规划方法和试探法等几种典型的分布式任务分配算法的基本思想、特点、不足和算法复杂度,以及可进一步改进之处,然后给出了一种试探法的改进算法,并简单了其特点和性能,最后指出了分布式任务分配的发展方向。

【总页数】6页(1-6)

【关键词】图论;任务分配;算法;分布式计算

【作者】何炎祥;罗先林

【作者单位】武汉大学计算机科学技术学院;武汉大学计算机科学技术学院【正文语种】英文

【中图分类】TP301.6

【相关文献】

1.对几种典型分布式任务分配算法的分析和改进 [J], 何炎祥; 陈燕涛

2.分布式系统中的“合—阀值”任务分配算法 [J], 何炎祥

3.分布式容错系统的任务分配算法 [J], 陈显锋; 裘丽华

4.局域同构分布式系统的自适应任务分配算法 [J], 毛国君; 杨名生

5.一种分布式协同干犹的功率分配算法 [J], 寇伟; 庄瑾

以上内容为文献基本信息,获取文献全文请下载

大型项目任务分配问题

一、 问题重述 假设有m 个人,共同完成n 项工作,(n>m ≥2)。每个人可以干任何一件工作,但效率不同,任意时刻每个人只能干一件工作,每项工作只能由一人独立完成。 如果这m 个人任选一项工作同时开始干,每个人干完一件工作后,立即选一项还没有人干过的工作接着干,直到所有n 项工作全部完成。从开始工作到最后一项工作完成的时间称为总完成时间,简称总时间,记为T 。 为使总时间T 尽量小,请对以下三种情况,分别确定每个人应干哪几项工作?顺序如何?并求出T 。 对一般情况进行讨论 (1) X1=(2, 3, 8, 9, 10, 7, 6) , X2=(3, 8, 5, 9, 7, 6, 4)。 (2) X1=(44, 37, 39, 25, 26, 49, 11, 49, 51, 46, 13, 31, 11, 50, 29, 16, 54, 13, 58, 29, 37, 49, 13, 40, 34, 25, 42, 43, 24, 24, 52), X2=(52, 37, 60, 56, 22, 45,60, 23, 37, 16, 60, 44, 11, 39, 16, 16, 50, 25, 13, 25, 30, 26, 58, 59, 31, 24, 19, 19, 43, 31, 31)。 (3) X1=(46, 27, 42, 21, 20, 40, 15, 33, 56, 24, 50, 29, 25, 56, 42, 42, 32, 15, 39, 45, 56, 52, 12, 38, 56, 32, 44, 36, 36, 34, 28, 31, 24, 13, 23, 59, 14, 30, 29, 35, 18, 34, 23, 42, 38, 18, 57, 43, 36, 30, 16, 50, 33, 48, 40, 52, 11, 21, 14, 16, 27, 17), X2=(11, 37, 43, 38, 52, 15, 20, 44, 33, 28, 18, 46, 57, 37, 15, 48, 31, 34, 35, 21, 27, 15, 40, 19, 57, 15, 33, 24, 54, 48, 24, 44, 23, 15, 12, 27, 50, 25, 22, 35, 23, 28, 13, 35, 21, 54, 40, 48, 57, 27, 38, 15, 42, 31, 59, 16, 57, 42, 28, 18, 34, 21)。 X3=(46, 37, 39, 25, 26, 49, 11, 49, 51, 46, 13, 31, 35, 50, 29, 59, 54, 13, 58, 29, 37, 15, 13, 40, 34, 25, 42, 43, 24, 24, 52, 52, 40, 60, 21, 22, 45, 60, 23, 37, 16, 60, 44, 11, 39, 16, 16, 50, 25, 13, 25, 30, 26, 58, 59, 31, 24, 19, 19, 43, 31, 31) 二、问题分析 我们的任务是寻找一个最佳调度方案,使总完成时间最短,该问题是一个NP 难题,不存在有效算法。求解大规模问题要用近似算法。最好能找到一个评价结果的指标。下面给出总时间的一个下界。设Y 是最短时间向量,如果每人都用Y 中的时间来干工作,中间无间息,且每人的最后一项工作都同时干完,这时的总时间T 最小,为T 0 因此有如下结论 定理 根据上述定理,计算出一个特定问题的下限很容易,对本问题的三种情形可计算出其下限。 (1) T 0= (2)T 0= 807 = 403.5 (3)T 0= 1395 = 465 ∑=≤≤=n j ij m i a m T 110)(min 1∑=≤≤≥n j ij m i a m T 11)(min 118)4679532(21=++++++??=∑=21y 21311i i ?=∑ =31y 31621i i

基于云计算环境的蚁群优化计算资源分配算法

基于云计算环境的蚁群优化计算资源分配算法 华夏渝,郑骏,胡文心 (华东师范大学计算中心,上海200241) 摘要:针对云计算的性质,提出一种基于蚁群优化(Ant Colony Optimization )的计算资源分配算法。分配计算资源时,首先预测潜在可用节点的计算质量,然后根据云计算环境的特点,通过分析诸如带宽占用、线路质量、响应时间等因素对分配的影响,利用蚁群优化得到一组最优的计算资源。通过在Gridsim环境下的仿真分析和比较,这种算法能够在满足云计算环境要求的前提下,获得比其他一些针对网格的分配算法更短的响应时间和更好地运行质量,因而更加适合于云环境。 关键词:云计算;网格;蚁群;资源分配 中图分类号:TP316 文献标识码:A Ant Colony Optimization Algorithm for Computing Resource Allocation Based On Cloud Computing Environment Hua xia-yu, Zheng jun, Hu wen-xin (Computer Center Institute, East China Normal University Shanghai, 200241) Abstract:A new allocation algorithm based on Ant Colony Optimization (ACO) was established to satisfy the property of Cloud Computing. When start, this algorithm first prognosticated the capability of the potential available resource node, and then analyzed some factors such as network qualities or response times to acquire a set of optimal compute resources. This algorithm met the needs of cloud computing more than others for Grid environment with shorter response time and better performance, which were proved by the simulation results in the Gridsim environment. Key words: Cloud Computing; Grid; Ant Colony Optimization; resource allocation 0引言 云计算(Cloud Computing),是指通过互联网连接的超级计算模式,包含了分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的相关技术,或者说是这些计算机科学概念的商业实现。 云计算一种新型的共享基础架构,可以将巨大的系统池连接在一起,以运营商和客户的方式,通过互联网为用户提供各种存储和计算资源。在云计算环境中,用户将自己的个人电脑,PDA或移动电话等其他设备上的大量信息和处理器资源集中在一起,协同工作。这是一个大规模的分布式计算模式,该模式由运营商的经济规模决定,并且是抽象的,虚拟化的以及规模动态可变的。其主要内容为受管理的计算能力,存储,平台和服务。这些内容通过互联网,按需分配给外部用户,其重要意义在于将计算能力作为一种商品在互联网上进行流通。 云计算的主要优势:快速地降低硬件成本和提升计算能力以及存储容量,用户可以以极低的成本投入获得极高的计算能力,而不用再投资购买昂贵的硬件设备,负担频繁的保养与升级 计算资源分配是云计算技术的一个重要组成部分,其效率直接影响整个云计算环境的工作性能。由于云计算有很多独特的特性,使得原有的针对网格计算的资源分配和调度算法已无法在该环境中有效的工作。本文提出的蚁群优化分配算法,综合考虑了云计算的一系列特点,以期在这种环境中能够高效地为用户作业分配合适的计算资源。 1 问题描述 云计算由网格计算演变而成,并将网格计算作为其骨干和基本结构。可以说,云计算是网格计算的一种更高级的形式。但是,这两者之间在现实中存在着巨大的区别,具体可以参见文献[1]。 云计算提供了更多抽象的资源和服务。这些资源和服务可划分为三个类别,分别是软件即服务(Software as a Service),平台即服务(Platform as a Service)和设备即服务(Infrastructure as a Service) [2,3]。 在软件即服务(SaaS)中,用户会得到一个特殊用途的客户端,该客户端允许用户通过互联网进行远程访问,并且基于使用情况来收取费用。

对三种典型分布式任务分配算法的分析

分布式系统几种典型一致性算法概述 姓名:王昌志学院:电子电气工程学号:M020214105 在分布式系统中,我们经常遇到多数据副本保持一致的问题。在这里,我们通俗地把一致性的问题可分解为2个问题: 1、任何一次修改保证数据一致性。 2、多次数据修改的一致性。 在弱一致性的算法,不要求每次修改的内容在修改后多副本的内容是一致的,对问题1的解决比较宽松,更多解决问题2,该类算法追求每次修改的高度并发性,减少多副本之间修改的关联性,以获得更好的并发性能。例如最终一致性,无所谓每次用户修改后的多副本的一致性及格过,只要求在单调的时间方向上,数据最终保持一致,如此获得了修改极大的并发性能。 在强一致性的算法中,强调单次修改后结果的一致,需要保证了对问题1和问题2要求的实现,牺牲了并发性能。本文是讨论对解决问题1实现算法,这些算法往往在强一致性要求的应用中使用。 解决问题1的方法,通常有两阶段提交算法、采用分布式锁服务和采用乐观锁原理实现的同步方式,下面分别介绍这几种算法的实现原理。 一.两阶段提交算法 在两阶段提交协议中,系统一般包含两类机器(或节点):一类为协调者(coordinator),通常一个系统中只有一个;另一类为事务参与者(participants,cohorts或workers),一般包含多个,在数据存储系统中可以理解为数据副本的个数。两阶段提交协议由两个阶段组成,在正常的执行下,这两个阶段的执行过程如下所述: 阶段1:请求阶段(commit-request phase,或称表决阶段,voting phase)。 在请求阶段,协调者将通知事务参与者准备提交或取消事务,然后进入表决过程。在表决过程中,参与者将告知协调者自己的决策:同意(事务参与者本地作业执行成功)或取消(本地作业执行故障)。 阶段2:提交阶段(commit phase)。 在该阶段,协调者将基于第一个阶段的投票结果进行决策:提交或取消。当且仅当所有的参与者同意提交事务协调者才通知所有的参与者提交事务,否则协

存储管理动态异长存储资源分配算法

. 存储管理—动态异长存储资源分配算法 一、设计目的 理解动态异长存储分区资源管理,掌握所需数据结构和管理程序,了解各种 存储分配算法的优点和缺点。 二、设计内容 (1)分析UNIX最先适应(First Fit,FF)存储分配算法,即map数据结构、存储分配函数malloc()和存储释放函数mfree(),找出与算法有关的成分。 (2) 修改上述与算法有关的成分,使其分别体现BF(Best Fit,最佳适应) 分配原则和WF(Worst Fit,最环适应)分配原则。 三、设计准备(理论、技术) 1.最先适应(First Fit,FF)算法 指对于存储申请命令,选取满足申请长度要求且起始地址最小的空闲区域。在实现时,可以将系统中所有的空闲区域按照起始地址由小到大的次序依次记录于空闲区域表中。当进程申请存储空间时,系统由表的头部开始查找,取满足要求的第一个表目。如果表目所对应的区域长度恰好与申请的区域长度相同,则将该区域全部分配给申请者,否则将该区域分割为两部分,一部分的长度与申请长度相同,将其分配给申请者;另一部分的长度为原长度与分配长度之差,将其记录在空闲区域表中 2.最佳适应(Best Fit,BF)算法 是为了克服最先适应算法缺点提出的。它在分配时取满足申请要求且长度最小的空间区域。在实现时,可以将系统中所有的空闲区域按照长度由小到大的次序依次记录于空闲区域表中。当进程申请存储空间时,系统由表的头部开始查找,取满足要求的第一个表目。 3.最坏适应(Worst Fit,WF)算法 是为了克服最佳适应算法的缺点而提出的。它在分配时取满足申请要求且长度最大的空闲区域。在实现时,可以将系统中所有的空闲区域按照长度由小到大的次序依次记录于空闲区域表中。当进程申请存储空间时,取第一个表目。 4.程序设计技术分析 按题目题目首先对存储分配表进行初始化;然后对用户输入的请求和释放,按照动态更新存储分配表,并将每次更新之后的存储分配表在屏幕上显示出来 动态分区分配需要解决三个问题:A.对于请求表中的要求内存长度,从可用表或自由链寻找出合适的空闲区域分配程序。B.分配空闲区后更新自由链或可用表。 C.进程或作业释放内存资源时,合并相邻空闲区并刷新可用表。 四、设计过程(设计思想、代码实现)

基于LTE的D2D资源分配最优算法

Resource Sharing Optimization for Device-to-Device Communication Underlaying Cellular Networks Chia-Hao Yu,Klaus Doppler,C′a ssio B.Ribeiro,and Olav Tirkkonen Abstract—We consider Device-to-Device(D2D)communication underlaying cellular networks to improve local services.The system aims to optimize the throughput over the shared resources while ful?lling prioritized cellular service constraints.Optimum resource allocation and power control between the cellular and D2D connections that share the same resources are analyzed for different resource sharing modes.Optimality is discussed under practical constraints such as minimum and maximum spectral ef?ciency restrictions,and maximum transmit power or energy limitation.It is found that in most of the considered cases,optimum power control and resource allocation for the considered resource sharing modes can either be solved in closed form or searched from a?nite set.The performance of the D2D underlay system is evaluated in both a single-cell scenario,and a Manhattan grid environment with multiple WINNER II A1of?ce buildings.The results show that by proper resource management, D2D communication can effectively improve the total throughput without generating harmful interference to cellular networks. Index Terms—Cellular networks,device-to-device,D2D,peer-to-peer,resource sharing,underlay. I.I NTRODUCTION T HE increasing demand for higher data rates for local area services and gradually increased spectrum conges-tion have triggered research activities for improved spectral ef?ciency and interference management.Cognitive radio sys-tems[1]have gained much attention because of their poten-tial for reusing the assigned spectrum among other reasons. Conceptually,cognitive radio systems locally utilize“white spaces”in the spectrum for,e.g.,ad hoc networks[2][3] for local services.Major efforts have been spent as well on the development of next-generation wireless communication systems such as3GPP Long Term Evolution(LTE)1and WiMAX2.Currently,the further evolution of such systems is speci?ed under the scope of IMT-Advanced.One of the main concerns of these developments is to largely improve the services in the local area scenarios.Device-to-Device (D2D)communication as an underlaying network to cel-lular networks[4][5]can share the cellular resources for Manuscript received November26,2010;revised February11,2011and March23,2011;accepted April20,2011.The associate editor coordinating the review of this paper and approving it for publication was N.Kato. C.-H.Yu and O.Tirkkonen are with the Department of Communi-cations and Networking,Aalto University,Finland(e-mail:{chiahao.yu, olav.tirkkonen}@aalto.?). K.Doppler and C.B.Ribeiro are with Nokia Research Center,Nokia Group (e-mail:{klaus.doppler,cassio.ribeiro}@https://www.360docs.net/doc/5713184798.html,). Digital Object Identi?er10.1109/TWC.2011.060811.102120 1see https://www.360docs.net/doc/5713184798.html,/ 2see https://www.360docs.net/doc/5713184798.html,/better spectral utilization.In addition to cellular operations where the network services are provided to User Equipment (UE)through the Base Stations(BSs),UE may communicate directly with each other over D2D links while remaining control under the BSs.Due to its potential of improving local services,D2D communication has received much attention recently[6][7][8][9][10][11][12][13][14][15][16]. The idea of enabling D2D connections in cellular networks for handling local traf?c can be found in,e.g.,[17][18][19], where ad hoc D2D connections are used for relaying pur-poses.However,with these methods the spectral utilization of licensed bands cannot be improved as D2D connections take place in license-exempt bands.Furthermore,ad hoc D2D connections may be unstable as interference coordination is usually not possible.In[20],non-orthogonal resource shar-ing between the coexisting cellular and ad hoc networks is considered.As the operations of both types of networks are independent(with independent traf?c loads),interference coordination between them considers only the density of transmitters.Recent works on D2D communication assume the same air interface as the underlaying cellular networks. In[21],the cellular resources are reused by D2D connections in an orthogonal manner,i.e.,D2D connections use reserved resources.Although orthogonal resource sharing eases the task of interference management,better resource utilization may be achieved by non-orthogonal resource sharing.In[4][5],a non-orthogonal resource sharing scheme is assumed.Cellular users can engage in D2D operation when it is bene?cial for the users or system.Further,D2D power control when reusing Uplink(UL)cellular resources,where cellular signaling for UL power control can be utilized,is addressed to constrain the interference impact to cellular operations. To better improve the gain from intra-cell spatial reuse of the same resources,multi-user diversity gain can be achieved by properly pairing the cellular and D2D users for sharing the resources[8][9][10].In[10],the resource allocation scheme over multiple cellular users and D2D users considers the local interference situations,making it possible for inter-cell interference avoidance.Interference randomization through resource hopping is considered in[11].This provides more homogeneous services among users in challenging interfer-ence environments,e.g.,when one cellular connection shares resources with multiple D2D pairs at the same time.Integra-tion of D2D communication into an LTE-Advanced network is investigated in[13][14],where schemes for D2D session setup 1536-1276/11$25.00c?2011IEEE

D2D网络中基于强化学习的路由选择与资源分配算法研究

D2D网络中基于强化学习的路由选择与资源分配算法研究 随着通信网络的发展,终端直连通信技术(Device-to-Devic,D2D)被广泛关注,它的应用将满足用户日益增长的流量需求。然而,D2D技术的引入使得蜂窝网络内部的干扰冲突加剧,用户难以满足服务质量(Quality-of-Service,QoS)的需求。 一些传统算法基于网络“抓拍”信息可以计算得到各采样时刻的网络控制策略,却难以适应复杂多变、高度动态的网络环境。因此,本文着手于动态环境下的D2D网络中的通信问题进行了深入地研究,并结合正在兴起的机器学习技术,提出了更加智能化的解决方案。 在本文中我们将分别研究“多跳D2D网络”与“D2D直连通信”两类D2D应用场景的通信问题,提出了在两种场景下基于强化学习的在线学习方法,从而解决多跳网络中的路由问题与D2D直连网络中的资源分配问题。而随着问题复杂程度的增加,强化学习算法也相应由浅入深。 在路由问题中,因问题复杂程度较低,我们利用传统强化学习算法中的值迭代算法求解,而在资源分配问题中因问题规模变大,本文依次提出了基于深度Q 学习(Deep Q-Learning,DQN)的资源分配算法和深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)的资源分配算法分别解决了问题中状态空间连续与动作空间连续的问题,而这两种算法都是深度强化学习(Deep Reinforcement Learning,DRL)中的经典算法。在多跳D2D网络路由问题中,我们考虑了三类随网络动态变化的QoS指标,并利用值迭代算法求解,同时提出了分布式的强化学习算法解决了集中式算法学习周期过长的问题。 仿真发现,在动态环境中,所提算法在性能与时间复杂度方面相较于传统算

LTE系统中资源分配算法的研究分解

LTE系统中资源分配算法的研究 1 LTE 概述 1.1移动通信的发展 Antonio Meucci于1860年在纽约首次向公众展示电话发明,随后,经过近百年的历程,第一个电话系统在1940年末问世,直到70年代末“蜂窝系统”进入通信这个广阔的天地,让人们感受到电话给生活带来的巨大改变。如今围绕着“电话通信”业务以惊人的速度发展,同时也改变着我们的生活,随之产生的新的通信方式移动通信也不断向着新的阶梯迈进。通信发展现在正立足于2G(secondgeneration,第二代移动通讯及其技术)和3G(3rd Generation,第三代移动通讯及其技术)之间,相关的研究人员仍在不断进行新一代的通信研究。从第一代通信系统到全球移动通讯系统GSM(Global System for Mobile Communications,全球移动通讯系统,俗称“全球通”第二代移动通讯技术的代表),移动通信系统的运营经历着飞速的发展。虽然二代网络系统中解决了很多一代中存在的缺陷,而且数据速率上限到达144Kbps,但对于数据速率的需求,仍无法满足用户。为了满足用户需求,保证网络的持续发展于2002年开始3G的网络建设。现在正在建设的3G网络在速率上已可以提供至少144kbps的车辆移动通信、384kbps的行人通信、卫星移动环境9.6kbps以及固定地点达到2Mbps的通信,可以提供最高数据速率达8~10Mbps,并且带宽也可达5MHz以上的要求。 整个移动通信其发展从起初的模拟到数字,再到称之为准宽带移动通信的第三代移动通信。通信的方式上已打破有线一统天下的格局,实现了在空间环境中无线传输的无线通信。这种利用电磁波而不通过电缆进行的无线通信是一个因用户需要而连接并提供服务,用户不需要时没有连接的一种通信方式。非常便捷,也不会出现资源使用独占的情况。这些改变让大家都不断享受到移动通信的信息丰富性,便捷性,而这也在无形中改变着社会,使得人们期待着未来的移动通信的发展必是更大容量、更高速率以及更多更强功能的多媒体业务的宽带移动通信系统。现在各国对3G的推广其使用情况,如表1-1。从表1-1中可以了解到当前部分国家地区主流运营商所选择3G制式的分布情况,清楚了解到3G的普及情况。从用户的需求发展趋势以及新一代的通信发展过程中发现,现有的3G和3.5G已不能满足发展的进一步需求。人们需求在不断的增加,通信的发展不能停滞不前,借鉴之前通信系统发展标准的不统一性所带来的诸多兼容问题,所以新一代通信系统设计上要保证国际范围内高度统一性,支持多种数据业务,提供高服务质量,加快当前技术进一步优化以及后续技术的开发研究。

无线通信中的最优资源分配—复杂性分 析与算法设计

无线通信中的最优资源分配—复杂性分 析与算法设计 刘亚锋 摘要 最优资源分配问题是无线通信系统设计中的基本问题之一。最优地分配功率、传输波形、频谱等资源能够极大地提高整个通信系统的传输性能。从用户的角度,多用户之间的相互干扰是制约整个通信系统高速稳健传输的最主要因素,适当地分配系统资源可以有效地消除多用户之间的相互干扰,从而提高整个通信系统的传输性能。从系统运营者的角度,最优地分配系统资源可以有效地提高功率和频谱等昂贵资源的利用率,从而降低运营费用。目前,相对于通信技术在现实生活中的蓬勃发展,通信系统优化的数学理论和方法显得相对滞后,在某些方面已经成为影响其发展和应用的关键因素,因此研究通信中的资源分配问题是非常有意义的。 本文研究无线通信中的最优资源分配问题,这些问题常常是带有特殊结构的非凸非线性优化问题。一方面,通信中的最优资源分配问题常常具有高度的非线性性,一般情况下难于求解;另一方面,这些优化问题又有自身的特殊结构,例如隐含的凸性和可分结构等。本文着重考虑多用户干扰信道中物理层资源最优分配问题的复杂性刻画,以及如何利用问题的特殊结构设计计算有效且满足实时性和分布式应用等实际要求的计算方法。 本论文首先考虑多输入单输出 (MISO) 干扰信道中的合作波束成形设计问题。在无线通信中,处在小区边沿的用户常常受到来自其他小区的严重干扰,我们考虑利用合作波束成形的方法提高处在小区边沿用户的传输速率。Luo和Zhang(2008)分析了在单天线情况下此问题的计算复杂性。我们证明在多天线情况下调和平均和几何平均这两个效用函数准则下的最优合作波束成形设计问题是NP-难的,这一结果完全不同于单天线时的结果。对于一般的效用函数,我们提出了一种非精确循环坐标下降法,并证明此方法产生的点列全局收敛于原问题的KKT点。该算法的最大优点在于只需交换少量信息,每个基站就可以调整各自的波束成形向量。 其次,我们讨论多用户多输入多输出(MIMO)干扰信道中干扰对齐的可行性判定问题。Cadambe和Jafar (2008) 证明干扰对齐能够使得多用户时变信道无干扰地传输最多一半的信号数。Yetis等 (2009) 和Gomadam等 (2008) 指出判断常系数MIMO干扰信道中干扰对齐的可行性是一个公开问题。我们完备地刻画了此问题的计算复杂性。我们证明,当每个传输端装有的天线数大于或等于3 (2) 每个接收端装有的天线数大于或等于2 (3) 时,干扰对齐的可行性判定问题是强NP-难的。我们也讨论干扰对齐问题的进一步推广,如干扰对齐松弛问题和干扰极小化问题等。 再次,我们考虑最大最小准则下的联合传输/接收波束成形设计问题。我们证明在MIMO 干扰信道中,给定一组信干噪比 (SINR) 目标,判断是否存在一组可行的传输/接收波束成形向量使得每个用户的SINR值大于或等于预先给定的SINR目标这一可行性判定问题是强NP-难的,这一结果完全不同于MISO干扰信道中的已有结果。上述结果也说明MIMO干扰信道中的最小SINR最大化问题是强NP-难的。考虑到问题的特殊结构,我们提出交替地升级传输波束成形向量和接收波束成形向量,从而将原问题分解为一系列简单凸优化子问题。我们证明提出算法产生的点列的任一聚点都是原问题的KKT点。 最后,我们考虑单输入单输出 (SISO) 干扰信道中联合功率/接入控制问题。传统的功

基于深度强化学习的蜂窝网资源分配算法

2019年2月 Journal on Communications February 2019 2019002-1 第40卷第2期 通 信 学 报 V ol.40 No.2基于深度强化学习的蜂窝网资源分配算法 廖晓闽1,2,严少虎3,石嘉1,谭震宇1,赵钟灵1,李赞1 (1. 西安电子科技大学综合业务网理论及关键技术国家重点实验室,陕西 西安 710071; 2. 国防科技大学信息通信学院,陕西 西安 710106; 3. 中国电子科技集团公司第二十九研究所,四川 成都 610036) 摘 要:针对蜂窝网资源分配多目标优化问题,提出了一种基于深度强化学习的蜂窝网资源分配算法。首先构建 深度神经网络(DNN ),优化蜂窝系统的传输速率,完成算法的前向传输过程;然后将能量效率作为奖惩值,采 用Q-learning 机制来构建误差函数,利用梯度下降法来训练DNN 的权值,完成算法的反向训练过程。仿真结果 表明,所提出的算法可以自主设置资源分配方案的偏重程度,收敛速度快,在传输速率和系统能耗的优化方面明 显优于其他算法。 关键词:蜂窝网;资源分配;深度强化学习;神经网络 中图分类号:TN929.5 文献标识码:A doi: 10.11959/j.issn.1000?436x.2019002 Deep reinforcement learning based resource allocation algorithm in cellular networks LIAO Xiaomin 1, 2, YAN Shaohu 3, SHI Jia 1, TAN Zhenyu 1, ZHAO Zhongling 1, LI Zan 1 1. State Key Laboratory of Integrated Services Networks, Xidian University, Xi’an 710071, China 2. School of Information and Communications, National University of Defense Technology, Xi’an 710106, China 3. The 29th Research Institute of China Electronics Technology Group Corporation, Chengdu 610036, China Abstract: In order to solve multi-objective optimization problem, a resource allocation algorithm based on deep rein- forcement learning in cellular networks was proposed. Firstly, deep neural network (DNN) was built to optimize the transmission rate of cellular system and to complete the forward transmission process of the algorithm. Then, the Q-learning mechanism was utilized to construct the error function, which used energy efficiency as the rewards. The gra- dient descent method was used to train the weights of DNN, and the reverse training process of the algorithm was com- pleted. The simulation results show that the proposed algorithm can determine optimization extent of optimal resource allocation scheme with rapid convergence ability, it is obviously superior to the other algorithms in terms of transmission rate and system energy consumption optimization. Key words: cellular networks, resource allocation, deep reinforcement learning, neural network 1 引言 随着无线网络中通信设备数量的急剧增加和 业务需求的多样化,有限的频谱资源与人们日益增 长的无线频谱需求之间的矛盾日渐突出和加剧。当前无线通信领域面临着智能化、宽带化、多元化、综合化等诸多技术挑战,无线网络环境变得日益复杂多样和动态多变,此外,绿色网络和智慧网络等新概念的提出,使频谱资源管理的优化目标日趋多样化,因此,如何优化频谱利用,最大限度地实现收稿日期:2019?01?19;修回日期:2019?02?15 通信作者:严少虎,youngtiger@https://www.360docs.net/doc/5713184798.html, 基金项目:国家自然科学基金重点资助项目(No.61631015) Foundation Item: The Key Project of National Natural Science Foundation of China (No.61631015)

相关文档
最新文档