基于2D Mesh的NoC路由算法设计与仿真

合集下载

片上网络可重构路由算法的开题报告

片上网络可重构路由算法的开题报告

片上网络可重构路由算法的开题报告一、选题背景和意义随着芯片制造工艺的不断发展和集成度的提高,片上网络(NoC)已成为面向多核系统的通信架构。

相比传统的总线或交叉开关网络,片上网络的通信带宽更大、延迟更小、可靠性更高,因此在高性能计算、通信、嵌入式系统等领域有着广泛应用。

然而,随着系统规模的扩大,传统的路由算法在网络拓扑结构复杂、路由表规模大等方面面临着挑战。

因此,如何提高片上网络的路由性能成为了一个重要的研究课题。

可重构技术是一种重要的解决方案,可以根据应用场景和网络拓扑结构来灵活地调整路由算法,以适应不同的需求。

二、研究内容和目标本论文将研究基于可重构技术的片上网络路由算法。

具体来说,研究内容包括:1. 基于可重构技术的片上网络路由算法设计与实现。

通过设计可重构的路由器和路由表,实现灵活可调的路由算法。

2. 基于不同应用场景和网络拓扑结构的路径搜寻策略。

根据应用场景和网络拓扑结构的特点,设计不同的路径搜寻策略,以实现更高效的路由。

3. 路由算法的优化与测试。

针对不同应用场景和网络拓扑结构,优化路由算法,实现更高效的路由。

同时进行实验测试,验证算法的性能和可扩展性。

本论文的目标是提出一种适用于不同应用场景和网络拓扑结构的高效灵活的可重构片上网络路由算法,以提高片上网络的通信性能和可靠性。

三、研究方法和进度安排本研究采用以下研究方法:1. 文献研究:对相关文献进行深入研究,了解当前片上网络路由算法的发展状况和存在的问题。

2. 算法设计与实现:设计可重构的路由器和路由表,实现灵活可调的路由算法。

3. 路径搜寻策略设计:根据不同应用场景和网络拓扑结构的特点,设计不同的路径搜寻策略,以实现更高效的路由。

4. 优化与测试:针对不同应用场景和网络拓扑结构,优化路由算法,实现更高效的路由。

同时进行实验测试,验证算法的性能和可扩展性。

预计的进度安排如下:第一年:设计可重构的路由器和路由表,实现灵活可调的路由算法。

2DMesh片上网络分区容错路由算法

2DMesh片上网络分区容错路由算法

2DMesh片上网络分区容错路由算法作者:胡哲琨杨升春陈杰来源:《计算机应用》2016年第05期Abstract: In order to reduce the entries of routing tables and avoid using large numbers of Virtual Channels (VC), a Regionbased Fault Tolerant Routing (RFTR) algorithm was proposed for wormhole switching 2D Mesh Network on Chip (NoC) to reduce the amount of hardware resources. According to the positions of faulty nodes and links, the 2D Mesh network was divided into several rectangular regions. Within each region the packet could be routed by deterministic or adaptive routing algorithms, while among these regions the routing path was determined by up*/down* routing algorithm. Besides, with the Channel Dependency Graph (CDG) model, the proposed algorithm was proved to be deadlockfree using only two VCs. In a6×6 Mesh network, the RFTR algorithm can reduce the amount of routing table resources by 25%. Simulation results show that, with the same amount of buffer resources, the RFTR algorithm can achieve an equivalent or even higher performance compared to up*/down* and segmentbased routing algorithms.Key words:Network on Chip (NoC); fault tolerant routing; deadlock avoidance;routing table; Channel Dependency Graph (CDG)0 引言随着集成电路工艺技术的发展,芯片内部可集成的IP核数目不断增加,出于对可扩展性、连线延时和功耗等因素的考虑,片上网络(Network on Chip, NoC)逐渐成为多核间通信的主流方式。

面向NoC的无死锁路由算法的研究的开题报告

面向NoC的无死锁路由算法的研究的开题报告

面向NoC的无死锁路由算法的研究的开题报告一、研究背景随着处理器芯片的发展,集成的处理器数量越来越多,单个处理器显然已经不能满足处理大量数据的需求。

针对这一问题,研究人员开始探索如何在一个芯片上集成多个处理器,这就出现了多处理器系统(Multiprocessor System-on-Chip,MPSoC)。

在MPSoC中,处理器通过网络互连,数据在网络中传递,因此网络通信的性能和可靠性至关重要。

On-Chip Network(NoC)作为一种纽带,负责处理器之间的通信,已经成为了现代MPSoC架构中最重要的组成部分之一。

在NoC中,最常用的路由算法是基于最短路径的迪杰斯特拉(Dijkstra)算法。

该算法是基于收敛的无死锁路由基础,通常会在路由时引入一些虚拟通道,以避免死锁。

虚拟通道确实可以有效地解决死锁问题,但是另一方面,它们又会增加芯片面积和功耗。

因此,如何在不引入虚拟通道的情况下保证无死锁路由是NoC研究领域中的一个热门话题。

二、研究目的本研究旨在探索面向NoC的无死锁路由算法,以提高路由性能和网络可靠性。

具体的研究目标包括以下几点:1.调研目前常用的无死锁路由算法及其优缺点,并确定研究重点。

2.设计面向NoC的新型无死锁路由算法,并提出可行的方案。

3.通过仿真验证算法的有效性和性能,并对比不同算法之间的优缺点。

三、研究内容1. NoC网络结构及路由算法概述本章将介绍On-Chip网络的概念和作用,例如NoC中一些常见的网络结构和路由算法,并分析它们的优缺点和适用情况。

2.分析无死锁路由算法的现状本章将对目前常用的无死锁路由算法进行归纳,分析其优缺点,并决定研究的重点。

3.设计新型无死锁路由算法在前两个章节的基础上,本章将提出一种新的无死锁路由算法,并设计相应的算法逻辑和数据结构。

4.仿真分析算法的有效性和性能通过仿真验证新算法的有效性和性能,并与传统算法进行对比分析。

四、研究意义本研究旨在解决NoC中路由算法存在的死锁问题,提高网络通信性能和可靠性。

一种基于2D—mesh的低延迟NoC路由算法设计

一种基于2D—mesh的低延迟NoC路由算法设计
ቤተ መጻሕፍቲ ባይዱ
方体(ye b ) hpr ue 以及蜘蛛网( i r n 等。图 1 c sdg ) peo 所示的 是基于经典的2 .e 结构的 N C模型。此外, Dm s h o 由于在规
传统总线架构带来的问题。 o N C不仅提供了良好的空问可
国 家 自然科 学 基 金 资 助 项 目(o6 86 2 )安 徽 省 自然 科 学 基 N . 708, 0
机制、 由算法 、 路 拥塞控制、o( Q S服务质量 ) 和路由器结构
等6 个方面, 而片上网络的路由算法就是研究关键问题之

的规模川 。当单个芯片上集成了成百上千个 I 核时, P 传统
的基于共享总线机制的片上系统 f s mO. i.o) s t .lh SC通 ye i p c 信架构遇到了严峻的挑战, 主要表现在片上系统的可扩展 性问题变得突出, 有限的资源空间问题 日 益成为扩展系统
1 引 言
随着半导体特征尺寸的缩小和集成电路工艺技术的 发展, 预计在未来若干年内, 电子元件的特征尺寸将达到
3 m甚至 2 m.并且在集成电路上将有数十亿晶体管 2l l 2l i
扩展性, 还提供 了很好的并行通信能力, 从而提高了数据
吞吐率和网络性能。 NC的互连技术的主要研究内容有: o 拓扑结构 、 交换


囊。
研究与开发

种基 于 2 — s D me h的低 延迟 N C路 由算法设计 o
欧 阳一 鸣 ’丁 同柱 ’梁 华 国 ’谢 , , , 涛 1 , 2 (. 1 合肥 工业 大 学计算机 与信 息 学 院 合 肥 2 0 0 : 3 0 9 2 美 国加利 福尼 亚 圣地 亚哥 州立 大学计算机 科 学 系 圣地 亚哥 9 12 . 28 )

基于双通道的NoC路由器系统级设计

基于双通道的NoC路由器系统级设计

Vo. 2 N . 11 o 1 Ma . 0 2 r 2 1
基 于双 通 道 的 N C路 由器 系统 级 设 计 o
段 丽芬 , 吴 宁
( 南京航空航天大学 电子信息工程学 院, 江苏 南京 20 1 ) 10 6
[ 摘要 ] 为提高路南器的并行处理能力, 减少传输延时, 提出并设计了一种包含 G 通道与B T E通道的双通道路由器.T通道 G
o h y t mC l tom ,a d a o t heXY— me so a o i ga g ihm ,t l n r irto nd t wic o to n t e S se p afr n d p st di n in lr utn lort hepol g a btain a hes t h c nr l i
f b i t e l e t e G aa p c e sa d B aa p c es t n mi i g p r l 1 a r o r ai h T d t a k t n E d t a k t r s t n a al . c z a t e Ke r s ewo k o h p,t — h n e r ue ,S se y wo d :n t r n c i wo c a n l o tr y t mC
Ba e n y t m v l s d o S se Le e
Du n Lf n, u Nig a i e W n
( ol eo Eet ncIfr t nE gnei ,N nigU iesyo eoa t s n so at s N mig20 1 ,C ia C lg f l r i nomao nier g aj nvri f rnui dA t nui , a n 10 6 hn ) e co i n n t A ca r c

高性能NoC路由器结构研究的开题报告

高性能NoC路由器结构研究的开题报告

高性能NoC路由器结构研究的开题报告一、研究背景及意义近年来,随着SoC(System on Chip)集成度的不断提高,大规模集成电路中网络互连的设计与实现变得日益复杂。

在诸多的互联方案中,网络-on-chip(NoC)逐渐成为一种主流的互连结构。

NoC使用一个分布式的通信系统来实现系统中的各个功能模块之间的数据交换,有助于提高系统的可维护性、可靠性和程序的并发性等特性。

NoC系统中的核心组件是路由器,它决定着数据包的转发、缓存和调度等关键参数。

因此,高性能NoC路由器的设计是一个具有理论和实际意义的重要课题。

目前,NoC路由器的研究主要集中在以下方面:路由算法、拥塞控制、缓存技术、核心处理器接口等。

这些研究工作为NoC系统设计和优化提供了很好的基础和指导,但还需要进一步探索高性能NoC路由器的结构方面的问题。

因此,本文将研究高性能NoC路由器的结构,分析其关键因素对路由性能的影响,以期为NoC系统的设计和实现提供新的思路和方法。

二、研究目标本文旨在研究高性能NoC路由器的结构,探索如下问题:1. 分析高性能NoC路由器的结构特点和需求。

2. 研究高性能NoC路由器结构因素对路由性能的影响。

3. 提出有效的高性能NoC路由器结构优化方法。

三、研究内容本文的研究内容主要包括以下几个方面:1. 阅读相关文献,分析高性能NoC路由器的结构特点和需求。

2. 研究高性能NoC路由器的核心组件,包括:输入端口(input port)、输出端口(output port)、路由计算单元(routing computation unit)和缓存单元(buffer memory)。

3. 分析高性能NoC路由器结构因素对路由性能的影响,包括:链路带宽、拥塞状况、缓存大小、路由算法等。

4. 提出高性能NoC路由器的结构优化方法,尝试解决实际场景中的路由器性能瓶颈问题。

5. 通过仿真实验验证所提出的优化方法的有效性。

四、研究方法本文主要采用文献研究的方法,收集和分析现有高性能NoC路由器的研究成果,探讨其结构特点和需求。

NoC_MPSim:基于片上网络通信架构多核仿真平台

NoC_MPSim:基于片上网络通信架构多核仿真平台

Absr c : A o fg r besmu ai np afr - No MPS m sp o o e h sp p r o x lrn sg p c ta t c n u a l i l t l t m- i o o C i i r p s d i t i a e re p o gt de in s a e n f i he
N C M Sm o — P i。该平 台包含处 理器工具链 、 台 自动化 配置脚 本以及 一个 包含 处理器 、 平 网络适 配 器以及 多
种路 由器的 R L 型库 , T模 可根据 用户输 入 的 系统 配置信 息 自动生 成周期精 确 的多核 仿真 系统 。针 对 片 上 网络 通信 架构 的特 征 , 定义 了基 于该 通信 架构 的 多核 系统 的 高层 次通 信抽 象模 型 , 并借鉴 并行机 中
的 消息传递机 制 , 出了一种可有 效 隐藏 网络乱序 的并行 编程模 型 及其 通信原 语 , 完成 其所 需要 的 提 并
软\ 硬件 建模 。 用提 出的编程模 型 , 应 实现 了 MSC算法基 于四核 仿真 系统 的分布式 并行计 算 , UI 并经 实 验得到 该并行 M SC算 法在 该 系统 中加速 比可达 2 6 UI .。 关键字 : 片上 多处理器 ; 片上 网络 ; 编程 模型 ; 通信抽 象
— —
o C— a e li o es se f No b s d Mu t -c r y t m. Th l t r whih c n an h r c s o o lc i , a c n g ain s rp n ep af m c o ti st ep o e s rto han o o f urto c i ta d a i RTL mo e ir r n l d n r c s e s newo k a p o sa d r u e s i b et e e aeac ce a c r t l —c r d ll a yi cu i gp o e s r , t r da tr n o tr , sa l og n r t y l c u aemu t o e b i smu ai n s se a c r i o i p tp r mee s A g e e o i lto y t m c o dng t n u a a tr . hih lv lc mmu ia in mo e s as e n d b s d o h s n c t d li lo d f e a e n t i o i c mmu ia in a c ie tr , nd b s d o t a al l r ga o n c t r h tcu e a a e n i,ap l o r mmi g mo e nd i o o r ep n d la t c mmu ia in p i tv s s n c t rmi e ,wh c o i ih c n efc iey s le t e o t o-o d rp o l m, a e r aie t o wae h d r n r sr cu e Ba e n t i a fe t l ov h u — f r e r b e v r e lz d wih s f r / a wa e i fa tu t r . t r s d o h s po a rg mmi gmo e, e ie p al l r n d l wer a z a l l r e MUS C a t me i n a4 o es se a dp o et es e s2. I r h t i -c r y tm, n r v h pe dupi 6. i c Ke r s: li r c s o y tm- n— p; t r —o — i ; o a y wo d Mu t -P o e s rS se o — Chi Newo k —n— Ch p Pr g mmi gmo e; mmu iai na src r n d l Co n c to b ta t

2D-Mesh结构片上网络无虚通道容错路由算法

2D-Mesh结构片上网络无虚通道容错路由算法

2D-Mesh结构片上网络无虚通道容错路由算法姚磊;蔡觉平;李赞;张海林;王韶力【摘要】10.3969/j.issn.1001-2400.2012.06.005% 为了解决单故障节点情况下片上网络的无虚通道容错通信问题,提出一种新的片上网络容错路由算法.该算法在已有算法绕行思想的基础上,首先利用内建自测试机制获取故障节点的位置信息,再通过辅助节点来优化数据的绕行策略,达到了均衡故障节点周围链路负载并减少部分数据的绕行距离的目的.针对8×82D-Mesh网络的仿真结果表明,与Zhang摧s算法和Chen摧s算法相比,采用本文算法后网络的饱和注入率分别提高了3畅13%和21畅77%,在注入率为0.09时网络的通信功耗分别降低了3畅40%和5畅57%.【期刊名称】《西安电子科技大学学报(自然科学版)》【年(卷),期】2012(000)006【总页数】8页(P26-33)【关键词】容错;无死锁;片上网络;虚通道【作者】姚磊;蔡觉平;李赞;张海林;王韶力【作者单位】西安电子科技大学综合业务网理论及关键技术国家重点实验室,陕西西安 710071;西安电子科技大学宽带隙半导体国家重点实验室,陕西西安 710071;西安电子科技大学综合业务网理论及关键技术国家重点实验室,陕西西安710071;西安电子科技大学综合业务网理论及关键技术国家重点实验室,陕西西安710071;西安电子科技大学综合业务网理论及关键技术国家重点实验室,陕西西安 710071【正文语种】中文【中图分类】TP302随着内核数目的增加和特征尺寸的缩小,NoC中的串扰、耦合和电磁干扰等负面效应愈发明显,从而降低了NoC芯片的可靠性.具有容错能力的NoC路由算法可以有效降低NoC对各种干扰的敏感性,进而提高芯片的成品率,减少制造成本,成为近年来NoC研究的热点技术之一.针对NoC的容错路由算法可分为两类:使用虚通道(Virtue Channel)技术的路由算法[1-3]和无虚通道的路由算法[4-6].文献[7]的研究表明,与无虚通道的路由节点相比,使用虚通道技术的路由节点的逻辑门数目增加了1到2倍,建立时延增加了将近1倍.因此,无虚通道的路由算法更适用于对功耗和成本要求较为严格的NoC芯片中.Chen在文献[4]中提出一种Mesh结构NoC无虚通道容错路由算法(简称为Chen’s算法),该算法用于解决单故障节点容错时存在绕行规律性不强,网络负载不均衡的问题,如图11(a)所示.Zhang在文献[6]中提出了一种针对Mesh结构NoC 的单故障节点容错算法(本文简称为Zhang’s算法),如图11(b)所示,该算法在无故障区域使用XY算法,在绕过故障节点时通过禁止数据在东北角的转弯来避免死锁.Zhang’s算法绕行规律性较强,算法复杂度低,但存在绕行环路上负载较重的问题,影响了NoC的性能.针对Chen’s算法和Zhang’s算法存在的不足,笔者提出一种2D-Mesh无虚通道单故障节点容错路由算法,该算法以Zhang’s算法的绕行思想为基础,在BIST 获取的故障区域信息的基础上通过优化数据绕行策略来均衡故障区域周围链路负载,减少部分数据的绕行距离,保留了Zhang’s算法路由规则简单,绕行规律性强的特点,可有效减少单故障节点NoC的容错通信时延,降低芯片的路由功耗.分析和仿真结果证明了该算法的可行性和有效性.2D-Mesh片上网络的容错结构模型如图1所示,该网络模型由节点及节点间的连接边组成,其中节点分为正常节点和故障节点两种类型.当连接边的两端均为正常节点时,该边为正常边;否则,为失效边.与故障节点相邻的正常节点及正常边构成的环路称之为绕行环路.当故障节点位于Mesh网络的内部时,绕行环路为一个封闭的环;当故障节点位于网络的边或顶点时,绕行环路变为非封闭的链路.在本文中将这两种情况统称为绕行环路.用N NE、N NW、N SE和N SW分别表示绕行环路的东北、西北、东南和西南4个顶点.C、S、D和A分别代表当前节点、源节点、目的节点和故障节点.NoC节点按照功能可分为路由模块和本地单元,本文算法的节点结构如图2所示. 本文算法包括数据沿X轴方向的绕行方法和沿Y轴方向的绕行方法两部分.S与D的相对位置如下列情况时,数据会沿X方向遇到绕行环路:(1)S和D均位于绕行环路所在行(y A-1≤y S≤y A+1,y A-1≤y D≤y A+1)且分别处于A的东西两侧(x D<x A<x S或x S<x A<x D),D不在绕行环路上(x D<x A-1或x D>xA+1);(2)S位于绕行环路所在行,D位于故障区域所在列(x A-1≤x D≤x A+1).对于第1种情况,按Zhang’s算法,数据在绕过故障节点的过程中需要经过绕行环(链)路上的NW(SW)和NE(SE)两个顶点,到达第2个顶点后按照XY算法传输到目的节点D,如图3中S 1到D 1和D 2,S 2和S 3到D 5的传输路线(实线箭头所示).对于第2种情况,按Zh ang’s算法,若故障节点位于数据按照XY算法从当前节点C到目的节点D的传输路线上,则数据需要绕过故障节点A到达绕行环路上与D 同侧且纵坐标相同的节点,然后按XY算法传输,如图3中S 1到D 3,S 2和S 3到D 4的传输路线(实线箭头所示).需要注意的是,由于Zhang’s算法禁止在绕行环路东北角转弯,源节点S满足x S≥x A+1且y A-1≤y S≤y A,目的节点D满足xD≤x A且y D≥y A+1时,增加了数据的路由距离,还加剧了绕行环路上的拥塞.本文算法的优化如下:增加坐标为(x A+2,y A-1)和(x A+2,y A)的2个辅助节点,并增加坐标为(x A+2,y A+1)的辅助拐点,辅助节点存有通过BIST机制获得的故障节点A的坐标,辅助拐点的作用是改善部分数据因不能在绕行环路东北角转弯而出现绕行距离过长的问题.当数据到达辅助节点后根据目的节点D的坐标来判断下一步的路由方式,若满足x D≤x A且y D≥y A+1,则将数据沿Y轴向辅助拐点传输,并在到达后继续按照XY算法路由;否则,继续按照Zhang’s算法路由,如图3中S 2和S 3到D 4和D 5虚线所示的传输路线.在引入辅助拐点后,数据会沿着以NW,SW,辅助节点(x A+2,y A-1)和辅助拐点为顶点的矩形形成逆时针的环路,进而导致死锁.由于NW,SW和辅助拐点为绕行必需的节点,因此只能通过禁止数据在辅助节点(x A+2,y A-1)处由东向北的转弯来避免死锁的形成.根据Zhang’s算法,源节点和目的节点的相对位置满足x S<x A,y S=y A且x D=x A+2,y D=y A以及x S≤xA+1,y S=y A-1且x D=x A+2,y D≥y A时,数据才会在辅助节点(x A+2,y A-1)处由东向北的转弯.对此本文算法改进如下:若源节点和目的节点的相对位置满足在节点(x A+2,y A-1)处由东向北的转弯,则当x S<x A时数据到达绕行环路后按顺时针传输,在到达NE节点后按照XY算法路由;当x S=x A或x A+1时,数据沿绕行环路逆时针传输,在到达NE节点后按照XY算法路由.对于m×n的2D-Mesh NoC,当故障节点坐标满足1<x A≤n-2且1<y A≤m-1时,存在2(n-x A-1)×[x A(m-y A)]个符合优化条件的源-目的节点对.算法流程如图5(a)所示.与D的相对位置关系如下时,数据会沿Y方向遇到绕行环路:D和S分别位于故障区域南北两侧(y S>y A+1,y D<y A或y S<y A-1,y D>y A),且D位于故障节点所在列.数据沿Y方向绕行过程中,按Zhang’s算法,数据先沿着X方向到达目的节点所在列,再沿Y方向到达绕行环路并顺其左半周绕过故障节点,如图4中实线箭头所示传输路线.在这个过程中,数据沿着X方向多次进行180°转向,不仅增加了绕行距离,也使得绕行环路左半周负载较重.本文算法的优化如下:将坐标满足y<y A-1,x A-1≤x≤x A+2或y>y A+1,x A-1≤x≤x A+1的节点定义为辅助点,辅助拐点坐标为(x A+2,y A+2).数据在路由过程中,若发现当前节点C为辅助节点,则调整路由方式为:(1)若当前辅助节点C的横坐标xC=x A+2,目的节点D坐标为x A-1≤x D≤x A+1且y D≥y A+1,则将数据沿Y 轴向辅助拐点传输,并在到达后继续按照XY算法路由;(2)若当前辅助节点C坐标为y C<y A-1,x A-1≤x C≤x A+1,目的节点坐标为x D=x A,y D>y A,则数据先以XY 算法向SW节点传输,再按Zhang’s算法绕行;(3)若当前辅助节点C坐标为y C>y A+1,x A-1≤x C≤x A+1,目的节点坐标为x D=x A,y D<y A时,分两种情况,若x C=x A-1,数据先以XY算法向NW节点传输,再按Zhang’s算法绕行,否则,数据先以XY算法向NE节点传输,再按Zhang’s算法绕行;(4)不满足前3种条件时,按照Zhang’s算法路由.如图4中虚线所示的传输路线.对于m×n的2D-Mesh NoC,当故障节点坐标满足1<y A<m-1时,网络中存在[(y A-2)n(m-y A)+(m-y A-1)n(y A-1)]个符合优化条件的源节点-目的节点对.算法流程如图5(b)所示.定义1 NoC可视为一强联通有向图I=G(N,C),其中N表示网络I中所有路由节点的集合,C为所有路由节点间有向通道的集合.任意相邻的两个路由节点均由一对方向相反的通道(cai,c bi)相连,下标i为该通道对所对应路由节点的编号,下标a,b为通道的指向,其中a表示通道指向坐标增加的方向,b则相反.定义2 给定网络I,路由算法R的作用是将数据从当前通道cpi,p∈{a,b}及节点n d 映射到目的通道cqj,q∈{a,b},即R(c pi,n d)=cqj,p,q∈{a,b},其中n d为c pi所指向的节点.如果存在R(c pi,n d)=cqj,p,q∈{a,b},则称c pi到c qj存在通道依赖.根据本文算法的特点,若R(x pi,n d)=x qj或R(y pi,n d)=y qj,i≠j.定义3 对于存在一个故障节点的2D-Mesh网络I可分为两个部分I 1和I 2.其中I 1为包含绕行环路及辅助拐点在内的最小矩形网络,在该矩形网络内因绕行需要,存在从Y到X方向的转弯;I 2为网络I中除I 2外的部分.引理1 给定的网络I和算法R生成的通道依赖图D,若D中不存在环,则R在网络I 中是无死锁的.证明 Duato在文献[8]中已证明.引理2 对于无故障的2D-Mesh结构NoC网络,采用本文算法是无死锁的.证明对于无故障的2D-Mesh,本文算法等效于XY算法.由XY算法的规则可知其对应的通道依赖图D中不存在环,由引理1可知在2D-Mesh中采用XY算法是无死锁的.引理3 图6(a)所示的网络I 1,在本文算法R下是无死锁的.证明假设故障节点A的坐标为(s,t),按照Zhang’s算法,禁止数据在绕行环路东北角的转弯,如图6(b)所示,则禁止了边x a(s+1,t)到y b(s,t+1)转弯,在本文算法中为了避免死锁禁止了边x a(s-1,t+1)到y a(s-1,t+2)的转弯,并增加了从边y a(s,t+1)到x a(s+1,t+1)以及y a(s,t+2)到x b(s+1,t+1)的转弯.因为边的数目有限,采用穷举法可以证明图6(b)中的边无法形成环路,由引理1知,网络I采用本文算法R是无死锁的.同理可证,A位于网络边沿时对应的I 1在本文算法R下是无死锁的.定理1 对于最多存在一个故障节点的2D-Mesh结构NoC网络,采用本文算法是无死锁的.证明若无故障节点,由引理2可知,该命题成立.若存在一个故障节点,则等效于证明网络I中存在I 1时整个网络是无死锁的.用反证法.假设存在一个故障节点时,I的通道依赖图中存在一个环,则该环上的节点根据位置关系可分为3种情况:(1)环上的节点均位于I 2内;(2)环上的节点均位于I 1内;(3)环上的节点一部分位于I 2内,另外一部分位于I 1内.由引理2可知,情况(1)不成立.由引理3可知,情况(2)不成立.对于情况(3),若环存在,则需要满足:环路上的一条边从I1内离开后能与I 2内的其它边组成一条可再次回到I 1的链路.由引理2的证明过程可知,在X或者Y方向上不存在这样的链路,而在I 2构成的二维网络内,由于禁止了Y方向边到X方向边的转弯,因此也不存在这样的链路.即情况(3)不成立.综上,假设不成立,即对于最多存在一个故障节点的2D-Mesh结构网络,采用本文算法是无死锁的.仿真采用OPNEC-Sim[9]仿真软件,该软件以OPNET的网络仿真引擎为基础,针对NoC的特点在进程域,节点域和网络域建模,构成了一个用于仿真NoC网络性能的专用平台.仿真分为静态分析、动态分析和功耗分析3部分.文献[10]中提出了一种静态分析方法,为了能更准确地比较不同容错路由算法下NoC中的性能差异,引入静态分析的均值和方差σ2的概念,其中,均值是每个节点平均转发数据包的个数,反映了当前算法中所有源-目的节点对的平均端到端距离.方差σ2反映了节点转发数据包个数偏离均值的程度,反映了当前算法对应的节点负载的均衡状况.对8×8的2D-Mesh NoC分别采用Chen’s算法,Zhang’s算法以及本文算法进行静态分析,故障节点坐标为(4,5),结果如图7所示.与Che n’s算法和Zhang’s算法相比,本文算法能有效均衡故障周围节点的负载强度,使得故障周围节点的负载分布趋于对称.静态分析结果的均值和方差σ2如表1所示.本文算法得到的均值和方差均优于采用Zhang’s算法和Chen’s算法得到的结果,且随着NoC网络规模的扩大本文算法的优势会更明显.当网络为8×8时,与本文算法相比,Chen’s算法和Zhang’s算法静态分析结果的均值分别增加了7.86%和1.52%,方差σ2分别增加了147%和16%.为了评估本文算法的动态性能,仿真参数设置如下[12]:(1)整个NoC网络使用虫孔交换方式进行数据包的传递,数据包由微片(flit)组成,微片为数据交换的最小单位,每个节点以注入率α向网络中发送微片.(2)数据包的目的节点服从均匀分布.(3)每个节点发送的数据包相互独立,数据包的发送间隔服从指数分布,且参数λ=1/(1.25×103α).(4)每个节点在本地输入方向上的缓存无限大,目的节点能够快速处理收到的数据包.(5)每个输入信道的缓存大小为4flit,每个数据包由4个flit构成.对于每个注入率仿真时间持续30000 cycles,前10 000 cycles不计入仿真结果.在8×8的2D-Mesh网络中随机生成故障节点,仿真算法为本文算法,Zhang’s算法和Chen’s算法,仿真500次所得到的结果求均值.仿真结果如图8所示,与Zhang’s算法和Chen’s算法相比,采用本文算法可有效减少NoC的网络时延,且随着注入率的增加本文算法的优势更为明显.定义最低时延的两倍大小为饱和时延,饱和时延对应的注入率为饱和注入率.与Zhang’s算法和Chen’s算法相比,采用本文算法可以将NoC的饱和注入率分别提高3.13%和21.77%.改变故障节点位置,将故障点分别取在(3,4),(0,4)和(0,0),即故障节点分别位于网络中心、网络边沿上和网络的顶点时,仿真结果如图9所示.当故障节点位于网络中心部分时本文算法优势较为明显,这是由于故障节点位于网络中心时满足优化条件的源-目的节点对数目最多,算法的效果最为明显.当故障节点位于网络顶点时不存在满足优化条件的源-目的节点对,此时本文算法与Zhang’s算法性能相同.与Zhang’s算法和Chen’s算法所需的路由器[6]不同,本文算法在每个端口增加故障坐标存储器,如图2所示.功耗仿真环境为Orion2.0[1-2],参数设置如下:路由器采用65 nm工艺,工作频率为500 MHz,工作电压为0.8 V,每个端口输入缓存大小均为128 bit,本文算法所需的故障坐标存储器为32 bit,节点之间的连线长度为2.5 mm,其它参数采用默认值.NoC大小为8×8,故障节点位置为(4,5).本文的路由功耗仿真采用文献[13]中的思想方法,功耗分析结果如表2所示.虽然增加了32bit的故障坐标存储器,但是本文算法能够改善数据包在故障节点周围的拥塞以及减少平均端到端距离,其路由功耗在3种算法中最少.在注入率为0.09时,与Zhang’s算法和Chen’s算法相比,实现本文算法所需的通信功耗分别降低了3.40%和5.57%.本文针对Zhang’s算法和Chen’s算法的不足,提出了一种基于故障预测的2D-Mesh结构NoC无虚通道容错路由算法,该算法通过NoC的BIST机制获取故障节点位置信息,再通过辅助节点来优化数据的绕行路线,能有效降低NoC的网络通信时延.本文算法具有Zhang’s算法简单,绕行规律性强,无死锁的特点,还能降低网络的平均端到端时延.仿真表明,随着故障节点位置的变化,本文算法的时延性能优于Zhang’s算法和Chen’s算法,且随着网络规模的增加这一优势更加明显.同时,与Zhang’s算法和Chen’s算法相比,实现本文算法需要的功耗更少.【相关文献】[1]Rameshan N,Laxmi V,Gaur M S,et al.Minimal Path,Fault Tolerant,QoS Aware Routing with Node and Link Failure in 2-D Mesh NoC[C]//Proc of the 2010 25th IEEE International Symposium on Defect and Fault Tolerance in VLSI Systems.Los Alamitos:IEEE Computer Society,2010:60-66.[2]Seyrafi M,Asad A,Zonouz A E,et al.A New Low Cost Fault Tolerant Solution for Mesh Based NoCs[C]//2010 International Conference on Electronics and Information Engineering.Piscataway:IEEE,2010:207-213.[3]Duan Xinming,Sun Xuemei.Fault-tolerant Routing in A PRDT(2,1)-based NoC[C]//2010 2nd International Conference on Computer Engineering andTechnology.Piscataway:IEEE,2010:506-510.[4]Chen K H,Chiu G M.Fault-tolerant Routing Algorithm for Meshes Without Using Virtual Channels[J].Journal of Information Science and Engineering,1998,14(4):765-783.[5]Fukushima Y,Fukushi M.Fault-Tolerant Routing Algorithm for Network on Chip without Virtual Channels[C]//2009 IEEE International Symposium on Defect and Fault Tolerance in VLSI Systems.Piscataway:IEEE,2009:313-321[6]Zhang Z,Greiner A,Taktak S.A Reconfigurable Routing Algorithm for a Fault-Tolerant2D-Mesh Network-on-chip[C]//45th ACM/IEEE Design AutomationConference.Piscataway:IEEE,2008:441-446.[7]Chien A A.A Cost and Speed Model for k-ary n-Cube Wormhole Routers[J].IEEE Trans on Parallel and Distributed Systems,1998,9(2):150-162.[8]Duato J.A Theory of Fault-Tolerant Routing in Wormhole Networks[J].IEEE Trans on Parallel and Distributed Systems,1997,8(8):790-802.[9]Cai Jueping,Huang Gang,Wang Shaoli,et al.OPNEC-Sim:an Efficient Simulation Tool for Network-on-Chip Communication and Energy Performance Analysis[C]//International Conference on Solid-State and Integrated Circuit Technology2010.Piscataway:IEEE,2010:1892-1894.[10]Lin Shuyen,Huang Chunhsiang,Chao Chihhao,et al.Traffic-Balanced Routing Algorithm for Irregular Mesh-Based On-Chip Networks[J].IEEE Trans on Computers,2008,57(9):1156-1168.[11]Kiasari A E,Rahmati D.A Markovian Performance Model for Networks-on-Chip.Parallel[C]//Proc of the 16th Euromicro Conference on Parallel,Distributed and Network-Based Processing.Piscataway:IEEE,2008:157-164.[12]Kahng A B,Li B,Peh L S,et al.Orion 2.0:a Fast and Accurate Noc Power and Area Model for Early-Stage Design Space Exploration[C]//2009 Design,Automation&Test in Europe Conference&Exhibition.Piscataway:IEEE,2009:423-428.[13]Merkel A,Bellosa F.Task Activity Vectors:a New Metric for Temperature-Aware Scheduling[C]//Proc of the EuroSys 2008 Conference.New York:ACM,2008:1-12.。

一种不规则2DMesh的NoC路由算法

一种不规则2DMesh的NoC路由算法
徐 欣, 王长 山
( 西安 电子科技大 学计算机 学院 , 陕西 西安 7 07 ) 10 1
摘要 : o N C的网络 拓扑结构是其研 究的重要方 面, 一些 实际应用 中, o 在 N C系统通 常集 成 多个不 同功能 、 同尺 寸、 同 不 不 通讯 需求的组 件 , 而规则 的拓 扑结构 并不适应 于在 这种 类型 的 N C 中应用 , o 因此不规 则 M s eh网络被 应用 于不规则 的 N C系统 , o 为解 决规 则 Meh路 由算 法在不规则 M s s eh中无法保证路 由连 通性 问题 。 出一种不规 则 Meh无 死锁路 由算 提 s
21 00年第 5期
文 章 编 号 :062 7 (0 0 0 -1 1 4 10 -4 5 2 1 )50 1 - 0
计 算 机 与 现 代 化 JS A U U X A D I U IU 1 Y I N A H A
总第 17期 7

种 不 规则 2 s D Meh的 N C路 由算 法 o
Ke r s n t o k o hp;r u n g rtm ;irg l D Me h y wo d : e r n c i w o t ga oi i l h re a 2 s u r
0 引 言
近年 来 , 种 全 新 的 集 成 电 路 体 系 结 构—— 一
法, 同时此算法与其他算法相比, 具有更少的虚 通道 和更优秀的路 由路 径选择 。
关键 词 : 片上网络 ; 由算法 ;不规则 2 s 路 DMeh 中图分类号 :P 9 T 33 文献标识码 : A d i 0 3 6/.sn 10 -45 2 1 .5 02 o:1. 99 ji .0 62 7 .0 0 0 .3 s

一种基于3Dmesh的NOC路由算法设计与分析

一种基于3Dmesh的NOC路由算法设计与分析

系列 问题 : 扩展性 差 、 可 总线 通 讯效 率 低 、 一 单
时钟 同步等 。N C具 有 良好 的空 间 扩展 性 。 供 o 提
由于 片上 网络 不 同 于传 统 意 义 上 的计 算 机
网络 ,其 拓扑 结构 在设 计 时 要求 应 具 有 对称 、 简
了高 效 的并 行 通 讯 能力 , 以分 组 交换 作 为通 讯 技
在 多个 层 次 , 每个 层 称 为 一个 平 面 (ln ) 利用 pa e ,
在 2 Meh2 T hs 构 ( 图 1 中 , D s/D o i 结 如 ) 节点 相
互 连 接成 一个 M 行 N列 的 阵列 . 或是 M行 N列
三 维 坐标 X、 Z来 定 位 每个 节 点 。通 过 将节 点 Y、
2 1年 第 1 00 2卷 第 6期
总第 1 5期 0
巢 湖 学 院学 报
Ju n l f h o u C l g o r a C a h ol e o e
No6 Vo .22 0 … 1 .01 1 G n r l ei l .0 e e a r 1 5 S a No
术 , 用 全 局 异步 一局 部 同 步 的通 讯 机 制 , 到 采 受
随着 半 导 体 技术 的发 展 。 未来 集 成 系统 将 包 含亿 万个 晶体 管 ,由数 百个 I 组成 。这些 I P核 P 核。 面对 涌 现 出的各种 功 能 复 杂 的多 媒体 和 网络
应 用 ,应 该 能 提 供 丰 富 的 多媒 体 服 务 和 网 络 服
收 稿 1 :0 0 0 — 1 3期 2 1 — 8 1
基 金 项 目: 徽 省 自然 科 学 研 究 项 目( 目编 号 :J0 0 2 3 安 项 K 2 1B 2 )

NoC路由算法

NoC路由算法

NoC路由算法NoC的图谱结构必须保证每个节点可以发送数据包到其他节点。

当没有完善的拓扑结构的时候,路由算法决定数据包从原地址开始选择那⼀条路径到⽬的地址。

所以,有效的数据算法对NoC⽹路性能的好坏是⾄关重要的。

路由算法可以按照不同的标准分为不同的⼏类。

⽐如说源路由(SOurce Routing)和分布式路由(Distrubuted Routing),确定路由(Deterministic Routng)和⾃适应路由(Adaptive Routing)。

确定路由(Deterministic Routing)确定路由是⼀种常见的路由,它的路由路径只与起点地址和终点地址有关,给定起点和终点地址,路由路径就被确定了,与当前的⽹络状态⽆关。

⽽在确定路由中,使⽤最多的就是维序路由(Dimension-Ordered Routing),因为他有着⾮常简单易实现的路由逻辑。

在维序路由中,每个数据包⼀次只在⼀个维上路由,当在这个维上到达了恰当的坐标之后,才按由低维到⾼维的顺序在另外的维上路由。

因为数据包是按照着严格的单调的维数变化的顺序在通道内路由,所以维序路由也是没有死锁的。

按照在不同拓扑结构的⽹络中路由,维序路由包括了2D Mesh中的XY路由和在超⽴⽅体(HyperCube)中的E-cube路由。

XY路由关于XY路由算法的具体原理⽅法,我已经在⼀⽂中有过详细介绍。

具体举例来说,⼀个源地址(1,2),⽬的地址(3,4)的微⽚,采⽤XY路由算法的路径是不会改变的。

(1,2)->(2,2)->(3,2)->(3,4)-(3,4)E-cube 路由E-cube路由和XY路由很相似,都是先在⼀个⽅向(维)上路由,然后再在其它⽅向(维)上路由。

具体来说,前⾯提到了在n维⽴⽅体中,每个节点是⽤⼀个nbit的⼆进制编号表⽰的。

每个节点n条输出的通道,其中第i条通道就对应的第i维。

在E-cube路由算法中,数据包的头部携带了⽬的节点的地址 d。

一种高效NOC路由选择机制的设计

一种高效NOC路由选择机制的设计

一种高效NOC路由选择机制的设计
汪勇; 张蓉; 潘攀; 孟坚
【期刊名称】《《电脑知识与技术》》
【年(卷),期】2012(008)010
【摘要】NOC性能的优劣很大程度上取决与它使用的路由算法,其中包括两大块:输入选择和输出选择。

先前的工作大多是研究如何改进输出选择,现论证输入选择
对于路由效率的影响,并设计一种行之有效的输入选择机制—基于阻塞程度的输入
选择机制。

该机制工作在多个输入同时请求同一个输出时,会自动根据上流路由器
的阻塞程度优先选通阻塞最严重的输入沟道,从而大大减少了网络的阻塞。

实验结
果证明,在不同的通信模式下,不论是与确定性输出选择还是与自适应性输出选择结
合使用,该文设计的输入选择机制在性能上都优于传统的先到先得的输入选择机制。

【总页数】5页(P2232-2236)
【作者】汪勇; 张蓉; 潘攀; 孟坚
【作者单位】安徽大学电子信息工程学院安徽合肥230601
【正文语种】中文
【中图分类】TP302
【相关文献】
1.一种基于2D-mesh的低延迟NoC路由算法设计* [J], 欧阳一鸣;丁同柱;梁华国;谢涛
2.一种基于OPNET的NoC路由算法设计 [J],
3.一种高效NOC路由选择机制的设计 [J], 汪勇;张蓉;潘攀;孟坚
4.一种基于双RNI 3D NoC通信架构的容错路由算法设计 [J], 胡春雷;方杰;毕佳佳
5.一种环形Buffer自适应NoC路由器设计 [J], 韦良芬;张佑生;王勇
因版权原因,仅展示原文概要,查看原文内容请购买。

基于FPGA的2D-Torus片上网络无死锁路由算法

基于FPGA的2D-Torus片上网络无死锁路由算法

收稿日期:2019-11-28基金项目:国家自然科学基金资助项目(61836011)ꎻ中央高校基本科研业务费专项资金资助项目(2020GFYD011ꎬ2020GFZD008).作者简介:李贞妮(1982-)ꎬ女ꎬ辽宁沈阳人ꎬ东北大学讲师ꎬ博士ꎻ李晶皎(1964-)ꎬ女ꎬ辽宁沈阳人ꎬ东北大学教授ꎬ博士生导师ꎻ王㊀骄(1978-)ꎬ男ꎬ辽宁沈阳人ꎬ东北大学教授ꎬ博士生导师.第42卷第1期2021年1月东北大学学报(自然科学版)JournalofNortheasternUniversity(NaturalScience)Vol.42ꎬNo.1Jan.2021㊀doi:10.12068/j.issn.1005-3026.2021.01.001基于FPGA的2D-Torus片上网络无死锁路由算法李贞妮ꎬ李晶皎ꎬ王㊀骄ꎬ杨㊀丹(东北大学信息科学与工程学院ꎬ辽宁沈阳㊀110819)摘㊀㊀㊀要:片上网络的拓扑结构和路由算法直接影响片上网络的传输延迟和传输效率.基于2D-Torus拓扑结构ꎬ提出了一种新的片上网络无死锁路由算法.通过改变数据包在片上网络路由过程中受限制转弯的位置ꎬ保证片上网络的自适应路由条件ꎬ从而有效降低片上网络的延迟.在FPGA硬件平台上ꎬ设计并实现了基于该路由算法的2D-Torus片上网络ꎬ并对其进行测试.实验结果表明ꎬ基于该路由算法的片上网络ꎬ可以满足片上网络多方向数据通信及多路数据并行通信等性能要求.关㊀键㊀词:2D-Torusꎻ片上网络ꎻ无死锁ꎻ路由算法ꎻFPGA中图分类号:TP393 0㊀㊀㊀文献标志码:A㊀㊀㊀文章编号:1005-3026(2021)01-0001-06Deadlock ̄FreeRoutingAlgorithmof2D ̄TorusNetwork ̄on ̄ChipBasedonFPGALIZhen ̄niꎬLIJing ̄jiaoꎬWANGJiaoꎬYANGDan(SchoolofInformationScience&EngineeringꎬNortheasternUniversityꎬShenyang110819ꎬChina.Correspondingauthor:LIJing ̄jiaoꎬE ̄mail:lijingjiao@ise.neu.edu.cn)Abstract:Thetopologyandroutingalgorithmofnetworkonchip(NoC)directlyinfluencethetransmissiondelayandthetransmissionefficiencyofthenetwork ̄on ̄chip.Anewdeadlock ̄freeroutingalgorithmforNoCwasproposedbasedon2D ̄Torustopology.BychangingthepositionofpacketsthatarerestrictedtoturnduringNoCroutingꎬtheadaptiveroutingconditionofnetwork ̄on ̄chipwasguaranteedꎬandthedelayofnetwork ̄on ̄chipwasreduced.The2D ̄TorusNoCbasedonthisroutingalgorithmwasdesignedandimplementedonFPGAhardwareplatformꎬandthenwastested.TheexperimentalresultsindicatedthattheNoCbasedonthisroutingalgorithmcanmeettheperformancerequirementsofnetwork ̄on ̄chipdatacommunicationformulti ̄directionandmulti ̄channel.Keywords:2D ̄TorusꎻNoC(network ̄on ̄chip)ꎻdeadlock ̄freeꎻroutingalgorithmꎻFPGA㊀㊀随着面向智能信息处理的嵌入式系统的发展和半导体工艺技术的进步ꎬ片上系统(systemonchipꎬSoC)能够集成的处理器和IP核越来越多ꎬ使基于总线结构的设计复杂度呈指数增长ꎬ片上多核间的复杂通信也使得基于总线的通信结构成为限制芯片速度㊁功耗㊁面积和数据吞吐量的瓶颈[1-3].ITRS预测ꎬ到2020年ꎬ单芯片上可集成的晶体管数目将达到千亿级的规模[4].片上网络(network ̄on ̄chipꎬNoC)的出现解决了基于总线的系统不可伸缩等问题ꎬ通过借鉴计算机网络技术ꎬ在芯片内部各个模块之间采用路由和数据包分组交换的方式进行通信ꎬ为SoC中处理器和IP核之间的通信提供灵活㊁高效㊁可靠的解决方案[5].㊀㊀目前ꎬ大多数片上网络采用最典型的二维网格(2D-Mesh)[6-7]结构.2D-Mesh拓扑结构是一种网格结构ꎬ每个路由节点连接一个计算节点IP核ꎬ并与其上㊁下㊁左㊁右4个方向的相邻路由节点连接(边界节点除外)ꎻ然而在Mesh拓扑结构中ꎬ边界路由节点之间不存在直接的路由连接ꎬ因此当数据包在边界节点之间传输时ꎬ可能需要沿横向或纵向穿过整个片上网络ꎬ导致数据包在片上网络中的传输延迟增加[8-9].与之相比ꎬ2D-Torus拓扑结构在Mesh拓扑结构的基础上ꎬ增加了行和列首尾路由节点的长连线ꎬ以达到缩短网络平均直径和提升片上网络通信性能的目的[10-12]ꎬ每个路由节点具有相同的结构ꎬ因此可扩展性强ꎬ易于在硬件上实现ꎬ且其路由路径的多样性有效降低了阻塞的发生ꎬ提高了网络的传输效率[1ꎬ13].因此ꎬ本文主要针对2D-Torus拓扑结构ꎬ对片上网络的路由算法进行研究.㊀㊀片上网络的路由算法决定了消息从源节点到目的节点要经过的通道序列[14-16].随着片上系统集成的处理器核数的不断增加ꎬ由生产缺陷㊁工艺偏差和芯片老化等引发的故障导致NoC出现故障的概率不断提高.路由算法主要解决路由路径的选择问题ꎬ一个好的路由算法必须考虑其是否能够充分利用片上网络的空闲资源来改善片上网络的延迟和吞吐率ꎻ是否能够尽可能减小片上网络的功耗.Torus拓扑结构中的环路增加了路由路径的多样性ꎬ但同时也带来了许多问题ꎬ例如死锁问题ꎬ这就进一步要求面向Torus结构的路由算法能够解决环路带来的死锁等问题.因此ꎬ本文针对2D-Torus拓扑结构ꎬ提出了一种基于列分转弯[5]的Torus无死锁(Torusdeadlock ̄freeꎬTDF)路由算法ꎬ通过改变数据包在片上网络路由过程中受限制转弯的位置ꎬ保证片上网络的自适应路由条件ꎬ从而降低片上网络的延迟.并通过理论分析㊁仿真实验和实物测试来证明该算法是无死锁的.1㊀TDF路由算法描述㊀㊀为解释TDF路由算法ꎬ假设目的节点坐标为D(xdꎬyd)ꎬ源节点坐标为S(xsꎬys)ꎬ当前节点坐标为C(xꎬy)ꎻ路由开始时ꎬ源节点坐标等于当前节点坐标.每个路由节点中ꎬ数据包可能的传输方向有9个ꎬ分别为O(本地)ꎬE(东)ꎬW(西)ꎬS(南)ꎬN(北)ꎬSE(东南)ꎬSW(西南)ꎬNE(东北)ꎬNW(西北)ꎬ具体如图1所示.㊀㊀2D-Torus片上网络由于增加了首尾节点的连线ꎬ因此每一行及每一列都存在环路.路由方向也不再是简单的东㊁西㊁南㊁北4个方向ꎬ传统的禁止转向技术不再适用.对于一个4ˑ4的2D-Torus片上网络ꎬ假定(0ꎬ0)节点在片上网络的左下角ꎬ(3ꎬ3)节点在片上网络的右上角.其拓扑结构如图2所示.图1㊀路由节点的可能传输方向Fig.1㊀Thepossibletransmissiondirectionofroutingnode㊀㊀设片上网络系统中0维上的坐标为xꎬk代表每个维度上节点的数目ꎬ例如一个4ˑ4的2D-Torus片上网络ꎬk=4ꎬ则x坐标的取值范围是0ɤx<k.图2㊀4ˑ4的2D-Torus片上网络拓扑结构Fig.2㊀Thetopologyof4ˑ42D ̄Torusnetwork ̄on ̄chip㊀㊀定义TDF算法的规则如下:当节点的x< [k/2]时ꎬ数据禁止NW转向和SW转向ꎻ当节点的xȡ[k/2]时ꎬ数据禁止NE转向和SE转向.数据在0列㊁k-1列㊁0行㊁k-1行这4条边缘信道时ꎬ若数据由0列向k-1列路由ꎬ下一跳应向西(W)转弯ꎻ若数据由0行向k-1行路由ꎬ当前节点为(0ꎬ0)ꎬ目的节点为(k-1ꎬk-1)时ꎬ下一跳应向西(W)转弯ꎬ其余情况下一跳应向南(S)转弯ꎻ若数据由k-1列向0列路由ꎬ当前节点为(k-1ꎬ0)ꎬ目的节点为(0ꎬk-1)ꎬ下一跳应向南(S)转弯ꎬ当前节点为(k-1ꎬk-1)ꎬ目的节点为(0ꎬ0)ꎬ下一跳应向北(N)转弯ꎬ其余情况下一跳向东(E)转弯ꎻ若数据由k-1行向0行路由ꎬ当前节点为(0ꎬk-1)ꎬ目的节点为(k-1ꎬ0)时ꎬ下一跳应向西(W)转弯ꎬ其余情况下一跳向北(N)2东北大学学报(自然科学版)㊀㊀㊀第42卷㊀㊀转弯.㊀㊀以4ˑ4的2D-Torus片上网络为例ꎬTDF路由算法的具体执行过程如下:㊀㊀1)若xd=xꎬyd=yꎬ说明数据已经传输到目的节点ꎬ当前路由节点会将数据发送到其本地端口.㊀㊀2)若xd=xꎬyd<yꎬ当y=3ꎬyd=0ꎬ则数据应向北方向(N)路由ꎬ其余情况数据应该向南方向(S)路由ꎬ当前节点也会随即将数据传输到南向输出端口.㊀㊀3)若xd=xꎬyd>yꎬ当y=0ꎬyd=3ꎬ则数据应向南方向(S)路由ꎬ其余情况数据应该向北方向(N)路由ꎬ当前节点也会随即将数据传输到北向输出端口.㊀㊀4)若xd>xꎬy=ydꎬ当x=0ꎬxd=3ꎬ则数据应向西方向(W)路由ꎬ其余情况数据应该向东方向(E)路由ꎬ当前节点也会随即将数据传输到东向输出端口.㊀㊀5)若xd<xꎬy=ydꎬ当x=3ꎬxd=0ꎬ则数据应向东方向(E)路由ꎬ其余情况数据应该向西方向(W)路由ꎬ当前节点也会随即将数据传输到西向输出端口.㊀㊀6)若xd>xꎬyd>yꎬ当xȡ[k/2]-1时ꎬ若y=0ꎬyd=3ꎬ则数据应该向南方向(S)路由ꎬ若yʂ0或ydʂ3ꎬ则数据应该向北方向(N)路由ꎻ当x<[k/2]-1时ꎬ若y=0ꎬyd=3ꎬ如果xd=3ꎬ则数据应该向西方向(W)路由ꎬ其余情况数据应该向南方向(S)路由ꎬ若yʂ0或ydʂ3ꎬ如果xd=3ꎬ数据应向西(W)路由ꎬ如果xdʂ3ꎬ则数据应该向东方向(E)路由.㊀㊀7)若xd>xꎬyd<yꎬ当xȡ[k/2]-1时ꎬ若y=3ꎬyd=0ꎬ则数据应该向北方向(N)路由ꎬ若yʂ0或ydʂ3ꎬ数据应该向南方向(S)路由ꎻ当x< [k/2]-1时ꎬ若y=3ꎬyd=0ꎬ如果xd=3ꎬ则数据应该向西(W)路由ꎬ其余情况数据应该向北(N)路由ꎬ若yʂ3或ydʂ0ꎬ如果xd=3ꎬ数据应向西(W)路由ꎬ如果xdʂ3ꎬ数据应该向东(E)路由.㊀㊀8)若xd<xꎬxȡ[k/2]ꎬyd>yꎬ当y=0ꎬyd=3时ꎬ数据应向南(S)路由ꎬ当yʂ0或ydʂ3时ꎬ如果x=3ꎬxd=0ꎬ则数据应向东(E)路由ꎬ其余情况数据应向北(N)路由.㊀㊀9)若xd<xꎬxȡ[k/2]ꎬyd<yꎬ当y=3ꎬyd=0时ꎬ数据应向北(N)路由ꎬ当yʂ3或ydʂ0时ꎬ如果x=3ꎬxd=0ꎬ则数据应向东(E)路由ꎬ其余情况数据应向南(S)路由.㊀㊀10)若xd<xꎬx<[k/2]ꎬyd>yꎬ如果y=0ꎬyd=3ꎬ数据应向南(S)路由ꎬ如果yʂ0或ydʂ3ꎬ则数据应该向西(W)路由.㊀㊀11)若xd<xꎬx<[k/2]ꎬyd<yꎬ如果y=3ꎬyd=0ꎬ数据应向北(N)路由ꎬ如果yʂ3或ydʂ0ꎬ则数据应该向西(W)路由.2㊀TDF路由算法无死锁证明㊀㊀由于面向片上网络的Torus拓扑结构在网络中存在多个环路ꎬ因此当数据包在路由节点间传输时容易产生死锁.当相邻的路由节点彼此请求对方进行数据转发时ꎬ若数据包进入循环等待状态ꎬ就会发生死锁.例如ꎬ当某一路由节点接收到数据包ꎬ并将其存储在缓存区中ꎬ数据包将根据路由算法请求下一跳的路由节点并申请缓存.若下一跳路由节点的接收通道被占据了ꎬ而占据该通道的数据包也正在等待被传输ꎬ并形成一个环路循环状态.那么ꎬ这些数据包都会因为无法请求到下一跳路由节点而无法释放当前路由节点的缓存ꎬ从而造成死锁现象.分析可知ꎬ产生死锁的根本原因在于数据包在路由传输过程中存在具有依赖性的环路.通常采用3种方法来避免死锁:①通过设计路由算法来控制数据包的传输ꎬ限制路由方向ꎬ破除依赖性环路ꎬ从而避免死锁现象.②通过使用虚通道来避免死锁的发生.③通过检测死锁现象ꎬ强制破坏依赖性环路ꎬ从而限制死锁的发生.本文提出的TDF算法就是通过设计路由算法来避免死锁.㊀㊀本文结合Dally[17]提出的通道依赖图和Duato等[18]提出的无死锁充分必要条件来证明本文提出的Torus片上网络TDF路由算法的无死锁特性.基于上述方法ꎬ对4ˑ4的2D-Torus拓扑结构中各个路由节点的出入通路进行编码标记ꎬ标记方案如图3所示.该方案中将每条路由通道分成两个方向ꎬ即路由节点的输出通道与输入通道.每一行的每一个方向上通道的x坐标都相同ꎬ每一列的每一个方向上通道的y坐标都相同.图3㊀路由路径编码Fig.3㊀Theroutingpathcoding㊀㊀编码完成后的2D-Torus片上网络路由路径3第1期㊀㊀㊀李贞妮等:基于FPGA的2D-Torus片上网络无死锁路由算法㊀㊀㊀㊀编码如图4所示.图4㊀2D-Torus片上网络路由路径编码Fig.4㊀Theroutingpathencodeofroutein2D ̄TorusNoC㊀㊀例如ꎬ(1ꎬ1)节点上方输出通道编码为(5ꎬ1)ꎬ输入通道编码为(7ꎬ2).假设有两组路由数据A和Bꎬ数据A从路由节点(1ꎬ1)传输至路由节点(3ꎬ3)ꎬ数据B从路由节点(3ꎬ3)传输至路由节点(1ꎬ1).根据本文设计的路由算法规则ꎬ数据A的路由路径为‹(1ꎬ1)(1ꎬ2)(1ꎬ3)(2ꎬ3)(3ꎬ3)›ꎬ数据B的路由路径为‹(3ꎬ3)(3ꎬ2)(3ꎬ1)(2ꎬ1)(1ꎬ1)›ꎬ根据编码规则可知数据A所经过的通道依次为‹(5ꎬ1)(5ꎬ2)(1ꎬ9)(2ꎬ9)›ꎬ数据B所经过的通道依次为‹(9ꎬ3)(9ꎬ2)(3ꎬ5)(2ꎬ5)›.由路由路径可见ꎬ数据A所经过的路由通道在不同维度均严格递增ꎬ数据B所经过的路由通道在不同维度均严格递减ꎬ又根据编码规则可知ꎬ该路由算法下数据在任意节点间传输所经路径均为单调增或单调减ꎬ且不存在路径交叉的情况ꎬ所以TDF路由算法是无死锁的.3㊀系统测试及结果分析㊀㊀在XilinxISE14 4开发环境下ꎬ基于SystemVerilog语言ꎬ设计并实现了4ˑ4的基于2D-Torus拓扑结构ꎬ采用TDF路由算法的片上网络ꎬ并对该片上网络进行仿真测试与功能验证.在FPGA的XilinxVirtex-5硬件平台上对系统性能进行测试.㊀㊀在测试中ꎬ对路由节点进行编号ꎬnet_gen[i]表示坐标为(i%4ꎬi/4)的路由节点ꎬ这里i为整数ꎬ则仿真中的net_gen[i]/ ./output_port_(x)代表坐标为(i%4ꎬi/4)的节点将数据从x端口输出ꎬnet_gen[i]/ ./input_port_(x)代表坐标为(i%4ꎬi/4)的节点将数据从x端口输入ꎬx可以为OꎬWꎬSꎬE和Nꎬ其中O代表本地端口ꎬW为西端口ꎬS为南端口ꎬE为东端口ꎬN为北端口.例如b00net_gen[0]/ ./output_port_(E)代表(0ꎬ0)节点将数据从东端口输出ꎬb32net_gen[11]/ ./input_port_(S)代表(3ꎬ2)节点将数据从南端口输入.3 1㊀单个节点传输测试分析㊀㊀这里以数据从(0ꎬ1)节点向(3ꎬ3)节点的传输为例进行分析.单个节点传输波形如图5所示.根据仿真波形图中的信息ꎬ可以列出该过程的路由信息表如表1所示.㊀㊀数据从(0ꎬ1)节点的本地端口输入ꎬ接着从(0ꎬ1)节点即net_gen[4]的西端口输出ꎬ从(3ꎬ1)节点即net_gen[7]的东端口输入ꎬ然后从net_gen[7]的北端口输出ꎬ从节点(3ꎬ2)即net_gen[11]的南端口输入ꎬ接着从net_gen[11]的北端口输出ꎬ从节点(3ꎬ3)即net_gen[15]的南端口输入ꎬ最后从net_gen[15]的本地端口输出.在路由的过程中ꎬ基于TDF路由算法的2D-Torus片上网络共消耗了大约48个时钟周期ꎬ而同样结构的奇偶转弯(odd ̄even)[9]片上网络共消耗了大约55个时钟周期.可知ꎬTDF路由算法可以有效减少路由延迟时间.图5㊀单个节点传输波形图Fig 5㊀Transmissionwaveformofaroutingnode4东北大学学报(自然科学版)㊀㊀㊀第42卷㊀㊀表1㊀‹(0ꎬ1)ꎬ(3ꎬ3)›路由信息表Table1㊀Theroutinginformationtableof‹(0ꎬ1)ꎬ(3ꎬ3)›当前节点下一跳节点输出端口(0ꎬ1)(3ꎬ1)W(3ꎬ1)(3ꎬ2)N(3ꎬ2)(3ꎬ3)N(3ꎬ3)当前节点O3 2㊀多节点并行传输测试分析㊀㊀测试中ꎬ分别从(3ꎬ3)ꎬ(2ꎬ1)ꎬ(0ꎬ3)节点向(0ꎬ1)ꎬ(0ꎬ3)ꎬ(3ꎬ1)节点传输数据ꎬ那么输入数据的标志位应该分别为111110001ꎬ110010011和100111101.仿真结果如图6所示.通过仿真结果可知ꎬ多组数据在4ˑ4的2D-Torus片上网络中能够进行有效的传输ꎬ没有产生死锁现象.且目的节点的输出数据与源节点的输入数据相同ꎬ验证了片上网络在该路由算法作用下并行传输的准确率.3 3㊀基于FPGA的片上网络性能测试㊀㊀以GenesysVertex-5系列的FPGA作为硬件平台ꎬ设计并实现了本文提出的4ˑ4的无死锁2D-Torus片上网络.无死锁Torus片上网络的硬件实物如图7所示ꎬ源节点为(0ꎬ0)ꎬ目的节点为(3ꎬ3).测试结果表明ꎬ系统实物测试与仿真结果一致.图6㊀多节点并行传输测试仿真图Fig 6㊀Thetestsimulationdiagramofmulti ̄nodeparalleltransmission图7㊀无死锁片上网络FPGA硬件实物Fig 7㊀Thedeadlock ̄freeNoCsystembasedonFPGA4㊀结㊀㊀论㊀㊀本文针对2D-Torus拓扑结构ꎬ提出了一种基于列分转弯模型的TDF路由算法ꎬ保证了数据包在片上网络中的自适应路由条件.并对TDF路由算法的无死锁性进行了理论证明.设计并实现了基于TDF路由算法的2D-Torus片上网络系统ꎬ并在FPGA硬件平台上对其进行了测试.实验结果表明ꎬ基于TDF路由算法的片上网络ꎬ路由算法无死锁ꎬ且能够实现多方向以及多节点的并行通信.片上网络是未来片上多核系统的主流通信架构ꎬ因此基于2D-Torus拓扑结构及TDF路由算法的片上网络具有较好的应用前景.参考文献:[1]㊀李贞妮ꎬ李晶皎ꎬ方志强ꎬ等.异步2D-Torus片上网络自适应路由算法[J].东北大学学报(自然科学版)ꎬ2015ꎬ36(9):1217-1221.(LiZhen ̄niꎬLiJing ̄jiaoꎬFangZhi ̄qiangꎬetal.Adaptiveroutingalgorithmofasynchronous2D ̄Torusnetwork ̄on ̄chip[J].JournalofNortheasternUniversity(NaturalScience)ꎬ2015ꎬ36(9):1217-1221.)[2]㊀WangLꎬMaSꎬLiCꎬetal.AhighperformancereliableNoCrouter[J].Integrationꎬ2017ꎬ58:583-592.[3]㊀DaneshtalabMꎬPalesiMꎬMakT.Introductiontothespecial5第1期㊀㊀㊀李贞妮等:基于FPGA的2D-Torus片上网络无死锁路由算法issueonNoC ̄basedmany ̄corearchitectures[J].Computers&ElectricalEngineeringꎬ2015ꎬ45(1):359-361. [4]㊀HoefflingerB.TheInternationaltechnologyroadmapforsemiconductors[EB/OL].(2013-06-26)[2018-04-01].http://www.itrs.net/Links/2010ITRS/Home2010.htm.[5]㊀蔡源ꎬ罗伟ꎬ向东.基于列分转弯模型的片上网络路由算法[J].清华大学学报(自然科学版)ꎬ2018ꎬ58(12):1051-1058.(CaiYuanꎬLuoWeiꎬXiangDong.Routingalgorithmbasedonacolumn ̄partitionturnmodelforanetwork ̄on ̄chip[J].JournalofTsinghuaUniversity(NaturalScience)ꎬ2018ꎬ58(12):1051-1058.)[6]㊀HeAPꎬFengGBꎬZhangJLꎬetal.AnasynchronousmeshNoCbasedboothmultiplication[J].IETCircuitsꎬDevices&Systemsꎬ2019ꎬ13(1):73-78.[7]㊀WangLꎬWangXHꎬLeungHFꎬetal.Anon ̄minimalroutingalgorithmforagingmitigationin2D ̄MeshNoCs[J].IEEETransactionsonComputer ̄AidedDesignofIntegratedCircuits&Systemsꎬ2019ꎬ38(7):1373-1377. [8]㊀FeeroBꎬPandeP.Performanceevaluationforthree ̄dimensionalnetworks ̄on ̄chip[C]//IEEEComputerSocietyAnnualSymposiumonVLSI.PortoAlegreꎬ2007:305-310. [9]㊀ChiuGM.Theodd ̄eventurnmodelforadaptiverouting[J].IEEETransactionsonParallelandDistributedSystemsꎬ2000ꎬ11(7):729-738.[10]KhawajaSGꎬMushtaqMHꎬKhanSAꎬetal.Designingareaoptimizedapplication ̄specificnetwork ̄on ̄chiparchitectureswhileprovidinghardQoSguarantees[J].PLoSOneꎬ2015ꎬ10(4):1-17.[11]DallyWJꎬSeitzGL.Deadlock ̄freemessageroutinginmultiprocessorinterconnectionnetworks[J].IEEETransactionsonComputersꎬ1987ꎬ36(5):547-553. [12]RahmatiDꎬSarbazi ̄AzadHꎬHessabiSꎬetal.Power ̄efficientdeterministicandadaptiveroutinginTorusnetworks ̄on ̄chip[J].MicroprocessorsandMicrosystemsꎬ2012ꎬ36(7):571-585.[13]TouzeneAꎬDayK.All ̄to ̄allbroadcastinginTorusnetworkonchip[J].TheJournalofSupercomputingꎬ2015ꎬ71(7):2585-2596.[14]Ezz ̄EldinRꎬEl ̄MoursyMAꎬHamedHFAꎬetal.ProcessvariationdelayandcongestionawareroutingalgorithmforasynchronousNoCdesign[J].IEEETransactionsonVeryLargeScaleIntegrationSystemsꎬ2016ꎬ24(3):909-919. [15]周磊ꎬ吴宁ꎬ李云.一种基于2D-Mesh的片上网络无死锁容错路由算法[J].上海交通大学学报ꎬ2013ꎬ47(1):18-22.(ZhouLeiꎬWuNingꎬLiYun.Afault ̄tolerantanddeadlock ̄freeroutingalgorithmin2D ̄Meshfornetworkonchip[J].JournalofShanghaiJiaotongUniversityꎬ2013ꎬ47(1):18-22.)[16]RenPJꎬKinsyMAꎬZhengNN.Fault ̄awareload ̄balancingroutingfor2D ̄MeshandToruson ̄chipnetworktopologies[J].IEEETransactionsonComputersꎬ2016ꎬ65(3):873-887.[17]DallyWJ.Virtual ̄channelflowcontrol[J].IEEETransactionsonParallelandDistributedSystemsꎬ1992ꎬ3(2):194-205.[18]DuatoJꎬYalamanchiliS.Interconnectionnetworks:anengineeringapproach[M].SanFrancisco:MorganKaufmannꎬ2002.6东北大学学报(自然科学版)㊀㊀㊀第42卷㊀㊀。

基于NoC的众核处理器可靠性仿真分析研究

基于NoC的众核处理器可靠性仿真分析研究

基于NoC的众核处理器可靠性仿真分析研究杨文顶;覃志东【摘要】With the development of semiconductor manufacturing,the transistor density on many-core chips increases re-lentlessly and causes significant lifetime reliability problem. To estimate the chip reliability accurately,this paper proposes a system reliability simulation framework based on Monte Carlo simulation. In addtion,the network structure is taken into con-sideration for the system reliability. Experimental results show that the relative deviation of the system-level reliability is up to 60% if the NoC communication structure is discarded .%随着半导体制造工艺的发展,众核芯片上的晶体管密度不断增加,随之而来的寿命可靠性问题日益严重。

为了准确评估芯片的可靠性,本文提出了一种基于蒙特卡洛方法的系统级可靠性仿真框架,并在此基础上研究了NoC通信架构对可靠性的影响。

实验结果表明,如果不考虑众核芯片的NoC通信结构,系统级可靠性评估的相对偏差最高可达到60%左右。

【期刊名称】《智能计算机与应用》【年(卷),期】2015(000)002【总页数】5页(P4-8)【关键词】众核处理器;可靠性;蒙特卡洛仿真;片上网络【作者】杨文顶;覃志东【作者单位】东华大学计算机科学与技术学院,上海201620;东华大学计算机科学与技术学院,上海201620【正文语种】中文【中图分类】TP302.70 引言众核芯片通过集成多个相对简单的处理器内核,以并行处理的方式达到提升整个处理器计算能力的目的。

一种面向应用的NoC容错路由算法

一种面向应用的NoC容错路由算法

i gv n t i lme t eag r h s ie o mp e n o i m. T ee a u t n r s l h w t a T a etrp ro ma c a ee it g h t l t h v l ai e u t s o t RA h s b t ef r n et n t x si o s h F e h h n
an wF utT l at o t g loi m( T A)f p l ai - r c cN C . h l rh £ s a il e al o rn ui grh F R — e R n A t o A pi t n S' i o s T ea o tm r t uep ra y r e o ef i gi yo tl
随 着 集 成 电 路 工 艺 的 发 展 , 片 上 网 络
( ewrso— hp N C) 成为 片 上互 联 的设 计趋 N tok—n C i,o 势。o N C将计 算机 网络技术 移植 到芯 片设计 中来 , 彻 底解决 多 I 块体 系结构 中的 问题 , 为片上 各部 P模 并 件 之 间的通 信 提供带 宽 、延 迟 、可靠性 等服务 质量
芯片。
据 传输 或称 为 流构成 了一 个集 合 K f。 : K =K, , } i K …K ,

(i t, i , 和 t分别 表 示 源节 点 和 目的 节 点 , s,i d)s i i
文献[ [ 提 出的路由算法利用应用 的通信信 S ( 34 ]] ; , 可以有 多条 流具 有相 同 的源或 目的 )i ≠ d表示
L N H n -u WA G C ag sa I o gjn, N h n - hn (c ol f o ue, inU iesy X ia h ax 10 1 C ia S h o o r p t X i a nvri , ’nS an i 0 7 , hn ) Cn r d t 7

NoC基础研究及一款基于XY路由算法的虫孔路由设计

NoC基础研究及一款基于XY路由算法的虫孔路由设计

毕业设计 [论文]题目:NoC基础研究及一款基于XY路由算法的虫孔路由设计学院:电气与信息工程学院专业:电子信息工程姓名:XXX学号:*******指导老师:XXX完成时间:2015年06月01日摘要片上网络作为一种新的通信方式,其核心是网络架构,与采用单总线结构的片上系统相比,片上网络能适应更大的系统规模、更高的系统复杂度和更多的IP 核数量。

因此,片上网络更能适应现实需求,对其进行研究十分必要。

而路由算法直接决定片上网络的性能;片上网络的输入、输出模块与其内部交换器的连接方式和连接时间则取决于片上网络的交换技术。

对于片上网络的研究,这两个问题都非常关键。

本文总结了片上网络的拓扑结构、路由算法、数据交换方式,重点解释了XY 路由算法、2D-Mesh拓扑结构和虫孔交换的优缺点,并使用VHDL语言设计了一款基于XY路由算法的虫孔路由器,设计分为输入、输出、虚拟通道、计数、顶层5个模块,完成了XY路由算法的虫孔路由器的各项功能。

最后使用QuartusⅡ完成编译及rtl级仿真。

关键词:NoC,2D-Mesh拓扑结构,XY路由算法,虫孔路由器,VHDLABSTRACTNoC, a brand new method of communication,with a central design technique of network architecture,is able to adapt to nowadays bigger size and higher complexity of the system and larger number of ip cores than SoC which is based on bus structure.Therefore,it is of great significance to study it.Being the key problem of NoC,the routing algorithm,as well as the way of switching, influences the performance of NoC directly.This paper gives a summary of the topology structure,routing algorithm and data switching pattern of NoC.And it explains both of the positive and negtive facts of XY routing algorithm,the topological structure of 2D-Mesh and wormhole switching.Also,there is a design of a wormhole data router which is based on the XY routing algorithm,using VHDL.The design consists of input,output,fifo,credit and top module and is compiled by QuartusⅡat rtl level.KEY WORDS: NoC,The topological structure of 2D-Mesh,XY routing algorithm,Wormhole data router,VHDL目录摘要 (I)ABSTRACT (II)目录 .................................................................................................................................................... I II 1 引言 .. (1)1.1 课题背景 (1)2NoC基础研究 (3)2.1 基本概念 (3)2.2 拓扑结构 (4)2.2.1 二维网格结构 (4)2.2.2 环状结构 (4)2.2.3 胖树结构 (5)2.3 路由算法 (6)2.3.1 XY路由算法 (6)2.4 数据交换方式 (7)2.4.1 虫孔交换机制 (7)2.4.2 分组交换技术 (8)2.4.3 电路交换技术 (8)3 基于XY路由算法的虫孔路由器设计 (9)3.1 总体设计 (9)3.1.1 基本理论 (9)3.1.2 设计总体框架 (9)3.2 基于XY路由算法的虫孔路由器程序设计 (11)4 程序仿真 (12)4.1 Modelsim仿真流程 (12)4.2 各模块仿真结果 (12)4.2.1 输入模块 (12)4.2.2 FIFO模块 (13)4.2.3计数模块 (14)4.2.4输出模块 (14)4.3 整体仿真 (14)5 设计总结 (16)5.1设计过程中遇到的问题及解决方法 (16)5.2展望 (16)参考文献 (17)致谢 (18)附录 (19)附录A:基于XY路由算法的虫孔路由器程序 (19)附录B:总程序测试平台 (35)附录C:rtl仿真图像 (37)1 引言1.1 课题背景当前,市场对电子产品的需求与日俱增,PC(Personal Computer)市场也随之日益成熟,数码消费品将主导半导体产品市场的未来增长。

基于人工神经网络的NoC智能动态链路管理方法

基于人工神经网络的NoC智能动态链路管理方法

基于人工神经网络的NoC智能动态链路管理方法
许威;张霞
【期刊名称】《计算机测量与控制》
【年(卷),期】2022(30)3
【摘要】功耗是片上网络(NoC)主要限制因素,链路状态的选择性开/关切换算法可降低电路级和系统级的链路功耗,这些算法大多集中于一个简单的静态阈值触发机制,该机制决定了是否应该打开或关闭链路;为解决上述触发机制存在诸多限制,提出了一种针对NoC的人工神经网络(ANN,artificial neutral network)作为动态链路功耗管理方法,该方法基于对系统状态的有监督在线学习,通过使用小型可扩展的神经网络来关闭和打开链路,从而提高预测能力;基于人工神经网络的模型利用了非常低的硬件资源,并且可以集成在大型网状和环面NoC中;通过对不同网络拓扑上各种综合流量模型的仿真结果表明,与静态阈值计算相比,该方法在较低的硬件支出下可以节省功耗;可为解决链路管理NoC中的功耗问题提供思路。

【总页数】5页(P168-172)
【作者】许威;张霞
【作者单位】北京城建设计发展集团股份有限公司;北京理工大学信息与电子学院【正文语种】中文
【中图分类】TP273
【相关文献】
1.基于通信链路的NoC映射算法
2.基于BIST的NoC系统通信链路测试研究
3.基于故障链路缓存再利用的NoC容错路由算法
4.基于链路状态感知的NoC自适应路由机制
5.基于故障粒度划分的NoC链路自适应容错方法
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于2D Mesh的NoC路由算法设计与仿真
欧阳一鸣;董少周;梁华国
【期刊名称】《计算机工程》
【年(卷),期】2009(035)022
【摘要】An XY-YX routing algorithm of 2D Mesh structure is presented, which is based on researching the turn model. The algorithm is deterministic, minimal and deadlock-free. Proof of deadlock freedom is presented. The algorithm is simulated on 4×4 2D Mesh network to evaluate the performance through NIGAM experimental platform. By comparing the algorithm with XY routing algorithm and minimal odd-even routing algorithm, it shows that the algorithm had a good performance in the uniform pattern and the hot spot pattern.%在研究Turn Model模型的基础上,提出一种基于2D Mesh结构的XY-YX路由算法,是一种确定性的无死锁的最短路径路由算法.给出无死锁的证明,通过片上网络(NoC)模拟仿真实验平台NIRGAM,将该算法在一个4×4的2D Mesh网络中进行仿真,并与XY路由算法及minimal OE(odd-even)路由算法进行比较,结果显示在转置模式和热点模式下具有良好的性能.
【总页数】4页(P227-229,235)
【作者】欧阳一鸣;董少周;梁华国
【作者单位】合肥工业大学计算机与信息学院,合肥,230009;合肥工业大学计算机与信息学院,合肥,230009;合肥工业大学计算机与信息学院,合肥,230009
【正文语种】中文
【中图分类】TP302
【相关文献】
1.基于内建自测技术的Mesh结构NoC无虚通道容错路由算法 [J], 姚磊;蔡觉平;李赞;张海林;王韶力
2.一种基于2D-mesh的低延迟NoC路由算法设计* [J], 欧阳一鸣;丁同柱;梁华国;谢涛
3.基于数控分流策略的2DMesh NoC路由节点设计 [J], 高健;崔建明
4.一种不规则2D Mesh的NoC路由算法 [J], 徐欣;王长山
5.基于Concentrated-Mesh和2D-Mesh结构的NoC路由算法 [J], 章功干;陈广宏
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档