mesh结构NoC的时钟网络研究
一种高速低功耗的NoC时钟网络设计
摘 要 : 为 了实 现 高速 低 功 耗 的 片 上 网络 时钟 网络 , 针 对 ME S H 型 片 上 网络 , 用 金 属一 绝缘质一 金 属 电 容 替 代
MOS电容 作 为发 送 端 驱 动 电容 和 接 收 端 耦 合 电容 , 设 计 了一 种 基 于 改进 的 电容 驱 动 型低 摆 幅 收发 器 的瀑 布 型 时 钟 网 络. S p e c t r e仿 真 结 果 表 明 , 在0 . 1 3 p m C MO S工 艺 条 件 下 , 该 时钟 网 络 的 时 钟 频 率 可达 5 GHz , 功 耗 和 延 时 仅 为 传 统 时 钟 网络 的 4 9 和 5 5 , 并 具 有 更 好 的噪 声 抑 制 能力 . 关键词 :片上网络; 时钟 网络 ; No C 时钟 网络设 计
刘 毅 , 陈 博 , 杨 银 堂 , 刘 刚
( 1 .西 安 电子 科 技 大 学 微 电子 学 院 , 陕西 西安 7 1 0 0 7 1 ; 7 1 0 0 7 1 )
2 .西安 电子 科 技 大 学 宽 禁 带 半 导 体 材 料 与 器 件 教 育 部 重 点 实验 室 , 陕西 西安
中 图分 类号 : T N4 0 2 文 献标 识码 : A 文章编号 : i 0 0 1 - 2 4 0 0 ( 2 0 1 3 ) 0 3 — 0 1 1 5 — 0 6
Hi g h— ・ s p e e d l o w。 。 p o we r c l o c k n e t wo r k d e s i g n f o r No C
s a v i n g a n d 5 5 de l a y r e du c t i on. A t t he s am e t i me f t hi s ne t wor k h a s a be t t e r no i s e s up pr e s s i on a bi l i t y.
一种不规则2DMesh的NoC路由算法
计算机与现代化 2010年第5期JIS UAN JI YU X IAN DA I H UA总第177期文章编号:1006 2475(2010)05 0111 04收稿日期:2009 12 03作者简介:徐欣(1983 ),男,辽宁阜新人,西安电子科技大学计算机学院硕士研究生,研究方向:片上网络路由算法;王长山(1950 ),男,副教授,研究方向:计算机网络。
一种不规则2D M esh 的NoC 路由算法徐 欣,王长山(西安电子科技大学计算机学院,陕西西安710071)摘要:N oC 的网络拓扑结构是其研究的重要方面,在一些实际应用中,N oC 系统通常集成多个不同功能、不同尺寸、不同通讯需求的组件,而规则的拓扑结构并不适应于在这种类型的N oC 中应用,因此不规则M esh 网络被应用于不规则的N oC 系统,为解决规则M esh 路由算法在不规则M esh 中无法保证路由连通性问题,提出一种不规则M esh 无死锁路由算法,同时此算法与其他算法相比,具有更少的虚通道和更优秀的路由路径选择。
关键词:片上网络;路由算法;不规则2D M esh中图分类号:T P393 文献标识码:A do:i 10.3969/.j i ssn .1006 2475.2010.05.032A NoC Routing A lgorith m for Irregular 2D M eshXU X in ,WANG Chang shan(School o f Co m pute r ,X i dian U niversity ,X i an 710071,Ch i na)Ab stract :T opo log ical struct ure is an i m po rtan t part for the design of ne t w ork on ch i p syste m s .A t so m e practica l app licati on ,N oC syste m s often i ntegrate a nu m ber o f heterogeneous components wh ich have varied f unc ti ons ,s i zes and comm un i cati on require m ents .Instead o f regular topo log i ca l net wo rks wh i ch are not su itab l e for this sort o fN oC syste m s ,irregular M esh net wo rk i s pro posed and appli ed in N oC sy stem sw ith irregular structure .So th i s paper i ntroduces a dead l ock free routi ng algor it h m f o r irregu l ar M esh .Compared w it h other routi ng a l go rith m,t h is routi ng algor it h m has fe w v irt ua l channels and exce llent path se l ec tion .K ey w ords :net w ork on ch i p ;routi ng a l gor it h m;irregular 2D M esh0 引 言近年来,一种全新的集成电路体系结构N o C [1 3](N et w ork on Ch i p ,片上网络)已经成为微电子学科研究的热点问题之一。
基于一种新网络拓扑结构的低功耗
大。 Torus结构[8]既具有 Mesh结构硬件实现简单、网络扩展
随着半导体制造工 艺 的 发 展,大 量 的 晶 体 管 和 计 算 资 源 构 的 关 系,并 指 出 了 不 同 互 连 结 构 的 综 合 性 能 和 各 自 的 使 用
可集成到一块芯片上。从 片 上 系 统(System on Chip,SoC)到 场合。虽然研究者提 出 了 新 的 技 术 和 架 构 来 降 低 NoC 的 功
供足够的带宽。片 上 网 络 (Network on Chip,NoC)被 视 为 解 决 下 一 代 通 信 架 构 扩 展 性 和 功 耗 效 率 的 新 范 式 ,成 为 当 前 的
HMesh来降低片上网络的功耗,并从理论上 分 析 了 它 与 经 典 拓扑结构的性能差异。然 后 提 出 了 适 合 HMesh 结 构 的 路 由
show that,compared with Mesh and Torus,the average power of HMesh drops by 12.9% and 11.24% respectively as
the networks is not in congestion,so it is more suitable for NoC.
Low Power Research Based on a New NoC Topology Architecture
CAO Hong-xin LI Guang-shun WU Jun-hua (School of Computer Science,Qufu Normal University,Rizhao 276826,China)
4个相邻的路 由 节 点 相 连。 它 的 网 络 拓 扑 结 构 是 规 则 的,对 应的路由算 法 比 较 简 单。但 它 的 网 路 直 径 和 节 点 间 距 离 较
分布式路由器的设计探究
分布式路由器的设计探究作者:范玉明孙璞来源:《硅谷》2011年第03期摘要:主要介绍分布式路由器的设计与实现。
着力于从另一角度来实现路由器对多时钟域的支持,即在输入端口中采用异步FIFO的设计方式来实现跨时钟域间的数据传输。
并采用高度参数化设计方法以实现路由器的可重用性。
具有一定的现实意义。
关键词:分布式;多时钟域;可重用性;中图分类号:TP2 文献标识码:A 文章编号:1671-7597(2011)0210038-011 概述在我们熟知的SoC设计中,各IP核之间的通信一般是通过共享总线方式的方法达成目的的。
然而随着科学技术的发展,单个硅片上可以集成的处理器逐渐增加,片上系统也演变地越来越复杂。
此时,长连线延时、信号完整性和扩展性问题都呈现出来。
而近几年来提出的NoC 片上网络,被广泛的认为是解决目前片上系统中存在的问题的一种很好的解决方案。
片上网络的基本思想就是全局异步局部同步(Global Asnchronous Local synchronous,GALS),也就是说片上网络应该要提供多时钟域之间的通信。
而路由器是片上网络中不同资源节点之间进行通信的中间站,这就要求路由器能够提供这种跨时钟域之间的数据传输。
本文所设计的分布式路由器具有如下两个特点:1)支持多时钟域,支持不同时钟域之间的数据具传输,从而实现了全局异步局部同步的设计思想;2)采用可重用设计技术,使得在不同的应用环境中只需通过参数配置即可使用,避免重复开发,缩短设计周期。
2 异步FIFO的设计与实现NoC的基本设计思想就是全局异步、局部同步,为了实现不同时钟域间的路由节点或是IP节点之间的数据传输,我们在设计时,缓存的设计采用异步的FIFO的实现方式来实现。
将读操作和写操作分别在不同的时钟域,写操作是在本路由节点的时钟域下工作,而读操作是根据相邻节点的时钟域下进行,这样将两个时钟域的操作隔离开了,有效的降低了亚稳态的概率。
由于读指针与写指针是两个时钟域中的信号,在进行比较时我们将其放在一个时钟域中进行。
NOC国内调研
随着半导体制造工艺的进步以及SoC(System-on-Chip)技术的完善,一方面,SoC集成的IP 核(intellectual property core)数目已经达到成千上万个,而IP核之间以传统总线结构为基础的通信模式遇到了种种瓶颈,大大限制了SoC的进一步发展,包括性能、功耗、延时以及可靠性等方面的问题;另一方面,多处理器SoC(MPSoC)的出现,使得总线结构的通信机制在可扩展性、通信效率以及功耗方面的问题更为突出。
NoC(Network-on-Chip)就是在这种背景之下提出来的,旨在运用片上网络技术解决SoC发展过程中以传统总线结构为通信基础所造成的种种瓶颈。
NoC的研究很宽泛,涉及到从物理设计到体系结构、操作系统、应用服务、设计方法和工具等诸多方面,本文主要探讨NoC在体系结构领域的研究热点,包括NoC的拓扑结构、功耗问题、性能评估问题。
NoC拓扑结构。
拓扑结构定义了片上网络内节点与链路的布局和互连方式,它对于网络的时延、吞吐率、面积、容错、功耗等有着至关重要的影响,进一步还影响了网络中的路由策略、映射算法等。
本节先对目前的拓扑结构进行了介绍,然后展望了未来NoC在拓扑结构主要的研究方向。
NoC拓扑结构包括规则拓扑与非规则拓扑(定制、专用拓扑)两大类。
目前主要的规则拓扑又可分为两大类:直接网络,网络内任一交换机节点,都与IP核直接相连;间接网络,网络内一部分交换机节点只与其他交换机节点相连。
目前,最流行的直接网络包括有二维网格(2D-Mesh),二维环绕(2D-Torus)和超立方。
流行的间接网络包括树网、蝶网。
在这些基本的规则拓扑基础之上,通过组合,增加旁路等改进技术,衍生了许多更好性能的规则拓扑结构,在此不一一列举。
非规则拓扑与规则拓扑不同的是,是针对特殊应用的定制网络,不具备复用性。
大致可分为四类:专用网络,完全根据应用的需求从零开始设计,没有遵循一定的规律;基于拓扑结构,在规则拓扑结构上增加或删除一些节点与链路,失去规整性;分层网络,全局与局部采用不同的拓扑规则;网络-总线混合拓扑结构。
一种基于3Dmesh的NOC路由算法设计与分析
1引言随着半导体技术的发展,未来集成系统将包含亿万个晶体管,由数百个IP 核组成。
这些IP 核,面对涌现出的各种功能复杂的多媒体和网络应用,应该能提供丰富的多媒体服务和网络服务。
这些IP 核的有效合作(例如,高效的数据传输),可以通过在芯片级上改变通信策略来达到。
能容纳这么多IP 核,且能满足对通信和数据传输的需要的结构,即是片上网络(Network-on-Chip ,NoC )结构。
NoC 技术的核心思想是计算机网络技术移植到集成电路芯片中来,从体系结构上解决片上系统(System-on-a-Chip ,SoC )总线式结构带来的一系列问题:可扩展性差、总线通讯效率低、单一时钟同步等。
NoC 具有良好的空间扩展性,提供了高效的并行通讯能力,以分组交换作为通讯技术,采用全局异步—局部同步的通讯机制,受到业界的广泛关注。
从网络的角度来看,片上网络研究的重点在于拓扑结构、协议设计、流量控制、服务质量等。
本文基于3Dmesh 这种拓扑结构,介绍和分析其上的路由技术,与研究人员共同探讨。
2NoC 中的拓扑结构拓扑结构是NoC 中各路由节点间、路由节点和处理节点间通信的物理连接,它确定了路由节点和路由节点,以及处理节点和路由节点之间的数据通路,制约着整个信息传输的速度、容错能力。
同时也决定着路由算法的设计以及整个系统的工作效率,从而对整个系统的性能,起着重要的影响。
由于片上网络不同于传统意义上的计算机网络,其拓扑结构在设计时要求应具有对称、简一种基于3Dmesh 的NOC 路由算法设计与分析苏新1,2陈永平2(1合肥工业大学,安徽合肥230009)(2马鞍山职业技术学院,安徽马鞍山243031)摘要:随着半导体技术的高速发展,集成度越来越高,片上系统由于其总线式结构,存在的许多问题,使其无法满足功能复杂的应用需求,于是,片上网络越来越受人们的关注。
文中在介绍了片上网络的拓扑结构和路由算法的基础之上,重点研究了基于3Dmesh 结构上的片上网络路由技术,并提出了一种适用于小规模的、3Dmesh 结构上的路由算法,并对算法的相关特性作了简单的分析。
一种基于分层Mesh网络的层次化NoC拓扑结构
一种基于分层Mesh网络的层次化NoC拓扑结构姜奎;韩国栋;沈剑良【摘要】针对片上网络中距离较远节点之间通信延迟过大的问题,提出一种层次化HDMesh拓扑结构.该拓扑结构采用分层设计,底层网络使用Mesh结构互连进行临近节点通信,顶层网络在Mesh结构的基础上增加2条对角链路以降低通信延迟.为避免顶层网络的拥塞,设计相应的HDXY路由算法,对各层流量进行合理分配.实验结果表明,在Rent流量模式下,相比Mesh,CMesh和CHMesh拓扑结构,HDMesh拓扑结构具有更低的通信延迟和更高的网络吞吐量.%Communication delay increases sharply with the expansion of distance between the nodes in the network on chip.In order to solve this problem,this paper proposes a Hierarchical Diagonal Mesh(HDMesh) topology.The topology adopts hierarchical design.The base-level is connected by Mesh for the communication between adjacent nodes.On the top level,two diagonal links are added in the Mesh architecture to further reduce the communication delay.To avoid the congestion on the top level network,a Hierarchical Diagonal XY (HDXY) routing algorithm is proposed to assign the flow rate of each layer reasonably.The experimental results show that,compared with Mesh,CMesh and CHMesh in the Rent flow mode,HDMesh has lower communication latency and higher network throughput.【期刊名称】《计算机工程》【年(卷),期】2017(043)010【总页数】5页(P1-5)【关键词】片上网络;层次化;拓扑结构;路由算法;Rent流量模式【作者】姜奎;韩国栋;沈剑良【作者单位】国家数字交换系统工程技术研究中心,郑州450002;国家数字交换系统工程技术研究中心,郑州450002;国家数字交换系统工程技术研究中心,郑州450002【正文语种】中文【中图分类】TP302随着片上系统(System on Chip,SoC)集成度的不断增加,片上系统中核与核之间的通信成为性能提升的瓶颈,而片上网络(Network on Chip,NoC)借鉴了计算机网络的思想,将片上系统的通信与计算分离,有效解决了传统SoC的通信问题[1-3]。
一种低延迟的无虚通道NoC容错路由算法
一种低延迟的无虚通道NoC容错路由算法李娇;徐海鹏;崇云锋;刘鹏;冉峰【摘要】随着特征尺寸的减小,片上网络发生故障的概率显著增加.为了提高片上网络的容错能力,降低网络延迟,提出一种低延迟的无虚通道容错路由算法.该算法在转向模型的基础上,采用旁路结构,保持故障节点在固定方向上的连接,能够有效降低数据包延迟同时应对故障节点任意数量、任意分布的情况.8×8的2D Mesh NoC的仿真结果表明,相比于参考的两种算法,本算法在单故障且通信负载为30%时,平均延迟分别降低4.35%和20.20%,且在多故障情况下同样具有较好的性能.【期刊名称】《上海大学学报(自然科学版)》【年(卷),期】2019(025)002【总页数】9页(P189-197)【关键词】片上网络;容错;低延迟;路由算法;旁路结构【作者】李娇;徐海鹏;崇云锋;刘鹏;冉峰【作者单位】上海大学微电子研究与开发中心, 上海200444;上海大学新型显示技术及应用集成教育部重点实验室, 上海200444;上海大学微电子研究与开发中心, 上海200444;上海大学微电子研究与开发中心, 上海200444;上海大学微电子研究与开发中心, 上海200444;上海大学微电子研究与开发中心, 上海200444;上海大学新型显示技术及应用集成教育部重点实验室, 上海200444【正文语种】中文【中图分类】TP393随着单个芯片上集成的处理器单元数目的增多,多处理器片上系统(multiple processor system-on-chip,MPSoC)的传统总线结构效率变低,因此需要一种新型的通信结构.鉴于此,片上网络(network on chip,NoC)应运而生.NoC技术具有可扩展性、可重用性、灵活性和平行度等优点,已成为多处理器片上系统互联问题的最佳解决方案[1-2].由于电路特征尺寸的不断减小,芯片受到串扰、耦合、制造工艺和电路老化等问题影响的可能性增大,更易产生瞬时故障或永久性故障,降低了NoC 的可靠性[3].为了有效减小故障对NoC带来的影响,具有容错性能的NoC路由算法成为了研究的热点.Zhang等[4]提出了一种可重构无虚通道容错路由算法(简称Zhang’s算法).该算法在无故障区域使用XY路由算法,同时为了避免绕过故障节点时发生死锁,根据转向模型禁止东北和北东两个转向.Zhang’s算法复杂度较低,但其每个节点需要获取8个方向上相邻节点的故障信息,且只能对一个故障节点容错.之后,姚磊等[5]对Zhang’s算法进行了扩展,提出基于内建自测试(build in self test,BIST)的容错路由算法.该算法利用BIST提供的故障信息,分别在x轴方向和y轴方向上优化绕行环(链)路上的数据包分布,缩短了数据包的路由距离.基于BIST的容错路由算法能够均衡故障区域周围的链路负载,降低网络的时延,提高网络吞吐量,但其仍只是对单故障区域进行容错.Ebrahimi等[6]提出一种最短路径容错路由算法(简称Ebrahimi’s算法),该算法能够保持NoC在发生故障时的性能,但当位于对角线上的两个相邻节点发生故障时,存在数据包不能到达目的节点的情况,且NoC的可靠性也会随着故障节点的增多而降低.另外,为避免死锁,Ebrahimi’s算法使用了虚通道,使得NoC路由节点的复杂度上升.为提高NoC的容错能力,提高网络传输效率,本工作主要提出了一种低延迟的无虚通道NoC容错路由算法.该算法利用旁路结构,缩短了多核间数据包传输时的路径,降低延迟时间,同时也能提高NoC的容错性能.通过NoC研究中常用的仿真器NIRGAM对算法进行仿真,验证了本算法的有效性.1 NoC路由节点旁路结构传统的路由节点内部包括输入缓存、路由计算单元、虚通道分配器、仲裁分配单元和交叉开关等[7].由于虚通道的使用会增加NoC路由节点的复杂度,增加芯片成本和功耗,因此本工作对传统的路由节点结构进行修改,去除了虚通道分配器,同时增加旁路结构.旁路结构能够在该路由节点发生故障时启用,保持了一定方向上的连接,避免因故障而增加路由算法的复杂度.路由节点旁路结构模型如图1所示.从图可知,旁路结构中4个输入输出通道处(东、西、南、北)共增加了4个多路复用器和多路选择器(虚线部分)以及旁路连线,其控制信号中的故障信号由故障检测模块生成.通过多路复用器、多路选择器和旁路连线,路由节点上的南、北输入通道分别直接连接北、南输出通道,东、西输入通道分别直接连接西、东输出通道.因此,当节点发生故障时,故障检测模块产生的故障信号选通旁路,使得数据包可以直接通过旁路传输到下一个路由节点.将旁路结构运用于整个NoC时,对于NoC边界上的路由节点,由于边界处会缺失与某一方向相连的路由节点,因此对边界故障进行容错时,势必会存在转向限制性.为改变这一限制,修改边界上路由节点的旁路结构,改变路由节点输入、输出通道的连接,从而保持节点与其相邻节点的连接性.(1)4个顶点.西北顶点路由节点为其东方向和南方向上输入输出通道的双向连接,东北顶点路由节点为其西方向和南方向上输入输出通道的双向连接,东南顶点路由节点为其西方向和北方向上输入输出通道的双向连接,西南顶点路由节点为其东方向和北方向上输入输出通道的双向连接.图1 路由节点旁路结构模型Fig.1 Bypass structure model of router(2)其他边界节点.对于西边界上的路由节点,因其没有西输入输出通道,则其南、北、东输入通道分别通过旁路连接到其北、东、南输出通道;对于北边界上的路由节点,因其没有北输入输出通道,则其西、东、南输入通道分别通过旁路连接到东、南、西输出通道;对于东边界上的路由节点,因其没有东输入输出通道,则其北、南、西输入通道分别通过旁路连接到南、西、北输出通道;对于南边界上的路由节点,因其没有南输入输出通道,则其东、西、北输入通道分别通过旁路连接到西、北、东输出通道.以3×3 Mesh NoC为例,修改后的NoC旁路结构如图2所示.由图可以看出,单向的通道连接会在边界节点上形成环路,为避免死锁,需要对部分转向进行限制. 图2 3×3 Mesh NoC的旁路连接Fig.2 Bypass connection of 3×3 Mesh NoC 2 无虚通道容错路由算法2.1 转向模型在NoC容错路由算法中,死锁是一个必须解决的问题.死锁是指数据包之间相互等待形成环形,使得数据包无法继续传输.在无虚通道的容错路由算法中,转向模型[8]是一种有效解决死锁的方案,在不需要添加虚通道的情况下,通过禁止部分转向避免死锁.文献[8]中给出了3种自适应的路由算法:西优先、北最后、逆向优先,这些算法的禁用转向如图3(a),(b)和(c)所示.本工作采用的转向模型根据后续的无虚通道容错路由算法,在数据包路由时,首先自适应地向西、北、南路由,然后才是东方向.即东方向是最后一个被传输的方向,该算法在数据包路由时禁止由东到南和由东到北的转向,从而避免产生环路形成死锁(见图3(d)).图3 容错路由算法的禁用转向示意图Fig.3 Schematic diagram of forbidden turnings for fault-toleront routing algorithm2.2 容错路由算法为了计算数据包的合理输出端口,本算法中每个节点会有一个4 bit的寄存器fault 表示4个相邻节点的故障信息.fault 0,fault 1,fault 2,fault-3分别表示东(E)、南(K)、西(W)、北(N)4个相邻节点的故障信息,数值为0时表示无故障,1则表示有故障.考虑到转向模型下数据包可存在多条传输路径,为了均衡传输的负载,增加1 bit 的标识位 fl ag来决定数据的输出端口.在n×n Mesh NoC下,当前节点坐标为(XC,YC),目的节点坐标为(XD,YD),本算法描述如下.(1)目的节点为当前节点(XC=XD,YC=YD)时,数据包转发到当前节点的知识产权(intellectual property,IP)核,即输出端口Out=L(本地).(2)目的节点与当前节点位于同一轴(XC=XD或YC=YD)时,数据包转发到该轴靠近目的节点的下一节点.(3)目的节点位于当前节点东南(XC<XD,YC>YD)时,如果当前节点不在西边界(XC6=0),南相邻节点故障且其不位于南边界(fault 1=1,YC6=1)时,数据包的输出端口Out=W;其他情况下,Out=S.(4)目的节点位于当前节点东北(XC<XD,YC<YD)时,当北相邻节点故障且不位于北边界(fault 3=1,YD+1 6=n),西相邻节点无故障(fault2=0),数据包的输出端口Out=W;其他情况下,Out=N.(5)目的节点位于当前节点西南(XC>XD,YC>YD)时,当南相邻节点故障且西相邻节点无故障(fault 1=1,fault 2=0),数据包的输出端口Out=W;当西相邻节点故障且南相邻节点无故障(fault 2=1,fault 1=0),数据包的输出端口Out=S;其他情况下,当标识位 flag=0时,输出端口Out=W,将标识位取反;当标识位 fl ag=1时,输出端口Out=S,将标识位取反.(6)目的节点位于当前节点西北(XC>XD,YC<YD)时,当西相邻节点故障且北相邻节点无故障(fault 2=1,fault 3=0),数据包的输出端口Out=N;当北相邻节点故障且西相邻节点无故障(fault 3=1,fault 2=0),数据包的输出端口Out=W;其他情况下,当标识位 flag=0时,输出端口Out=W,将标识位取反;当标识位 fl ag=1时,输出端口Out=N,将标识位取反.基于上述算法的描述可以看出:当目的节点位于当前节点东南或东北时,由于转向模型的限制,只存在一条固定的数据包传输路径;而当目的节点位于西南或西北时,算法可以采用多条路径,同时在节点中增加1 bit的标识位,避免数据包固定传输同一路径造成阻塞.这使得算法具有一定的自适应性,能够缓解热点的产生.2.2.1 单故障节点当NoC存在单个故障节点且故障节点不处于边界时,Zhang’s算法和本算法的原输路径如图4所示.由图可知,在单个故障存在情况下,按照Zhang’s算法,数据包分别从源节点4,6,2传输到目的节点6,1,6.由于故障节点的存在,故障节点以及相连的链路都无法使用,数据包需要在故障节点周围进行绕行才能到达目的节点;而基于本算法,在相同源节点和目的节点的情况下,由于故障节点的旁路被选通,数据包利用旁路结构能够通过故障节点,有效降低数据包的传输距离.本算法最大能优化数据包绕行减少3跳,即源节点和目的节点位于同一列或同一行的情况.当故障节点位于边界时,根据本算法的旁路规则,会产生边界故障,如图5所示.由图可以看出,当前节点与目的节点分别位于节点1与节点5时,由于转向模型的限制,数据包无法通过虚线所示路径传输到目的节点.图4 两种不同容错路由算法的传输路径Fig.4 Transmission path of two different fault-toleront routing algorithms图5 边界故障Fig.5 Boundary fault为了解决图5所示的边界故障问题,提高NoC的容错性和可靠度,本算法允许故障边界节点相连的节点部分180◦转向,以便有效解决边界节点发生故障时数据包的传输限制.禁用的180◦转向如图6所示,其中边界故障的旁路连接可以类似表示为单向传输环路(单向实线箭头构成部分).对于西边界故障形成的单向传输环,允许其北相连节点(节点1)进行由南到南的转向,东相连节点(节点2)进行由西到西的转向,禁止其南相连节点(节点3)进行由北到北的转向;对于北边界故障而言,允许其西相连节点(节点4)进行由东到东的转向,南相连节点(节点5)进行由北到北的转向,禁止其东相连节点(节点6)进行由西到西的转向;对于东边界故障而言,允许其西相连节点(节点7)进行由东到东的转向,北相连节点(节点8)进行由南到南的转向,禁止其南相连节点(节点9)进行由北到北的转向;对于南边界故障而言,允许其西相连节点(节点10)进行由东到东的转向,北相连节点(节点11)进行由南到南的转向,禁止其东相连节点(节点12)进行由西到西的转向.图 6 禁用的180◦转向(虚线)Fig.6 Forbidden 180◦turnings(dotted line)因此,对于图5所示的边界故障,数据包可以先传输到节点7,进行180◦转向,然后通过故障节点4的旁路到达目的节点5.通过允许180◦转向,边界上的数据包可以不受转向模型的限制,正常地传输到相应的目的节点,且面对多故障节点情况时数据包也能够利用这些转向更有效的传输.2.2.2 多故障节点对于多故障情况,Zhang’s等[4]提出了将多个故障节点与一些无故障节点扩展成一个故障区域的设想,但因故障区域中的无故障节点被视为故障节点,无法进行数据的传输接收,降低了NoC的可靠性.图7所示为一对斜对角故障节点的情况.如果当前节点C与目的节点D位于图中位置时,此时目的节点位于当前节点的西南方.故障节点与节点C,D形成了一个故障区域(虚线框).按照Zhang’s算法,故障区域内的节点C和D被视为故障节点,无法进行传输与接收数据.而对于本算法,数据包可以通过故障节点的旁路传输到目的节点,且由于算法的自适应性,数据包可以通过两条路径(实线)进行传输.图7 多故障节点下容错路由算法的传输路径Fig.7 Transmission path for fault-toleront routing algorithm with multiple faults3 算法无死锁证明本算法采用的转向模型是无死锁的,由于在边界故障节点上允许部分180◦转向,因此需证明在边界上允许180◦转向,算法仍无死锁.利用Dally等[9]提出的通道依赖图(channel dependency graph,CDG)的方法,即当网络对应的CDG无环路时,算法在该网络中无死锁.根据Dally的方法,西边界故障时的网络连接如图8所示.由于本算法采用的转向模型禁止东南转向和东北转向,即不存在X56到X64的转向和X12到X24的转向.由于Z54到Y42以及Z54到Y46中也存在东南转向和东北转向,因此也不存在这两种转向.同时,为解决边界故障的问题,增加Y15到Y54的转向和Z54到Z41的转向,禁止Z41到Y15的转向.由采用本算法后网络对应的CDG可以看出,CDG中没有形成环路,即本算法是无死锁的.对于其他边界故障的情形,也可以类似证明.图8 西边界故障的网络连接Fig.8 Network links in west boundary fault4 仿真分析采用NIRGAM仿真器[10]对本算法的性能进行仿真验证,并与Zhang’s算法和Ebrahimi’s算法进行比较.NIRGAM是一种基于System C的NoC专用仿真器,具有代码开源、扩展性好等特点.仿真器的主要参数配置如表1所示.表1 仿真器的参数配置Table 1 Configuration of simulator parameters?为了体现本算法的性能,分别在单故障与多故障情况下进行仿真,比较Zhang’s算法、Ebrahimi’s算法和本算法的平均延迟.在单个故障的情况下,Zhang’s算法、Ebrahimi’s算法和本算法的数据包平均延迟曲线如图9所示.可以看出,在通信负载较低时,3种算法的平均延迟基本一致,但随着通信负载的不断增加,Zhang’s算法和Ebrahimi’s算法的平均延迟分别在通信负载20%和30%时迅速提升,而本算法的平均延迟则缓慢升高,在通信负载为40%后才大幅度升高.在通信负载为30%时,本算法的平均延迟相比于Zhang’s算法改善20.2%,相比于Ebrahimi’s算法改善4.35%.这是由于Zhang’s算法存在较长的绕行路径,在通信负载较高时延迟较大的问题显现出来;而Ebrahimi’s算法虽为最短路径,一定程度上降低了延迟,但由于采用了虚通道,当通信负载较高时会出现负载不平衡的情况,产生阻碍数据包传输的的热点,进而增加了延迟.本算法虽也存在绕行,但相比于Zhang’s算法,绕行距离要短.此外,本算法具有部分自适应性,能够有效避免热点的产生.图9 单故障下3种不同容错路由算法的平均延迟Fig.9 Average latency of three different fault-toleront routing algorithms with single fault在多故障的情况下,由于Zhang’s算法的性能并不高,因此仅比较Ebrahimi’s算法和本算法.图10为多个故障情况下两种算法的平均延迟曲线.可以看出,与单故障类似,本算法仍具有较低的平均延迟,且随着故障节点数目的增多,平均延迟均会有所增加.图10 多故障下两种不同容错路由算法的平均延迟Fig.10 Average latency of two different fault-toleront routing algorithms with multiple faults5 结束语本工作提出了一种低延迟的无虚通道容错路由算法,通过旁路结构,保持了故障节点在部分方向上与相邻节点的连接,进而减少了数据包的传输延迟,同时对边界旁路结构加以改进,解决了算法在使用转向模型时边界节点故障时的路由限制.仿真分析的结果表明,本工作提出的算法能够有效降低数据包的平均延迟,且在多故障下仍能保持良好的性能.参考文献:【相关文献】[1]Silva D R G,Oliveira B S,Moraes F G.Effects of the NoC architecture in the performance of NoC-based MPSoCs[C]//IEEE International Conference on Electronics,Circuits and Systems.2014:431-434.[2]Mahdoum A.An efficient network on chip design flow[C]//IEEE International Conference on Communication Technology.2015:1-8.[3]Radetzki M,Feng C C,Zhao X Q,et al.Methods for fault tolerance in networks-on-chip[J].Acm Computing Surveys,2013,46(1):28-36.[4]Zhang Z,Greiner A,Taktak S.A reconfigurable routing algorithm for a fault-tolerant2DMesh network on chip[C]//45th ZCM/IEEE Design Automation Conference.2008:441-446.[5]姚磊,蔡觉平,李赞,等.基于内建自测技术的Mesh结构NoC无虚通道容错路由算法[J].电子学报,2012,40(5):983-989.[6]Ebrahimi M,Daneshtalab M,Plosila J,et al.Minimal-path fault-tolerant approach using connection-retaining structure in Networks-on-Chip[C]//17th IEEE/ACM International Symposium on Networks-on-Chip.2013:1-8.[7]Kumar M,Kumar K,Gupta S K,et al.FPGA based design of area efficient router architecture for network on chip[C]//IEEE International Conference on Computing Communication and Automation.2016:1600-1605.[8]Glass C J,Ni L M.The turn model for adaptive routing[J].Journal of Association for Computering Machinery,1994,41(5):874-902.[9]Dally W J,Seitz C L.Deadlock-free message routing in multiprocessor interconnection networks[J].IEEE Transactions on Computers,1987,36(5):547-553.[10]Nirgam.A simulator for NoC interconnect routing andapplicationmodeling[EB/OL].(2016-05-08)[2017-01-15]..。
不规则Mesh NoC上基于路由表的路由
不规则Mesh NoC上基于路由表的路由李惠民;沈海斌【期刊名称】《计算机工程》【年(卷),期】2013(000)010【摘要】Network-on-Chip(NoC) system often integrates many heterogeneous components which have different sizes. This NoC has an irregular topology. In the irregular mesh, traditional routing algorithm may not be usable any more. To solve the routing problem, this paper proposes a novel routing algorithm, called INC routing algorithm. INC routing is based on two small routing tables, FDT and IFDT. The simulation result shows that the routing scheme can find the shortest path between two nodes in most cases, which reduces the latency a lot. And the routing tables FDT and IFDT have a fixed size of 12 items. Their sizes do not increase when mesh grows.%片上网络(NoC)系统通常集成很多不同尺寸大小的IP 模块,具有不规则的拓扑结构,传统的路由算法可能不再适用。
针对NoC不规则拓扑结构的路由问题,提出INC路由算法。
该算法采用2个很小的路由表,即FDT路由表和IFDT路由表。
片上互连网络(NOC)发展综述
片上互连网络(NOC)发展综述1. 片上网络成为必然趋势1.1. 单芯片上集成的数百个晶体管的数量随着集成电路制造工艺尺寸等比例的持续缩小,集成电路芯片的性能和集成度按Moore定律迅速提高。
目前单芯片上集成的晶体管的数量可以达到十亿个晶体管,如AMD公司2010年推出的Operon 6100处理器上集成了18亿个晶体管.根据国际半导体技术线路机构2009年预测,微处理器单芯片集成的晶体管的数量在2016年将接近百亿。
图 1 半导体集成工艺的发展趋势1.2. 互连线延迟随着工艺尺寸的减小,晶体管的门延迟等比例的缩小。
而单位长度的金属线[53]的电阻变大,而单位长度的金属线的电容基本保持不变。
单位长度的金属导线随着工艺尺寸的缩小,线延迟增加。
多核体系结构中存在着两种互连线,一是局部互连线,二是全局互连线。
局部互连线是指,随着工艺尺寸的缩小,互连线的长度也会相应的缩小,例如处理器中计算单元内部的互连线。
全局互连线是指,随着工艺尺寸的缩小,互连线的长度不会变化。
局部互连线随着工艺尺寸的缩小,线延迟也会相应的缩小,但是其减小的速度小于晶体管的门延迟。
全局互连线的延迟,随着工艺尺寸的缩小而增加。
全局通讯延迟增长的速度非常快。
图 2给出了每个工艺尺寸下时钟周期是8个FO4,在一个时钟周期,互连2线所能够达到的芯片的区域。
在35nm的工艺条件下,在20X20mm的芯片面积上,一个时钟周期内,信号所能够达到的范围小于整个芯片面积的1%。
因此需要对全局信号,进行精心的设计。
Intel P4处理的设计中采用了2个流水线站来传输数据。
图 2 不同的工艺尺寸下在时钟周期为8FO4~达到的距离图 3 不同工艺节点下互连的相对延时变化1.3. I/O引脚数量按照经验,片外存储器访问通道的数量应至少与片内Core的数量相同。
对于一个64位数据宽度的通道,加上地址和控制总线,所需要的I/O管脚的数量是110根。
同时如果考虑到电源地的I/O管脚的数量几乎是整个管脚的数量的三分之一,那么,这个数值将达到150根。
二维网格结构的NoC通讯架构关键技术研究的开题报告
二维网格结构的NoC通讯架构关键技术研究的开题报告一、选题背景与意义随着互联网和物联网的发展,人们对于高性能计算和分布式系统的需求越来越迫切,而网络互连技术作为高性能计算和分布式系统的重要基础设施,扮演着关键的角色。
Network on Chip(NOC)作为集成电路中的一个新兴技术,其特点是高速、低延迟、低功耗和高可靠性,逐渐被广泛应用于多核处理器、航空航天等领域。
传统的二维网格结构NoC作为一种多核处理器互连网络的重要形式,近年来在路径长度、误码率、吞吐量、功耗等方面均有较大提高,因此也受到研究者的广泛关注。
本文将重点研究二维网格结构NoC通讯架构的关键技术,包括路由算法、流控制、拥塞控制等,旨在进一步提高该类NoC的通讯效率、稳定性和可靠性,对于扩展其在多核处理器、通讯领域的应用具有实际意义。
二、研究内容与目标本文主要针对二维网格结构NoC通讯架构的关键技术展开研究,具体包括以下几个方面:1.路由算法:基于二维网格结构NoC的通讯特点,提出一种适合该结构的高效路由算法,以实现最短路径、最小冲突等目标。
2.流控制:在NoC通讯过程中,需要进行流量控制,避免大量数据同时发送导致网络拥塞的发生。
本研究将针对二维网格结构NoC的流控制进行优化和改进。
3.拥塞控制:当网络出现拥塞时,必须对数据流进行监控和控制。
本研究将探索基于二维网格结构NoC的拥塞控制策略,提高NoC通讯的可靠性和稳定性。
目标:通过设计和优化路由算法、流控制和拥塞控制等关键技术,实现二维网格结构NoC的高效通讯、稳定性和可靠性,挖掘其在多核处理器、通讯领域中的潜在应用价值。
三、研究方法和技术路线1.系统性分析和调研:结合文献资料和实际案例,分析NoC通讯技术的瓶颈和发展方向,优选研究对象和技术路线。
2.算法设计和实验仿真:根据分析结果和优化目标,设计路由算法、流控制和拥塞控制策略并进行实验仿真,分析数据的性能指标如路径长度、延时、吞吐量、拥塞率等。
基于不规则Mesh的NoC无死锁路由
基于不规则Mesh的NoC无死锁路由
段新明;杨愚鲁
【期刊名称】《小型微型计算机系统》
【年(卷),期】2008(29)7
【摘要】网络拓扑的选择是NoC设计中的一个重要问题,目前典型的特定应用NoC系统通常集成多个不同功能、不同尺寸、不同通讯需求的组件,而规则的网络拓扑结构并不适于在这种类型的NoC中应用,因此不规则Mesh网络被提出并被应用于不规则结构的NoC系统.为解决规则 Mesh路由算法在不规则Mesh中无法保证路由连通性的问题,本文提出一种不规则Mesh无死锁路由算法,无论NoC系统集成组件的版图如何变化,这一算法始终是连通的,即算法与不规则Mesh的规模和结构是无关的,同时算法仅使用较低的虚拟通道.
【总页数】4页(P1215-1218)
【作者】段新明;杨愚鲁
【作者单位】南开大学,信息技术科学学院,计算机科学与技术系,天津,300071;南开大学,信息技术科学学院,计算机科学与技术系,天津,300071
【正文语种】中文
【中图分类】TP393
【相关文献】
1.基于3Dmesh的新型热量均衡无死锁路由算法 [J], 陈洁坤;管祥生;续鹏
2.不规则Mesh NoC上基于路由表的路由 [J], 李惠民;沈海斌
3.二维DMesh网络中基于转弯模型的无死锁路由算法研究 [J], 王新玉
4.一种基于2D-mesh的片上网络无死锁容错路由算法 [J], 周磊;吴宁;李云
5.基于路径的无死锁NoC多播路由器的设计 [J], 张颖;吴宁;葛芬
因版权原因,仅展示原文概要,查看原文内容请购买。
NoC在纳米计算结构下的延迟与拥塞优化映射
NoC在纳米计算结构下的延迟与拥塞优化映射徐文苑;段成华【期刊名称】《计算机工程与设计》【年(卷),期】2011(032)001【摘要】片上网络(NoC)映射的性能严重依赖于该网络拥有的互联结构.在自组装的纳米计算结构上探索了NoC映射问题,特别研究了在该结构上与最小延迟与拥塞相关的映射问题.提出了一个用于评估传输延迟的模型,并提出了SWMAP映射算法,使应用任务能够映射到具有小世界特性的纳米计算结构上.该算法使用了两种应用任务测试样例进行测试,实验结果表明,与以前的映射算法相比,在小世界网络结构上SWMAP算法得到的平均通信延迟减少了26%~50%.%The performance of NoC mapping depends strongly on the underlying architecture. We explore NoC mapping on self-assembled nano-scale computing architectures. Specifically, the minimal latency and congestion aware mapping on such architectures is addressed.We first present a novel model for evaluating transport latency, and a mapping algorithm is proposed by utilizing the potential of underlying architecture and equalizing the communication processing capabilities. Two types of applications are used as test benchmarks. Experimental results show that, compared with previous works, a shorter latency of 26%~50% is achieved.【总页数】5页(P51-54,70)【作者】徐文苑;段成华【作者单位】中国科学院研究生院,信息科学与工程学院,北京,100049;中国科学院研究生院,信息科学与工程学院,北京,100049【正文语种】中文【中图分类】TP302【相关文献】1.延迟约束下的功耗与热感知NoC映射 [J], 董文箫;沈海斌;全励;严晓浪2.Web计算模式下服务器端任务拥塞处理的一种优化方法 [J], 王智广;陈明;刘立峰3.内存计算环境下基于索引结构的内存优化策略 [J], 英昌甜;王维庆;于炯;卞琛;国冰磊;祁雷4.云计算环境下大数据分布规律的结构优化设计 [J], 曾令平5.基于ABAQUS计算优化下沭阳闸除险加固结构方案设计参数分析研究 [J], 岳彬彬因版权原因,仅展示原文概要,查看原文内容请购买。
面向能耗和延时的NoC映射方法
面向能耗和延时的NoC映射方法杨盛光;李丽;高明伦;张宇昂【期刊名称】《电子学报》【年(卷),期】2008(36)5【摘要】随着对NoC平台研究的逐步深入,如何将规模庞大的应用合理地映射到NoC平台上成为亟待解决的问题之一.本文基于二维网格结构NoC平台,建立了旨在优化系统通信能耗和执行时间的统一目标函数.提出了通过优化链路负载分布间接优化延时的方法,避免了NoC等待延时精确建模的难题.并且采用蚁群算法实现了面向能耗和延时的NoC映射.调整参数λ,可以选择单一目标或者联合目标优化.本文还对映射结果进行了执行时间模拟.实验结果显示:与随机映射相比,单一目标优化在通信能耗和执行时间上分别能节省(30%~47%)和(20%~39%),而联合目标优化则能在能量支配的映射方案中进一步挖掘时间维度的潜力.【总页数】6页(P937-942)【作者】杨盛光;李丽;高明伦;张宇昂【作者单位】南京大学微电子设计研究所,江苏南京,210093;江苏省光电信息功能材料重点实验室,江苏南京,210093;南京大学微电子设计研究所,江苏南京,210093;江苏省光电信息功能材料重点实验室,江苏南京,210093;南京大学微电子设计研究所,江苏南京,210093;江苏省光电信息功能材料重点实验室,江苏南京,210093;南京大学微电子设计研究所,江苏南京,210093;江苏省光电信息功能材料重点实验室,江苏南京,210093【正文语种】中文【中图分类】TN47【相关文献】1.基于人工蜂群算法的低能耗高性能NoC映射 [J], 邓植;顾华玺;杨银堂;曾代兵2.面向实时数字信号系统关键链路延时的NoC映射方法研究 [J], 陈庚生;陈亦欧;胡剑浩3.面向时延的NoC映射技术研究 [J], 易宏波;罗兴国;陈韬;刘静;桑晓丹4.UWSNs中面向能耗和延时优化的移动数据收集 [J], 殷正坤;李鹏5.面向NoC多核芯片组的任务映射算法 [J], 侯宁;张多利因版权原因,仅展示原文概要,查看原文内容请购买。
NoC映射方法和路径分配研究的开题报告
NoC映射方法和路径分配研究的开题报告一、课题背景与意义网络通信已经成为了人们日常生活中不可缺少的一部分,它涉及的领域非常广泛,例如金融、医疗、教育、娱乐等。
而当前互联网的发展趋势,越来越多的设备需要进行连接,这些设备在数据传输时,需要通过路由器来进行数据包的传输,这就对路由器的性能有较高的要求,而路由器的性能要素中,NoC映射方法和路径分配则是值得重视的一个方面。
因此本次课题旨在研究NoC映射方法和路径分配的优化方式。
二、研究目的本次研究旨在通过对NoC映射方法和路径分配的研究,探索并尝试出优化NoC映射和路径分配的方法和方案,以提高路由器的性能和效率,使其能够更好地满足现代网络通信的需求,为互联网的发展做出一定的贡献。
三、主要内容本次课题将主要围绕NoC映射方法和路径分配展开研究工作,重点涉及以下几个方面:1. 对NoC映射方法的研究与优化NoC映射方法对于提高路由器的性能和效率十分重要,因此本次课题将重点研究NoC映射方法,并探索出更加适合现代网络通信需求的映射算法,以提高路由器的性能和效率。
2. 对路径分配的研究与优化路径分配是路由器数据包传输的重要环节,因此本次课题将针对路径分配展开研究工作,探索出更加高效和灵活的路径分配策略,以提高路由器的数据传输效率。
3. 系统实现与仿真本次课题还将尝试进行系统实现和仿真,以验证优化方案的有效性,评估方案对路由器性能和效率提升的效果。
四、研究方法和技术路线本次研究将采用文献调研、理论分析、实验仿真等研究方法,首先对NoC映射方法和路径分配的相关文献进行调研和研究,结合理论分析,选择合适的算法进行实验仿真。
在实验仿真的过程中,通过对数据进行分析和对实验结果进行统计,验证优化方案的有效性,评估方案对路由器性能和效率提升的效果。
五、预期结果和意义本次课题旨在研究NoC映射方法和路径分配的优化方式,预期结果如下:1. 提出更加高效和灵活的NoC映射方法和路径分配策略,以提高路由器的性能和效率;2. 经过实验仿真验证,优化方案的有效性得到验证,评估方案对路由器性能和效率提升的效果;3. 为现代网络通信的发展贡献一定的力量,促进互联网的发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
弊端 , 提出并设计 了一 种混合 结 构 的时钟 网络 。 析 分 计 算表 明 , 本文 设计 的混合 结 构 时 钟 网 络较 好地 解 决 了通 信延迟 和瞬 时功耗 问题 。
非 对 称 瀑 布结 构 时钟 网络 如 图 3所 示 , 时钟 由
提供时钟 输 入信 号 。meh结构 No 的域 间时钟 网 s C
络 常 采用 非对 称 瀑布 结构 ( tra1和对称 瀑布 结 wae f ) l 构 , 2给 出了 meh结 构 No 的时 钟 网络结 构 框 图 s C 图 ( 问时钟 网络是非 对称 瀑 布结构 的情况 ) 域 。
( aefl) 对称 瀑布 网络 通信 延迟 大的弊 端 , 出并设计 了一 种混合 结构 的时钟 网络 。并 以 4 w tra 和 1 提 × 4混合 结构 时钟 网络为例 , 计算得 出该时钟 网络 的最 大通信 延迟 为非 对称 瀑布 网络 的 1 . % , 2 5 局部
单方 向数 据流 的通信 延迟 约 为对称 瀑布 网络 的 2 , 5 芯片 的瞬 时功耗 约 为 同步 时钟 网络 的 5 %。 O源
和 开关 之间 的局 部 互 联完 全 独 立 于 网络 的大小 , 提
高 了可扩展性 。另外 , 维 meh拓 扑结 构 中网络路 二 s 由相对 简单 , 网络开关 的逻辑相 对较 小 , 占用 较小 故
式 中 , 是相 邻 域 问的时 钟延 迟 , 是 经过 的时 △
左 上 角引人 , 每经 过 1个 域就 分为 2个分支 , 个 分 1 支 水平走 , 1个分 支 引入 临近 的 1 。 另 列 每列时钟 信 号 向下延 伸 至最末 的 1 域 。图 中每个 空心箭头 不 个
1 N C 的 meh结 构 及 时 钟 网络 o s
No 的 网 络结 构 可 以根 据 应 用 的需 要 采 用 不 C 同 的 拓 扑 结 构 , me h F tte 如 s 、 a—re和 Ho e cmb nyo
meh结 构 N C的时 钟分 为 域 问时钟 和域 内时 s o 钟 。 内时钟是 图 1资源 中 的时钟 , 域 该时钟是 由资 源 内的 时钟 调整 电路 产 生 的 时钟 信 号 , 同资源 的 时 不 钟 在频率 和 相位 上没 有任何 相 关性 。域 间时钟是 分 布 在 资源 之 间 的时 钟 , 时 钟 不仅 给 域 间的 网络 开 该
关 提供 工作 时 钟 , 且 还 给 资源 中的 时钟 调整 电 路 而
的串扰耦合 , 天线效应和瞬时错误 ̄5 43 ,等都将很难解
决 。No C能够 在一 定 程度 上解 决 上 述 问题 , 缩小 设
计和生产 之间 的差距 。 本 文针 对 同步 时 钟 网络 的 瞬 时功 耗 大 , 对 称 非 瀑 布网络 ( tr l 和对称 瀑 布 网络通 信延 迟 大的 waef 1 a)
维普资讯
20 年 8 0 6 月
西 北 工 业 大 学 学 报
J u n lo rh se n P ltc n c l ie st o r a fNo t we tr o ye h ia Un v riy
Au . g
2 0 0 6
第2 第4 蜷 期
t n l t c n l g o d p f r s m io d c o s) i a e h o o y r a ma o e c n u t r [ o ]
的芯片 面积 。基 于上 述 2点 , 以 No 所 C一般 都选 择 meh拓 扑 结 构 , 1给 出 了 No 的 m s s 图 C e h结 构 框
关 键 词 : C, No 时钟 分布 网络 , tral混合 结构 时钟 网络 waefl , 文献 标 识码 : A 文章 编 号 :0 0 2 5 (0 6 0 — 7 — 5 1 0 — 7 8 2 0 ) 44 20
中图分类 号 : P 0 T 32
国际半 导体 技 术 发展 部 门 I RS Th nen — T ( eitra
V o1 2 o. . 4N 4
me 构 No 的时钟 网络研 究 s h结 C
周 国 昌 ,沈 绪 榜
( 北工业大学 计算机学 院,陕西 西安 7 0 7 ) 西 1 0 2
摘
要: 分析 了 meh结 构 No 的 3种 时钟 网络 , 对 同步 时钟 网络 瞬 时功 耗 大 , s C 针 非对称 瀑布 网络
图 。
预测 单个 芯片 的集 成 度将 达 到 几 十亿 晶体 管 , 特征
尺 寸将缩 小 到 5 m; 0n 时钟 频 率 可达 l Hz全 局 OG ; 信号 的延 迟 可能 超 过时 钟 周期 [ , 而 增 加 了全 局 2从 ] 同步 设计 的 困难 ; 片上 通信 资源 的设计 将 代 替计 算 资源 成为 设计 的 主 要部 分L ; 艺 等 比例 缩小 带 来 3工
但代表信号方 向, 而且还形象地代表经过每个域后 的时钟 延迟 。由于 meh拓扑 结构 规整 , 信开关 一 s 通
致, 负载 相 同 , 以相 邻开 关 之间 的时钟 延迟相 同 。 所
( )数 据 流与 时 钟 同方 向时 , 间延迟 时间 r 1 域 , 的计算 如下
T — m ・A Td () 1
收 稿 日期 :0 51-9 2 0 —I0 作 者简 介 : 国 昌 (9 8 ) 西 北 工 业 大 学 博 士生 , 要 从 事 计 算 机 体 系 统 结 构 及 嵌 人 式 芯 片设 计 的 研 究 。 周 17一 , 主
维普资讯