一种高速浮点加法器的设计实现

合集下载

高速浮点FFT处理器的FPGA实现

高速浮点FFT处理器的FPGA实现

计数器

蝶运模 型 块
蓑I 会l _ ~输 M I
R A 一 一

t 控制 器
输I t { 数据
R A
何 最后 ・ 缀写地 址



r :。 h i -
31浮点蝶形运算单 .
31 自定制浮点数据格式 .1 .
图 2 FT F 处理器结构图
F b 2 0 e. 0 6
文章编号:17— 59( 0 6 0 —0 0 0 63 14 20 ) 106— 4
高速浮点 F T处理器的 F GA实现 F P
丁智泉 ,张红雨
( 电子科技 大学电子工程 学院,成都 605 ) 10 4
摘 要 :介 绍 了一种 基 于 F GA 的 12 点 自定义 2 位 浮点 F T处理 器的设 计 。采 用改进 的蝶 形 P 04 4 F
件 x v 00来实现 F T处理器。 c l0 F
3 F T 处理 器 结 构 F
本文中的 F T信号处理器的结构如 2所示。从罔 2 F 中可以看到浚H可 处理器包括: 蝶形运算单元、 旋转因子 R M 、 O 输入数据 R M、 【 A 输}数据 R M 、同址运算 R M 、 I A A 计数器 、 地址产生器和主控制器。
维普资讯
第 1卷 第 1 9 期
20 06年 2月
四川理工学院学报 (自 然科 学版 )
J OURNA1 OF S CHUAN . I UNI VERS T OF I Y
v0 .1 1 9No. 1
S IN E&E CE C NGI E I G( T R C E EE TON、 NE R N NA U ALS INC DII

32位浮点加法器设计

32位浮点加法器设计

32位浮点加法器设计32位浮点加法器是一种用于计算机中的算术逻辑单元(ALU),用于执行浮点数的加法运算。

它可以将两个32位浮点数相加,并输出一个32位的结果。

设计一个高效的32位浮点加法器需要考虑多个方面,包括浮点数的表示形式、运算精度、舍入方式、运算逻辑等。

下面将详细介绍32位浮点加法器的设计。

1.浮点数的表示形式:浮点数通常采用IEEE754标准进行表示,其中32位浮点数由三个部分组成:符号位、阶码和尾数。

符号位用来表示浮点数的正负,阶码用来表示浮点数的指数,尾数用来表示浮点数的小数部分。

2.运算精度:在浮点数加法运算中,精度是一个重要的考虑因素。

通常,浮点数加法器采用单精度(32位)进行设计,可以处理较为广泛的应用需求。

如果需要更高的精度,可以考虑使用双精度(64位)浮点加法器。

3.舍入方式:浮点数加法运算中,结果通常需要进行舍入处理。

常见的舍入方式有以下几种:舍入到最近的偶数、舍入向上、舍入向下、舍入到零。

具体的舍入方式可以根据应用需求来确定。

4.运算逻辑:浮点数加法运算涉及到符号位、阶码和尾数的加法。

首先,需要判断两个浮点数的阶码大小,将较小的阶码移到较大的阶码对齐,并相应调整尾数。

然后,将尾数进行相加并进行规格化处理。

最后,根据求和结果的大小,进行溢出处理和舍入操作。

在32位浮点加法器的设计中,还需要考虑到性能和效率。

可以采用流水线技术来提高运算速度,将加法运算划分为多个阶段,并在每个阶段使用并行处理来加速运算。

此外,还可以使用硬件加速器和快速逻辑电路来优化运算过程。

总结起来,设计一个高效的32位浮点加法器需要考虑浮点数的表示形式、运算精度、舍入方式、运算逻辑以及性能和效率。

在实际设计中,还需要根据具体应用需求进行功能扩展和优化。

通过合理的设计和调优,可以实现高性能的浮点加法器,满足不同应用场景的需求。

一种64位浮点乘加器的设计与实现

一种64位浮点乘加器的设计与实现
持 IE 一5 E E 7 4标 准 的 6 bt 4 i 浮点 乘加 器 。
关 键 词 改进 B t oh 2算 法 浮 点 乘 加 器
Wa ae l c 树 全 定制 l
文 章 编 号 1 0 — 3 1 ( 0 6 1 — 0 5 0 文献 标 识 码 A 0 2 8 3一 20 )8 0 9 — 4 中图 分 类 号 T 3 2 P 1
( o e e o C mp t ce c , otw s r o tc nclU i r t, ia 0 2 C l g f o ue S i e N r et n P l eh i nv s y X ’n 7 7 ) l r n h e y a ei 1 0
Ab t a t T e sr c : h mu t l — d p rt n s f n a na n ma y s i n i c n e g n e n p l a in , s e il n t e l py a d o e ai i u d me t l i n c e t a d n i e r g a p i t s e p ca l i h i o i f i c o y i d f ma e r c s i a d f l o i g p o e s g n DS t e l a ig— on mu t l a d r a b e w d l u e . mi g t o r C 0 e e n P.h f t o n p it l py- d e h s e n i e y s dAi n a P we P 6 3 i mirp c so s se , 6 b t c r e s r y tm a 4一 i o o mu t l a d u e f ai g- on u i l p y— d f s d l t i o n p it nt wh c s p o t E ih u p rs I EE一 5 d u l p e iin 7 4 o b e r cso l t n tn a d s f ai g — i t sa d r i mp e n e n MI 02 u o n p o i lme t d i S C .5 m 1 5 CMOS e h oo y wi h t o f p st e d r c in P M tc n lg t t e me h d o o i v i t h i e o f l c so c r u t& ly u e in I U e o r h n ie meh d n l dn mp v d o t l oi m , la e o — ul u tm i i — c a o t d s . S S a c mp e e sv t o i cu i g i r e B h a g rt g t o h Wa l c c n p e s g te — n t b ln e - o rs o o i g o aa c d 4 2 c mp e s g u i n ar — a e a d r t . rs i r e u i a a c d 4 2 c mp e s c mp sn f b ln e - o r s i nt a d c r s v d e s e c n n s y Ke wo d :i r v d B t l o i m , l p y a d, a lc r e f l c so d sg y r s mp o e o h a g r h mu t l- d W l e te ,u l u t m e i t i a — n

32位浮点加法器设计

32位浮点加法器设计

32位浮点加法器设计一、基本原理浮点数加法运算是在指数和尾数两个部分进行的。

浮点数一般采用IEEE754标准表示,其中尾数部分采用规格化表示。

浮点加法的基本原理是将两个浮点数的尾数对齐并进行加法运算,再进行规格化处理。

在加法运算过程中,还需考虑符号位、指数溢出、尾数对齐等特殊情况。

二、设计方案1. 硬件实现方案:采用组合逻辑电路实现浮点加法器,以保证运算速度和实时性。

采用Kogge-Stone并行加法器、冒泡排序等技术,提高运算效率。

2.数据输入:设计32位浮点加法器,需要提供两个浮点数的输入端口,包括符号位、指数位和尾数位。

3.数据输出:设计32位浮点加法器的输出端口,输出相加后的结果,包括符号位、指数位和尾数位。

4.控制信号:设计合适的控制信号,用于实现指数对齐、尾数对齐、规格化等操作。

5.流程控制:设计合理的流程控制,对各个部分进行并行和串行处理,提高加法器的效率。

三、关键技术1. Kogge-Stone并行加法器:采用Kogge-Stone并行加法器可以实现多位数的并行加法运算,提高运算效率。

2.浮点数尾数对齐:设计浮点加法器需要考虑浮点数尾数的对齐问题,根据指数大小进行右移或左移操作。

3.溢出判断和处理:浮点加法器需要判断浮点数的指数是否溢出,若溢出需要进行调整和规格化。

4.符号位处理:设计浮点加法器需要考虑符号位的处理,确定加法结果的符号。

四、性能评价性能评价是衡量浮点加法器设计好坏的重要指标。

主要从以下几个方面进行评价:1.精度:通过与软件仿真结果进行比较,评估加法器的运算精度,误差较小的加法器意味着更高的性能。

2.速度:评估加法器的运行速度,主要考虑延迟和吞吐量。

延迟越低,意味着加法器能够更快地输出结果;吞吐量越高,意味着加法器能够更快地处理多个浮点加法运算。

3.功耗:评估加法器的功耗情况,低功耗设计有助于提高整个系统的能效。

4.面积:评估加法器的硬件资源占用情况,面积越小意味着设计更紧凑,可用于片上集成、嵌入式系统等场景。

基于IEEE754浮点数的快速反码加法器设计

基于IEEE754浮点数的快速反码加法器设计


c l
图 2 3位 加 法 器
图 3 由 3 加 法 器 构 造 的 9位 超 前 进 位 加 法器 位
第 一级 超前 进位 逻辑 的输 出可 由( ) 3 式递 推得 到 : = o 0 。 C G +尸 c C =G + 1 1 1 P G + 1 0 0 2 1 P C =G + 1 0 P 尸 C 由此类 推 , C =G + 2 1 2 1 0 2 P C 3 2 P G +P P G +P P10 0 在这 一组 3位加 法器 中 , 可令 在 组进位 c 表 达式 中
成原码 , 最快的方法是使 用反 码运算 系统 。试应用超前进位和 反码运 算 系统原理设 计 了单精 度 浮点数
的快 速 的 阶码 减 法 器 和 尾 数 加 法 器/ 法 器 。 减
[ 关键 词] 浮点数 ; 加法器 ; 反码 ; 超前进位 [ 中图分类 号]T 1 [ 献标 识码 ]A P3 文 [ 文章编号 ]10 6 2 2 0 )6- 0 3一 5 0 6— 4 X(0 7 0 0 8 o
达式 为 : S =AoB oC C =AB +( iC … A +B )
() 1
() 2
第 二个 等式可 以写 为 :
C+ 1= Gf Pi + C
其 中 : AB ; =A + G = i B;
[ 收稿 日 ]0 7 O 一 8 期 2 0 一 3 O [ 作者简介 ] 李澄举 (9 9 , , 14 一) 男 广东梅县人 , 副教授 , 主要研究方 向: 计算机硬件设计 。
C + = G +Pi 1+ Pi 1Gf 2+ … +P 1 P1 1 Gi Pi P … G0+PE 1 o 0 P …P C

多工位级进模设计实例

多工位级进模设计实例

多工位级进模设计实例在计算机科学领域中,多工位级进模设计是一种用于提高处理器性能的技术。

它通过将处理器划分为多个工位,并在每个工位上同时执行不同的指令,以实现指令级并行处理。

本文将介绍几个多工位级进模设计的实例,以帮助读者更好地理解这一概念。

实例一:乘法器设计乘法运算是计算机中常见的运算之一。

在传统的乘法器设计中,需要进行多次乘法和加法操作,整个运算过程比较耗时。

而采用多工位级进模设计,可以将乘法运算拆分为多个阶段,每个阶段在一个工位上并行执行。

例如,可以将乘法器划分为部分积生成、部分积累加和最终结果生成等多个工位,在每个工位上同时执行不同的操作。

这样可以大大提高乘法器的运算速度。

实例二:浮点数加法器设计浮点数加法是计算机中常见的浮点运算之一。

在传统的浮点数加法器设计中,需要进行多次位运算和规格化等操作,整个运算过程较为复杂。

而采用多工位级进模设计,可以将浮点数加法器划分为多个阶段,每个阶段在一个工位上并行执行。

例如,可以将浮点数加法器划分为对阶段、对尾数相加和规格化等多个工位,在每个工位上同时执行不同的操作。

这样可以显著提高浮点数加法器的运算速度。

实例三:流水线设计流水线是多工位级进模设计中常用的一种技术。

它将处理器的指令执行过程划分为多个阶段,并在每个阶段上同时执行不同的指令。

例如,可以将流水线划分为取指、译码、执行、访存和写回等多个阶段,在每个阶段上并行执行不同的指令。

这样可以大大提高处理器的指令执行效率。

实例四:并行排序算法设计排序算法是计算机中常用的一种算法。

传统的排序算法通常是串行执行的,即每次只处理一个元素。

而采用多工位级进模设计,可以将排序算法划分为多个阶段,每个阶段在一个工位上并行执行。

例如,可以将排序算法划分为分组、局部排序和合并等多个工位,在每个工位上同时处理不同的元素。

这样可以显著提高排序算法的执行速度。

多工位级进模设计是一种提高处理器性能的重要技术。

通过将处理器划分为多个工位,并在每个工位上同时执行不同的指令,可以实现指令级并行处理,从而大大提高处理器的运算速度和指令执行效率。

浮点加法器IP核的VHDL设计

浮点加法器IP核的VHDL设计

1 装载 : ) 比较 A B的指数域 e, , 、 1e 并把 A B 别装 载 2 、分
到两个 寄存器 R g eA和 R g eB中, 出现非规 格化加 数 (e 若 d—
n r l u es , oma nmbr)将其规格化 。
2 移位 : ) 计算差值 d 一e i将指 数小 的浮 点加 数 =i e 2, 1
( )Na 不是一 个数 )e 5 /0 7 且 , 0 则 V= 5 N( : =2 5 24 , ≠ ,
Na N。
1 2 浮点 数加法运算规则 .
S e3 : ] l02 3
2 2 3 2
f 20 [ :] 2

满足速度上的要求 , 浮点加法器体系结构 采用多周期 5 级流 水线方式 , 图 2 如 。根据运算 规则 把完成一次 浮点数加 法分
成 5 步 骤 : 载 (od 、 位 (hf) 相 加 (d ) 规 格 化 个 装 1a ) 移 si 、 t ad 、
的尾数 右移 d位 , 使得 A、 B具有 相同的指数 , 出的位保存 移 在尾数的扩展位 , 以提高运算精度 。 3 相加 : A、 ) 将 B的尾 数转换 成 2的补码 的形 式 , 并相
加。
4 )规格化 : 结果规格 化使 尾数格 式为 1f ,。找 出高位第

1 IE 5 浮点数标准与浮点数加法的运算规则 E E 74
1 )×2 ×1 f .。
图 2 多周期 5级流水线的浮点加 法器结构
( )( , )如果 e 2 +0 一0 : :0且 ,=0贝 =( ) ×0 ,0 一1 。
( )非规格 化数 : =0 但 f  ̄ , V为非规格化数。 3 e , s 0则 :

一种高速浮点加法器的优化设计

一种高速浮点加法器的优化设计

Ab ta t sr c :H ih p r o ma c l a i g p i t d e h o t n a t f d r c o r c s o s lo i h e lt g - e f r n ef t - o n d ri t e i o n a s mp ra t rso p mo e n mir p o e s r ,a s st e r a— i me i g r c s i g a d d g t l in l r c s ig c r ,a d t e k y t h c o r c s o a a p o e sn a h,t e c c e ma e p o e s n n i i g a o e sn o e n h e o t e mir p o e s rd t - r c s i g p t as p h y l o a i a d t n o e a in d cd d t e mir - r q e c ft e d vc . W e p e e t a n w e in o EEE c mp i n fb sc d i o p r t e ie h c o fe u n y o h e ie i o r s n e d sg f I o l t a d u l p e ii n f a i g p i ta d rb sn a i u p i z t n t c n q e , u h a wo d t a h s p r t n, h e o b e r c s l t n d e y u ig v ro s o t o o n o mia i e h iu s s c s t a a p t e a a i t r e o o p p l e s a e ,a t s 4 b CL a d r a n w A g c f rhg - p e l a i g p i ta d r i ei t g s f s e t5 A d e , e LZ l i i h s e d fo t - o n d e .wh c to u e aro n o o n ih i r d c sa p i f n f s a al l n iia o y a i me i o a t i a el a i g z r i ft e r s l o u ta t n wih u n wi g wh t e a tp r l t p t r rt ea c h tct n i p t e d n - e o b t o h e u t fs b r c i t o tk o n eh r c s o t e r s t s p st e o e a ie Al f a o e f c i ey i c e s t e s e d o f a ig p i t a d r n t Afe h e e i o i v r n g t . i v l b v e f t l n r a e h p e f l t - o n d e u i, o e v o n tr

浮点加法运算器前导1预判电路的实现

浮点加法运算器前导1预判电路的实现

预判与尾数的减法运算并行执行 , 不是对减法结果的判 断, 而 同时 , 并行 检 测 预 判 中可 能 产 生 的 1位 误 差 , 效 缩短 了整 有
个 加 法 器 的 延 时 。 L P 电路 设 计 采 用 V L语 言 门级 描 述 , O HD 已通 过 逻 辑 仿 真 验 证 , 在 浮 点 加 法 器的 设 计 中得 到 应 用 。 并 关 键 词 浮 点 加 法 规 格 化 前 导 1 判 预
p se h o c s lt n a d v r c t n I i a pid t te d s f f a n — it d e. a sd te l i ai e f a o . s p l o h ei o o t g— n d r i g mu o n i i i t e n g l i p o a
文 章 编 号 1o — 3 1 (o 2 2 — 12J 文 献 标 识 码 A o 2 8 3 一 2 o )1 0 4 ’ 2 0 中 图分 类 号 r 3 22 1 P3. +
Th sg f Le d n - e De i n o a i g On r d ci n i o t g Po n e P e i to n Fl a i - i t Ad e n dr
Li Xi o i Su a y ng n Fumi  ̄ Xi H o ng a ng
( ej g U i ri fS i c B in nv sy o c n e& T c n l y B in 0 3 i e t e eh oo , e ig 10 8 ) g j 0
维普资讯
浮点加 法运算器前 导 1 预判 电路 的实现
李笑 盈 孙 富 明 夏 宏
( 京科 技 大 学信 息 工程 学 院 , 京 10 8 ) 北 北 0 0 3 ( 国防 科技 大学 电子 工程 学 院 , 长沙 4 0 7 ) 10 3

一种深度流水线的浮点加法器

一种深度流水线的浮点加法器
司的 Srt I系列芯 片, 级 流水线可 以达 到 3 6MHz t iI ax 8 5 以上的速度.
关键 词 : 浮点加法器;P A 流水线; FG ; 吞吐量
中图分 类号 : N 3 . T 4 12
文献 标识码 : A
文章 编 号 :o 59 9 ( o 7 O -9 o l o -4 O 2 o ) 3o 儿-4
b t d xo rt na dma t s p r t n, d io ds b rcinwees p r t p r sp e n e Fo i— o hi e p ai ni ao ai n e o n s e o a dt na u t t r e aae a a t i n a o d wa rs td e rsn

gepeio 3 i ) p rt n we s tr ’ Srt Ifmi h ,ahee ru h u ts n r ta 5 l r s n(2bt o ai , e Al aS t i I a l c i ci d t o g p t ae oe h n3 6 ci s e o u d e a x y p v h r r
S HAO Ji , U n ln YU n c e g e Wa —e g. Ha —h n
(olg f If r t nS i c n eh oo y, n igUnvri f rn ui C l e n omai c n e d T cn lg Na jn ies yo Aeoa t s& As 0 “i5 e o o e a t c tm t , r c " 1 0 6 C ∞ ) g2 0 1
M Hzb ih-tg epy pp l i . yeg t a ed e l iei u s ng Ke o d :la ig p i ta d r PGA ;p p l i g h o g p t y w r s fo tn - on d e ;F iei n ;t r u h u n

浮点加法的SystemC设计

浮点加法的SystemC设计

Abta tB sdo ige一 o£ gI E 7 4 h o £ d e ei e . h aioa m t di Src : ae ns l Ⅱ a n E E 5 ,fe 1a ad r sds d T et df nI eh n i f i r j o s
t b i ess m m d l yuigHD ( ad aed s nl g ae ,u eef i c w adnt i o u dt yt o e b s L hrw I ei n ug ) b th fc n yi l n o f l h e n | g a t ie so t t SC ss m o hp ei . sa e ad aed s nl g ae ae nC+ l g ae Ss m o o ( yt nc i)d s n A w h rw r ei n u g sdo + a ug ,yt C i e g n g a b n e s
mo e s i b e frs se l v l e i t a L. a e n t en w o o t d e , g r h d s n a d te r ut l o y tm e e s h n HD B s d o h o fn a d r Al oi m e i n a d f a t g h
moeVr i u ot ga d r at f d l 0 ytm e i . r0e V ot ai d e r 0 ue f s C t d pc ge n n p mo S e o t
Ke r s Ad e ; i mei ; v tmC y wo d : d r Ar h t S se t c
smc u e ma p n t h ka i g a d r i h n tn e, ak d a o t h w sg s se i y tmC, t tr p i g wih t e f tn d e s t e i sa c tl e b u o de i n y tm n S se

32位浮点加法器设计[整理版]

32位浮点加法器设计[整理版]
32
32位浮点加法器设计
苦行僧宫城
摘要:运算器的浮点数能够提供较大的表示精度和较大的动态表示范围,浮点 运算已成为现代计算程序中
不可缺少的部分。浮点加法运算是浮点运算中使用频率最高的运算。因此,浮 点加法器的性能影响着整个
CPU勺浮点处理能力。文中基于浮点加法的原理,采用Verilog硬件描述语言
设计32位单精度浮点数加法
f)规格化移位:对尾数加减结果进行移位,消除尾数的非有效位,使其最高位为
1。Байду номын сангаас
g)舍入:有限精度浮点表示需要将规格化后的尾数舍入到固定结果。 由以上 基本算法可见,它包含2个全长的移位即对阶移位和规格化移位,还要包括3个全 长的有效加法,即步骤c、d、g。由此可见,基本算法将会有很大的时延。
2 32位浮点加法器设计与实现
器,并用modelsim对浮点加法器进行仿真分析,从而验证设计的正确性和可 行性。
关键词:浮点运算 浮点加法器Verilog硬件描述语言
Studying on Relation of Technology and Civilization苦行僧宫城
(School of Mechatronic Engineering and Automation, Shanghai
University, Shanghai,China)
Abstract: The floating-point arithmetic provides greater precision and greater dynamic representation indication range, with floating point calculations have become an indispensable part of the program.Floatingpoint adder is the most frequently used floating point arithmetic. Therefore, the performance of floating point adder affecting the entire CPU floating point processing capabilities. In this paper the principlebased floating-point addition, Verilog hardware description language

基于FPGA的高速浮点加法器的实现

基于FPGA的高速浮点加法器的实现

第一作者简介 : 秀芳(97 )女 , 族 , 士 , 授 , 究 方 向: 王 16 一 , 汉 博 教 研 无线通信。 通 讯 作 者 简 介 : 振 龙 ( 9 5 ) 男 , 族 , 士 研 究 生 , 究 方 侯 18 一 , 汉 硕 研 向 : 息 传输 及 处理 。 信
2 浮点加法器的硬件实现过程
的硬 件实 现注入 了新 的活力 。
位、 双精 度 6 4位 。以单精 度 浮点 数 为 例 , 计 了 3 设 2
位 的高 速浮 点加法 器 。

— 一 E —
—— —— ——— ÷ ・——— 一M — — ——— —+
文献 [ ] 计 了高速 的 F T 处 理 器 , 内部 正 2设 F1 I 其 是使用 了浮点算 法 单 元 。 由于 其 使用 的是 1 6位 浮 点算 法 , 整个设 计 的精 度 方 面还 有 待 提 高 。文 献 在 [] 3 利用 V ro D ei gH L语 言设 计 了一 种 浮点 加 法 器 , l 系统最 高 时钟频 率达 到 8 MH , 是应 用 在 实 时 信 0 z但 号处理 领 域 , 钟频 率 还有 很 大 的提 高 。文 献 [ 时 4]
Sm S i E进 行 联 合 仿 真 结 果 表 明 , 系统 的运 行 精 度 可 以达 到 1 数 量 级 , 时该 设 计 可 参 数 化 、 作 为 独 立 的 子 系统 应 用 于 其 0 同 可
他 数 字 信 号处 理 领 域 。
关键词
IE 7 4 E E 5
可 编程 逻 辑 门 阵 列
第 l 0卷
第2 5期
21 0 0年 9月




32位高速浮点乘法器优化设计

32位高速浮点乘法器优化设计

集成电路设计与开发n墨i乒mdD目幛l叩m∞IofIc32位高速浮点乘法器优化设计周德金1,孙锋2,于宗光2(1.江南大学信息工程学院,江苏无锡214036;2.中国电子科技集团公司第五十八研究所,江苏无锡214035)摘要:设计了一种用于频率为200MHz的32位浮点数字信号处理器(DSP)中的高速乘法器。

采用修正B∞tll算法与wa‰e压缩树结合结构完成Carrysum形式的部分积压缩,再由超前进位加法器求得乘积。

对乘法器中的4.2压缩器进行了优化设计,压缩单元完成部分积压缩的时间仅为1.47曲,乘法器延迟时间为3.5哪。

关键词:浮点乘法器;Bootll编码;4.2压缩器;超前进位加法器中图分类号:TN332.22文献标识码:A文章编号:1003.353x(200r7)10J0000.04Des咖ofa32.bitIIigh-Speednoa铀g-PoiIltMultiplierzHouDe.jinl,suNFen92,Yuz叽分gua孑(1.删钿m砌nE喈打姗{嗜,瑚t豇l如,SD砒册毙rlg娩‰妙,阢硝2l加36,嘶u;2.77le58山脑凹旆触出地,凹粥,‰i214035,C越眦)Abs仃act:Allig}I-speedmultiplierin200MHz32bitnoating—pointDSP啪8p陀鸵nted.M0d正edb∞tllalgoritllm如dtlleWallacetr∞wem岫edto剐ucetllec盯rys盯epaItialproductto蛐matldc邺r、nect0坞,aca玎ylook-alleadadd盯w∞d鹤ignedtocon、rerttlIe8岫“c缸ryve=cto糟tofinalfom蚍.Theope珀tir唔cycletin抡oftllecoⅡlpre鹪ionuIliti81.47n8by叩tiIIIi五ngthe4—2coⅡ甲r嘲晦。

一种高性能四倍精度浮点乘加器的设计与实现

一种高性能四倍精度浮点乘加器的设计与实现

d e c r e a s e d . A n d b y m a k i n g u s e o f p a r a me t e r i z e d d e s i g n a n d v e r i i f c a t i o n me t h o d o l o g y , t h e c o r r e c t i o n o f t h e Q P F MA i s v e r i i f e d e ic f i e n t l y .
第4 0 卷 第 2 期
Vo 1 . 40
NO . 2





2 0 1 4年 2月
Fe b r u a r y 2 01 4
Co mp u t e r En g i n e e r i n g

开发研究与工程应用 -

3 t l t m- g - : 1 0 0 一 3 4 2 8 ( 2 0 l 4 ) 0 2 9 4 _ _ 0 6 文 献l ; i 嘏码: A
HE Ju n, HUANG Yon g - qi n, ZHU Yi ng ( S h a n g h a i Hi g h P e r f o r ma n c e I n t e g r a t e d Ci r c u i t De s i g n C e n t r e , S h a n g h a i 2 0 1 2 0 4 , C h i n a )
中图 分类号: T P 3 6 8 ・ 1
种 高性能四倍 精度 浮点乘加 器的设计 与实现
何 军 ,黄永勤 ,朱 英
( 上海 高性 能集 成 电路设 计 中心 ,上海 2 0 1 2 0 4 )

一种定浮点合并的FALU设计与实现

一种定浮点合并的FALU设计与实现

操作模式选择信号 M d , oe还有一个用于定点加减指 令的进位信号 Cn i。输 出信号也有四个 :2位的结 3 果输 出信号 R sl, eut只有 在 执 行 浮 点 指令 时才 有 效 的下 溢信 号 U o l fw和上 溢 信号 0 o 只有在 执行 定 l fw,
点加 减指令 时才 有效 的进 位输 出信号 C r 。 ar y
Absr c :AL ta t U i t k y u c in l ni f s he e f n t a u t mo eT o O d il CPU a d n DS P.Th s a e i to u e a i p p r n r d c d Flai g—p i t i e —pon u e F ot n o n F x d i t f s d ALU, hrug o T o h c mbi t n o u c in l n t e s tc n lg nai ff n to a u is r u e e h oo y, o o r n s lto e hn l g mu tpe d t ah tc n lg pea d io ai n tc oo y, li l aa p t e h o o y,i h o y,tc n r du e c i ra a d r d c n t e r i a e c h p a e n e u e p we o u t n ef ci ey i a x c t i d fi sr ci n,Si lto h wst a h o rc ns mp i fe t l . tc n e e u e21 n so n tu t o v k o mu ain s o h tt e FAL c n U a
I < Bi ( l0 n 3 :1 J (
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
பைடு நூலகம்
法器的使用频度为 ))$ " 浮点加法器在协处理器 中占有绝对重要的地位! 其性能优劣必然影响到
-./ 浮点处理性能 " 浮点加法器要满足单精度 # 双 精 度 和 !0 位 扩 展 精 度 实 数 或 者 临 时 实 数 1+ 位 符 号 #+) 位增阶指数 #23 位尾数4 的要求 "
协处理器内部将临时实数格式用于所有的计 算 " 从存储器中读取所有的数据类型将自动转换为 临时实数格式 " 由于临时实数格式的精度和范围超 出其它格式很多 ! 因此计算最终结果引入的误差也 将可能发生在短实数 1单精度数 5 或者长实数 1 双精度 数5 的范围之外 " 本文的浮点加法器设计成 +2 位指 数加法器和 2! 位尾数加法器两大部分 " 23 位的尾 数加法器考虑到 3 位用于舍入和精度控制的附加 位 ! 可以扩展到 2! 位组成尾数加法器及其总线 "
1@5 由于对阶移位和规格化移位互斥 ! 在关键路 径上只存在其一 " 在符合 ABBB 规格化有效的操作
数加法中 ! 可省去规格化移位 "
1C5 前导 + 位置预测判定 !从操作数中预测结果 前导 0 的个数 " 不要等到运算结果出来后再计算结 果需规格化移位的次数 " 加法与前导 0 预测并行处
ABBB 最近舍入 1GH5! 无论是舍入和转换 ! 计算 IJK 和 IJKJ+ 都是必要的 " "#$%&’( 根据两条运算路径的具体特点 ! 提出
两种可变延时的 ;8<=>’;? 算法1LMI5*+," 在可变延时 中 ! 完成 一 个 操 作 周 期 数 是 可 以 变 的 ! 结 果 一 经 算 出就输出 ! 以减少平均延时 " 本文在借鉴改进的 ;8<=>’;? 算法同时 ! 侧重从 电路结构上采用动静态进位链的设计方法 ! 减少关 键路径延时 !提高浮点加法器的运算速度 "
理 ! 减少延时 !提高效率 "
收稿日期 & !""C%"C%+!
#$! +,-$./)*
指数加法器进位链设计是指数加法器设计的
1NW
微电子学与计算机
!""# 年第 ! 期
关键所在 ! "# 位的指数加法器 " 采用 $ 位一组 " 组内 采用改进的曼彻斯特进位链设计方法 " 组间采用静 态行波进位 %&’(()*+,-&&./ 加缓冲驱动的方式 ! 下面 从控制逻辑 # 电路结构和版图实现上分析设计在提 高速度 "减少延迟所能采取的方法 ! 行波进位加法器的延时与输入位数有一定的 比例关系 $!"#$%&0%’+12!()&&*+!,-.! 其中 !/)&&* 和 !,-. 分别表 示加法 器 的 进 位 时 间 和 求 和 时 间 ! 从 公 式 可 以 看 出 " 当设计全加器组成快速的行波进位加法器时 " 优化 !/)&&* 比 !,-. 重要 "因为后者对于加法器的延时居 于次要影响 ! 组间静态行波进位链采取的措施 $%12 取消进位 的反相器以减少进位延时 " 变成低电平有效 ! 利用 全加器的反相特性 " 即输入端反相 " 输出值也反相 !
A 5
=12 在组内 "从电路结构上改善曼彻斯特进位链
的速度 ! 如图 1=D2在 $ 位曼彻斯特进位链的两端并接传 输管 " 需要增加进位的选通控制 :EF ! 其导通控制 由进位传输信号 45 来控制 $ 个串联的 F5EG 管 H 再 经反相驱动产生 :EF ! 通过这种方法 " 使得 $ 位进 位输出的节点等效电容为原来电路的 IJK 左右 " 因 此可以大大改善进位链的时延特性 ! 改善速度的同 时却增加 43 个晶体管 " 在面积增加不是太多的情 况下是可取的 !
1;<1= 5==<62 !
超前进位加法器的实现形式有门阵列形式 # 动 态多米诺 >?8@AB82 进位的方式等 ! 在 . 位的超前进 位加法器中 " 门阵列的形式结构紧凑 " 由 *! 个 CDE 管构成超前进位 ! 若用动态多米诺的形式 " 晶体管 可以节省 " 但最坏的延时增加到 ’ 个 FCDE 的串结 延时 ! 根据具体应用和相关工艺的需要选择合适的 电路实现形式 ! 本文从低功耗 # 高速度和面积允许 的角度 " 选择传输管逻辑与动态多米诺构成超前进 位加法器形式 ! 由于 ’"$&":*!(" 使得超前进位所需的门尺寸会 随位数的增加大到难以实现 " 因而超前进位的级数 通常不超过 . 级 ! 扇入 >G1B:AB0 和扇出 >G1B:8HI0 会显 著增加延时 ! 3CDE 门延时同扇入 # 扇出的关系为 $
!
!"
根据 "#$%&’( 的技术报告 ! 浮点指令中浮点加
*+,
DE’F? 对于 ;8<=>’;? 算法进一步优化 ! 使得其
减少系列操作 *C," 优化基于舍入运算的实现要等到 运算结果产生后才可执行 ! 并且对于结果进行小数 量的修改 " 通过提前计算所有可能的结果 ! 用选择 正确的结果来减少舍入和转换 " DE’F? 证明了对于
’! 位尾数加法器分成八大组 > 其中一组用于附
加位的处理 " 与另外 N 组有些不同 2 " 每一大组产生
. 个超前进位信号形成组内的进位信号 " 组之间是 行波进位的方式 ! 进位链的结构如图 - 所示 ! 这样
在高位加法中解决了使用超前进位的问题 " 同时避 开了超前进位位数超过 . 位时 " 较大的扇入和扇出 引起延时和面积急剧增加的缺点 !
此 外"在 尾 数 加 法 器 的 输 入 端"采 用 两 输 入 端 多路选择器和三输入端多路选择器组合方法来实 现短移位相加运算! 短移位相加是指两个源操作 数 " 其指数差 的 绝 对 值 小 于 等 于 + 的 情 况 下 " 不 需 使用桶式移位寄存器就可相加 ! 这样可以减少滚桶 的移位操作步骤 " 加快了尾数的运算速度 !
=3/ 在组之间 " 每 $ 位插入一个缓冲驱动 " 可以
!""#年第 ! 期
微电子学与计算机
*’/
超前进位基础上进行行波进位 ! 对于 ’! 位的尾数 加法器" 我们采用了基于分组超前进位加法器
>J1K<= 8B L68HM 3450 的设计方法 " 可以有效地 解 决
上述问题 ! 可以减少进位延时 " 特别是大的扇入和 扇出对于传播延时的影响 ! 电路结构规则 " 便于版 图的设计和面积的优化 !
# ’()*
加法器多数情况下用来实现算术运算的操作 ! 经常面对的是速度限制问题 " 因而仔细地优化设计 加法器是非常重要的 " 优化包括逻辑优化和电路优 化 " 超前进位加法器1F’%%N 9<<O%’?$’: ’::$%5 就是逻 辑优化的一个典型例子 " 至于电路优化 ! 简单说就 是通过合理布置晶体管的尺寸和电路的拓扑关系 来优化速度 " 不同于一般的加法器 ! 浮点加法器有其相对独 立的双运算路径 " 指数运算和尾数运算双总线路径 实现 ! 使得两个逻辑分离器件在一定的条件下可以 并行工作 ! 执行加减两个最为频繁的操作运算速度 比单路径提高 )0$" 指数总线数据宽度 +2 位 !包含 一位符号位和 +) 位指数偏移 " 2! 位的尾数宽度包 括 23 位的数据精度位和 3 位附加位 " 其中附加位 用于误差控制 !如警戒位 PQRE’%:5#舍入位 G1%<E(:5 # 粘贴位 S1T;7FO5 等设置的标志位用于精度的保证 "
!;%IJNOL29%:6%.P"2QRMP%6<.+12!7-88 !; 对于 . 求导 " 获得最大值 $!!=!. %IH .3;!%1JS ! . 典型的值取 T 或 $! 在本文指数加法器的设计中 取 .0$ ! %T2 在版图实现上 " 考虑同进位有关晶体管的尺
寸 " 合理安排从低位进位输入到组内进位输出端晶 体管的尺寸 ! 原则上是从大到小 " 因为在整个进位链放电的 过程中" 靠近进位输入端的晶体管流经最大的电 流 " 即 >.IU>.1U>.RU>.T! 同理 "对于连接到 ? 和求 值端的晶体管也是渐小地安排晶体管的尺寸 ! 进位 链上每个节点的扩散电容为 R 个传输管 # 一个下拉 管 # 一个预充电所组成的等效电容 ! 根据 V)@>&* 延时所定义的 @2 延迟模型LRM$
!""#年第 ! 期
微电子学与计算机
+2C
012345-$./)*67
I( I>>%<’F? <U V$T7R( U<% W7R?=S>$$: 69<’;7(R=><7(; I::$% 合肥工业大学微电子设计研究所 89: ;<= >? 1合肥 @C000X5
摘 要 ! 浮点加法器是协处理器的核心运算部件 ! 是实现浮点指令各种运算的基础 ! 其设计优化是提高浮点运 算速度和精度的关键途径 " 文章从浮点加法器算法和电路实现的角度给出设计方法 ! 并且提出动态与静态结合 设计进位链的方案以及前导 0 预测面积与速度的折衷方法 " 动态与静态结合设计进位链的方法有效地降低了 功耗 ! 提高了速度 ! 改善了性能 " 目前已经嵌入协处理器的设计中 ! 并且流片测试成功 " 关键词 ! 浮点加法器 ! 进位链 ! 优化
相关文档
最新文档