并行前缀加法器的研究与实现

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

67%0’&(08 a.;T ;T, V*,); .8\*,)^, 9- ;T, ^U,,1 9- D91,*8 D.\*9U*9\,^^9*^K ;T, 8,,1 9- -)^; )11,*^ Z,\9D,^ D9*, ,/.*
V,8;B aT,8 ;T, ;,\T89+9V_ T)^ V9; ;T, ^;)V, 9- 1,,U ^:ZD.\*98K ;T, \988,\;.‘, ].*, ].++ U+)_ )8 .DU9*;)8; *9+, ,.;T,* .8 ;T, )*,) 9* .8 ;T, ;.D.8VB G)^,1 98 ‘)*.9:^ >?@% ;,\T89+9V.,^b AB#C!DK AB#!!DK AB#2!D )81 EA8DK ;T.^ ;T,^.^ D)c,^ ) U,*-9*D)8\, \9DU)*.^98 ].;T 1.--,*,8; Z.; ].1;T^K )81 ;T,8 ^,+,\;^ ;T, )11,* )*\T.;,\;:*, -.; -9* 1,,U ^:ZD.\*98 ;,\T* 89+9V_ )\\9*1.8V ;9 ;T, .DU)\; 9- \988,\;.‘, ].*,^ 98 )11,* U,*-9*D)8\, .8 1,,U ^:ZD.\*98 ;,\T89+9V_B
! 并行前缀加法器电路特性分析
为了简化三种加法器结构的比较 " 假设加法器 的输入是同时达到 ! 在没有考虑连线延迟和扇出影 响的情况下 "&’ 加法器和 $% 加法器拥有最小的加 法器延迟 " 而 )& 加法器由于其逻辑层次深度多了 一级 " 因此比起 &’ 加法器和 $% 加法器而言 " 延迟 较大 ! 但是随着 *+,’ 工艺的不断发展 " 扇出和连 线对电路延迟的影响已经起着重要的作用 ! 因此 " 评判加法器延迟的大小 " 已经不能够仅仅只关注逻 辑电路层次的多少 " 同时也更要考虑扇出和连线的 影响 ! 在电路中" 一段连线的模型分割成为多个短 线" 其中每一短线可以抽象成为分布式的连线模 型 " 如图 - 所示 ! 其中 " 逻辑输入电容 !"# 输出电阻 #.# 门延迟
以上两个等式不相等 $ 根据结合律以及冥等律这两种重要的特性 ! 可 以将以上串行加法操作转化成为并行的加法操作 $ 其中 ! 结合律允许前缀等式中的每一个子项进行预
I-
微电子学与计算机
!""! 年第 !" 卷第 #" 期
+
$% 加法器大扇出的问题 ! &’ 加法器充分利用了冥
等律的特点 " 通过限制每一个节点的输出来减小扇 出 " 但是付出的代价就是每一级中使用了更多的横 向连线 ! 在 &’ 加法器中 " 最长连线的长度与 $% 加 法器中的一样 ! 如图 ( 所示 " 为了改进 $% 加法器的扇出 ")& 加法器增加了逻辑层次深度 !
$C%
但是前缀操作不支持交换率 $ 证明如下 &
$ $
% % % ;" ,% % !$ % 8$ $ $ & % " $ " & "$ ,"& % % % ;" ,% % !$ % 8$ $ $ & % " & " $ "$ ,"& $#D%
IJ 加法器结构具有最小的逻辑深度 ! 但是同时
也具有最大的扇 出 ! 在 最 后 一 级 ! 最 大 扇 出 可 以 达 到 /L"$ 因此 ! 对于 IJ 加法器而言 ! 连线长度与扇出 成为影响延迟的主要因素 $ 如 图 # 所 示 !EF 加 法 器 在 一 定 程 度 上 缓 解 了
;.GH!22%*4, ;2%&4, 44
!,8";#
2#(4
其中 " 第一项是连线电容效应 " 也就是连线的
7BCD>E F* 模型 ! 第二项是连线的电阻效应 "也就是 分布式 F* 模型 ! " 实验结果 在 J’+* .G#@!C #KL+ 工 艺 $.G#!!C #KL+ 工 艺 $.G#(!C #KH+ 工艺 $以及 I.0C #K@+ 工艺下 " 针 对 #L 位宽加法器 $(" 位宽加法器 $L- 位宽加法器 $ 以及 #"@ 位宽加法器的 $% 结构 $&’ 结构 $)& 结 构 进行比较 " 如图 ! 所示 !
9$: ;2’+%8 &)*)++,+ U*,-./ )11,*K H% )11,*K 57 )11,*K GH )11,*
! 引言
众所周知 ! 在高性能微 处 理 器 和 $%& 处 理 器 中 ! 二进制加法 器 的 运 算 时 间 至 关 重 要 ! 加 法 运 算 常常处于高性能处理器运算部件的关键路径中 " 随 着微处理器运算速度的大幅度提高 ! 对快速加法器 的需求也越来越高 " 因此 ! 为了减少进位传输所耗 的时间 ! 提高计算速度 ! 多年以来 ! 人们提出了许多 快速加法器结构 ! 并且以不同的电路设计类型加以 实现
$B%
证明如下 &
在以上三种结构中 !IJ 结构充分利用了前缀计 算所具有的结合律特性 ! 但是没有使用冥等律 * 图 " 中显示了 #< 位加法器的每一级节点之间的互联关 系 * 输入在最顶 层 ! 输 出 在 最 低 层 ! 最 高 位 在 最 左 边 * 图中仅仅显示了横向之间的联系 ! 而没有显示 纵向之间的联系 * 在第一行中 ! 每一个节点用来计 算 % +. ("$ 在后面每行中 !拥有横向连线的节点都是 一个前缀计算节点 $ 最后一行用来计算加法的和 $
" )
,N
$J# $J" $J2
-$ ( ( ( ( IN O$J#BN O$J"BN O$J2BN O$JFB ) ) +)")#)A ) ) ) ) N2O
#
( ( ( O N O N O ) $J"B ) $J#B ) $JAB
!""! 年第 !" 卷第 #"期
微电子学与计算机
C’
从式 $#%& 式 $’% 可以看出 ! 前缀加 法 器 可 以 是 一 个级联进位加法器 "()**+, -.((/ .00,( #$ 但是由于前 缀操作具有结合律 "1223-).4)5)4/%&
#$%$&’() &*+ ,-./$-$*0&012* 23 4&’&//$/ 4’$315 6++*Z)8VK 5[@ ?.8
&%\T99+ 9- >9DU:;,* %\.,8\,K R9*;T],^;,*8 &9+_;,\T8.\)+ [8.‘,*^.;_K Y.+)8 =#AA=" >T.8)O
E"
微电子学与计算机
!""! 年第 !" 卷第 #" 期
并行前缀加法器的研究与实现
靳战鹏

沈绪榜
罗旻
& 西北工业大学计算机学院 ! 陕西 西安 =#AA=" $ 要 ! 随着微处理器运算速度的大幅度提高 ! 对快速加法器的需求也越来越高 " 当 45%6 工艺进入深亚微米阶
段的时候 ! 很多情况下 ! 无论是在面积还是在时序上连线都起着决定性的作用 " 文章基于不同的 >?@% 工艺 ! 针对 三种不同结构的并行前缀加法器 ! 在不同数据宽度的情况下进行性能比较 ! 根据深 亚 微 米 下 金 属 互 连 线 对 加 法 器 性能的影响 ! 挑选出适合深亚微米工艺的加法器结构 " 关键词 ! 并行前缀加法器 !H% 结构 !57 结构 !GH 结构 中图法分类号 ! P&2E 文献标识码 ! # 文章编号 ! $%""&’()% &!%%!$#"&AE"JAF
$/01# 2%&3" 和 2#&4" 为每一个线段的电容 $ 电阻 # 2%’4" 为
连线每一个负载节点 " 的负载电容 !
因此 " 总延迟就是每一级逻辑的延迟与每一级 线段延迟的总和 " 即 $151678$759/:;$</=> ! 当不考虑连线延 迟的时候 " 根据文 献 ?@A" 可 以 将 逻 辑 延 迟 模 型 简 化 为 7BCD>E F* 模型 !
同数据宽度的情况下进行性能比较 ! 根据深亚微米 下金属互连线对加法器结构的影响 ! 挑选出适合深 亚微米工艺的加法器结构 %
" 为了进一步提高加法器的运算速度 ! 提出
了 并 行 前 缀 加 法 器 #&)*)++,+ &*,-./ 011,* $ 结 构 ’23!(% 由于采用了简单的标准单元以及规则的内部连接 ! 并行前缀加法器非常适合于 45%6 实现 " 对于目前的并行前缀加法器而言 ! 在逻辑层次 已经最小的情况下 ! 如何进一步提高加法器的性能 是一个关键的问题 " 在影响性能的几个因素中 ! 扇 出 &7)89:; $ 和连线长度在其中起了关键作用 % 当
’#!"(
着决定性的作用 ’<!=(% 因此 ! 研究加法器中互连线的 作用是非常有必要的 % 本文基于不同的 >?@% 工艺 ’AB#C!D(AB#!!D (
AB#2!D( 以及 EA8D! 针对三种不同结构的并行前缀 加 法 器 ’57 结 构 ’F(!GH 结 构 ’!(! 以 及 H% 结 构 ’2(! 在 不
"
并行前缀加法器
对于并行前缀加法器 ! 有如下定义 ’ 两 个 操 作 数 ! I"A"#BBB"#BBB"$J#K% I&A&#BBB&’BBB&$J#% 其
中 AL#LAJ#!AL’L$J# % 同时有操作 ’
(#I"#M&#K )#I"#M&#K *#I"#&# AL#L$J# 定义前缀操作 )! *’ N (# ( ( +) ,( O!N # OIN # # ’ O )# )# )#)’ AL#L$J#
$$ ’$ $ 8$ 8$
! ! ! % !$ % %!$ %&!" " (!$ " $!& " $<%
!(!$;"(!$ *!$!& ! ! +" ,% ;" ,% %!$ %&!"8$ (!& #!$ $!& #!$ &!" % "(!’ " "#!$,"$!&,"&!" $ "$! & % % % % % ;" ,% % ! "$ %$!&%!$ %&!"8$ %#!$!$ $!& $!& &!" % " #!$ " " " "$!&,"&!"
计算 ! 这也就意味着上面提到的串行计算可以被分 解为多个并行计算的过程 $ 同时 ! 冥等律允许这些 并行计算的子项相互之间可以重叠 ! 这样就使并行 计算具有很大的灵活性 $ 目前 ! 通常使用的并行前缀加法器有 EF 加法
! % % % !$ % %!$ %&!" " #!$ " $!& " ! % % ’$ %(!$!$$ %$!&!$ %&!"% (6$6&6" " " " $$
$7%
器 (IJ 加法器 G7H以及 KE 加法器 G!H! 这三种并行前缀
G’H
% % % ! ! 其中 ! $ %$! &8$ %$! $ %$)#!$ %$)"! 999 !$ %&:# " " " " " $ ! % $6& " &
证明如下 &
加法器的结构分别如图 #&图 ’ 所示 )
$!%
N#O
45%6 工艺进入深亚微米工艺阶段的时候 ! 在很多情
况下 ! 连线的作用无论是在面积还是在时序上都起
收稿日期 , !%%!&%F&#F 基金项目 , 国防 - 十五 * 预研课题 &F#2ACA#A#AC $ 西北工业大学研究生创业种子基金 &S"AAFAA!A$
N"O
因此 ! 加法进位可以表示为 ’
前缀操作同时还具有冥等律 "?0,@*34,A-/ %!
$>%
$
% % % % 8$ % !$ % (6"6$6& " (! & " ( ! & " " ! & % % % !$ % " (!& " "!& % % % % 8$ %(!"!$ %"!$!$ %"!$!$ %$!& " " " " $ % % ;" 9% % % !$ "!$ "!$ "!$ %!$ %$!& " (!" ""!$,""!& " % % % 8$ %(!"!$ "!$ %$ %$!& " ""!$ " % % 8$ %(!"!$ %$! & " " 8$ 8$ % % " (! &
%#!$;"#!$ ,"%$!&,"$!& ,%&!"% % ;" ,% ;""#-$ ,"$-& ,%&= "% %8$ #= $ #= $ $!& % "#!$,"$!&,"&!" "(!$,"$!&,"&!" %(!$;"(!$ ,%$!&;""(!$ 9%&!"% % "(!$,"$!&,"&!"
相关文档
最新文档