DDS逻辑优化设计及Verilog实现[1]

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

ＤＤＳ逻辑优化设计及Ｖｅｒｉｌｏｇ实现
摘要：本文主要介绍了在ＤＤＳ系统中，为了提高芯片运算速度，加大输出带宽，减小芯片规模从而提高可靠性和频谱纯度而采用的优化方法及其ＶｅｒｉｌｏｇＨＤＬ实现。
关键词：流水线；输入寄存器结构；加法器最低位修正；压缩存储查找表
概述
制造上来说是不实际的，所以要对间插入了一个数据转换器，负责进
图２流水线加法器框图
法器流水线。Ｄｆｆｎ是输出为ＱＮ的
Ｄ触发器，其输出端接加法器最低
进位。
波形折叠及抬高算法
波形折叠（地址转换器）
ａｌｗａｙｓ＠（ａｄｒｉ）
ｉｆ（ａｄｒｉ［１４］）
图３加法器最低进位修正图
ａｄｒｏ＝１４＇ｈ１ｆｆｆ＾ａｄｒｉ［１３：０］；ｅｌｓｅ
压缩ＳＩＮ值ＲＯＭ查找表逻辑的结构描述实现
ＲＯＭ１ｇａｔｅ１（ｄａｏｎｅ，ａｄｒｏ［１３：５］，ｃｌｋ，ｒｅｎ，ｄｉｎｏｎｅ）；
ＲＯＭ２ｇａｔｅ２（ｄａｔｗｏ，｛ａｄｒｏ［１３：９］，ａｄｒｏ［４：０］｝，ｃｌｋ，ｒｅｎ，ｄｉｎｔｗｏ）；
ａｄｄｅｒｏｎｅｇａｔｅ３（ｄａｏｎｅ，ｄａｔｗｏ，ｒｅｓｕｌｔ［１１：０］）；
由于ＤＤＳ频率合成方法具有算法进行改进。
行数据转换。相位累加器输出的地
低频率转换时间、低失真输出波
址码位宽为１６位，Ｄａｔａ［１２：０］为查
形、高分辨率、高频谱纯度、可编
ＤＤＳ设计优化
找表输出的二进制ＳＩＮ值，它经过
程和宽频率输出范围等优良性能，
这一部分对ＤＤＳ设计进行了数据转换器后和ａｄｒｉ［１５］反拼接成
ｃｏ２，ｎｅｔ１，ｎｅｔ３，ｃｏ１，ｃｌｋ３，ｃｌｋ，ｋ，ｒｓｔ）；
ｆｏｒｌｉｎｅａｄｄｇａｔｅ５（ｑ［３１：２４］，ｃｏ，ｃｏ２，
ｃｌｋ４，ｃｌｋ，ｋ，ｒｓｔ）；
这是用ＶｅｒｉｌｏｇＨＤＬ的结构描
述方法实现的，对应于用电路图输
入逻辑。其中的ｌｉｎｅａｄｄ，ｔｗｏｌｉｎｅａｄｄ，
ｔｒｉｌｉｎｅａｄｄ，ｆｏｒｌｉｎｅａｄｄ是带寄存器的加
储器做查找表，通过高速ＤＡＣ产生找表逻辑实现。查找表用字长为１３实现加法器可以提高累加器的运算
已经以数字形式存入的正弦波，并位的ＲＯＭ实现，存储压缩后的ＳＩＮ速度３倍之多。为了提高运算速度，
用频率控制字Ｋ来调制ＤＤＳ的输出值。本芯片在相位累加器和查找表加法器算法采用的是目前速度最快
而压缩存储查找表在保证芯片使用精度的情况下减少了大部分面积利用sin函数的对称性和三角恒等式以及最后的sin值压缩算法经过具体实验可以达到79241的压缩率大大节约了rom的容量可以使芯片在满足性能要求的基础上节约相当大的芯片面积同时节约了功耗提高了芯片的可靠性
通信与计算机
■ 西安电子科技大学微电子研究所史吉吉杨银堂
ＸｐｅｒｔＤＳＰ平台是对ＳｏＣ更高集
接口。
间通信邮箱（ＩＣＰＭ）定义并实现一个成水平、快速上市时间和更好性能
标准。ＣＥＶＡ在使用ＤＳＰ＋ＡＲＭ系要求的一种综合性解决方案。与
处理器间通信规范定义的主统进行ＤＳＰ应用开发方面的经验已ＡＲＭ核标准接口结合的高层次整
（收稿日期：２００３－１１－１２）
15 ｔｒｉｇｇｉｎｇ）规格的支持。
ＸｐｅｒｔＴｅａｋ已包含一组硬件功能，使软件提供商的更高层次的标准化。
此外，ＣＥＶＡ为提取硬件的应ＡＰＢ从属桥内处理器间的通信得到
用开发提供一种应用开发基础设简化。作为相应领域里的领导者，
综合性解决方案
施，并为应用开发商提供一种标准ＣＥＶＡ和ＡＲＭ已联手为一种处理器
参考文献１ＪＶａｎｋｋａ，ＭＷａｌｔａｒｉ，ａｎｄＭ
Ｋｏｓｕｎｅｎ，褹ＤｉｒｅｃｔＤｉｇｉｔａｌＳｙｎｔｈｅｓｉｚｅｒｗｉｔｈａｎＯｎ－ｃｈｉｐＤ／Ａ－ＣｏｎｖｅｒｔｅｒＩＥＥＥＪＳｏｌＳｔａＣｉｒｃ，１９９８；３３（２）：２１８－２２７
２Ｊ．Ｖａｎｋｋａ，襍ｐｕｒＲｅｄｕｃｔｉｏｎＴｅｃｈｎｉｑｕｅｓｉｎＳｉｎｅＯｕｔｐｕｔＤｉｒｅｃｔＤｉｇｉｔａｌＳｙｎｔｈｅｓｉｓ，ｉｎＰｒｏｃ．１９９６ＩＥＥＥＦｒｅｑｕｅｎｃｙＣｏｎｔｒｏｌＳｙｍｐ．，Ｊｕｎｅ１９９６；９５１５９
系统要求有一套硬件和软件开发工应用面对不同的ＳｏＣ实现，拥有一蜂窝电话应用开发商能够把精力集
在现代频率合成领域中具有越来越优化，目的是在保持其原有优点的１４位数据输入ＤＡＣ，变换成连续的
重要的地位。在许多应用领域中，基础上，尽量减少硬件复杂性，降正弦信号Ｖ输出。
如通信、导航、雷达和电子对抗等，低芯片面积和功耗等，提高芯片速
对ＤＤＳ优化如下：
ＤＤＳ频率源都是主流的关键部件。度。核心结构如图１所示。图中相位
用中都是可以忽略的，在生成波形ｃｌｋ，ｄａｔａｉｎ，ｋ，ｒｓｔ）；
则用全１和从ＲＯＭ中取出的数相
的精确度上已经可以满足要求了。
ｔｗｏｌｉｎｅａｄｄｇａｔｅ３（ｑ［１５：８］，ｃｏ１，加，就相当于原数据减１后再在最
但由此而产生的截尾误差却会对频ｃｏ０，ｃｌｋ２，ｃｌｋ，ｋ，ｒｓｔ）；
结语总体而言，ＤＤＳ可以得到下面的改进：使用流水线算法和输入数据寄存器可以在不过多增加门数的条件下，大幅提高芯片的工作频率；修正加法器最低进位位带来３ｄＢ左右的频谱性能提高，提高了输出波形的频谱纯度；而压缩存储查找表在保证芯片使用精度的情况下减少了大部分面积，利用ＳＩＮ函数的对称性和三角恒等式以及最后的ＳＩＮ值压缩算法经过具体实验可以达到７９．２４：１的压缩率，大大节约了ＲＯＭ的容量，可以使芯片在满足性能要求的基础上，节约相当大的芯片面积，同时节约了功耗提高了芯片的可靠性。按照此优化方法设计的芯片可以工作在７５ＭＨｚ频率上，输出信号谐波小于－６０ｄＢ，而芯片规模是１３０００门左右。■
度。在设计中增加一个时钟分配器，响，在实际应用中可以忽略。
样比用减法器要节约门数。
通过时钟的分配时序，可以节省保
抬高算法（数据转换器）
存输入频率控制字的级联寄存器。
主要优化算法的Ｖｅｒｉｌｏｇ实现
ａｌｗａｙｓ＠（ｄａｔａ，ａｄｒｉ［１５］）
还同时节约芯片的２４个Ｉ／Ｏ口，唯
ＶｅｒｉｌｏｇＨＤＬ语言专门面向硬件
２１６，把ＲＯＭ容量的单元数从２３２降低进位修正实现
ｅｎｄ
到２１６。损失的低１６位相位累加数值
ｄｆｆｎｇａｔｅ１（ｃｉ，ｃｉ，ｃｌｋ，ｒｓｔ）；
根据ａｄｒｉ［１５］的数值可以判断
对应０．０２度的间断，在绝大部分应
ｌｉｎｅａｄｄｇａｔｅ２（ｑ［７：０］，ｃｏ０，ｃｉ，ｃｌｋ１，波形值应该是正是负，如果是正，
３Ｓ．Ｍｏｒｔｅｚａｐｏｕｒ，Ｅ．Ｋ．Ｆ．Ｌｅｅ，褼ｅｓｉｇｎｏｆＬｏｗ－ＰｏｗｅｒＲＯＭ－ＬｅｓｓＤｉｒｅｃｔＤｉｇｉｔａｌＦｒｅｑｕｅｎｃｙＳｙｎｔｈｅｓｉｚｅｒＵｓｉｎｇＮｏｎｌｉｎｅａｒＤｉｇｉｔａｌ－ｔｏ－ＡｎａｌｏｇＣｏｎｖｅｒｔｅｒｏｎＩＥＥＥＪｏｕｒｎａｌｏｆＳｏｌｉｄ－ＳｔａｔｅＣｉｒｃｕｉｔｓ，Ｖｏｌ．３４，Ｎｏ．１０，Ｏｃｔｏｂｅｒ１９９９：１３５０－１３５９
高位拼接１，以１ＬＳＢ的偏移量为代
谱纯度和输出带宽产生影响。相应
ｔｒｉｌｉｎｅａｄｄｇａｔｅ４（ｑ［２３：１６］，价，可以省略减法器。如果是负，则
４０２００４．４电子设计应用ｗｗｗ．ｅａｗ．ｃｏｍ．ｃｎ
通信与计算机
用按位异或实现相减，得到经过抬高处理的数据。抬高处理是为了满足ＤＡＣ的输入全为正值的需要。
减少，详见图２。对输入寄存器结构进行优化，以降低硬件复杂度，减小
尾误差为２，即频率控制字（奇数）和去ａｄｒｉ值，从而实现地址码对π/２的截尾误差（２的整数次幂）之间互质。折叠。因为被减数是确定的而且是
芯片面积，从而进一步提高运行速这样带来的地址上１／２ＬＳＢ的误差影全１，所以可以用异或实现减法，这
４．Ｌ．Ｋ．ＴａｎａｎｄＨ．Ｓａｍｕｅｌｉ，“ Ａ２００ＭＨｚＱｕａｄｒａｔｕｒｅＤｉｇｉｔａｌＳｙｎｔｈｅｓｉｚｅｒ／Ｍｉｘｅｒｉｎ０．８µｍＣＭＯＳ” ｏｎＩＥＥＥＪｏｕｒｎａｌｏｆＳｏｌｉｄ－ＳｔａｔｅＣｉｒｃｕｉｔｓＶｏｌ．３０，Ｎｏ．３，Ｍａｒｃｈ１９９５：１９３－２００
频率。
之间插入了一个地址转换器，负责的预先进位算法。为了避免因预先
从算法可以看出，ＤＤＳ的工作进行地址转换。在查找表和ＤＡＣ之进位加法器中进位传输链过长而影
主频决定它输出的频率：
ｆｏｕｔ＝ｆｃｌｋ＊Ｋ／２Ｎ（Ｎ为相位累加器的位数，Ｋ为频率控制字，位宽３２位，ｆｃｌｋ是芯片主频），所以提高ＤＤＳ的主
频就可以提高它的输出频率和输出
带宽，同时对于ＲＯＭ的实现来说，
如果用３２根地址线来寻址，则需要
一个非常大的ＲＯＭ，要２３２那么大。这种ＲＯＭ从存取时间、可靠性和
图１优化后的ＤＤＳ核心结构框图
ｗｗｗ．ｅａｗ．ｃｏｍ．ｃｎ电子设计应用２００４．４３９
通信与计算机
要合作者
帮助创建了硬件和软件工具标准集，合使ＣＥＶＡ能够垂直开发其产品。
涉及多个芯核的应用开发，其使用户专注于高层次的附加值特性。完整的ＤＳＰ平台可做到标准软件应
主要问题之一是整合。一个包含ＩＣＰＭ标准使开发商能够为应用开用、开发工具和处理器间通信协议
ＣＥＶＡＸｐｅｒｔＤＳＰ和ＡＲＭ处理器的发实现一种公共接口。ＤＳＰ和ＡＲＭ的最佳供应。这种综合性的供应使
响速度，每８位加法器由两个４位的的解决办法如图３所示：将Ｄ触发器
ａｄｒｏ＝ａｄｒｉ；
预先进位加法器级联而成。因引入的输出端连接到相位累加器最低位
根据ａｄｒｉ［１４］的数值可以判断
流水线而多加入８０个寄存器中的４８的ｃ０，相位累加器字长变为３２＋１位，地址码是否需要对 π/２进行折叠。这个可以通过改进的输入数据寄存器频率控制字的值相当于２Ｋ＋１，而截里用＾是按位异或，作用是用全１减
ａｄｄｅｒｔｗｏｇａｔｅ４（ａｄｒｏ［１３：５］，ｒｅｓｕｌｔ［１１：０］，ｄａｔａ［１２：０］
ＲＯＭ１和ＲＯＭ２是两个读写存储器，ＲＯＭ１是主值存储器，ＲＯＭ２是修正存储器，分别存放预先计算好的主值和修正值。ｄｉｎｏｎｅ和ｄｉｎｔｏｗ是ＲＯＭ的数据写入端，ｄａｏｎｅ和ｄａｔｗｏ是数据读出端。Ａｌｌａｄｅｒ是一个１２位加法器，将主值和修正值相加。ａｄｄｅｒｔｗｏ是１３位加法器，完成［Ｓｉｎ（π ｘ／２）－π ｘ／２］＋π ｘ／２，从而得到Ｓｉｎ（π ｘ／２）的值。
１．引入流水线对累加器进行优
累加器为３２位，如果主频为化。将３２位累加器分成４条流水线，
ＤＤＳ的改进构想
７５ＭＨｚ，则确定频率分辨率为每条流水线完成８位的加法运算，流
Байду номын сангаас
ＤＤＳ电路的关键是利用高速存０．０１７４Ｈｚ。相位－幅值转换部分由查水线的进位进行级联。运用流水线
ｅｌｓｅ
３２位输出中提取高１６位作为ＲＯＭ活，可直接描述硬件单元结构，而
｛ｄａｔｕｍ｝＝ｄａｔａ－１３＇ｈ０００１；
的查找地址，相位累加器的输出截且具有很好的可读性。
ｅｎｄ
尾可以减少ＲＯＭ的尺寸到原来的１／
流水线加法器阵列和加法器最
ｒｅｓｕｌｔ＝｛！ａｄｒｉ［１５］，ｄａｔｕｍ｝；
ｂｅｇｉｎ
一的缺点是数据要保持４个时钟周与系统设计。可以在芯片算法、功
ｉｆ（ａｄｒｉ［１５］）
期，会降低系统跳频的跳转频率。能模块、层次结构和测试向量等方
ｄａｔｕｍ＝１３＇ｈ３ｆｆｆ＾ｄａｔａ；
２．从图１可知，从相位累加器的面进行描述。ＶｅｒｉｌｏｇＨＤＬ简单、灵