判决反馈均衡DFE(下)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
判决反馈均衡DFE(下)
DFE基本概念
1.DFE架构介绍
2.关键功能模块
3.瞬态波形和眼图
4.DFE对边沿的影响
5.自适应算法简介
6.VerilogA模型
7.模型结果说明
8.PAM4下的DFE
7.VerilogA模型
Verilog-A Hardware Description Language(HDL)是IEEE定义的用于描述模拟系统(Analog Systems)行为的硬件描述语言。
通过对子模块建模,可实现项目初期系统级模型搭建和仿真验证。
提供研究阶段的可行性分析。
自顶向下(TOP-DOWN)设计流程,方便从系统角度,明确定义关键子模块参数和指标要求。
如图1,Verilog-A是Verilog-AMS的一个纯模拟子集(Analog-Only Subset),结合verilog或者VHDL可实现数模混合信号的系统验证。
目前主流仿真器工具spectre,spice,ADS等都支持Verilog-A语言。
图1
相对于Verilog/VHDL语言,模拟设计人员更熟悉Verilog-A,也表现的更友好。
常见模块如运放,比较器,AD/DA,PLL等。
可以很
方便的实现理想替代,方便及加速模拟设计验证。
在前文判决反馈均衡器DFE(中)中我们对SerDes Rx部分进行纯Verilog-A的建模,并重点分析了DFE这个小系统。
实际上,像CTLE,DFE,CDR,DESER等可以建模实现,同样可以构成TX和PLL,并最终形成具有层级(hierarchy)关系的大系统。
通常EDA工具都会提供 Verilog-A帮助文档,详细语法解释和实用例子都能帮助新手比较快的入门。
图2简单列举了下Verilog-A中常见的功能函数。
图2
针对具体的建模需求,Reference文档外加互联网资源都可作为参考,多练多用,相信很快就能构建模块基本功能的建模需求。
更复
杂的功能就需要深度理解电路非理想特性,定制高阶功能性能了。
图3的教材提供了AMS系统设计及仿真的说明,有兴趣的可以参考下。
图3
8.模型结果说明
这里着重介绍下DFE相关的模型,涉及到模拟部分的Verilog-A 建模和算法的Verilog或者Verilog-A实现。
图4列出了DFE模拟模块,包含加法器,动态比较器,乘法器,延迟单元,多路选择器,数据对齐(Align)及DFE算法VA模型。
图4
算法的实现可以数字HDL语言的方式通过Verilog或者VHDL实现,最后使用混合仿真的方式来验证。
当然在初期模型阶段,使用VerilogA实现的算法模型可以通过浮点型数据实现更接近基本原理的算法Demo。
规模也更小,验证速度也会更快。
通过图4的基本模型单元,就可以搭建前边DFE系列文章中提到的不同架构,对比评估架构差异和性能表现。
图5所示是其中的一个DFE评估的子系统。
图5
图4-5中DFE的子模块功能只包含了基本功能,当然也可能实现更复杂的功能。
比如加法器建立时间、tap分辨率,动态比较器的输入失调、噪声及延迟时间。
收敛算法的更新速率、精度等。
模型的复杂度和仿真速度是正相关的。
这个就需要根据建模验证的目的选择合适的模型精度。
最后,要注意的是,接收机部分包含了LEQ均衡及算法、CDR的环路,DFE补偿及算法,多环路多种算法之间耦合,造成相互影响,所有的小系统功能点评估最后都需要在整体系统整体上做性能回归,保证小系统评估的准确性。
9.PAM4下的DFE
随着SerDes线速率按照几乎翻倍的形式提升,信号带宽的变化面临着信道插损越来越高的难题,也对均衡能力提出了更高的挑战。
目
前看来,更高阶的编码方式,从NRZ(或者PAM2)转变到PAM4,是一种比较有效的解决方案。
从而维持奈奎斯特频率不变的基础上加倍数据率。
PAM4的编码相对于NRZ的变化如图6所示。
图6
PAM4相对NRZ编码信号幅度下降到1/3,SNR 下降了9.5dB,绝对眼宽也会减小。
这些对接受侧的实现会有更高的要求,但总体上,牺牲信噪比换来的带宽保持不变还是有收益的。
图7
目前从主流协议标准来看,如图8是光互联论坛OIF针对56/112G定义的不同互联场景,信道距离SR-MR-LR及信号编码等都差异化定义,针对不同场景,可以对接收侧的架构实际上差异化设计。
图8
目前PAM4编码的接收侧架构,针对SR低插损场景,主要是基于传统NRZ升级结构的实现形式,如图9[1]和图10[2]所示。
包含多电平量化,PAM4编解码,CDR 鉴相pattern变化等新增功能点。
图9
插损较小的XSR/VSR场景,甚至都不需要纠错机制就能保证比较低的误码率,就能实现高效能的数据传输。
图10
针对MR-LR信道高插损场景,图11是基于ADC采样结构的SerDes RX结构[3],接收端AFE包含CTLE+VGA的均衡,经过6-8bits 精度的TI-ADC采样量化,在数字域使用DSP实现FFE+DFE的组合均衡。
这种ADC+DSP的实现形式,因为其后续强大的数字均衡能力,具有很高的潜力。
在超高速的中长距应用中越来越广泛。
图11
图12是文献[4]提供的DSP实现框图,包含多阶FFE+1Tap DFE 的。
数字域实现的均衡算法收益很多,因为算法实现对工艺相对不敏感,可充分利用先进工艺的特点,能够实现高速低功耗,小面积目标,数字实现也更加灵活,工艺演进中迁移更容易。
当然也就更考验算法
调教,算法鲁棒性等。
图12
最后,送上一个用excel模拟离散时间域DFE算法的简单Demo,如图13-15。
采用全速率直接反馈结构,Vref和Tap自适应,Tap收敛使用的仍然是前文介绍的SS-LMS算法。
图13
图13所示,脉冲响应主标H0(Main Cursor)是0.6,后标H1-H3分别为0.2、0.15和0.05。
Vref/Tap更新步长也存在差异,3个DFE Tap补偿全部开启。
图14
图14是Vref和3个Tap的收敛过程。
可以看到收敛完成结束时,后标H1-H3都几乎完美地被消除掉。
图15是采样点收敛过程散点图,眼高可以从0.4Vppd增加到1.2Vppd。
图15
关于DFE的这个系列内容就这么多了,希望大家能够有所收获,咱们下期见吧~,Bye
缩略语:
NRZ Non Return to Zero
PAM4 Pluse Amplitude Modulation 4-Level
TI-ADC Time Interleaved Analog to Digital Converter
CTLE Continuous Time Linear Equalizer
DFE Decision Feedback Equalizer
S/M/LR Short/Medium/Long Reach
参考文献:
【1】A 40 Gb/s PAM4 SerDes Receiver in 65nm CMOS Technology,IEEE,2018.
【2】A 1.7-pJ/b 112Gbps XSR Transceiver for Intra-package Communication in 7nm FinFET technology,ISSCC, 2021.
【3】112-Gb/s PAM4 ADC-Based SERDES Receiver With Resonant AFE for Long-Reach Channels,IEEE, 2020.
【4】56Gbps PAM4 SerDes Link Parameter Optimization for Improved Post-FEC BER,IEEE, 2019.。