信号完整性日志
www.lambexpress.com/articles/1228-feedforward-equalizer-location-study-for-high-speed-serial-systems
拇指

高速串行系统前馈均衡器定位研究

2019年5月21日

基于数据转换器的SerDes设计由于其架构的灵活性和强大的数字信号处理(DSP)均衡而越来越受欢迎。对于基于RX的第一代ADC,由于其面临的各种挑战,大部分注意力都集中在高速和高性能ADC的实现上。关于均衡器的最佳位置(如前馈均衡;FFE)以达到最佳的系统性能。

通常,在混合信号SerDes中,由于延迟和增益的实现更简单,FFE被放置在TX侧。通常,TX侧FFE,也就是TX FIR,被限制在3到5个点。然而,TX FFE受到峰值功率约束,这实际上削弱了输出信号的平均功率。当数据速率超过25Gbps时,背板/铜电缆系统中的前游标符号间干扰(ISI)变得不可忽略。因此,为了有效地处理前标ISI以及通道脉冲响应中的长尾问题,对一个节能FFE的需求变得更加重要。(基本上TX FFE遵循l1范数系数归一化。)

另一方面,RX FFE不需要l1范数系数归一化,也不具有与TX FFE相同的峰值功率约束。尽管由于非线性要求,模拟RX FFE可能受到其他系数的约束,但前端噪声会被FFE系数的l2范数放大。此外,数字RX FFE系数可以更容易和优化地适应,以实现消除信道ISI和减轻系统噪声放大之间的最佳权衡。然而,一个真正的模拟FFE覆盖广泛的数据速率是很难建立合理的功率和非线性。

基于adc的RX的出现允许系统和电路设计人员重新评估TX FFE与RX FFE的选择。本文对TX和RX FFE进行了理论分析、仿真和实际比较。对于所有的例子,使用最小均方(LMS)算法来适应ffe。为简单起见,系统中不包括DFE。然而,由于DFE通常是链路中的最后一个均衡器,它不会增加串扰或噪声,因此比较是公平的,结论应该为目前面临56G挑战的行业提供重要的见解,很快将面临112G的挑战。

此外,还将研究TX DAC和RX ADC量化的影响。讨论了量化误差的性质,并进一步纳入现有的分析框架。使用不同的噪声、量化和FFE设置进行行为模拟,以验证见解并得出结论。对于一些用于112G应用的长距离铜通道,执行了权衡模拟开云体育官网登录平台网址,以在不同数量的FFE分接头和转换器分辨率下找到最佳解决方案空间。

最后,我们提出了DAC和ADC芯片实现的挑战。在如此苛刻的速度下,时钟成为一个至关重要的方面,数字电路和模拟电路之间的界限变得模糊。最先进的工作进行了调查,以提供更好的比较和证明可行性。

FFE两个位置之间的信噪比分析

FFE定位的研究越来越受到重视。[1]的工作提出了一个长TX FIR,结果是一个更简单的接收机和更节能的链路。如图1(a)所示,[1]的作者认为,由于数字乘法,将接收机FFE移动到发射端会降低RX FFE功率。

图1

系统仿真显示了图1(b)和图1(c)两种方案之间的性能差异。结果表明,TX FFE方案具有更大的开眼,从而具有更好的系统性能。如图1(b)所示,根据[1],RX FFE的主要缺点是当需要许多小系数的远端开关来消除阻抗不连续和反射造成的残余ISI时的实现成本。

然而,[1]中不清楚的是,在接收端存在一些FFE,它与连续时间线性均衡器(CTLE)一起进一步塑造了信道。作者实际上只建议将FFE的远端长尾丝锥移到TX侧,以便处理反射。这一事实促使我们认为,RX FFE和一个更分析和系统的研究仍然是必要的。

最近的工作,如[2],已经证明了PAM4链路架构在112G的远程应用中的系统级可行性。通过SerDes架构的合理假设和现实的噪声和抖动源,作者在[2]中得出结论,RX FFE在睁开眼睛(眼睛高度和眼睛宽度)方面的性能比将FFE放置在TX一侧时的性能要好得多。图2总结了这一点。

图2

但是[2]并没有详细的解释这一现象。因此,在本文中,我们根据信噪比(SNR)方面的链路性能裕度进行了深入分析,并对FFE位置之谜进行了理论解释。在本节中,首先开发了一个理论框架,以了解FFE的位置在典型链接系统中的影响。信噪比将被用作比较性能的度量。图3显示了典型链路系统的简化框图,其中FFE在TX端或RX端。信噪比比较点选择在决策反馈均衡器(DFE)的输入处,因为这对两种架构都是通用的。我们用FFE作为唯一的均衡方法来研究系统性能。我们假设理想的定时和时钟恢复来限制分析的范围,这允许在离散时间(DT)域进行系统模拟和评估。

图3

系统信噪比理论分析

在这个分析中考虑的非理想性是ISI,由脉冲响应建模,和一个独立的同分布(i.i.d)。RX输入端的高斯噪声。输入噪声的来源包括终端的热噪声、输入参考RX电路噪声和来自邻近攻击者的串扰。

通常,FFE位于TX端,因为它不提高噪声,更重要的是它的实现更简单。然而,由于受电源限制的最大输出摆幅,也称为峰值功率约束,TX FFE系数必须标准化。因此,对于一个均衡器用P前体,后游标,传输的信号振幅直接被归一化因子衰减E1均衡系数的l1范数E2

为了进行分析,我们强制FFE的主光标点击为1,即:E3使用得到的TX FFE系统的信噪比由式(1)给出,其中军医是通道(碰撞到碰撞)脉冲响应。E-5均衡通道的主游标是否除以给定的眼睛数(例如,PAM4,=4,有1 = 3眼)。一个是给定调制的信号RMS强度(例如,对于PAM4,A = 0.745).E6分别为残余ISI和RX输入噪声的标准差。

情商1

同样的分析可以应用于在RX端有FFE的系统。FFE将以相同的方式均衡信道(目前假设与TX FFE的系数相同),但会提高RX输入噪声功率。具体来说,输入噪声功率被l2范数放大E7FFE系数的,E8对应的系统信噪比如式(2)所示。

情商2

使用这两种信噪比表达式,可以立即进行比较。假设有足够的FFE抽头,且决策点的剩余ISI不是系统中的主要噪声源,则上述信噪比分别简化为式(3)和式(4)。

Eq 3和4

很明显,由于FFE系数L1或L2范数,感兴趣的体系结构的信噪比仅在额外衰减方面有所不同。众所周知,对于任何给定的向量E9因此,RX FFE的系统性能至少与TX FEE一样好,如式(5)所示。

情商5

为了验证式(5)中的不等式,我们考虑用于112Gbps PAM4应用程序的三个不同通道,如图4所示。开云体育官网登录平台网址28GHz(奈奎斯特频率)的信道损耗分别约为16dB、24dB和33dB。同样的FFE系数应用于TX和RX FFE,并且它们被计算为在感兴趣的采样阶段完全取消ISI(零强迫),给定光标前和后点击的数量。下面描述了计算给定信道的信噪比以及选定的游标前和游标后点击次数的步骤:

  1. 计算零强迫FFE系数。
  2. 将计算得到的均衡器系数与DT通道脉冲响应进行卷积,得到均衡后的脉冲响应。
  3. 计算剩余ISI噪声功率并乘以一个
  4. 求FFE系数的L1和L2范数。
  5. 利用式(1)(2)计算TX或RX FFE系统的信噪比。

RX输入噪声强度从0mV扫描到5mV均方根。最大TX摆动保持在E10汽油400 mv。用于此分析的FFE长度为a) 5个前游标+ 15个后游标,b) 10个前游标+ 20个后游标,c) 15个前游标+ 25个后游标。图5显示了考虑所有三个通道和FFE长度的输入噪声量的计算系统信噪比。开云体育官网登录平台网址

F 4

对于任何通道和FFE长度,我们看到得到的RX FFE系统的性能与TX FFE系统一样好。由于所研究系统的线性性质,当没有RX输入噪声时,FFE对系统具有相同的影响,无论其位置如何E11然而,当考虑RX输入噪声时,会出现很大的差异。TX FFE的性能比RX FFE快得多。系统信噪比差异可大于6dBE12汽油在比较TX和RX ffe时,最坏情况下的通道大于2mV。

对于损耗开云体育官网登录平台网址较大的信道(链路2和链路3),增加FFE长度可以显著提高性能。但是,30次和40次的设置之间没有显著差异。在RX输入热噪声存在的情况下,链路3是一个特别难以操作的通道。因此,TX FFE很难均衡链路3。

我们运行行为瞬态仿真来验证系统信噪比方程。PRBS13数据模式用于模拟时间和足够的数据长度以捕获大部分ISI。图6显示了TX和RX FFE系统的抽样眼图示例。我们可以直观地得出结论,RX FFE具有更高的系统信噪比,因为误差分布在数据级别上。精确的信噪比值是通过寻找眼睛张开和误差传播的比率来计算的。通过用理想的数据水平减去输出值来发现错误。

F 5

图7显示了与之前的分析结果绘制的行为模拟的系统信噪比。瞬态模拟结果与解析曲线基本重合,证明了分析的有效性。一旦我们对分析框架有了信心,我们就能够在后面的部分中添加更多的非理想性。自适应均衡器的性能也可以用行为模拟来证明。

F 6

F 7

均衡器的适应

将FFE放在RX端的另一个动机是均衡器自适应能力。在TX端调整FFE时,需要一个反向通道,这导致了进一步的复杂性和开销。对于不同的硅供应商来说,相互操作变得更加具有挑战性。另一方面,RX侧FFE可以提供更健壮的系统性能,因为它的真正性质是使系数适应PVT引起的系统变化。

传统的FFE自适应使用LMS算法,这是一种最陡的梯度下降算法,目标是最小均方误差(MMSE)解决方案。RX自适应的另一个优点是它能够在不同噪声源之间找到最佳权衡。此外,讨论TX FFE由于缺乏自适应而不能以最优FFE系数运行的情况更为现实。为了捕捉这种效应,将5%的随机误差添加到ZF FFE系数中。这意味着额外的剩余ISI会显著降低系统性能。

图8显示了比较ZF TX FFE、ZF RX FFE和MMSE RX FFE之间性能的仿真框图。为了使图表可视化并更有效地讨论结果,只考虑链接2(中度损失),因为观察到的趋势对于其他渠道应该是相同的。开云体育官网登录平台网址图9显示了相对于输入噪声功率的信噪比结果。很明显,自适应RX FFE优于ZF TX FFE的系数偏移。

F 8

在这个特殊的情况下,我们故意显示了一个添加了随机错误的30点设置,该设置比采埃孚FFE的另一个20点设置性能更差。这是由于错误的30分频系数不能像随机生成的20分频系数那样有效地取消信道ISI。对于RX自适应FFE,该系统仍然能够在更多的敲击下显示出改进,并且比采埃孚FFE具有显著的优势。在RX端具有适应能力以跟踪任何运行环境和电路变化不仅对标称系统性能很重要,而且对各种条件下的鲁棒性也很重要。

F 9

DAC和ADC分辨率的实际考虑

在本节中,我们将包括更现实的系统构建模块,如dac和adc,以了解它们在FFE均衡和系统性能上下剧中的影响和限制。当需要大量的FFE开关时,数字均衡器是更好的选择,因为FFE的混合信号实现受到电路自身寄生的严重限制(见第4节)。因此,数据转换器是实现模拟和数字信号处理之间过渡的必要条件。

DAC用于发射机端,将数字均衡器输出转换为驱动到信道上的模拟信号。接收端使用ADC将通道输出信号转换为数字代码,由后续DSP进一步处理。对于我们的理论分析,我们将假设FFE系数具有比转换器高得多的分辨率。换句话说,我们希望关注转换器的限制及其对系统性能的影响。行为仿真结果提出和结论得出,特别是关于FFE的有效性存在的转换器,以及之间的权衡FFE长度和转换器分辨率。

基于dsp的串行链路系统结构与建模

图10显示了相关系统的修改后的框图。DAC在TX FFE之后添加,ADC在RX FFE之前添加。

F 10

在DAC的前面有一个量化器来限制FFE的输出分辨率。adc本身就扮演着量化器的角色。因此,这两种体系结构都包含量化器,可以将多个输入值存入相同的输出值。量子器最重要的非理想性之一是有限分辨率,这是我们为简单起见而分析的重点。

在无限分辨率FFE系数的情况下,两种架构中的量化器可以具有相同的楼梯状直流传递函数,如图11所示。转换器的分辨率(由比特数指定)决定了传输曲线中的电平数和步长。在示例图中,使用一个3位转换器来夸大楼梯的清晰度。量化误差图可以通过从理想输入中减去量化输出得到。锯齿曲线(中间图)显示1 / 2步长范围。我们还可以在应用随机输入时绘制量化误差的直方图。由于数据转换器的内在量化误差增加到系统中,误码率(BER)将会增加。

F 11



当转换器的输入足够随机时,量化误差的分布变得均匀,不可能回溯准确的输入值。当此条件为真时,量化误差可以作为一个独立于其他噪声源(ISI、热噪声等)的噪声源来处理。同样重要的是要注意,量化噪声的均匀分布使其成为有界噪声,与无界高斯噪声相比,它以截然不同的方式影响系统。在本文的范围内,基于信噪比的分析将继续用作比较系统性能的代理,但我们认识到,这样的结果不会直接转化为误码率,尽管具有很强的相关性。

基于信噪比的系统分析

当我们将转换器简单地建模为另一个具有其自身分布和噪声功率的噪声源时,我们可以应用与本研究前面相同的基于信噪比的分析。对于以。为界的均匀分布E13是转换器的LSB大小,标准偏差(因此RMS噪声功率)是E14灯头通过找到合适的E15对于每个架构,我们可以将额外的量化噪声纳入式(3)和式(4)中。

对于TX FFE体系结构,DAC的全尺寸范围(也称为E16天)为变送器允许的最大摆动。峰值功率约束已经应用于数字领域,因此DAC的全量程范围是E17=400mV,与前一节中使用的值相同。如果DAC有B位,那么它的LSB大小E18E19术语是由于DAC本质上比ADC阶梯少一个台阶的事实。然而,由于我们主要处理中等到高分辨率的转换器(例如>6位),这个术语的影响是最小的。因此,我们将dac和adc的LSB大小视为相同E20

由于这个量化噪声在TX端,它将被信道过滤,就像实际信号一样。因此,接收到的由于量化而产生的总噪声乘以信道的L2范数,即:

情商6Eq 6字

因此,TX FFE的最终接收机信噪比为:

情商7

现在对于RX FFE架构,ADC的全量程范围是最大通道输出。信道输出的理论最大值是最大TX摆动乘以信道的L1范数。因此,对于具有B位的ADC, LSB大小E22ADC后面是FFE,这意味着它的量化噪声被FFE滤波器的L2范数放大,就像RX输入噪声一样。然后给出噪声方差E23RX FFE系统的最终信噪比为:

情商8

由式(7)和式(8)可以看出量化器的位置对系统性能的影响。上述结论仍然适用于前一节E24是主要噪声源。然而,当量化成为主导时,信噪比比较变得不清楚。尽管RX FFE有好处E25总体而言,TX FFE体系结构具有E26当谈到量化噪声时。因此,更准确的比较必须考虑信道、量化分辨率和相关系统中的其他噪声源。

仿真结果与讨论

与前几节类似,我们首先使用图12所示的分析方程绘制系统信噪比与RX输入噪声的关系。本节只使用30-tap设置。最后给出了无限分辨率变换器的实验结果,以供参考。总体趋势和结论与之前的分析一致。随着RX输入噪声成为主导,RX FFE架构仍然显著优于TX FFE。

然而,在低噪声环境中,TX FFE可以提供更好的信噪比,这是由于信道滤波的影响,对于低分辨率转换器来说影响更深远(B=6)。另一方面,当分辨率过低时,系统信噪比下降很大,使系统整体性能无法接受。因此,更现实的量化器分辨率通常等于或大于7位。在这样的设置下,量化器效应几乎可以忽略不计,可以得出与以前相同的结论。

量化器也在行为模拟中实现,与分析结果进行比较。图13中只显示了Link 2的结果。再一次,瞬态模拟的信噪比结果与理论分析相吻合。值得注意的是,对于低分辨率转换器,使用自适应RX FFE的好处会减少,因为总系统噪声由量化噪声主导。

为了从不同的角度可视化性能,在三种不同的RX输入噪声设置下,信噪比与量化器分辨率的关系被绘制出来,如图14所示。合理的噪音水平(E27~ 1-3mV),系统信噪比在7 - 8位左右趋于平稳,RX FFE开始优于TX FFE。Link 2的瞬态结果也显示在图15中,并且可以从结果图中重申类似的结论。

F 12

F 13

F 14

F 15

综上所述,通过在系统中增加转换器,在TX端和RX端使用DSP,由于量化噪声,系统整体性能下降。与考虑FFE系数时的L1与L2范数效应类似,量化噪声也可以看到信道滤波,并且给定感兴趣的信道,可以计算相应的L1和L2范数放大。带DAC的TX FFE在转换器分辨率方面有更宽松的要求,但RX输入噪声影响仍然占主导地位。为了获得合理的系统信噪比和足够的变化余量,需要中等分辨率的转换器,而TX侧转换器的优势消失了。

FFE长度和量化之间的权衡

通过再次研究式(7)和式(8),可以得出一个重要的观察结果,当涉及量化噪声时,通过无限减小ISI,收益边际是递减的。因此,拥有更多FFE的最小好处可能无法证明实现的成本是合理的。

在本节中,我们将探讨使用信噪比作为度量的FFE长度和量化分辨率之间的权衡,并展示RX和TX FFE在上述权衡中的差异。同样,RX输入噪声也会对最终结果产生重要影响。重要的是要注意这样的分析是依赖于渠道的。虽然仅以链接2为例,但总体趋势和顶级结论将保持正确,而绝对信噪比值可能会有所不同。

图16显示了在不同噪声环境下,不同量化器分辨率下的信噪比与FFE抽头个数的关系。以黑色曲线为参考,表示无限分辨率量化器的结果,与前几节的相应曲线相同。当E12汽油= 0mV时,TX和RX FFE提供相同的系统信噪比E28使用因此只显示一条虚线曲线。我们看到,当没有RX输入噪声时,TX FFE可以优于RX FFE,从而使TX FFE具有优势。对于这个特定的通道,除了稳定的性能提升直到大约15次点击之外,在大约25次点击时还会有另一次性能提升。这意味着特定通道脉冲响应在约16处具有较大的ISI分量th后游标位置(8个前标)。然而,当量化器只有6位时,这种性能的跳跃就不那么显著了。这与我们的直觉一致,对于低分辨率的系统,增加FFE长度不再有很大的SNR改善。

F 16

TX FFE的优势很快消失,即使RX输入噪声水平小。为E297位的RX FFE实际上比8位的TX FFE提供了更好的信噪比性能。由于数据转换器在这样的速度下的实现挑战(第4节),这具有重要的意义E12汽油存在时,TX FFE变得完全不可行,并且由于峰值功率约束,在现实中有更多的水龙头会降低信噪比性能。

等高线图提供了FFE长度和量化器分辨率之间权衡的更好视图。如图17所示,当没有RX输入噪声时,TX和RX FFE提供了相似的性能。最好的效果出现在更大的分辨率和更多的点击。对于高分辨率量化器(>8bits),仍然有增加抽头次数的动机,而对于中低分辨率量化器(<6bits),如果增加抽头次数,等高线图上的信噪比几乎遵循相同的颜色,表明没有显著的性能增益。

有趣的是,对于噪声较大的RX输入环境,TX FFE的等值线图完全改变,而RX FFE的等值线图保持相对不变。这两种架构的总体性能都有所下降,但TX FFE的性能下降更为严重。另一方面,对于TX FFE,增加敲击次数不再有效,实际上会降低性能。峰值性能实际上发生在高分辨率和足够的FFE开关。对于RX FFE,性能峰值仍然在右上角,但对于7位或8位量化器,增加FFE长度也没有太大好处。

f17使用

给定感兴趣的信道和RX输入噪声水平,我们可以使用类似于上面示例的等高线图找到FFE长度和量化器分辨率之间的最佳权衡。一般来说,TX FFE在低噪声设置下可以有更好的性能,但RX FFE在其他情况下会更好。此外,RX FFE系统性能随着FFE长度的增加趋于单调增长,而TX FFE在最大输出信号归一化到满量程范围时进一步受到峰值功率约束的限制。

硅实现讨论

对于56G及以上的高速链路,系统设计与硅实现和可实现性更加交织在一起。尽管这类系统的电路设计本身是一个巨大而重要的领域,但我们仍然可以通过研究顶级挑战和一阶比较得出有意义的结论。在本节中,我们将讨论DAC和adc各自的设计挑战,并使用最先进的出版物来估计电路功率,以提供TX和RX FFE架构之间更真实的比较。

高速DAC设计的挑战

尽管有许多著名的DAC拓扑,如电阻串和R-2R DAC,但电流转向DAC在高速下应用最广泛。目前,在这样高要求的带宽下,替代方案在很大程度上仍未被探索。即使是电流导向dac的最大挑战之一,也是由于大电流电平和许多单元元件的并行连接,导致输出节点上的大电容,这可能严重限制TX带宽。时钟往往是这类dac面临的最大挑战,尤其是高速率时钟的分布。高频信噪比通常受到抖动和静态定时误差的限制,通常只能容忍几百fsrms.此外,预驱动程序通常必须是时间交错的(2倍或4倍),这导致了必须减轻的倾斜和ISI。

随着速度的提高,数字和模拟电路设计之间不再有明确的界限。对于这种理想的dac,数字数据路径设计也变得非常具有挑战性,有许多级别的时钟和并行。让这部分系统来支配权力也不足为奇。对于更先进的工艺技术,布线和布局寄生已经成为限制设计性能的更明确的问题。dac往往有很长的线路,需要复杂的提取工具和许多布局迭代。

此外,有限的S22会导致远端的ISI,这是TX设计中更明显的问题。因此,复杂的t型线圈ESD结构必须与DAC一起设计,这为本已具有挑战性的任务增加了另一个维度。

高速ADC设计的挑战

虽然在GHz采样速度下,与dac相比,adc面临着类似的挑战,但更多的研究工作已经投入到为各种系统构建节能adc上。在所有的架构中,flash ADC是最快的,但由于需要大量的比较器,7b分辨率是不切实际的。目前的解决方案依赖于大量时间交错的SAR adc,在输入和子adc处进行正交采样,运行速度高达~1.5 GS/s。逻辑延迟和亚稳态要求使得子adc难以更快。由于线寄生的主导地位,技术扩展没有多大帮助。

大量的时间交错需要大量的缓冲功率。这也是ADC输入电容和布局寄生的一个强大功能。因此,ADC的输入电容必须管理以保持高带宽。在芯片输入端,通过精心设计的ESD结构实现所需的带宽,这通常是以可靠性为代价的。

ADC功率趋向于在片、交错网络和时钟之间平均分配。通常,在这种速度状态下,功率倾向于与时钟频率的平方成比例增长,因此很难在高速下保持电源效率。

为了利用数字校准降低功率,提出并验证了不同的偏移校准、倾斜校准和增益校准方法。背景校准更容易确保ADC的鲁棒性,因为转换器在RX端,就像均衡器可以有效地适应一样。此外,如果为每个前端采样器保留单独的采样组,DSP均衡器可以吸收一些倾斜。这些均衡器组可以优化调整各自的系数以提高性能,这是TX ffe难以具备的特性。

DAC和ADC之间的功耗估计

尽管高速DAC的性能受到模拟部分的限制,但在现代设计中,时钟和数字往往占主导地位。因此,由于系统中可能包含的不同特性和功能,因此很难估计功率。此外,我们还必须考虑到鉴相器、插补器等。此外,大多数高速dac以前都是在SiGe BiCMOS工艺中实现的,这种工艺速度快,但成本高,而且不像CMOS工艺那样可扩展。

通过查看CMOS工艺中一些最近的高速DAC设计,我们可以使用技术节点缩放来估计最先进的功率。最近最具影响力的出版物之一是[7],这是一个65nm CMOS的56GSps 6位DAC。据报道,包括测试内存结构,其功率为750mW。对于模拟电路,如果设计是热噪声受限的,由于kT / C的限制,技术缩放并没有真正的帮助。对于数字电路来说,先进的技术过程不仅受到互连寄生的限制,而且还受到电源电压缩放的限制。因此,我们假设功率与晶体管栅极长度成线性比例(而不是二次比例)。以[7]为起点,我们估计16nm的6位DAC的功率为210mW,采样频率为64GSps。

F 18

[8]中报道的设计是一个使用18GSps 8位DAC的完整发射机。报告的总功率为144mW(发射机为84mW,时钟为60mW)。如果我们只假设系统的数字功率(在本实验中是乐观的),我们可以估计在运行于64GSps的情况下,16nm的总发射机功率为300mW。

另一方面,近年来对adc的研究兴趣越来越大,从[6]等详细调查中可以推断出明确的趋势。图18显示了被调查adc的能源效率与它们的关系信噪比和失真比(SNDR)。adc的有效比特数(ENOBs)可以根据公式(9)的SNDR直接计算出来。图中的红圈突出了最近发表的adc的有效比特数(ENOBs)约为6至7的区域。我们看到功率效率(每转换能量)从1pJ到10pJ。

情商9

深入研究表明,对于使用交错sar的高速adc,功率效率接近3mW/GSps (3 pJ)。我们估计对于一个64GSps的ADC(考虑到112G应用的设计余量),功率应该在192mW左右。

另一个图显示了类似的估计值,如图19所示。用于高速adc(不完全受噪声限制)的典型优点(FOM)是每转换步骤的能量效率,如式(10)所示。

情商10

F 19

当这个FOM与采样频率相对应时,我们观察到它们在对数对数尺度上的线性关系,这表明每当我们打算将转换速度提高一倍时,都会产生异常的成本。红色圆圈强调了频率区域56G - 112G应用的要求,我们观察到FOM在50-500 fJ/ convl -step之间。在当前技术的前沿使用50fJ的乐观值,并假设ENOB为6,我们得到了大约205mW的估发值,采样率为64GSps。

dac和adc的功率估计都在200mW到300mW左右。然而,由于大量的工作和文献调查,我们对adc估计的一致性更有信心。由于模拟电路的性质和布局的寄生性,技术缩放只能为更先进的技术过程提供一阶估计。我们必须承认,DAC的功率估计是乐观的。因此,可以得出结论,adc可以构建得更高效。

总结及未来工作

转换器进一步提高了高速链路的带宽以及强大的DSP功能。高阶调制(如PAM4)对于可能实现的112G链路是必要的,并且需要仔细比较系统架构以构建节能解决方案。在本文中,我们广泛地讨论了前馈均衡器的位置及其对系统性能的影响。

将我们感兴趣的链接视为离散时间滤波器,并使用采样信噪比作为度量,我们研究了当FFE在TX侧时峰值功率约束的限制,以及当它在RX侧时噪声增强。

在RX输入噪声存在的情况下,由于TX FFE的输出信号强度被FFE系数的l1范数降低,RX FFE显著优于TX FFE。给出了系统信噪比的解析表达式,并进行了行为仿真,验证了分析的有效性。除了直接的信噪比性能优势,RX FFE还允许在运行时跟踪环境和电路变化。

转换器随后被包括在系统模型中。本文讨论了量化问题,并假设量化是一个独立的噪声源。对于中分辨率到高分辨率的dac和adc, RX FFE仍然保持其信噪比优势,因为输入噪声影响仍然更深刻。此外,当变换器存在时,FFE开关数量增加的回报边际明显递减。等高线图可以用来找到最优解空间,并指定FFE长度和转换器分辨率。DAC和ADC的功耗是根据最近发布的数据估计的,并推断出下一代的处理技术和速度。

为了今后的工作,可以在系统中加入决策反馈均衡器(DFE),并与FFE一起研究其效果。分析需要扩展到连续时域,从而考虑时序和FFE对抖动的影响。最近还有一些关于模拟ffe的出版物,例如[9]。将部分FFE置于adc前对系统的影响也需要充分研究,这也需要在电路实现方面进行深入研究。

与大多数复杂领域类似,将链路架构和电路设计在一起非常重要。仅仅评估链路性能和指定组件的需求而不适当地承认硅实现的困难是不够的。通过理解关键构建块的本质和设计挑战,我们可以获得对整体系统性能的有意义的见解,并导致创新的解决方案。

本文最初发表于DesignCon2018.

Baidu
map