图7:八车道系统的NEXT和ext示例

在大多数高速接收机中,使用连续时间线性均衡器(CTLE)提供高通滤波,使数据采样器处看到的信号频谱平坦,以消除通道的低通效应。这增强了奈奎斯特周围期望信号的通道输出信号频谱,但它也增强了奈奎斯特频率周围NEXT(相对衰减较少的高频频谱)的信号频谱。

接收机的设计需要在CTLE中具有可配置性,以便在低XTLK系统中,通过适当的算法检测XTLK,可以打开CTLE高频升压范围以实现充分的均衡。这是在宽带CTLE中完成的,以保持CTLE组延迟行为,有助于改善CTLE自适应行为。这种策略在DFE的利用上将是CTLE的重和轻。

另一方面,如果检测到过量的XTLK,则需要限制CTLE高频增强以最小化奈奎斯特频率附近的NEXT频谱放大,并且需要减小带宽以使CTLE不会放大带外的NEXT频谱。这种策略在CTLE贡献方面很小,在DFE利用率方面很大,而不会放大不希望看到的XTLK。这种配置将扭曲奈奎斯特频率附近的CTLE组延迟行为,需要采取适当的步骤来保持期望的自适应算法行为。有各种各样的技术来检测系统中的XTLK级别;这些算法的解释超出了本文的范围。

系统级优化的内外环均衡导论

经典的逐路SerDes收发器优化是系统不可知的。SerDes在每信道的基础上优化远端伙伴发射器和它自己的本地接收器。它不注意邻近的小巷。这种逐通道的SerDes收发器均衡称为内环均衡,如图8所示。系统不可知的内部均衡可能会导致具有较短走线的车道的多余余量,而具有较长走线的车道可能会受到性能限制,所有这些都在单个链路内。在这种情况下,PCIe链路中至少有一个最弱的PCIe通道将成为单点故障源。

图8:经典的内部均衡循环不能优化交叉车道性能

对于较低数据速率的应用程序,系统无关的逐通道优化是可以接受的。然而,在规格限制插入损耗接近30dB且没有显著XTLK下限降低的PCIe Gen4数据速率下,PCIe Gen4内环均衡方法将面临挑战,无法满足期望的系统目标误码率性能。与其他标准不同,PCIe Gen4没有前向纠错(FEC)保护。幸运的是,PCIe Gen4标准化了“Lane Margin”功能,允许主机检测中继器或处于正常L0工作状态的终端设备的操作EYE Margin[1]。车道余量的标准化为许多创新的系统级优化方法打开了大门。我们解决了PCIe Gen4 Lane Margin特性的一个应用,通过使用如图10所示的外环路均衡方案,调整攻击通道的发射器幅度、摆幅率和前后光标,在高保证金通道和保证金不足的通道之间交换EYE保证金。

图9:使用外环均衡的交叉通道发射机发射机控制

外环均衡有助于xtlk敏感通道与较长的走线通过调整TX幅度,或摆率,或TX前/后的重点与较短的走线适当。这反过来又减少了系统中的XTLK地板,并有助于在压力较大的车道上运行EYE余量,如图10所示。

图10:车道余量辅助外环路均衡

外环均衡前,长迹EYE余量较低,短迹EYE余量过大。外环均衡使用PCIe标准化方案检测lane操作EYE余量的当前状态。主机指示短跟踪信道增加信道两端的上升/下降时间,以减少信号频谱中超过奈奎斯特频率的高频内容。然后,主机指示短跟踪通道(s)使用双方都能理解的PCIe定义的供应商特定消息来降低两端的发射机幅度,直到长跟踪通道(s)的运营利润率提高,短跟踪通道(s)仍然保持健康的运营利润率。作为最后的手段,短走线去强调也可以调整,以减少整个系统的XTLK地板通过减少发射机输出信号能量在系统中,并在同一时间允许其链路伙伴接收器不应用过量的CTLE高频升压。

内部和外部均衡回路的流程图如图11所示。最初,系统XTLK级别是使用每个Lane基础上的已知算法来感知的。在高XTLK环境中,Lane优化配置为DFE重优化方案。在低XTLK环境中,Lane优化配置为CTLE重优化方案。使用传统的均衡方法,每个通道将由链路两端的接收器与其链路伙伴发送器一起使用反向信道自适应进行优化[12]。这种级别的均衡与整个系统性能无关。

图11:内部和外部均衡循环排序

在初始的逐通道均衡之后,使用PCIe Gen4裕度方案执行主机定向的跨通道优化。主机将识别多余的边距通道和缺边距通道。然后,主机控制的外部均衡将指导主机和设备端发射机调整发射机的发射幅度、升压和转换率,这样,多余的余量通道将放弃一些余量,而余量不足的通道将获得合理的运营余量。其理念是调整TX振幅、升压和摆幅率,以最大限度地减少来自高边际车道的整个系统XTLK贡献,从而帮助边际不足的车道获得足够的运营边际,因为通过边际辅助的外部均衡回路减少了系统的损害下限。

这种迭代外环均衡方案的定性视图如图12所示,使用如图11所示的优化流程。经典的内环均衡方案在每个信道上重新配置接收机,并执行基于信道的内环均衡来优化每个信道。然后在LTSSM中切换到L0正常工作状态,并逐车道进行边缘计算以确定每个车道的EYE边缘。如果所有车道都有良好的运行余量,则外部均衡环路结束。如果检测到低边缘车道和高边缘车道,则指示高边缘车道在车道两侧减小其振幅。

此过程将减少系统XTLK地板:在所有通道中再次执行PCIe Lane margin。重复lane margin和发射机调整过程,直到受压力的lane EYE margin变为可接受的,而不会使好lane的EYE margin降低到可接受的margin阈值以下。如果没有达到平衡的系统性能,则通过发射机转换率和去重点调整进行外环均衡。变送器参数控制的顺序是实现特定的或特定于系统需要的。理想情况下,应该先调整摆幅率,然后调整振幅,再调整发射机的减重。通过外环均衡的眼平衡阶段的定性视图如图12所示。

图12:长通道和短通道操作EYE余量平衡与外部均衡回路

利用车道余量的外环路均衡实现模型

PCI Express Gen4基本规范中引入的通道边界命令和响应包括一个供应商定义的命令和响应,可用于控制外环均衡。表1显示了PCI Express Gen4基本规范中提供的边缘命令和相应响应表的相关部分。

表1:在PCIe Gen4基本规范中提供的供应商定义的边际命令

命令

响应

保证金的命令

边距类型[2:0]

有效接收人号码[2:0]

边际有效载荷[7:0]

边距类型[2:0]

边际有效载荷[7:0]

供应商的定义

101 b

001b到101b

供应商的定义

101 b

供应商的定义

在上表中,有效的接收方编号字段解释如下:参见图1,查看可选包含计时器的链路中的发送器和接收器的相对位置。表2中的Cmd[2:0]的值决定了命令的最终目标是接收器还是发射器。

编码

接收机

发射机

001 b

Rx (A)

Tx (B)

010 b

Rx (B)

Tx (C)

011 b

Rx (C)

Tx (D)

100 b

Rx (D)

Tx (E)

101 b

Rx (E)

Tx (F)

对于外环均衡,供应商定义的条目如表2所示。

表2:供应商定义的用于外循环均衡的margin命令

命令有效载荷位定义

描述

响应有效载荷位定义

描述

有效载荷[7:5]= Cmd[2:0]

111b = Tx振幅

110b = Tx转换率

101b =预强调

100b =岗位重点

011b, 010b =保留

001b =执行Rx适配

000b = No命令

有效载荷[7:5]=状态[2:0]

状态(2:0)=

011b = NAK

010b =在进行中

001b =设置

000b =空闲/已完成

载荷[4]=增加

指定是增加还是减少所选属性。当Cmd[2:0]为100b ~ 111b时,

0b =减少

1b =增加

否则,设置为0b

载荷[4]= MaxValue

1b =达到的最大值(正向或负向)

0b =未达到最大值

有效载荷[3:0]= Amt[3:0]

指定增加/减少的数量

为Tx振幅,Tx转换率,前强调,或后强调。

否则设置为0000b

有效载荷[3:0]= Amt[3:0]

当Cmd[2:0]为100b ~ 111b时,响应载荷[3:0]反映命令载荷[3:0]。否则,Response Payload[3:0] = 0000b

  • 对于“Tx振幅”、“Tx转换率”、“预强调”和“后强调”命令,命令的目标是发射机
  • 对于命令Rx Adaptation,命令的目标是一个接收器
  • 当指定的增加或减少量使发射机超过其支持的最大值时,发射机将达到其最大值,并在Response Payload[4]中报告已达到最大值。
  • 与PCIe Gen4基本规范中描述的lane margin一样,主机使用PCI Configuration tlp在接收器能力寄存器中写入和读取其lane margin来控制其自己的发射器和接收器的外环均衡。
  • 与PCIe Gen4基本规范中描述的lane margin一样,主机使用PCI Configuration TLPs控制下游组件中上游端口的外环均衡,以在接收器能力寄存器中写入和读取下游组件的lane margin。
  • 与PCIe Gen4基本规范中描述的lane margin一样,主机使用Control SKP Ordered Sets控制retimer发射器和接收器的外环均衡。

外循环均衡的过程如下:

  1. 系统软件决定在一个链路中应该调整哪些发送/接收对。
  2. 系统软件发送的命令,目标的第一组发射机(都在同一地址,但在不同的车道上),以增加/减少Tx振幅,Tx转换率,Tx前强调,并根据需要的Tx后强调。
  3. 系统软件轮询与命令相关的状态,直到所有目标发射器返回NAK(表示遇到错误)或空闲/完成状态。
  4. 然后系统软件发送指令,目标接收器与目标发射器相关联。命令接收器执行Rx自适应。
  5. 系统软件轮询与命令相关的状态,直到所有目标发射机返回NAK或空闲/完成状态。
  6. 重复步骤2到步骤5,直到系统软件完成调整。
  7. 然后,系统软件执行车道边距来确定是否有足够的边距(参见图11)。如果余量足够,这个过程就完成了。否则,这些步骤可以用剩余的变送器参数重复。