信号完整性日志
www.lambexpress.com/blogs/13-market-perspectives-guest-blog/post/1443-trends-in-data-center-computing
拇指牧师

数据中心计算趋势

2019年11月19日

根据思科的最新报告,全球对更多数据的高需求继续以每年25%的复合年增长率增长。除了消费者的高需求外,数据中心内部的流量也在以类似的速度继续增长。事实上,数据中心本身产生的流量比消费者产生的流量要多。网络功能虚拟化(NFV)和数据中心的超大规模意味着流量可以在数据中心内持续动态地分配,确保资源最大化。不断增长的互联网流量意味着数据中心内部的技术必须更快、更高效。

F1

图1:从技术角度来看,NFV和软件定义网络(SDN)导致了数据中心内部的重大变化。

100G让位于400G,最终变成800G

数据在整个基础设施中的移动速度是满足消费者对更多数据需求的关键。不到10年前,基础设施的骨干还是基于40gbit /s技术。40gbit /s被100gbit /s取代,100gbit /s开始是10个10gbit /s通道,然后转变为4个25gbit /s通道。然而,100gbit /s对于即将到来的变化来说还不够快。虚拟现实、自动驾驶和大数据等技术意味着需要更低延迟的更多数据。因此,人们开始研究如何达到400gbit /s。

400gbit /s的最大争议是是否使用传统的信令(NRZ),或者是否使用新技术(PAM-4)取代NRZ信令。IEEE和CEI等标准组织花了大量时间讨论这两种方法,最终决定将PAM-4信令作为400gbe的实际技术。这意味着400gbe的改变是革命性的,而不是进化的。因此,生态系统的大部分仍有待建设。100 GbE成本低且可靠,而改用400 GbE还没有达到真正看到整个基础设施都改用它的成本和可靠性。当Facebook宣布将继续建立基于100 GbE技术的数据中心时,400 GbE生态系统停滞的证据就真正显现出来了。

即使400gbit /s的数据中心建设速度略有放缓,但这并不意味着技术仍在进步。随着5G开始接管手机网络,数据中心将面临更大的压力,而800 Gbit/s的技术正在开发中!目前,800 GbE将分两个阶段推出,第一阶段为8路100gbit /s技术,最终改为4路200gbit /s PAM-4信令。虽然800gbe可能看起来是进化,但转向200gbit /s PAM-4信号将给开发人员带来许多挑战。如今,在100gbit /s的速度下,我们面临着巨大的信噪比挑战,利润率不断受到压力。由于误码率从10E-12下降到10E-5(未校正),我们看到了前向纠错和均衡的需求。现在想象一下将数据速率翻倍是多么困难。

PCIExpress从Gen4移动到Gen5和PAM4

到目前为止,我们已经讨论了以太网标准,但这并不是我们看到技术必须更快发展的唯一地方。PCIExpress一直是高速数字技术的基本构建模块之一。PCIExpress已经在Gen4上停留了近十年,但是Gen4还不够快,无法处理400 GbE。PCIExpress需要采用并变得更快,因此PCIExpress联盟宣布了Gen5,其速度翻了一番,以满足400GbE的需求。向第5代移动意味着速度从16 Gbit/s提高到32 Gbits/s,利润率进一步缩小。

F2

图2:在未来五年内,PCIExpress的发展速度将提高4倍。

对于PCIExpress Gen5来说,最深刻的挑战将是如何区分通道末端的1和0。为了描述这种行为,开发人员使用实时眼睛测量。对于第4代,测量值为20mV。虽然这个数字很小,但可以实时测量眼睛。当我们转移到PCIExpress Gen5时,规格缩小到14 mV!这是难以置信的小,这是在去除通道的影响和平衡眼睛之后。简单地说,迁移到第5代并不容易。更困难的将是转向PCIExpress Gen6。据宣布,为了跟上800GbE的步伐,PCIExpress将转向PAM-4。这是一个重大的变化,意味着整个生态系统将出现新的学习和测试设备。

新技术不断涌现,以提高吞吐量

由于PCIExpress花了多年时间才达到Gen5和>20 Gbit/s,因此行业需要更快的速度。正如在介绍中提到的,软件定义网络和网络功能虚拟化正在接管数据中心,这创造了对机器学习的需求。随着机器学习的发展,处理器和所有加速器(包括图形处理单元(GPU))之间需要非常快速的通信。机器学习也为整个数据中心的gpu带来了巨大的需求。对更快速度的需求产生了对新技术的需求,这些新技术可以比PCIExpress更好地处理机器学习。在技术组合中加入缓存相干互连(CCIX)和计算快速链路(CXL)。

那么为什么需要新技术呢?这些技术背后的主要驱动力,除了对更快速度的需求之外,是对缓存一致性的需求。本质上允许更容易地访问处理器和加速器的缓存。缓存一致性是实现更快机器学习的关键组件,因为服务器组件处于持续通信状态。CXL和CCIX都承诺缓存的一致性和速度将满足400Gbe基础设施的需求。他们计划与PCIExpress共存。

结论

数据中心内部的技术正在向更快、更高效的技术发展。向400gbe的转变是革命性的,这意味着即使是高速数字技术也会受到影响。开发人员必须跟上这些变化,才能以更少的延迟和更快的速度满足消费者对更多数据的持续需求。

Baidu
map