统计模型对真实世界系统行为的预测有多好?在许多信号完整性应用中,例如在给定误码率(BER)下的随机抖动估计,统计分布的给定总体用于推断潜在的未来结果。类似地,图1描述了一个模型,用于预测高斯分布的各种总体大小的直方图范围与直方图西格玛(一个标准偏差)的比率。预测结果表明,随着人口的增长,极差与西格玛比值的极限也在增加。

例如,给定100个值的总体规模,范围与西格玛的预测比率为6.180。然而,对于10,000,000个值的种群规模,这个比率增长到11.224。这导致在不断增加的样本群体中发生统计显著事件的概率增加。随着更多的值被添加到样本总体中,在数据集中捕获异常值或离群值的机会就会提高。

f1

图1:对于给定的人口规模,可以预测直方图范围与直方图分布之比的极限。人口越多,峰-峰范围-西格玛比值越大。

为了启发式地研究统计模型预测的准确性,我们使用函数生成器和示波器使用3 MHz正弦波收集测量参数结果的不同总体大小。示波器捕获了多次正弦波的采集,并测量了1000个波形周期内的循环频率(见图2)。示波器还计算了直方图的标准偏差(参数P2)和范围(参数P5)。

请注意,测量频率与西格玛的比值接近0.1%。在这个实验中使用的示波器有一个样本时钟抖动规格为280飞秒有效值,相对于正弦频率变化可以忽略不计。虽然抖动噪声的一小部分来自示波器产生的测量误差,但正弦波的测量峰到峰到sigma频率的大部分随机变化是由于相对较低精度的函数发生器的质量造成的。

f2

图2:收集了1000次频率测量的直方图。参数P1计算信号频率。P2和P5计算直方图分布的标准差和范围。

收集了更大的5,000,000个值,如图3所示。在这个统计意义更大的直方图中出现了随机频率波动的高斯形状。由于每个数据集合的结果都不同,因此执行一系列三个测试运行,并为每个总体大小制作表格。

f3

图3:收集了一个统计上显著的直方图,包括500万循环频率测量的更大人群,结果证实了更大的范围-西格玛比。

图4使用半对数图比较了实验结果与模型。图4中的蓝线描绘了最初在图1中给出的预测模型值。三次测试运行的实验结果以图中所示的橙色、黄色和紫色圆圈表示。

f4

图4:来自图1(蓝线)的预测模型以及实验结果(橙色、黄色和紫色圆圈)。实验结果表明,该模型能够准确预测不同种群规模的范围-西格玛值的极限。

该模型预测,随着人口的增加,范围-西格玛比值极限会扩大——例如,当人口从1000增加到100万时,比值从7.438增加到10.399。在实验室中,使用示波器收集的数据也证实了这一点,为该模型确实是现实世界测量结果的良好预测提供了支持。这对于许多信号完整性测量应用来说非常重要,这些应用依赖于数据子集的外推来预测系统行为。例如,可能有十亿分之一的机会,边缘会太早或太晚到达,导致闭锁系统中的电子故障。通过参考sigma与峰峰之间的关联模型,信号完整性工程师可以对最坏情况系统行为的可能性和严重性做出预测。