据报道,英伟达提升了Vera Rubin的性能,以阻止超大规模开发者依赖AMD Instinct AI加速器——提升的加速时钟和内存带宽将功率需求提升500瓦,达到2300瓦

智能计算 时间:2026-01-22来源:

也许还能提升产量作为额外加分。

1769045397235834.png

最近,英伟达宣布已启动其面向人工智能数据中心的Vera Rubin平台的“全面生产”,这向合作伙伴保证该平台有望在今年晚些时候发布,并领先于AMD等竞争对手。不过,除了可能提前发布外,Nvidia 还据报道正在重新设计 Rubin GPU 的规格以提升性能:据报道,TDP 将提升至 2.30 kW,内存带宽提升至 22.2 TB/s。

据Keybanc(通过@Jukan05)报道,Rubin GPU的功率评定已锁定为2.3千瓦,高于英伟达最初宣布的1.8千瓦,但低于部分市场观察者预期的2.5千瓦。将功率从1.8千瓦提升的意图源于确保今年基于Rubin的平台相比AMD预计约1.7千瓦的Instinct MI455X明显更快。关于Rubin功耗预算增加的信息来自非官方来源,但SemiAnalysis间接证实了这一点,SemiAnalysis声称英伟达提高了HBM4堆栈的数据传输速率,现在每块Rubin显卡的内存带宽达到22.2 TB/s,从13 TB/s大幅提升。我们已联系英伟达,试图核实这些说法。

额外的500W功率余裕为英伟达提供了多种提升实际性能的选项,而不仅仅是纸面规格。最直接的是,它能在持续训练和推断负载下实现更高的持续时钟,同时在AI加速器全负荷时减少节流。额外的性能也将使得同时保持更多执行单元运行变得更容易,从而在计算、内存和互联同时负载的重工作负载中提升吞吐量。

除了流处理器(或更准确地说是张量单元),额外的功耗预算还可用于以更高时钟运行HBM4内存和PHY以提升内存带宽。事实上,更高的功耗预算还能使英伟达提升所有链路(包括内存、内部互连和NVLink)到更激进的作点的性能,同时保留声音信号余量,这在现代AI系统受限于内存带宽和结构性能时变得尤为重要。

在系统层面,AI加速器多500W TDP就能提升每节点和机架的性能。超规模化者更看重系统级性能而非单GPU性能,因为完成同一任务所需的GPU数量更少,降低网络负载并提升集群级效率。当然,这还假设这些超大规模企业能够为耗电量更高的机器供电。

最后但同样重要的是,提高TDP对制造端也有帮助,因为它能实现更灵活的分区和电压余量,从而提高可用良率,而无需减少执行单元数量或降低时钟。

因此,额外的500W不仅有助于提升Rubin显卡的性能和VR200 NVL144机架级解决方案的竞争地位,还作为可靠性的余裕,确保GPU在大规模数据中心部署中能够提供可预测且持续的吞吐量,而不仅仅是纸面上的更高峰值数据。作为额外福利,英伟达有可能向市场供应更多Rubin显卡,这对其盈利有利。

关键词: 英伟达 Vera Rubin AMD Instinct AI加速器

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版