800V 进入 AI 数据中心,电源要从机柜到板级重新设计

智能计算 时间:2026-04-25来源:EEPW

编者按:AI 服务器单机功耗和单柜输入功率增加,低压大电流会带来线缆、连接器、母线、电源模块和散热压力。800V 进入讨论,背后是从机柜输入、中间母线、板级电源到热插拔、遥测、保护和隔离驱动的一整套供电设计变化。

AI 数据中心最先被看见的,还是 GPU。

但 GPU、加速卡和电源模块被装进同一个机柜后,单柜输入功率会增加。电流变大,线缆、连接器、母线、电源模块和散热系统都会先感受到压力。算力芯片还能继续增加,供电不能只靠加粗线缆、增加电源模块和堆散热片来硬撑。

800V 进入 AI 数据中心讨论,就是在解决这个问题。这个数字背后是一段很具体的供电路径:电从机柜入口进来,先经过热插拔和保护,再进入中间母线和电源模块,最后由板级电源送到 GPU、CPU 和加速器附近。每一段都要重新计算电流、损耗、发热、隔离和保护。

单柜耗电增加,低压大电流先卡在线缆、连接器和散热上

过去数据中心也在做电源升级,但这一轮压力更集中。AI 服务器的单机功耗增加以后,一个机柜里要承载的输入功率更高。电压不变时,要送同样多的功率,就需要更大的电流。

电流一大,问题会很直接。线缆要更粗,连接器和母线要承受更高电流,电源模块的导通损耗和温升会上来,机柜里的布线和风道也会变难。机柜空间有限,线缆不能无限加粗,散热风量也不能无限增加。

提高机柜侧供电电压,可以在同等功率下降低电流。电流降下来,线缆、连接器、铜排和部分电源模块的损耗会减轻,布线和散热压力也会下降。但电压抬高以后,高压隔离、输入保护、热插拔、故障检测和维护安全都要一起重新设计。

提高电压只是第一步。800V 进入系统后,机柜输入、中间母线、板级电源、热插拔、遥测和保护这些环节的设计要求都会跟着变化。

高压电进入机柜后,还要一路降到 GPU 附近

AI 数据中心讨论 800V,不能只看机柜入口。高压电进入机柜后,通常还要经过热插拔控制、隔离母线转换、中间电压分配和板级多相降压,最后才到 GPU、CPU、内存和加速器附近。

越靠近负载,电压越低,电流越大。GPU 负载变化很快,板级电源需要快速响应;响应慢了,电压波动、纹波、温升和保护动作都会变得难处理。

机柜侧要处理高压输入、连接器、浪涌电流、热插拔和安全保护。中间母线要把高压转换到服务器内部更容易使用的电压。板级电源要靠近 GPU、CPU 和加速器,把电压继续降到芯片需要的范围。

热插拔、遥测、保护和隔离驱动也要一起算进设计。AI 服务器功耗高,停机成本高,电源模块能不能安全插拔,电压、电流和温度能不能被准确监测,过流、过温和短路能不能快速切断,都会影响整机可靠性。

TI 想占住的,是从机柜入口到算力芯片的供电设计

TI 这次把 800V 放进了 AI 数据中心的完整供电路径里。高压电进入机柜后,要经过隔离、中间转换和板级供电,最后送到 GPU、CPU 和加速器附近。转换级数、模块位置、遥测和保护设计,都会影响整柜效率和长期可靠性。

TI 在 800V DC 电源架构中,把 800V 热插拔控制器、800V 到 6V 隔离母线转换、6V 到低于 1V 的多相降压、遥测和保护放在一起展示。公开资料显示,这套架构把 800V 到处理器供电压缩到两级转换:先从 800V 转到 6V,再从 6V 降到 GPU 核心所需的低电压。

这和 TI 近几年在应用市场上的表达方向是一致的。它希望市场在谈一个具体应用时,能把单颗器件和实际工程问题联系起来。放到 AI 数据中心这条线里,TI 想让市场记住的是:电要从机柜入口稳定、高效地送到算力芯片附近。

这件事对 TI 很关键。AI 数据中心的注意力仍然在 GPU 和算力平台上,但 GPU 的供电电流、板级热设计、电源转换效率和故障保护会影响整机密度和运行稳定性。TI 要争取的是这个工程问题:当行业讨论 AI 基础设施时,不只讨论算力,也讨论电能不能稳定送到算力芯片附近。

客户最后会看工程落地。高压输入能不能保护住,中间电压能不能高效转换,板级电源能不能贴近 GPU 和加速器,遥测数据能不能及时暴露异常,保护动作能不能在故障扩大前切断,这些都会影响 AI 集群能不能长期运行。

onsemi 对应高功率转换和功率器件

onsemi 这类公司主要对应高功率转换和功率器件。

AI 服务器和机柜的输入功率增加以后,中间 DC/DC 转换、高功率电源模块和功率级器件会更吃力。这里要同时处理耐压、电流、开关损耗、导通损耗、温升和长期可靠性。器件损耗高,热就压不住;开关速度和驱动配合不好,转换效率和体积都会受影响;可靠性不足,长时间满负载运行就有风险。

SiC、GaN 等功率器件在这个时候被更多讨论,原因也在这里。AI 数据中心要完成电压转换,还要在更小空间里完成更高功率输出,并把损耗、发热和体积控制住。

onsemi 的机会更容易落在这些具体问题上:高功率转换环节用什么功率器件,开关损耗怎么降,封装和散热怎么处理,高温和长时间运行下的可靠性怎么保证。这些问题会直接影响单柜能不能装得更密,电源效率能不能提高,散热能不能压住。

ADI 和 Allegro 对应板级监测、保护和驱动

电从机柜一路走到板级以后,问题会变得更细,也更接近整机稳定性。

板级电源要给 GPU、CPU、内存和加速器供电。负载变化快,电流大,板上空间有限。这里需要更准确的电流检测、更快的保护响应、更可靠的热插拔、更完整的电压、电流、温度和功耗数据,也需要稳定的驱动和隔离。

ADI 更容易出现在热插拔、遥测、多相控制、电源监测和保护这些环节。AI 服务器运行时,整机需要知道每个电源模块的电压、电流、温度和故障状态。数据看不准,保护动作就可能不及时;状态看不全,运维和调试也会变难。

Allegro 主要对应高电流检测和隔离栅极驱动。电流检测会影响过流保护、功率控制和效率判断。隔离驱动要在高压、高噪声环境里稳定驱动功率器件,同时保证高压侧和低压控制侧之间的安全隔离。

这些环节看起来没有 GPU 显眼,但在高功率 AI 服务器里,电流检测不准、驱动不稳、保护动作慢,都会影响整机效率、故障处理和长期可靠性。

800V 改变的是电源设计里的压力分布

800V 不会让电源设计变简单,它只是改变了压力分布:机柜侧电流下降,高压保护、隔离、中间转换和板级供电的要求同时提高。

电一路降到板级以后,低压大电流的问题仍然存在。GPU 核心附近仍然需要多相降压,仍然要处理大电流、快速负载变化、发热、纹波、布局和保护响应。

这也解释了为什么 TI、onsemi、ADI、Allegro 这类公司会重新进入 AI 数据中心讨论。算力芯片决定 AI 服务器的计算上限,但电能不能稳定送到 GPU 和加速器附近,会影响单柜部署密度、电源效率、散热设计和整机可靠性。

客户最后会看供电路径能不能长期稳定运行

GPU 还会继续是 AI 数据中心里最受关注的器件。

但 AI 服务器越装越密,单柜输入功率增加以后,电源设计会越来越影响整机方案。高压输入怎么接入机柜,中间母线怎么降压,板级电源怎么靠近 GPU,热插拔和保护怎么保证维护安全,遥测数据怎么帮助发现异常,这些都会进入客户评估。

后面拉开差距的,会是整套供电路径能不能长期稳定运行,单个器件参数已经不够。

单柜能不能装进更多计算板卡,电源转换效率能不能提高,发热能不能压住,故障能不能快速定位和隔离,电源模块能不能安全维护,都会影响 AI 集群的建设成本和运维成本。

800V 进入讨论,说明 AI 数据中心的竞争已经不只停在算力芯片上。电源模块、功率器件、隔离驱动、电流检测、热插拔、遥测、保护和散热这些环节,会决定 AI 基础设施能不能承载更多 GPU、更高单柜耗电和更长时间运行。

FAQ

问:800V 为什么会进入 AI 数据中心供电讨论?

答:因为 AI 服务器单机功耗和单柜输入功率增加,低电压、大电流供电会带来更高线损、更大热压力和更复杂的布线。提高机柜侧供电电压,可以在同等功率下降低电流,减轻线缆、铜排、连接器、电源模块和散热系统的压力。

问:800V 会影响哪些供电环节?

答:它会影响机柜输入、热插拔保护、中间母线、DC/DC 转换、板级供电、PoL 供电、电流检测、遥测、隔离驱动、故障保护和散热。电压提高后,低压侧一部分电流压力会下降,高压侧的隔离、保护和故障处理要求会提高。

问:TI 在这篇文章里对应哪些供电环节?

答:TI 对应的是从 800V 输入到 GPU 核心供电的电源设计,包括高压输入保护、隔离母线转换、板级多相降压、遥测和保护。它希望市场在讨论 AI 数据中心时,不只想到 GPU 和算力,也能想到电怎么从机柜入口稳定、高效地送到 GPU 和处理器附近。

问:onsemi、ADI 和 Allegro 分别对应哪些环节?

答:onsemi 对应高功率转换和 SiC、GaN 等功率器件;ADI 对应热插拔、遥测、多相控制、电源监测和保护;Allegro 对应高电流检测和隔离栅极驱动。

问:800V 会让电源设计更简单吗?

答:不会。800V 可以降低机柜侧电流,减轻线缆、连接器和部分电源模块的压力,但高压安全、隔离、保护、热插拔、故障检测和板级响应要求都会提高。工程问题没有消失,只是压力分布变了。

关键术语解释

800V DC:这里指 AI 数据中心供电中更高电压等级的直流配电思路,用于在高功率场景下降低机柜侧电流,减少线损和布线压力。

中间母线:位于高压输入和板级低压供电之间的电压层级,负责把高压转换成服务器内部更容易使用的中间电压,并向后级电源模块分配功率。

板级供电 / PDN:靠近服务器主板、加速卡和处理器的供电网络,需要处理大电流、快速负载变化、纹波、效率、发热和可靠性。

PoL 供电:Point of Load,负载点供电,指在靠近 GPU、CPU、内存或加速器的位置完成最后一级降压。

热插拔:整机在不断电或不停机条件下接入或移除电源模块时,需要用电源管理和保护电路控制浪涌电流、异常电压和安全风险。

遥测:对电压、电流、温度、功耗和故障状态进行实时监测,帮助整机做功率管理、故障预警和运维判断。

隔离栅极驱动:用于驱动功率器件,同时在高压侧和低压控制侧之间提供安全隔离,常见于高压、高功率电源系统。

SiC / GaN:面向高压、高效率和高功率密度场景的功率器件技术路线,可用于降低转换损耗、提高开关频率和减小电源体积。

本文首发于电子产品世界(EEPW)。后续 EEPW 将继续围绕汽车电子底层能力、智驾芯片、智控平台、800V 高压系统、车载传感和方案交付等方向持续更新。

关键词: AI 数据中心 800V 机柜供电 中间母线 板级供电 电源架构 热插拔 遥测 隔离驱动 电流检测 TI onsemi ADI Allegro

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版