谷歌在一年内将人工智能查询的能源成本降低了 33 倍

智能计算 时间:2025-08-26来源:

今年到目前为止,美国的用电量与去年同期相比增长了近 4%。这是在几十年基本上持平使用之后发生的,这一变化与数据中心的快速扩张有关。其中许多数据中心的建设是为了服务人工智能使用的蓬勃发展。鉴于煤炭使用量的增加满足了部分不断增长的需求(截至 5 月,煤炭的发电份额比前一年增长了约 20%),人工智能对环境的影响看起来相当糟糕。

但是,如果不访问只有通过运行数据中心才能获得的各种详细信息,例如硬件的使用频率以及它提供 AI 查询的频率,就很难确定。因此,虽然学术界可以测试单个人工智能模型的功耗需求,但很难将其推断到现实世界的用例中。

相比之下,谷歌拥有来自实际用例的各种数据。因此,它发布的人工智能环境影响新分析是一个难得的机会,可以窥探一下幕后的情况。但新的分析表明,能源估算目前是一个不断变化的目标,因为该公司表示,其数据显示,仅在过去一年中,搜索的能源消耗就下降了 33 倍。

有什么进的,什么出的

进行这些分析时的一个大问题是要包括什么。显然,处理器在处理请求时消耗了大量能量。但支持这些处理器所需的内存、存储、冷却等所需的能量也需要。除此之外,还有用于制造所有这些硬件和建造容纳它们的设施的能源。人工智能在训练过程中还需要大量能量,其中一小部分可能计入训练后对模型发出的任何单个请求。

任何对能源使用的分析都需要决定要考虑哪些因素。对于过去所做的许多研究,各种因素被跳过,主要是因为执行分析的人员无法访问相关数据。他们可能不知道需要多少处理器专门用于给定任务,更不用说与生产它们相关的碳排放了。

但谷歌几乎可以访问所有东西:用于处理请求的能源、执行此请求所需的硬件、冷却要求等等。而且,由于跟踪因公司活动(直接,通过发电等方式,或通过供应链间接)产生的范围 2 和范围 3 排放正在成为标准做法,因此公司也可能获得这些排放。

对于新的分析,谷歌跟踪 CPU、专用 AI 加速器和内存的能量,无论是在处理查询时处于活动状态还是在查询之间空闲时。它还跟踪整个数据中心的能源和水使用情况,并了解该数据中心中还有什么,因此它可以估计用于提供 AI 查询的比例。它还跟踪与电力供应相关的碳排放,以及其使用的所有硬件生产产生的排放。

三个主要因素没有成功。一是用于接收请求和交付结果的网络容量的环境成本,该成本将根据请求的不同而有很大差异。这同样适用于最终用户硬件上的计算负载;这将看到使用游戏台式机的人和使用智能手机的人之间的巨大差异。谷歌本可以做出合理估计但没有做出的一件事是训练其模型的影响。此时,它将清楚地知道那里的能源成本,并且可能可以对训练模型的使用寿命和在此期间处理的请求数量做出合理的估计。但它没有将其包含在目前的估计中。

为了得出典型数字,进行分析的团队跟踪了 24 小时内为请求提供服务的硬件,以及该硬件的空闲时间。这为他们提供了每个请求的能量估计值,该估计值因所使用的模型而异。对于每一天,他们都会确定提示的中位数,并使用它来计算环境影响。

下降

使用这些估计,他们发现单个文本请求的影响非常小。“我们估计 Gemini Apps 文本提示的中位数使用 0.24 瓦时的能量,排放 0.03 克二氧化碳当量 (gCO2e),并消耗 0.26 毫升(或约五滴)水,”他们总结道。考虑到这一点,他们估计能源消耗类似于大约 9 秒的电视观看时间。

坏消息是,请求量无疑非常高。该公司选择对每个搜索请求执行人工智能作,这是几年前根本不存在的计算需求。因此,虽然个人影响很小,但累积成本可能是相当可观的。

好消息?就在一年前,情况会更糟得多。

其中一些只是取决于情况。随着美国和其他地方太阳能的蓬勃发展,谷歌安排可再生能源变得更加容易。因此,过去一年每单位能源消耗的碳排放量减少了 1.4 倍。但最大的胜利是在软件方面,不同的方法使每个提示的能耗减少了 33 倍。

显示不同硬件使用的能量百分比的颜色条。AI加速器的用途最大,其次是CPU和RAM。闲置机器和间接费用各占 10% 左右。

处理 AI 请求的大部分能源消耗来自在定制加速器芯片上花费的时间。 

1756170075191961.png

处理 AI 请求的大部分能源消耗来自在定制加速器芯片上花费的时间

谷歌团队描述了该公司为此所做的一些优化。一种是称为“专家混合”的方法,它涉及弄清楚如何仅激活处理特定请求所需的人工智能模型部分,这可以将计算需求降低 10 到 100 倍。他们开发了许多主要模型的紧凑版本,这也减少了计算负载。数据中心管理也发挥着作用,因为公司可以确保任何活动硬件都得到充分利用,同时允许其余硬件保持低功耗状态。

另一件事是,谷歌设计了自己的定制人工智能加速器,并构建了在其上运行的软件,使其能够优化硬件/软件鸿沟的两侧,使其能够相互良好运行。鉴于 AI 加速器上的活动占查询总能耗的一半以上,这一点尤为重要。谷歌在运营高效数据中心方面也拥有丰富的经验,这些经验也延续到了人工智能方面的经验。

所有这一切的结果是,它估计仅在去年一年,典型文本查询的能耗就下降了 33 倍。这会产生连锁反应,因为与构建硬件相关的碳排放等问题会被硬件在其使用寿命期间可以处理更多查询这一事实所稀释。

鉴于这些效率的提高,谷歌很容易简单地将结果用作公关活动;相反,该公司在读起来非常像学术出版物的内容中详细介绍了其方法和考虑因素。它采取这种方法是因为这项工作背后的人希望看到该领域的其他人采用它的方法。“我们主张广泛采用这种或类似的综合测量框架,以确保随着人工智能能力的进步,它们的环境效率也会提高,”他们总结道。


关键词: 谷歌 人工智能 查询 能源成本

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版