英伟达正研发一款绝密 AI 推理芯片,或于下月首发
据《华尔街日报》上周五晚间的报道,英伟达公司正研发一款专用推理处理器,这款芯片将被开放人工智能研究中心(OpenAI)及其他人工智能企业用于开发运算速度更快、能效更高的模型。
这款全新的推理平台预计将于本月下旬在圣何塞举办的英伟达年度 GPU 技术大会(GTC)上正式发布,芯片中将整合英伟达去年 12 月从芯片初创企业格罗克公司(Groq)收购的相关技术。
推理,指的是将完成训练的人工智能模型投入实际生产运行的过程,如今已成为人工智能行业的核心关注领域。英伟达的竞争对手如谷歌、亚马逊云科技,均已研发出专门的推理芯片,与英伟达的图形处理器(GPU)展开竞争;同时,英伟达还面临着思睿帕斯系统公司(Cerebras Systems)、桑巴诺瓦系统公司(SambaNova Systems)等专注于推理芯片研发的初创企业的挑战。
《华尔街日报》称,OpenAI 已提前获得英伟达这款新推理芯片的试用权限,并将成为首批用户之一,这对英伟达而言是一次重大的胜利。尽管为丰富算力架构体系,OpenAI 此前一直在寻找比英伟达 GPU 能效更高的替代产品,但该公司上周刚获得这家全球顶级芯片制造商 300 亿美元的投资,这笔交易也再次印证了 OpenAI 与英伟达的合作决心。
英伟达是全球占据绝对主导地位的 GPU 制造商,其生产的图形处理器作为专用芯片,可同时执行数十亿项运算任务。尽管英伟达始终声称其 GPU 可同时适用于人工智能模型的训练与推理环节,但如今其 GPU 已不再被视为驱动人工智能应用的最高效选择。许多企业发现,英伟达的芯片能耗过高,这使得其在人工智能智能体这类应用场景中的使用成本居高不下 —— 人工智能智能体可代表人类自主执行各类任务,对算力有着极高的需求。
也正因如此,OpenAI 上月与思睿帕斯公司签订了一份价值数十亿美元的合同,以获取该公司那款餐盘大小的推理专用芯片的使用权。思睿帕斯公司称,其研发的芯片在推理任务中的运算速度远快于英伟达的 GPU。
据悉,英伟达这款新推理芯片将整合格罗克公司的研发技术。去年 12 月,英伟达以 200 亿美元的价格获得了格罗克技术的非独家授权,同时还聘请了该公司的创始首席执行官乔纳森・罗斯与总裁桑尼・玛德拉加入英伟达,这一交易也被称为硅谷历史上规模最大的 “人才收购” 案之一。
格罗克研发的推理芯片被称为 “语言处理单元(LPU)”,这类芯片基于一种全新的架构打造,能以更低的能耗完成推理运算。不过,英伟达目前尚未公布将如何运用这家初创企业的技术。
有消息称,OpenAI 计划将英伟达这款新推理芯片用于其 Codex 编程工具的算力支撑,该工具是对抗安索普公司(Anthropic)Claude Code 的竞品。代码开发类应用已成为生成式人工智能领域最具影响力且盈利性最强的应用场景之一,而在这一领域,OpenAI 始终位居第二 ——Claude Code 被公认为该市场的领导者。
英伟达也在推广其中央处理器(CPU),将其作为运行推理工作负载的另一选择。传统模式下,大多数企业会将英伟达的 GPU 与 CPU 搭配使用,通过两款芯片的协同运作弥补彼此的性能短板。
但英伟达表示,部分智能体式人工智能工作负载,仅依靠其最先进的格雷斯中央处理器(Grace CPU)就能实现更高效率的运行。上月,元宇宙平台公司(Meta)成为首家承诺大规模部署纯 CPU 架构的企业,该架构将为其广告定向智能体的实际生产运营提供算力支持。
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码
