英特尔和SambaNova将Xeon 6定位为人工智能推断目标
智能体 AI 正快速从实验室走向实际部署,这迫使数据中心架构师重新思考如何处理推理工作负载。对此,英特尔与 SambaNova 系统公司推出了一款全新的异构架构,旨在支撑下一代人工智能应用。
两家公司表示,该架构将 GPU、SambaNova RDU 与英特尔至强 6 处理器相结合,实现了性能、能效与兼容性的平衡。对于从事人工智能基础设施工作的工程师与系统架构师而言,这一公告凸显出未来推理系统有望摆脱仅依赖 GPU 的模式。
面向智能体 AI 的异构计算方案
全新架构针对新兴的 “智能体 AI” 工作负载设计,这类系统能够自主进行推理、规划并执行复杂操作。这些工作负载在推理的不同阶段,对计算资源有着不同的需求。
根据该架构方案:GPU 用于模型处理大尺寸提示词的预填充阶段;SambaNova 的可重构数据流单元(RDU)负责高吞吐量解码运算;至强 6 处理器则作为主控与执行 CPU,统筹任务并运行应用逻辑。
这种分工体现了行业内日益明显的趋势:将 AI 推理的不同阶段与最合适的硬件加速器匹配,而非单纯依赖 GPU。两家公司称,该设计还能兼容支撑绝大多数数据中心环境的 x86 软件栈。
依托 x86 生态系统
保持与现有基础设施的兼容性是此次合作的核心。数据中心与企业级 AI 部署通常高度依赖基于 x86 的软件与管理框架,因此集成能力成为新架构的重要考量。
英特尔公司数据中心事业部执行副总裁兼总经理 Kevork Kechichian 表示:“数据中心软件生态建立在 x86 架构之上,并运行于至强处理器 —— 这为开发者、企业与云服务商提供了成熟可靠的规模化应用基础。未来的工作负载需要多样化的混合计算能力,此次与 SambaNova 的合作推出了一款高性价比、高性能的推理架构,能够满足客户规模化需求,而这一切均由至强 6 驱动。”
这款联合研发的平台预计将于 2026 年下半年面向企业、云服务商与自主可控 AI 项目开放使用。
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码
