RISC-V,伏击AI Agent
今日,2026 玄铁 RISC-V 生态大会召开,中电标协 RVEI 战委会主任倪光南提到:「在物理 AI 时代,RISC-V 拥有模块化、低功耗、定制化、安全性等优势,能更好地满足多样化的算力需求。」
过去两年,整个行业的注意力几乎都被 GPU 吸走了。
只要谈 AI,绕不开的就是 H100、B200,仿佛算力只剩下一种形态:大规模并行计算。这不难理解。大模型把计算需求高度集中在训练和推理上,谁能提供更多并行算力,谁就更靠近 AI 时代的核心舞台。于是,AI 几乎被等同于 GPU。
相比之下,CPU 并没有退场,只是退到了背景里。它依然重要,只是不再是最抢眼的角色。
变化是从 Agentic AI 开始显现的。前不久,黄仁勋发表署名长文,谈到未来软件形态可能会被智能体重塑;几天之后,英伟达又发布了 Vera CPU,并明确把它和 Agentic AI 放在一起讲。连起来看,这两个动作至少说明了一件事:当 AI 开始从「生成答案」走向「执行任务」,算力的重心也在悄悄变化。
也正是在这个时间点上,2026 玄铁生态大会开了。会场上,达摩院一口气端出了玄铁 C950、Flex 可扩展平台,以及新一轮生态动作。单看,这是一场 RISC-V 生态大会;但如果把它放回 Agent 这条主线里,它讨论的其实是同一个问题:下一代智能系统,到底需要什么样的 CPU,什么样的架构。
大模型时代,GPU 站在台前;到了 Agentic AI 时代,CPU 的重要性正在重新上升。而比 CPU 更值得重新估值的,可能是 CPU 背后的那套架构。
RISC-V,恰好撞上了这个时间点。
CPU,收复失地
很多人会疑惑,为什么 Agentic AI 时代,CPU 会重新崛起?因为,Agent 不是更长一点的聊天,而是更完整一点的软件。
这一点,已经不只是概念。伯克利的 BFCL v4,已经把函数调用、工具调用放到 Agent 评测的中心;《TheAgentCompany》则把智能体扔进一个模拟软件公司,让它浏览网页、写代码、运行程序和同事协作。结果并不轻松:最强基线 Agent 自主完成率也只在约四分之一这个量级。换句话说,Agent 真正难的,不是把一句话答出来,而是在复杂环境里把一件事做完。
这正是 CPU 重新变重要的原因。大模型时代,行业追求的是把训练做大、把推理做快,因此 GPU 天然站在舞台中央;但 Agent 时代,决定体验的往往不是那段 token 生成,而是整条执行链:检索、读写、调度、脚本执行、sandbox 拉起、数据库访问、状态管理,以及反复重试和结果校验。这些环节并不天然属于 GPU 的主场。

来源:《A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI》
Georgia Tech 与 Intel 一篇针对 Agent 系统的最新研究,对 Haystack RAG、Toolformer、ChemCrow、LangChain 和 SWE-Agent 五类代表性负载做了系统级剖析,结论是:CPU 侧的工具处理,最多可以占到总延迟的 90.6%;在大批量场景下,CPU 动态能耗最高可占总动态能耗的 44%。说到底,GPU 决定模型会不会想,CPU 决定系统会不会干。
于是,问题也就变了。行业内思考的不只是 CPU 回来了,还在思考:什么样的 CPU 架构,最适合 Agent?
传统服务器时代,x86 的优势几乎没有悬念;手机和 PC 时代,Arm 更占上风。但这是 AI Agent 时代。Agent 不是在旧软件框架上做增强,而是在重写软件本身。它需要的,不是一颗放之四海而皆准的「标准品 CPU」,而是一套能够围绕具体场景快速生长、快速裁剪、快速扩展的底层架构。
这正是 RISC-V 的本质优势。RISC-V 能够迅速回答 Agent 时代最核心的三个问题:
首先,RISC-V 足够灵活。云端智能体、边缘机器人、端侧助手,看上去都叫 Agent,但对时延、功耗、吞吐和安全的要求完全不是一回事。Agent 负载高度分化,底层架构必须可裁剪。
其次,RISC-V 足够开放。AI 算法的演进速度是以月为单位的,RISC-V 开放的生态意味着,一旦新的算法需求出现,全球的开发者和芯片厂商可以迅速响应,推出定制化的硬件方案,而不必等待某家巨头的排期。这种敏捷性,是封闭架构无法比拟的。
第三,RISC-V 天生强调开放互联,更适合做系统整合。Agent 不是一个单点功能,而是一整套系统:前面要感知,中间要决策,后面还要调用、执行、校验。很多时候,它不是靠一个计算单元单打独斗,而是 CPU、NPU、DSP 和各种加速模块一起配合。RISC-V 的开放和可扩展,决定了它在这种异构整合上更有空间,也更容易贴着场景去搭底座。
过去很多人看 RISC-V,总爱用昨天的尺子:它能不能立刻复制 x86?能不能马上对标 Arm?能不能一夜之间拥有成熟生态?
AI Agent 时代给出的新问题是:谁更适合成为下一代智能软件的底层载体?
在这个问题上,RISC-V 反而有一个过去少见的优势:它没有沉重的历史包袱,却有足够大的可塑性;它不是在旧软件时代和 x86、Arm 拼兼容存量,而是在新软件时代争夺增量。
这就是 RISC-V 最值得被重估的地方。
正如达摩院首席科学家孟建熠在大会现场所说:「行业需要协同创新、开放、有生态的架构,支撑起未来 Agentic AI 所带来的新世界。」
玄铁 C950,越过山脊
这次玄铁生态大会上,最重磅的发布无疑是 C950。


RISC-V 已走过 15 个年头,这几年它在 MCU、嵌入式、家电、车载、存储等领域快速铺开。RISC-V 已正式占据全球处理器市场 25% 份额。按 SHD Group 的预测,到 2030 年全球 RISC-V SoC 出货量将超过 162 亿颗。换句话说,RISC-V 的问题从来不是不够广,而是还不够高。
真正要从边缘走向主流,RISC-V 迟早要打下高性能和 AI 计算。2024 年,RISC-V International 批准的 25 项标准里,超过一半已经与高性能或 AI 相关,这本身就说明,整个生态都在往这两个方向集体抬升。

达摩院玄铁,正是沿着这两条线一路向上推进的代表。2019 年,阿里发布玄铁 C910。今天回看,C910 最重要的意义,不只是当年的性能数字,而是它第一次让行业相信:RISC-V 具备迈向高性能通用计算的可能。后来的如意 BOOK 甲辰版笔记本,以及法国云服务商 Scaleway 推出的全球首个 RISC-V 云实例,底座都选了 C910。某种意义上,C910 吹响了 RISC-V 冲击高性能的号角。
服务器芯片,是检验一套架构性能成色最严格的考场。到 2025 年,达摩院推出 C930,性能达到 SPECint2006 15/GHz 左右,并在今年迭代中提升到约 17/GHz,第一次真正跨过了服务器级高性能 CPU 的门槛。
今年玄铁生态大会上,达摩院把这条线继续推高:新一代旗舰 CPU 玄铁 C950。按大会披露,C950 在 SPECint2006 基准测试中突破70,单核性能超过22/GHz,最高主频达到3.2GHz,成为目前性能最强的 RISC-V CPU。
把这个标准放到行业坐标里看,C950 已经可以对标 X86、Arm 最新一代面向云计算和机器学习场景的主力高性能核心。也就是说,C950 进入的,已经不是 RISC-V 内部比较,而是主流高性能 CPU 的核心战场。
更关键的是,C950 不是一颗只会冲分的 CPU。在 MySQL、Redis、Nginx、OpenSSL 这些最典型的服务器工作负载下,C950 同样跑出了行业第一梯队的表现。这比跑分更有说服力,因为它说明,C950 在数据库、缓存、Web 服务、密码运算等真实系统场景中,已经具备了正面竞争力。
玄铁在 C950 上加入了自研 Matrix 加速引擎,C950 已经能够顺利运行Qwen3 最强开源模型和 DeepSeek V3「满血版」,输出速度分别达到 34 Tokens/s 和 18 Tokens/s,首 Token 延迟分别为 3.4 秒和 1.7 秒。这也是 RISC-V CPU 第一次真正跑通千亿参数级模型。再加上 C950 支持 RVA23.1 全部标配和可选扩展,进入服务器、AI、汽车等平台,以及 Linux、Android 等系统环境的门槛也被进一步降低。
因此,C950 的出现对 RISC-V 行业至少有三重意义。
第一,它证明 RISC-V 开始真正进入高性能和 AI 计算的腹地。过去大家总说 RISC-V「有潜力」,但潜力这件事说久了,很容易变空。C950 的价值,在于它将这种潜力转化为可验证的产品能力。它不再只是向前试探,而是已经能够与 Arm Neoverse V2、AMD Zen5、Intel GNR 这一类主流高性能核心放在一张桌子上讨论。这对于 RISC-V 而言,不只是信心提升,更意味着技术路线获得了更明确的产业确认。
第二,它给整个 RISC-V 高性能发展树立了新的标杆。C910 让行业看到高性能的可能,C930 让 RISC-V 迈过服务器门槛,而 C950 则首次把「高性能旗舰产品」真正做了出来。过去两年,RISC-V 在高性能方向持续推进,但始终缺少一颗足够有代表性产品。C950 的出现,把全球 RISC-V 高性能的基准整体向上抬升了一档。此后,无论国内还是海外,围绕高性能 RISC-V 的竞争都很难再绕开这条新基线。
第三,它的前瞻性不只在于性能,而在于它是按 AI Agent 时代的 CPU 逻辑做出来的。AI Agent 时代所需要的,不只是传统意义上的通用 CPU,也不只是单点 AI 加速器,而是一种既能承载复杂系统负载,又具备原生 AI 处理能力的新型 CPU。C950 的重要性,正在于它已经开始回应这一问题:面向未来 Agent,CPU 应当具备怎样的能力结构。从这个角度看,C950 并不只是「今天最强」,更是在向下一代 CPU 的形态靠近。
放回玄铁自身的路线图中,这条演进线就更清晰了。C925、C930、C950,从 12 分、17 分到 22 分/GHz,玄铁已经逐步铺开了自己的高性能产品谱系。再加上此前的中低性能产品,玄铁显然要做的,不是一颗孤立的明星芯片,而是一整套覆盖不同场景的 RISC-V 处理器矩阵。
Flex,RISC-V 的「外挂」
如果说 C950 解决的是一个问题:RISC-V 能不能做出高性能、能跑 AI 的旗舰 CPU。那么 Flex 回答的,其实是另一个更关键的问题:就算玄铁做出来了,行业能不能跟着做出来。
这恰恰是 RISC-V 和 x86、Arm 最不一样的地方。
在传统架构里,客户买到的往往是一个相对完整的标准答案;但 RISC-V 的价值,从来不只是「有一颗现成 CPU」,而是它允许用户围绕具体场景继续往下做。AI、存储、车载、工业控制,每个行业的负载都不一样,真正能把 RISC-V 差异化拉开的,也不是通用部分,而是定制能力。
玄铁这次发布 Flex,本质上就是把这种定制能力,从「各家自己摸索」变成「官方给一套台阶」。Flex 提供了处理器建模、开发环境和软件工具链等整套框架,客户既可以直接选用成熟的玄铁 CPU IP,也可以基于 Flex 做自定义加速,打造更贴近垂直场景的处理器。Vector 加速、Matrix 加速等 AI 能力,客户也可自行通过 Flex 平台来实现。
Vector 解决通用向量计算,Matrix 往大模型推理再走一步。这样一来,客户不必从零起步,而是在一个已经跑通过模型、已经有工具链和软件栈支撑的平台上继续做专用化。这也是 Flex 真正像「外挂」的地方。它不是替客户把所有事情做完,而是先把最难的 80% 做掉。剩下那 20%,交给客户结合自己的 Know-how 去完成。
玄铁这几年的策略其实越来越清楚:自己往上走,去啃高性能和 AI 这些最难的共性能力;合作伙伴往下沉,去吃具体行业、具体场景、具体产品。
2024 年,玄铁推动成立无剑联盟;到 2025 年大会上,无剑联盟又吸纳了西门子 EDA、网易有道、普华基础软件、经纬恒润、南瑞瑞腾、Cadence 等新成员;2026 年,玄铁生态大会又把国芯科技、Canonical、千问、天翼云、SGS 等真正拉到一张桌子上。RISC-V 生态的落地也在进一步推进,我们在现场了解到南芯 RISC-V 出货量已经超过 1 亿颗,未来三年电源品类有望做到 10 亿美金。
C950 是在立标杆,Flex 是在搭台子,无剑联盟则是在把台子变成产品。
中国开源,会师RISC-V 高性能
如果说玄铁 C950 证明了 RISC-V 已经开始摸到高性能和 AI 计算的门槛,那么更值得注意的是,这件事已经不再只是单点突破,而是中国开源力量开始在 RISC-V 高性能生态上会师。
一端是标准。玄铁已经在 RISC-V 基金会技术委员会及 10 多个技术小组担任主席或副主席,持续参与高性能和 AI 相关标准推进;另一端是底层技术,北京开源芯片研究院披露,其「香山」高性能 RISC-V 路线已经形成从「南湖」到「昆明湖」的持续演进,并明确朝着服务器级高性能和虚拟化能力推进,未来玄铁也会参与进来;再往下,则是软件和应用生态的补齐,玄铁积极投入 OpenRuyi 社区,patch 贡献排名第一,并与中兴等伙伴在服务器开源组件、存储和编解码优化上持续推进。这意味着,今天的 RISC-V 已经不只是某一颗芯片、某一家公司的故事,而是在标准、处理器、操作系统、基础软件和行业应用之间,慢慢形成一条完整链路。
过去很多年,RISC-V 更像一种开放的可能:灵活、可扩展、可定制,但离主流高性能计算,总像还隔着最后一道门。
Agentic AI 的到来,让这件事第一次有了新的判断标准。从这个角度看,2026 玄铁生态大会真正重要的,不只是发布了一颗 C950,也不只是拿出了 Flex 和无剑联盟,而是把一件事讲得更具体了:
RISC-V 不是赶上了 Agentic AI。恰恰相反,Agentic AI 正在证明,RISC-V 才是更像下一代 CPU 的那套架构。
关键词: 安谋科技
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码
