MCU,智能觉醒

嵌入式系统 时间:2026-02-25来源:半导体产业纵横

根据 IoT Analytics 的报告,全球物联网 MCU 市场规模预计到 2030 年将达到 73 亿美元,年复合增长率约为 6.3%。这一增长主要得益于自动化升级需求的释放、LPWAN 项目的推动、AI 向边缘迁移的趋势以及亚洲尤其是中国市场的快速增长。AI 技术的融入正在彻底改写 MCU 的生存逻辑。而 AI 技术的深度融入,正从底层改写 MCU 的技术逻辑与市场格局,催生出兼具低功耗、实时性与智能推理能力的 AI MCU,成为物联网智能化发展的载体。

AI MCU 通过集成神经网络处理单元(NPU)、扩展专用指令集等方式,实现了边缘端的本地智能推理,精准匹配了智能设备对低功耗、高实时性和高性价比的需求。这不仅推动了 MCU 产品的升级,更让市场竞争愈发激烈,国内外各大芯片厂商纷纷加大研发投入,推出各具技术特色的 AI MCU 产品,加速边缘智能应用的落地。

Arm:构筑 AI MCU 核心技术底座

作为全球领先的处理器架构设计公司,Arm 的内核产品线覆盖了从高性能计算到低功耗嵌入式应用的全场景,自 1990 年成立以来,已形成 Cortex-A、Cortex-M、Cortex-R 三大系列产品,以及面向服务器/基础设施的 Neoverse 系列,各系列基于 ARMv7、ARMv8、ARMv9 等不同架构版本设计,针对专属应用场景完成深度优化。

其中,Cortex-M 系列是微控制器(MCU)和嵌入式系统的核心处理器内核,以低功耗、高实时性和高成本效益为核心特性,支持单周期指令执行、纳秒级快速中断响应,最小内核尺寸仅 0.01mm²,搭配 Thumb-2 指令集,无 MMU 且可运行 RTOS,是目前绝大多数 MCU 产品的技术基石,也成为 Arm 布局 AI MCU 的核心切入点。

为了让 Cortex-M 系列具备更强的 AI 计算能力,Arm 推出了一系列专属技术与内核产品。2019 年,Arm 发布适用于 Armv8M 架构的 Cortex-M 矢量扩展技术(MVE)——Arm Helium 技术,作为 Armv8.1-M 架构的扩展,该技术通过高效的 SIMD(单指令多数据)操作,为机器学习(ML)和数字信号处理(DSP)应用带来显著性能提升,在机器学习任务中可实现最高 15 倍的性能突破。而 Arm Helium Utils 作为 CMSIS DSP 库的组成部分,还为该技术提供了一系列实用函数,进一步优化 DSP 和 ML 任务的处理效率。

Cortex-M55 和 Cortex-M85 是首批支持 Helium 技术的处理器,让小型、低功耗的嵌入式系统能够应对音频设备、传感器集线器、关键词识别、静态图像处理等场景的计算挑战,也让基于 Arm 内核的 MCU 具备更强的 AI 处理能力。2023 年,Arm 再度推出专为 AI 应用设计的 Cortex-M52 处理器,不仅实现了能效的进一步提升,成为 Cortex-M3、Cortex-M33 等主流 MCU 内核的替代选择,更借助 Helium 技术实现了 DSP 和 ML 处理能力的显著升级,将 AI 驱动的创新引入更多低功耗嵌入式场景。

除了内核本身的升级,Arm 还推出了面向 Cortex-M 系列的 microNPU——Ethos-U55,专为面积受限的嵌入式和物联网设备设计,可大幅加速 ML 推理性能。当 Ethos-U55 与 Cortex-M55 协同部署时,相较于传统的 Cortex-M 系统,机器学习性能可提升高达 480 倍,为低成本、高能效的 AI MCU 解决方案提供了支撑。

在国内,安谋科技也基于 Arm 架构完成了本土化创新,其自主研发的第三代高能效嵌入式芯片 IP「星辰」STAR-MC3,基于 Arm v8.1-M 架构打造,向前兼容传统 MCU 架构,同时集成 Arm Helium 技术,在显著提升 CPU AI 计算性能的同时,兼顾优异的面效比与能效比,成为 AIoT 领域主控芯片及协处理器的核心架构,助力客户高效部署端侧 AI 应用。

RISC-V:AI MCU 的另一技术路线

除了 Arm 架构,RISC-V 凭借开源、灵活的特性,成为 AI MCU 的另一重要技术选择,其矢量扩展(RVV)技术可让处理器内核加速海量数据集的单指令流计算,完美适配机器学习、图像压缩处理、数据加密、音视频多媒体处理、语音识别和自然语言处理等任务——而这些正是物联网端侧 AI 落地的核心计算需求,也吸引了众多企业基于 RISC-V 架构打造 AI MCU 产品,形成与 Arm 架构互补的技术格局。

如今,谷歌已通过与合作方 Synaptics 共同将基于 RISC-V 的 Coral NPU 架构推向市场。Coral NPU 是基于 RISC-V 指令集架构,包含一个四阶标量 CPU 核心、一个 32 位 RISC-V 向量引擎以及一个专门为现代 Transformer 模型优化的矩阵核心加速器。谷歌给 Coral NPU 的定位是「一个全栈、开源的平台,旨在解决性能、碎片化和隐私这三大核心挑战,而这些挑战限制了功能强大、始终在线的 AI 技术在低功耗边缘设备和可穿戴设备上的应用。」

国内外厂商:AI MCU 产品落地加速

依托 Arm Helium、RISC-V RVV 等技术,国内外芯片厂商纷纷推出自研 AI MCU 产品,从高端高算力到入门级解决方案,覆盖不同应用场景,推动 AI MCU 的商业化落地。

国际大厂:技术领先,布局全场景

瑞萨电子的 RA8 系列作为业界首个基于 Arm Cortex-M85 内核的 MCU 系列,兼具 MPU 的高性能与 MCU 的易用性、低功耗和低 BOM 成本,支持单核或双核设计,最高可实现 1GHz 的 CPU 主频、0.25 TOPS NPU 算力,还集成了包含 EtherCAT 在内的多协议工业网,可满足 AI、工业以太网、机器人、HMI 等高算力应用需求。在此基础上,瑞萨推出的 RA8P1 微控制器产品群,采用 Cortex-M85(1GHz)+Cortex-M33(250MHz)的双核异构设计,并集成 Arm EthosTM-U55 NPU,借助 Arm Helium 技术实现了 DSP 和 AI/ML 性能的大幅提升,树立了 MCU 性能的新标杆。

意法半导体的 STM32N6 则是首款内嵌自研神经处理单元(NPU)——ST Neural-ART accelerator 的 STM32 MCU,专为节能型边缘 AI 应用设计,其搭载的 Arm Cortex-M55 内核主频高达 800MHz,结合 Arm Helium 向量处理技术显著增强 DSP 处理能力,芯片整体时钟频率可达 1GHz,计算性能达 600 GOPS,能为计算机视觉和音频应用提供实时神经网络推理能力。

恩智浦的 i.MX RT700 系列则以多内核架构实现智能算力的分层部署,该系列拥有 5 个计算内核,主计算子系统包含 325MHz 的 Arm Cortex-M33 核与 Cadence Tensilica HiFi 4 DSP,超低功耗感知子系统则搭配第二款 Cortex-M33 核与 Cadence Tensilica HiFi 1 DSP,无需外部传感器集线器,有效降低系统设计复杂度与 BOM 成本。同时,该系列集成恩智浦 eIQ Neutron NPU,可将 AI 工作处理速度提高 172 倍,还内置 7.5MB 板载 SRAM,为可穿戴设备、医疗设备、智能家居等边缘智能设备提供算力支撑。

英飞凌的 PSoC Edge E81、E83、E84 系列均基于 Arm Cortex-M55 内核打造,支持 Arm Helium DSP 指令集,同时搭配不同的 AI 加速单元:E81 搭载英飞凌自研超低功耗 NNLite 神经网络加速器,E83 和 E84 则内置 Arm Ethos-U55 微型 NPU,与传统 Cortex-M 系统相比机器学习性能提升 480 倍,且三款产品均集成丰富外设、片上存储器和硬件安全功能,支持 WiFi 6、BT/BLE、Matter 协议等,适配低功耗计算领域的机器学习应用。

德州仪器则依托 DSP 技术优势布局 AI MCU,其 C2000 MCU 系列的 TMS320F28P550 MCU,搭载 150MHz C28x 32 位 DSP CPU,集成浮点单元(FPU32)与三角函数加速器(TMU),并内置 NPU 实现边缘 AI 计算,算力达 600–1200 MOPS,支持本地运行 CNN 模型,适配工业控制等场景的 AI 需求。

国内企业:紧跟趋势,本土化适配突出

国内芯片厂商也在 AI MCU 领域快速突破,结合本土物联网应用场景完成产品优化,同时实现了 RISC-V 架构的落地应用,形成差异化竞争优势。

新唐科技推出的 NuMicro M55M1 是定位入门级的 AI MCU 解决方案,专为 AI 数据识别、智能音频等边缘应用打造,基于 Arm Cortex-M55 核心设计,搭载 Arm Ethos-U55 NPU 与 Helium 向量处理器,AI 运算能力达 110 GOPS,相较于传统 1GHz MCU,AI 推理性能实现超 100 倍突破,还内置 1.5MB RAM、2MB Flash 并支持外扩存储。同时,新唐科技还推出自研 NuML Tool Kit 开发工具,并提供人脸识别、物体识别等多款现成 AI 模型,大幅降低 AI 应用开发门槛,加速产品落地。

国芯科技则聚焦 RISC-V 架构的 AI MCU 研发,其端侧 AI MCU 芯片 CCR4001S 已实现 10 万颗交货,该芯片采用 RISC-V 内核,主频 230MHz,集成 0.3 TOPS @INT8 算力的 NPU,可高效运行 MobileNet、ResNet、Yolo 等深度学习算法,实现物体识别、目标检测等复杂任务,同时兼具低功耗特性,尤其适配空调智能控制等家电智能化场景,支持客户自主导入算法模型并完成迭代优化。此外,国芯科技还与赛昉科技联合推出 CCR7002 芯片,通过多芯片封装技术集成高性能 SoC 与低功耗 AI 芯片子系统,同样提供 0.3TOPS 的 NPU 算力,实现 RISC-V 架构与 AI 的深度融合。

乐鑫科技的 ESP32-S3 则在通用 MCU 基础上增加了 AI 算力支持,这款集成 2.4GHz Wi-Fi 和 Bluetooth 5 (LE) 的 MCU,搭载 Xtensa 32 位 LX7 双核处理器,主频 240MHz,新增的向量指令可加速神经网络计算和信号处理,开发者通过 ESP-DSP、ESP-NN 等库即可实现图像识别、语音唤醒等 AI 应用,适配智能家居等轻量级边缘智能场景。

华为海思则针对家电端侧智能化推出 Hi3066M,这款微算力嵌入式 AI MCU 采用海思自有 RISC-V 内核,内置 eAI 引擎,主频 200MHz,搭配 64KB SRAM 和 512KB 内置 Flash,可适配空调、冰箱、洗衣机等白电的 AI 节能、智能检测等场景,同时预留了足够的存储空间,满足未来 5~10 年的产品升级需求,是华为首款端侧 eAI 芯片。

结语

AI 与 MCU 的融合,已逐渐从技术探索走向商业化落地。随着边缘智能需求的持续释放,以及芯片厂商在算力、功耗、成本和开发工具上的不断优化,AI MCU 将成为更多智能设备的算力载体,在智能家居、工业控制、消费电子、医疗设备等领域实现更广泛的应用,推动物联网产业向更智能、更高效的方向发展。

值得关注的是,中国作为 RISC-V 生态最核心的推动者与践行者,也是全球 RISC-V 芯片应用最活跃的国家。相较于 Arm 架构芯片,我们所能深入了解的往往仅限于其外设、调试系统、总线结构及指令集,却缺乏有效渠道窥探 Cortex-M 内核的核心细节,无法深入掌握芯片内部流水线等关键技术;而 RISC-V 的开源特性恰好解决了这一痛点。更为重要的是,它大幅降低了内核学习门槛,能够培养出一大批深入掌握内核技术的专业人才。

如今,在 MCU 中融入 AI 功能,已成为一件司空见惯的事情,这一趋势也将持续推动边缘智能产业的深度发展。

关键词: MCU

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版