彻底改变处理器设计:英特尔的软件定义超级核心
在不断发展的计算领域,英特尔的“软件定义超级核”专利申请 (EP 4 579 444 A1) 代表了一种在不仅依赖硬件扩展的情况下增强处理器性能的突破性方法。这项创新于 2024 年 11 月提交,并于 2023 年 12 月在美国申请中优先提交,解决了传统高性能内核的低效率问题,传统高性能内核通常通过频率涡轮增压来牺牲能源效率来换取速度。通过将多个内核虚拟融合成一个“超级内核”,英特尔提出了一种混合软硬件解决方案,聚合每周期指令数 (IPC) 功能,实现节能、高性能计算。本文探讨了软件定义超级核 (SDC) 的概念、机制、优势和影响,重点介绍了它们如何改变现代处理器。
该专利的背景凸显了处理器设计中持续存在的挑战。高 IPC 内核虽然功能强大,但在很大程度上依赖于工艺技术节点扩展,这变得越来越困难和昂贵。更大的内核还会减少总体内核数量,从而限制多线程性能。混合架构,例如混合性能和效率内核的架构,试图平衡单线程 (ST) 和多线程 (MT) 需求,但需要设计和验证具有固定比率的多种内核类型。英特尔的 SDC 通过从相邻的物理内核(通常属于同一类,例如效率或性能内核)创建虚拟超级内核来规避这些问题,这些内核并行执行单线程程序的部分内容,同时在报废时保持原始程序顺序。这给作系统 (OS) 和应用程序带来了一个更大的内核的错觉,将性能提升与物理硬件扩展解耦。
SDC 的核心是通过协同的软件和硬件框架运行。该软件组件可能集成到即时 (JIT) 编译器、静态编译器甚至传统二进制文件中,将单线程程序拆分为指令段,每个指令段通常约 200 条指令。流控制指令,例如检查“虫洞地址”(用于内核间通信的保留内存空间)的条件跳转,引导执行:一个内核处理奇数段,另一个内核处理偶数段。同步作可确保按顺序停用,“同步加载”和“同步存储”强制执行全局顺序。常驻加载和常驻存储处理寄存器依赖关系,通过特殊内存位置传输必要的数据,而不会产生过多的开销(估计不到 5%)。对于非线性代码,如分支或循环,间接分支或虫洞循环指令使用预测目标或存储的程序计数器来动态地重新引导内核来保持并行性。
硬件支持很少但至关重要,主要是通过 SDC 接口增强内存执行单元 (MEU)。这些接口使用共享的“虫洞”地址空间来管理负载存储排序、内核间转发和监听,以实现快速数据传输。内核可以共享缓存或独立运行,但系统保证内存排序和架构完整性。作系统起着关键作用,根据硬件引导计划 (HGS) 建议预配核心,在有益时将线程迁移到 SDC 模式(例如,对于高 IPC 阶段),并在条件发生变化时恢复,例如分支错误预测增加或系统负载需要更多独立核心。
SDC 的好处是多方面的。通过允许更长的涡轮突发或在较低电压下运行来提高能效,因为聚合 IPC 减少了对频率缩放的需求。灵活性是一个关键优势:平台可以在高意法半导体性能(通过超级内核)和高 MT 吞吐量(通过单个内核)之间动态调整,从而适应没有固定硬件比率的工作负载。与以前的多线程分解不同,复制会产生 25-40% 的指令开销,SDC 最大限度地减少冗余,专注于显式依赖关系。这可以使高性能计算民主化,减少对先进工艺节点的依赖,并实现数据中心、移动设备和人工智能加速器的可扩展设计。
然而,挑战依然存在。实现需要精确的软件拆分,以最大限度地减少通信开销,并且硬件添加虽然很小,但必须验证可靠性。提到了通过二进制转换与各种指令集架构 (ISA) 的兼容性,但实际部署可能会面临作系统集成障碍。
总之,英特尔的软件定义超级核心专利预示着向以软件为中心的处理器发展的范式转变。通过将虚拟融合与高效的核心间通信相结合,SDC 有望弥合性能需求和硬件限制之间的差距,培育更具适应性、更高效的计算系统。随着技术节点趋于稳定,此类创新可能会定义处理器的下一个时代,为从人工智能到日常计算的应用提供前所未有的活力。
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码
