Arm 推出自研 136 核 AGI CPU
作者: CBISMB
责任编辑: 邹大斌
来源: CBISMB
时间: 2026-03-25 10:43
关键字: Arm,CPU,Meta,数据中心,AI
浏览: 0
点赞: 0
收藏: 0
本周二,Arm 发布了其首款自主研发的硅片——是的,这是一颗真正的芯片,而不再仅仅是一个设计蓝图。Arm 表示,其旗舰客户 Meta 计划在今年晚些时候大规模部署这款拥有 136 个核心的 CPU。
这款芯片被命名为“AGI CPU”,是这家英国芯片设计公司首款带有 Arm 品牌的数据中心级处理器,其设计初衷正是为了服务于“代理式 AI”(agentic AI)。
这款新硬件标志着这家英国芯片设计公司商业模式的重大转变。虽然 Arm 对数据中心并不陌生,但在此之前,其参与方式仅限于授权构建这些产品所需的IP或指令集架构。
尽管品牌宣传充满了炒作意味,但这颗芯片搭载的 Arm Neoverse V3 核心本身并不会运行 AI 模型。那是 GPU 或越来越多的高端 ASIC芯片的任务。相反,Arm 认为其首款数据中心 CPU 将为 AI 代理(AI agents)提供动力。在这方面,该芯片将与英伟达上周在 GTC 大会上详解的独立 Vera CPU 及其机架系统直接竞争。
“我们认为,CPU 对于最终实现 AGI 至关重要,”Arm 云与 AI 执行副总裁 Mohamed Awad 说。
近年来,GPU备受关注,但随着 OpenClaw 等代理式系统的兴起,对通用计算能力的需求再次回到视野中心。这些框架需要 CPU 核心和内存来编写和执行代码、自动化任务,并促进用于训练下一代模型的强化学习。
Arm 押注于这些代理的普及将推动 CPU 需求增长四倍,并正将其最新芯片定位为利用这一趋势的关键产品。
专为 AI 打造的 CPU
Arm 的 AGI CPU 是一款功耗为 300 瓦的处理器,拥有136个 Neoverse V3 核心,基准频率为 3.2 GHz,最高加速频率可达 3.7 GHz。它由两个采用台积电3 纳米工艺制造的晶粒(die)组成。该处理器每个核心配备 2 MB 的 L2 缓存,并拥有 128 MB 的共享系统级缓存(SLC)。
据 Awad 介绍,设计团队刻意避免加入那些会占用晶粒面积却无助于目标工作负载的加速器或功能。
“传统 CPU 的构建方式往往担心对旧应用程序的支持等问题,”他说,“我们特意不想添加那些无法在该设备的使命中实现 100% 利用率的功能。”
他补充道:“这是一款从头开始的设计,旨在解决所有这些问题。”
与英伟达的 Vera 不同,Arm 选择在其针对代理优化的处理器中放弃SMT技术。Awad 认为,每个核心一个线程可以实现更具确定性的性能扩展。
该 CPU 支持 12 通道 DDR5 内存(预计每个晶粒 6 通道),支持高达 8800 MT/s 的内存速度。总带宽达到 825 GB/s,相当于每个核心 6 GB/s。
与许多现代 CPU 不同,为了最大限度地减少延迟,该芯片的内存和 I/O 功能与计算单元集成在同一个晶粒上。因此,在操作系统看来,每个插槽将表现为两个独立的 NUMA(非统一内存访问)域。
最后,在 I/O 方面,该处理器配备了 96 条 PCIe 6.0 通道,并支持 CXL 3.0。
极致密度
Meta 已经是大量部署英伟达基于 Arm 架构的 Grace CPU 的客户,并计划使用该公司的 Vera 芯片,它也将成为 Arm 首批主要的 CPU 客户之一。
作为这些努力的一部分,Arm 表示已验证了两种OCP机架设计。其中一种是 36 千瓦的风冷机架,包含 30 个计算刀片,每个机架总计 8160 个核心。
该公司还验证了一种密度更高的 200 千瓦液冷机架,配备 42 台八节点服务器,总计可达 45,696 个核心。作为参考,这超过了英伟达 Vera ETL256 CPU 机架核心数(22,528 个)的两倍多。
Meta 并非唯一排队抢购 Arm 新处理器的客户。OpenAI、SAP、Cerebras、Cloudflare、F5、SK 电信和 Rebellions 也被列为早期客户。
除了 AI 代理,Arm 还看到了该芯片作为定制加速器的“机头”,甚至作为用于网络或存储的通用 CPU 的应用场景。事实上,我们获悉包括联想在内的 OEM 合作伙伴已经在开发使用该芯片的 19 英寸系统。
到目前为止,企业客户在 Arm 数据中心硅片方面的选择有限,Ampere Computing 一直是该领域唯一的非云厂商。
Arm 的 AGI CPU 计划于今年晚些时候上市。至于它是否真的能带来“奇点”,那就是另一个完全不同的问题了。