Arm第一次亲自做芯片!发布全新AGI CPU:136核心、两倍性能秒杀x86
一直以来,Arm都是一家对外提供IP授权的芯片企业,包括CPU、GPU、NPU和各种系统IP。
后来,Arm打造了计算子平台(CSS),相当于打包各种IP的平台级解决方案,客户拿去就可以做出完整芯片(比如小米玄戒)。
如今,Arm宣布其计算平台进入全新阶段,首次涉足量产芯片领域,首款产品就是“AGI CPU”。


打个不是太精确的比方,这就类似于NVIDIA、AMD不但卖GPU芯片,也自己做公版显卡。
这是一款由Arm自主设计、面向AI数据中心的CPU芯片,旨在应对日益增长的代理式AI(Agentic AI)工作负载,同时帮助生态伙伴快速、规模化部署量产级的Arm平台。
合作伙伴可根据需求,灵活选择Arm IP授权、Arm CSS方案,或者直接购买部署Arm芯片。

Arm AGI CPU基于Armv9.2指令集、Arm Neoverse V3架构,支持bfloat16、INT8 AI指令集。
这也是当今众多数据中心级CPU的核心支撑,包括NVIDIA Vera、亚马逊Graviton、谷歌Axion、微软Azure Cobalt。
它采用台积电3nm工艺制造,提供136核心、128核心、64核心三种规格,可单路可双路,每个核心配备两个128-bit SVE单元、2MB二级缓存(最大272MB),还有128MB三级缓存,主频3.2GHz,热设计功耗300W。
内存支持12通道DDR5,每通道2条,最高速率8800MT/s,每核心内存带宽6GB/s,时延低于100ns。
I/O扩展支持96条PCIe 6.0通道,支持CXL3.0 Type 3,还可以提供六条PCIe 4.0。


Arm官方的参考设计服务器采用1OU双节点设计,基于符合OCP规范的DC-MHS 标准规格设计,每台刀片服务器配备两颗Arm AGI CPU,以及独立内存与I/O,共计272个核心。
这些刀片服务器可在标准风冷36千瓦的机架中满配部署,最多30台,总计8160个核心。
Arm还与超微合作推出了200千瓦的液冷设计方案,可容纳336颗Arm AGI CPU,总计超过45000个核心。


Arm声称,它在单核、SoC、刀片式服务器、机架各层级上,都实现行业领先的性能表现,尤其是单机架性能可以达到x86平台的两倍以上。
其中,更高性能、更高能效的单线程性能,可处理更多任务;叠加更多的可用线程,最终实现单机架性能的大幅提升;领先的内存带宽,则支持每个机架运行更多线程,避免在持续高负载下因核心争抢资源而导致性能下降。
另外,部署Arm AGI CPU之后,每吉瓦AI数据中心算力的资本支出,可以节省多达100亿美元。

客户合作方面,Arm已与Cerebras、Cloudflare、F5 Technologies、OpenAI、Positron、Meta、Rebellions、SAP、SK Telecom等达成进一步的商务合作,都会在各自的方案中部署Arm AGI CPU,覆盖加速器管理、控制平面处理、云与企业级API、任务与应用托管等领域。
Arm还与永擎电子、联想、广达电脑、超微等头部OEM/ODM厂商合作,现已推出基于Arm AGI CPU的早期系统,更广泛的商用部署预计将于今年下半年落地。
超大规模云服务商、云计算、芯片、内存、网络、软件、系统设计与制造等领域的50多家领军企业,都支持Arm进军芯片领域,包括AWS亚马逊云、博通、谷歌、Marvell、美光、微软、NVIDIA、三星、SK海力士、台积电等等。







【版权提示】每日芯片网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至 1069823586@qq.com,我们将及时沟通与处理。
猜你喜欢
黄仁勋郁闷!华为国产芯片份额已达20%:单卡算力是H20三倍
黄仁勋看完肯定不会高兴。美国持续加码的芯片制裁,正彻底改写中国AI芯片市场格局。IDC最新数据显示,2025年中国市场AIGPU总交付量达400万片,其中国产半导体厂商交付165万片,拿下国内AI服务
算力需求爆发!“超节点”成国产芯片厂商角逐热点
算力是“智能”的基础,充足的算力被认为是大模型发展的“第一性原理”。在3月25日至29日召开的“2026中关村(5.350,0.06,1.13%)论坛年会”(以下简称年会)上,“算力焦虑”被众多参会者
英伟达在中国不吃香了!国产芯片占比升至41%:华为一家独占近半
据报道,中国AI芯片市场格局正在重塑,本土厂商以快速攀升的市占率,不断撼动英伟达长期以来的主导地位。市场研究机构IDC的最新报告显示,2025年中国AI加速服务器市场中,本土芯片厂商的市场份额已攀升至
全国首个万卡级全栈自主可控智算集群点亮!搭载华为先进芯片
近日,深圳14000P(petaflops)智能算力集群全面建成点亮。作为全国首个采用全国产先进芯片打造的万卡级全栈自主可控智算集群,其投运标志着深圳在构建自主可控算力底座上取得突破性进展。此次新点亮
游戏党福音!汇顶发布新一代柔性OLED触控芯片GT9926:OPPO新机首发
汇顶科技正式推出全新一代柔性OLED触摸屏控制芯片GT9926,并率先商用于OPPOK15Pro+游戏手机。该芯片面向新一代轻薄化、高性能OLED柔性屏幕设计,针对高负载、强显示干扰等业界挑战全面优化
1周前
马斯克的TeraFab芯片厂野心有多狂:年产2000亿颗2nm芯片
马斯克的TeraFab芯片工厂计划正式官宣了,我们之前已经有多篇报道,这个项目的野心之庞大绝对是惊爆所有人的眼球。其中的一个核心数字是1TW算力,这个不仅相当于美国每年电力规模的2倍,还是全球芯片算力





