昨天,Arm 宣布其"全面设计"计划取得重大进展。 该计划于一年前启动,旨在通过促进行业合作伙伴之间的合作,加快数据中心定制芯片的开发。 该生态系统现已发展到包括近 30 家参与公司,最近又增加了 Alcor Micro、Egis、PUF Security 和 SEMIFIVE 等公司。
一个值得注意的进展是,Arm、三星代工厂、ADTechnology 和 Rebellions 合作创建了一个人工智能 CPU 芯片平台。 这项合作旨在为云、HPC 和 AI/ML 工作负载提供解决方案,将 Rebellions 的 AI 加速器与 ADTechnology 的计算芯片结合起来,采用三星代工厂的 2 nm Gate-All-Around (GAA) FET 技术实现。
该平台有望为生成式人工智能工作负载带来显著的效率提升,据估计,对于像Llama3.1这样拥有4050亿个参数的LLM,其效率将比标准CPU设计提高2-3倍。
Arm的方法强调了CPU计算在支持完整人工智能堆栈方面的重要性,包括数据预处理、协调和检索增强生成(RAG)等先进技术。 公司的计算子系统(CSS)旨在满足这些要求,为合作伙伴构建多样化的芯片组解决方案奠定基础。
包括 Alcor Micro 和 Alphawave 在内的几家公司已经宣布了为各种人工智能和高性能计算应用开发由 CSS 驱动的芯片的计划。 该计划还关注软件就绪情况,确保主要框架和操作系统与基于 Arm 的系统兼容。 最近的努力包括引入 Arm Kleidi 技术,该技术可为 PyTorch 和 Llama.cpp 等开源项目优化基于 CPU 的推理。
值得注意的是,正如Google所称,大多数人工智能工作负载都是在 CPU 上进行推理的,因此为人工智能打造最高效、性能最好的 CPU 非常有意义。