据The Information报道,研发出世界最大芯片的明星AI芯片独角兽Cerebras Systems已向证券监管机构秘密申请IPO。Cerebras成立于2016年,总部在美国加州,专注于研发比GPU更适用于训练AI模型的晶圆级芯片,为复杂的AI应用构建计算机系统,并与阿布扎比科技集团G42等机构合作构建超级计算机。基于其最新旗舰芯片构建的服务器可轻松高效地训练万亿参数模型。
这家创企正在创建优先股,价格比上一轮私人融资大幅折扣。此举可能会使其股票在首次公开募股前对私人投资者和参与公开上市的人更具吸引力。据此前报道,Cerebras已聘请花旗集团担任其IPO的牵头银行。
根据Prime Unicorn Index共享的文件,6月初,Cerebras批准以14.66美元发行约2700万股新股。这远低于其2021年F轮融资时的27.74美元股价,该轮估值超过40亿美元。新的股票授权表明,Cerebras对自己的估值约为25亿美元。
尚不清楚Cerebras是否已正式出售这些股票,或者谁将持有这些股票。
该公司已累计融资7.2亿美元,估值约为42亿到50亿美元。在AI领域声名赫赫的OpenAI联合创始人兼首席执行官Sam Altman曾参与Cerebras的8000万美元D轮融资。Cerebras在官网将Altman列在其投资人列表的第一位。
GPU竞不是最佳引擎?
当芯片设计企业都在将晶圆分割成数百颗独立芯片时,Cerebras另辟蹊径,选择将整块晶圆做成一颗芯片。
2019年8月,其首颗晶圆级芯片WSE以“世界最大芯片”的名号引爆全球科技圈,它由一整片晶圆制成,采用台积电16nm制程,在46225mm²面积上集成了40万个AI核心和1.2万亿颗晶体管。其2021年推出的二代WSE-2更进一步,采用台积电7nm制程,创下集成85万个AI核心和2.6万亿颗晶体管的新纪录,搭载WSE-2芯片的AI超算系统CS-2也同期发布。
今年3月,Cerebras推出了第三代晶圆级芯片WSE-3和AI超级计算机CS-3。WSE-3采用台积电5nm制程,有90万个AI核心和4万亿颗晶体管,AI峰值算力高达每秒125千万亿次。
CS-3是15U的服务器,最高功耗为23kW,可在本地或云端使用。CS-3拥有高达1.2PB的巨大存储系统,旨在训练比OpenAI GPT-4和GoogleGemini大10倍的下一代前沿模型。在CS-3上训练1万亿参数模型就像在GPU上训练10亿参数模型一样简单。
Cerebras团队认为,GPU不是训练大模型的最佳引擎,因为开发者必须将模型分割成许多部分,将它们分布在数百和数千个GPU上,这意味着他们必须重写模型以跨集群工作,他们的代码将从大约600行增加到20000行。而Cerebras想解决的就是这个问题。
其首席执行官Andrew Feldman曾用做西装打比方,有一位裁缝可以在一周内作出一套西装,他雇佣了隔壁也能一周做一套西装的裁缝,现在他们一周可以做出两套西装,但他们无法在三天半内做出一套西装。
GPU就像无法协同工作的裁缝,至少在分子动力学的一些问题上是这样,随着连接的GPU越来越多,它们可以同时模拟更多的原子,但却无法更快地模拟相同数量的原子。而WSE以完全不同的方式扩展,芯片不受互连带宽的限,可以快速通信,就像两个裁缝完美协作、在三天半内制作出一套西装一样。
与GPU不同,Cerebras晶圆级集群将计算和内存组件分离,支持轻松扩展MemoryX单元的内存容量。Cerebras为超大规模客户提供120TB和1200TB选项,而1200TB的配置能够存储有24万亿个参数的模型。单个CS-3机架可存储比10000节点GPU集群更多的模型参数,使得一台机器上可以开发和调试万亿参数模型。
同样训练700亿参数大语言模型Llama 2,GPU集群需要大约1个月,而CS-3集群只用1天。
产品侧,CS-3可与英伟达同台竞技
今年4月,Cerebras发文比较Cerebras CS-3与英伟达B200,称CS-3和英伟达DGX B200是2024年上市的两款最令人兴奋的AI硬件新品。
无论AI训练性能还是能效,CS-3都做到倍杀DGX B200。
Cerebras还提供AI模型服务。其平台已经训练了各种各样的模型,从多语言大模型到医疗健康聊天机器人,帮助客户训练基础模型或者微调开源模型,而且大部分工作都是开源的。
Andrew Feldman和Gary Lauterbach分别是Cerebras Systems的首席执行官和首席技术官。两人已合作超过12年,曾在2007年联合创办高带宽微服务器先驱SeaMicro,这家公司在2012年被AMD以超过3亿美元的价格收购,两人也一起加入了AMD。Andrew Feldman在AMD做了两年半的副总裁。
Andrew Feldman有斯坦福大学MBA学位,多次作为公司高管完成了收购和上市。Gary Lauterbach是计算机架构大牛,曾担任SPARC Ⅲ和UltraSPARC Ⅳ微处理器的首席架构师。
最后:AI竞赛升温,算力股正躺赢?
AI算力繁荣正带动相关股票的飙涨。本周英伟达以超过3.3万亿美元的市值登顶“全球股王”。此前向云计算公司出售数据中心组件的Astera Labs在今年3月上市时,首日股价暴涨76%。
IPO计划显示,Cerebras希望驾驭投资者对AI硬件销售的热情浪潮。这家AI芯片公司需展示它计划如何获得AI计算市场。其财务业绩暂时无法得知,该公司在12月的一篇博客文章中表示,它最近达到了“现金流收支平衡”,但未详细说明。