据报道,Meta公司开发了一些定制电脑芯片来帮助其执行人工智能和电子游戏任务,该公司本周首次与外界沟通了这些产品。这家社交媒体巨头在本周早些时候首次披露了该公司的内部芯片项目,此后又在周四晚间的虚拟活动上探讨了他们对人工智能技术基础架构的投资。
Meta此前宣布今年为“效率之年”,不仅裁员至少2.1万人,还大幅压缩各种成本。在此之后,投资者一直在密切关注Meta对人工智能及相关数据中心硬件的投资。
尽管对一家公司而言,自主设计和开发电脑芯片的成本十分高昂,但Meta基础架构副总裁亚历克西斯·博乔林(Alexis Bjorlin)表示,Meta相信,只要能提高公司业绩,便可证明这笔投资的意义。该公司还一直在调整其数据中心的设计,以便将更多精力集中在具有能耗效率的技术上,比如液冷技术和减少过热。
其中一款名为Meta可扩展视频处理器(MSVP)的电脑芯片可以处理视频,并将其传输给用户,同时减少能耗。博乔林表示,“没有任何商用产品”可以像Meta渴望的那样高效地处理和传输每天40亿段视频。
另外一款处理器则是该公司的Meta训练和推理加速器(MTIA)家族中的首款芯片,其目的是帮助Meta处理各种专门的人工智能任务。新的MTIA芯片专门处理“推理”,也就是利用已经训练好的人工智能模型做出预测或采取行动。
博乔林表示,新的人工智能推理芯片有助于加强Meta的推荐算法,这种算法可以决定用户的信息流中显示哪些内容和广告。她拒绝回答这款芯片的制造商,但一篇博文透露,该处理器“采用台积电的7纳米工艺制造”,表明这款处理器由台积电代工。
博乔林还表示,Meta为其人工智能芯片家族制定了“好几代路线图”,包括用于训练人工智能模型的任务,但她拒绝提供除新款推理芯片之外的更多细节。之前有报道称,Meta取消了一个人工智能推理芯片项目,并启动了另外一个项目,但却要到2025年才能推出具体的产品。博乔林拒绝对此置评。
由于Meta并未像Alphabet和微软一样出售云计算服务,所以该公司没有太大动力公开讨论其内部数据中心芯片项目。
“看看我们分享的内容,这是我们首批开发的两款芯片,肯定能够借此一窥我们在内部从事的项目。”她说,“我们没有宣传这些事情,也不需要宣传,但你知道,全世界都很感兴趣。”
Meta工程副总裁阿帕纳·拉马尼(Aparna Ramani)表示,该公司的新硬件是为了与其自主开发的PyTorch软件高效配合,后者已经成为第三方开发者开发人工智能应用时最常用的工具之一。
这款新硬件最终可以用于执行与元宇宙相关的任务,比如虚拟现实和增强现实,还能用于新兴的生成式人工智能技术。生成式人工智能是一种统称,指的是能够创造有吸引力的文本、图像和视频的人工智能软件。
拉马尼还表示,Meta为该公司的程序员开发了生成式人工智能编程助手,帮助其简化软件开发和运营过程。这款新的助手类似于微软2021年在人工智能创业公司OpenAI的帮助下推出的GitHub Copilot工具。
除此之外,Meta还宣布,该公司的超级计算机Research SuperCluster(简称“RSC”)已经进入到第二阶段,也就是最后一个阶段。这台超级计算机包含1.6万个英伟达A100 GPU,Meta使用这台超级计算机训练其LLaMA大语言模型及其他技术。
拉马尼表示,Meta依然坚持自己的信念,希望通过为开源技术和人工智能研究做出贡献来推动科技领域的发展。该公司透露,其最大的LLaMA大语言模型LLaMA 65B包含650亿个参数,使用1.4万亿个令牌训练。令牌指的是用于训练人工智能的数据。
OpenAI和谷歌等公司均未公开披露各自大语言模型的相似指标,但本周有媒体披露,谷歌的PaLM 2模型使用3.6万亿个令牌,包含3400亿个参数。
与其他科技公司不同,Meta将其LLaMA大语言模型发布给研究人员,使之可以研究这项技术。但LLaMA大语言模型随后被泄露给了更多人,使得许多开发者在自己的应用中整合了这项技术。
拉马尼表示,Meta“仍在考虑我们所有的开源合作,当然,我想重申,我们的理念仍是开放科学和交叉合作。”