大模型带动生成式AI爆发后,对算力的高需求让芯片巨头英伟达的订单量、收入、股价一路走高,而国内芯片厂商却一直处于蛰伏状态。最近,终于吹动了国产AI芯片。8月26日,据证监会官网消息,上海燧原科技股份有限公司(以下简称“燧原科技”)在上海证监局办理了上市辅导备案,由中金作为辅导机构,启动了A股IPO之路。
作者|summer
作者|Yoky
如若燧原科技上市成功,将成为2020年寒武纪上市之后的“AI芯片第二股”。
公开资料显示,燧原科技自2018年3月成立,主要提供AI训练和推理产品,涵盖芯片、板卡、智算一体机、液冷算力集群以及配套的软件系统。截至目前,已经融资了10轮、累计70亿人民币,估值达到160亿元。投资方包括国家大基金、腾讯、美图、真格基金、红点中国等,其中腾讯连投6轮,成为燧原科技的最大股东,持股占比超20%。
燧原科技的两位创始人均是半导体行业的“老将”,成立燧原前,赵立东与张亚林都曾在AMD有超过10年的工作经验,并相继担任高级职位,赵立东回国后,在紫光通信科技主管半导体投资相关工作,为燧原的成立积累了国内的上游供应链。
值得注意的是,燧原科技在IPO辅导的早期阶段就已经受到了整个行业的高度关注。中国大模型能否走出独立曲线,一定程度上取决于底层芯片的性能突破和进化。这也直接导致了每一家AI芯片公司的一举一动都被放在了镁光灯下。
从行业的发展角度看,整个大模型预训练阶段的巨量运算需求只是第一波,后面还有商业部署、迭代训练、产业应用等等。因此张亚林认为:“算力需求今后会越来越大,并远远超过现在我们能够想象的范围。”
但从整个半导体和芯片产业的市场格局却并没有那么乐观,在短期公司数量爆发后也将迎来淘汰期,最终收敛成几家头部的厂商,可以说入局门票稀少。赵立东也曾公开讲道:“芯片行业的特点是老大赚钱,老二也能赚钱,老三就非常困难,基本上就没有市场了。”
抢先上市的燧原,能否卡位第二?
只做“AI”的芯片公司
当前,半导体行业在资本市场上一直笼罩着一层迷雾。
2023年6月以来,A股IPO政策阶段性收紧叠加全球半导体行业周期性低迷,让国产芯片在资本市场爆火后又遇冷。据公开资料不完全统计,截至7月29日,2024年已有43家半导体企业IPO终止,42家主动撤回IPO,其中有19家芯片设计类企业。
而AI芯片中,除了寒武纪在2020年就已成功登陆科创板,还有壁仞去年7月被传拟在港股上市后,也没了音讯。此时燧原的IPO,从某种程度上看,是对整个行业信心的提振。
而之所以燧原科技能够在受阻的环境下冲击A股,一个核心原因在于整个生成式AI的爆发,产生了对高性能AI的芯片的需求缺口,而燧原刚好是从第一天起,就押注了云端AI芯片。
赵立东曾分享过自己的创业思考:2018年创业时,摆在他面前有几条路线,CPU、GPU和AI芯片。“那时候CPU和GPU的方案已经很成熟了,我想要做就做AI芯片”。
简单来说,英伟达几乎垄断的GPU,更像是“万金油”,而在AI芯片则是针对机器学习、深度学习等特定算法上经过调优后,在这一场景下做到比GPU效果更好功耗更低,但却不能通用。通常企业在训练时,会采用GPU+AI芯片组合的方式,来降低GPU的成本和高功耗。
围绕着AI训练和推理两个环节,2018年到2021年四年的时间里,燧原科技推出了两代邃思系列芯片邃思1.0和邃思2.0。在此基础上,推出云燧AI加速卡CloudBlazerT20、i10和T21、i20,并已经实现了量产和规模化落地。
硬件产品涵盖板卡、智算一体机、液冷算力集群,同时为硬件配备了驭算和鉴算两个软件开发平台,提供自研芯片+加速器+软件系统的一体化解决方案。
高能效比和低功耗是邃思芯片强调的差异。邃思芯片采用了自主研发的SIA(Syntiant Neural Decision Processor)架构,这是一种低功耗的AI处理器,采用事件驱动的方式,能够保证在高精度的基础上,实现低功耗和高性能的平衡。同时SIA架构内置了多种传感器,包括声音、图像等,能够实现多种AI场景的感知和识别。
2022年,是燧原科技发展的一个关键节点。在国家发布东数西算战略的宏观政策下,燧原科技开始着手推出云燧智算集群,主要面向大规模、集约化的人工智能算力应用场景,例如智慧城市、智慧交通、智算中心等。
这让此前两代芯片的积累和加速器开始有了大规模落地的场景,公开信息显示,燧原科技协助东数西算的一个重要省份甘肃的各个城市,包括庆阳、张掖等打造千卡、万卡规模的AI训练算力集群。
2023年后,整个生成式AI的爆发对算力和速度提出了更高的要求,为了更直观地展示燧原科技系统化的方案和芯片能力,燧原科技推出了文生图MaaS平台服务产品燧原曜图,以燧原科技自研的邃思系列芯片作为算力支撑。
张亚林透露,燧原科技紧接着会有一个文生文的平台发布。“做这个平台的目的就是让燧原的系统化和方案的能力直接通过这个产品的展示,直接触达高层用户。”
从底层芯片到板卡、软硬件一体的解决方案,以及最终的效果展示,之所以做得“大而全”,本质上受限于整个中国的芯片环境。“如果你定位是一个芯片公司或者是一个硬件提供商,你很难通过一种具象的方式去跟应用方、模型方聊,而这样的一种系统化产品的搭建,让你轻易地以产品原型的方式去触达更多的客户。”张亚林讲道。
腾讯芯片的“关键一子”
可圈可点的是,在连投6轮后,腾讯成为了燧原科技最大的股东。对于在自研芯片起步较晚的腾讯而言,燧原更像是是它给自己上的一层保险。
互联网大厂中,布局芯片已经成为了巨头们的共识,阿里巴巴收购中天微后内部重组成了平头哥,百度旗下拥有昆仑芯,华为更是打造了全自研的昇腾生态。
而腾讯则是把AI芯片的命脉押在了燧原科技之上。早在PreA轮,腾讯就进入了燧原科技的股东阵营,此后再没错过每一轮融资。
除了是大股东,腾讯还是燧原科技的大客户兼业务合作伙伴,又出钱又出力。
在双方的合作中,腾讯庞大的业务体系为燧原科技提供了丰富的芯片使用场景和训练机会,例如在人机对战环节,借助云燧人工智能训练加速卡为算力底座,通过对云端AI模型训练的加速,让机器以更快的速度持续地学习游戏动态与多样化对战角色、策略,此外,腾讯的语音转文字、腾讯会议等产品中也大规模用上了“邃思”芯片。
此外,燧原还上了云。2023年,腾讯云与燧原科技共创了“存算分离”的混合云架构,将代码存在本地的同时,把云端算力嵌入整个设计、验证流程,高效支撑研发效能提升,帮助燧原节省了千万级IT投入,任务并发量提升了100%,整体仿真周期缩短30%。
对于和腾讯合作这件事儿,张亚林曾提到“跟大的互联网战略客户进行完全匹配部署,是我们在推理和部署上非常关键的抓手。因为大的互联网公司战略客户,它有所有真正的内容理解、智能交互、智能会议、推荐搜索、大模型的应用,包括游戏等场景。他们会极致关注性价比,要求你做到跟竞争对手更好的性价比,他才会进行试用。”
可以说,腾讯为燧原提供了一块巨大的“试验田”,而于腾讯而言,更重要的是通过投资解决自研芯片的短板。2021年,腾讯就和燧原科技合作研发了一款紫霄系列芯片,在OCR文字识别、智能会议、图像语音降噪等方面实现了业界同类产品两倍以上性价比,借由紫霄芯片,让腾讯得以向金融、交通等行业客户提供普惠且高质量的人工智能解决方案。
而现如今,随着大模型竞争白热化,走向了基础设施之争,自研芯片薄弱就意味着随时可能会被其他企业“卡脖子”,这也是为什么腾讯需要与燧原科技强绑定的关键原因。
左手互联网,右手智算中心
芯片属于长周期、重投入行业,很难在短期内获得经济效益,因此商业化一直是第一大难题。
据官网消息显示,燧原科技的主要客户分为四个部分:互联网、智慧城市、智算中心、金融。而核心客户可以分为两大类:一类是以腾讯、美图为代表的互联网公司;另一类则是与地方政府共同打造智慧城市、智算中心等政府项目。
其中两个比较大的客户腾讯和美图,均是燧原的核心股东。借助股东的业务场景,燧原科技也得以打磨自身产品,积攒了从研发、设计再到部署、应用全流程的服务经验。
2018年,在接受腾讯的Pre A轮的时候,赵立东就曾提到,“为了实现业务落地零的突破,我们必须寻求合作,只有这样才能让落地的第一步走成功。”2019年,燧原科技才退出第一代芯片,相比打造出成型芯片再寻找客户,燧原科技与腾讯展开合作,让一代芯片的研发缩短了数个月。
对于芯片而言,业务场景很重要,“芯片是‘用进废退’的,越用才会越好用。”赵立东讲道,“国际主流芯片厂商的产品都经过了十余年甚至数十年的迭代优化,才有了现在的水平和规模。”
此外,一些大的政府项目,也是借助了上市企业弘信电子的合作资源,公开信息显示二者有深度合作,也共同打造了适合人工智能应用与训练基础能力的国产化算力平台,以及甘肃东数西算算力网络等。
左手互联网大厂、右手智算中心,让燧原在此前6年里有稳定的收入和场景,也为此时上市奠定了基础。
进入2023年后,新的中国基座大模型创业公司的批量出现,也为底层AI芯片企业提供了新的市场机会。
张亚林在2024WAIC期间,介绍了当下燧原科技的客户结构:“目前在国内,首先绝大部分算力消纳需求大的用户还是在互联网;其次可能是垂直行业与央国企,最后是初创大模型公司等。”
2024年,智谱AI CodeGeeX与燧原科技云燧i2.0尝试合作,“燧原+智谱AI”的AI大模型编程助手一体机将帮助开发者提高编程效率、缩短开发周期,并提供智能化的编程辅助功能。不过这并没有进入到智谱AI核心的训练和推理阶段,仅仅业务侧的一些点状尝试。
不过,伴随着大模型进入应用落地,越来越多的新兴企业也在挑战着芯片厂商的服务能力。有媒体报道,国内某家不愿具名的AI芯片公司透露,2023年以来,尝试让后台的研发人员走到一线亲自服务——不仅要驻场联合调教,在销售打单后,给客户专门拉个有研发人员的小群。客单价小到几百万、几十万不等,都能享受7×24小时的咨询。
如果说,此前芯片厂商都在卷技术卷产品的1.0阶段,那么2024年后,则是进入了卷市场卷服务的2.0阶段。
上市,只是下一个赛段的开局。