两个月前,当载着全球首台0.55NA EUV光刻机零件的卡车,出现在英特尔位于俄勒冈州的厂区时,半导体行业开始讨论未来英特尔在芯片工艺制程上赶超台积电的可能。然而,英特尔向世界表露了远不止于此的野心。
北京时间2月22日凌晨,英特尔召开了首届Intel Foundry Direct Connect大会,与以往侧重产品展示和技术分享的活动不同,本次会议只有一个主题——芯片代工。
图片来源:Intel
在半导体产业链中,芯片代工是个不折不扣的“重要且枯燥”的环节,但这次活动所展示出的亮点,随便拎出一项都足以让人感到惊讶:
采用Intel 18A工艺(1.8纳米级)的Clearwater Forest至强处理器已完成流片,1.4纳米级的Intel 14A工艺首次亮相。
首推AI芯片的系统级代工模式,提供从工厂网络到软件的全栈式优化。
已成功拿下微软的芯片订单,将采用Intel 18A代工。
代工服务的IP、EDA合作伙伴,包括新思科技、Cadence、西门子、Ansys、Lorentz、Keysight表示工具和IP已准备就绪。
值得一提的是,活动现场英特尔还宣布了与ARM达成合作,未来将支持为基于ARM架构的SoC(系统级芯片)提供代工服务,这种强烈的违和感,就连前来站台的ARM首席执行官Rene Hass都打趣地说道:
“感觉就像在Windows上运行iTuns一样奇怪。”
过去一周,当全世界都在讨论Sora的革命性进步时,英特尔悄悄拿出了应对AI算力需求爆炸的完整解决方案,再一次证明了这位昔日芯片行业霸主的地位。
IDM 2.0,绝境逢生?
当提起英特尔时,人们通常会习惯性地把它与英伟达或AMD做对比,但实际上,英特尔在半导体产业中的发展路径与后两者截然不同,一个最本质的差异是英特尔是业内少数采用IDM模式的芯片厂商。
所谓IDM,就是指从设计、制造、封装测试到销售自有品牌IC都一手包办。
与之相对应的,一类是诸如英伟达、AMD的Fabless厂商,他们只做芯片的IC设计,芯片制造环节完全交由代工厂完成。另一类则是以台积电、格芯为代表的Foundry厂商,他们负责芯片的代工及封装环节。
这种分工模式的好处在于,Fabless厂商无需承担动辄数十亿美元的产线建设成本,Foundry厂商也无需维持体量庞大的产品开发团队,可以专注于工艺制程的提升。
这种分工明确且高效的产业链上下游关系,是维持摩尔定律在今天仍能存续下去的前提条件。因此,当今还在采用IDM 模式的芯片厂商某种程度上其实是“非主流”的存在。
而英特尔的商业模式要更加“邪门”。
现任CEO帕特·基辛格在2021年上任后,提出了“IDM 2.0模式”。即坚持自己生产芯片的同时,也为第三方芯片设计公司提供代工服务,同时把部分制程芯片交给其他代工厂,来实现对自家工艺的补充。
这个设想听起来很美好,但即便是完全不了解芯片行业的人也能够察觉到一丝端倪:第三方芯片设计公司,他们的产品可能本就与英特尔存在竞争关系,那么他们要如何放心把芯片制造环节交由后者呢?
英特尔接收的全球首台0.55NA EUV光刻机,图片来源:Intel
打一个比方,这就像是苹果对微软说,“我们正在升级MacOS系统,如果有需要的话,也可以帮你一起开发Windows系统。”
还有一个无法忽略的问题是,芯片代工行业是个典型的“重资产、长周期”产业,如果建设能够承接第三方芯片设计公司的产能,势必会让前期成本大幅增加,这一点在去年的多份财报中都已经有所体现,比如在2023年第二季度,英特尔在整体营业利润率为33%的情况下,其负责芯片代工业务的IFS部门利润率为-28%,严重拖累集团业绩表现。
因此,在IDM 2.0概念被提出后,外界的质疑声始终没有中断过。
而在去年6月,意识到IFS部门已经成为沉重负担后,英特尔选择了将该部门拆分出去,未来将独立运营,并在财报中单独核算损益。
在同一时间,半导体行业也迎来了一场巨变。
随着算力需求在全球范围内的激增,负责AI芯片代工的主要大厂台积电出现明显的产能瓶颈问题,比如CoWoS先进封装的月产能至今维持在1.3-1.5万块(晶圆),而其中部分产能还要被苹果M1 Ultra等芯片分走,因此在2023年下半年,出现了英伟达高性能计算卡交货周期普遍延长至12-16个月的情况。
考虑到目前具备先进制程的厂商,无外乎台积电、英特尔、三星电子三家,且三星电子的在5纳米工艺节点后的良率问题至今仍是个谜,英特尔成为芯片设计厂商为数不多的代工可选项。
这也是英特尔此时提出“AI芯片系统级代工”的底气所在。
泼天富贵,英特尔能接住吗?
尽管眼下的英特尔似乎占据天时地利,但这家公司现在有实力在代工行业中大展拳脚吗?如果单以市场份额来看,根据TrendForce的统计数据,英特尔在全球芯片代工业占比仅为1%。
不过,就技术而言,英特尔仍然算得上是行业中的领先者。
首先是其工艺制程目前处于稳步推进状态。在2021年7月,英特尔曾公布了“四年五制程节点”的计划,即利用四年时间推进Intel 7、Intel 4、Intel 3、Intel 20A和Intel 18A五个制程节点,目的是到2025年重新获得全球芯片代工的制程领先性。
就目前已公开的信息来看,两款基于Intel 3的产品Sierra Forest和Granite Rapids已经分别完成流片及设计认证后的试生产工作。“埃米级”的Intel 20A及Intel 18A也预计在今年投入生产。
英特尔制程节点规划图,图片来源:Intel
值得一提的是,这两个工艺节点将搭载,可能是英特尔未来十年最重要的两项技术:RibbonFET栅极全环绕场效应管,以及PowerVia背部供电网络。
简单地说,前者可以推动芯片上的晶体管尺寸进一步微缩;后者则是将芯片的电源线及信号线移植到晶圆背后,从而降低功耗。
这两项底层技术共同奠定了英特尔代工业务的技术基座,也确保了摩尔定律仍然可以得到延续。
当然,眼下行业内还不大需要如此高精尖的技术,毕竟AI从业者们所依赖的主力芯片——英伟达A100,其制程也不过7纳米。
而就短期来看,AI行业可能更需要英特尔在封装环节的技术积淀。
在本次会议上,英特尔宣布将FCBGA 2D+纳入英特尔代工先进系统封装及测试的技术组合之中。这一组合将包括FCBGA 2D、FCBGA 2D+、EMIB、Foveros和Foveros Direct技术。
这一连串晦涩难懂的技术名词,让英特尔具备了满足不同代工客户的异构集成需求,也让来自不同供应商、用不同制程节点打造的“芯粒”能够更好地协同合作。
这里有必要解释下“芯粒”的概念:可以简单地理解为一种小型的模块化芯片。它对于AI行业的意义在于,能够将CPU、GPU、NPU高速连接在同一个系统中,极大提升异构核之间的传输速率,在提高数据访问速度的同时,降低数据处理功耗。
英特尔2.5D封装产线,图片来源:Intel
此外,英特尔也为AI芯片创业公司,如近期风头正盛的Groq和SiMa.AI,这些潜在的创业公司客户做足了准备。这些公司普遍认为专用芯片比通用芯片效率更高,因此在产品研发上也多集中于构建专门用于某些架构的芯片,但问题在于这些创业公司在芯片版图设计上可谓五花八门。
因此,在本次会议上前来为英特尔站台的合作伙伴中,可以看到芯片行业内的“EDA五巨头”(新思科技、Cadence、西门子、Ansys、Lorentz)悉数到场,以展示英特尔为各型软件及工具认证做出准备。
总的来说,无论是工艺制成还是封装技术,亦或是开发工具,英特尔已初步具备“AI芯片的系统级代工”能力,但英特尔自此之后真的可以高枕无忧了吗?
显然不是,一个最直接的隐患在于,尽管芯片代工部门未来在财报上将独立核算,但产线的前期建设及调试费用依然需要英特尔支付。
这将是一笔天文数字。就目前英特尔官方披露的项目进展来看,这家公司未来将分别在波兰、以色列和德国共计投资626亿美元,用于晶圆代工产线修建。在芯片补贴法案的资金迟迟无法到位的情况下,这些投资几乎完全需要由英特尔承担。
另外不得不提的一点是,英特尔CEO帕特·基辛格曾多次表示,独立之后的芯片代工部门与芯片设计部门完全切割,后者在有代工需求时将评估市场上的不同方案,综合成本选择代工厂,绝对公平竞争。
基辛格的确做到了。目前,英特尔内部代号为“Arrow Lake”与“Lunar Lake”的两款处理器的Computer Tile部分就是交给了台积电代工。
但长此以往,如果英特尔自家处理器的核心模块都是由台积电代工完成的,其他Fabless厂商又如何能放心地将订单交给英特尔呢?这恐怕是英特尔代工部门不得不考虑的问题。