目前,汽车中使用的许多最先进的电子设备都符合 ASIL D 标准,预计可在 125°C 的温度下正常工作。 在亚利桑那州凤凰城进行的最新研究就证明了这一点,该地区有 64 天白天气温超过 110 华氏度(43.3 摄氏度),有 5 天最高气温超过 115 华氏度(46.1 摄氏度)。 在这样的温度下,深色内饰的深色汽车车厢内的温度可接近华氏 200 度(摄氏 93 度),这与水的沸点相差无几。
IEEE 功能安全标准委员会发布的一份新白皮书指出,由于数据有限、系统中的非线性和动态相互作用以及预测技术不足,很难准确预测复杂系统在这些条件下的行为。白皮书指出:"温度、湿度、振动、海拔或辐射等环境因素会对系统的退化和故障产生重大影响。将这些因素纳入RUL(剩余使用寿命)预测模型可能具有挑战性,而且测量这些因素对系统的动态影响也可能受到限制"。
图:铜互连中电迁移导致故障的 SEM 图像。 钝化已被去除。
Synopsys 市场营销和业务开发副总裁 Steve Pateras 说:"我们有许多 OEM 客户,几年前他们告诉我们他们没有任何问题,也不担心他们的硅片,因为他们通常使用的是 10 年前的技术。现在情况不再是这样了。 我们的汽车客户现在正处于 5 纳米和 3 纳米芯片的领先地位,需要能够测量正在发生的事情,而不仅仅是假设会发生什么或利用过去的经验。 因此,对于许多原始设备制造商来说,RUL 正成为一个真正的大问题。 根据阿伦尼乌斯方程(该方程用于研究材料在温度条件下的降解过程),以及在凤凰城夏季一定时间内的运行小时数,我们能够研究硅寿命的变化。 结果相当惊人。"
Pateras说,对于一个设计寿命为30年的芯片来说,环境温度过高会使其寿命每年多减少10%,因此一年后寿命就会下降到26年。
芯片制造商非常清楚这些因气候变化而加剧的趋势。 极端温度的出现更加频繁,有时可能持续数周而不是数天。 所有这些都需要纳入芯片架构,这可能需要不同的材料、额外的余量和某种主动冷却方式。
英飞凌科技美洲汽车市场营销副总裁 Bill Stewart 说:"有两个方面需要考虑。其一是设备的质量。 我们的汽车芯片故障率为十亿分之六十。 因此,对于在高温下使用的部件,我们在设计上留有余量。 第二个方面是功能安全,以及如何检测系统故障。 是软件故障? 是硬件故障? 不管是我们的芯片还是别人的芯片,你如何诊断并提醒操作员,这样你就可以一瘸一拐地回家,重新设置,或者打开'检查发动机'指示灯,去找经销商。"
在复杂系统中,最重要的是车辆中的各种部件和系统如何与其他部件和系统相互作用。 在这种复杂程度下,看似无关紧要的组件可能会导致整个系统瘫痪。 此外,根据 ISO 26262 的要求,故障切换到其他系统可能会导致意想不到的相互作用。 故障切换电路需要按照与故障部件相同的 ASIL 级别进行设计,而且即使在相同的条件下,也需要按照预期运行。
Synaptics智能传感部门高级副总裁兼总经理 Satish Ganesan 表示:"我们还没有遇到过凤凰城一辆汽车上的显示屏出现故障的情况。但也有其他组件因发热而失效。 即使其他组件出现故障,我们的触摸组件和屏幕仍有可能正常工作。 但任何组件出现故障都可能导致系统故障。"
出问题的原因
所有这些都是以正常工作负荷为前提的。 随着车辆中自主系统的不断增加,处理元件的利用率可能会大幅提高。 与任何电子产品一样,更高的使用率会使电路温度升高,导致加速老化。
英飞凌科技汽车车身和信息娱乐部门高级总监 Ray Notarantonio 说:"当我们对一个部件进行鉴定时,我们会制定一个任务剖面图。该任务概况包括温度、电压和其他一切。 当然,汽车在其寿命的 50%时间里都不会处于最高温度下。 这不在任务范围内。 但我们看到,自动驾驶将改变任务概况,因为汽车将更频繁地活动并运行人工智能。 这是一个重要因素。 我们认识到这一点,而且我们从资质的角度做了很多工作,以超越这些任务简介。"
其他人对此表示赞同。Ansys 高级应用工程师 Josh Akman 说:"如果你拥有一辆具有自动驾驶功能的组合电动汽车,那么它的占空比可能是 100% 。它可能会连续行驶,这与通勤车的使用量完全不同。 现在,汽车引擎盖下基本上就是一台电脑。 要考虑的挑战还有很多,如果你要缩小到非常小的节点,比如 5 纳米或 3 纳米,那么这些东西就必须履行许多相互竞争的职责--不仅要保证热完整性,还要保证电气和机械完整性。 如果解决了其中一个问题,有时就会加剧另一个问题。 有很多事情需要平衡。"
"考虑包装层面的相互作用,可以在某种程度上区分老化效应和磨损效应,"Akman 说。"如果持续高温,一个常见的问题是焊点会变得更脆。 当第一次回流焊时,你得到的是散装焊料,在封装和印刷电路板的接口处,你得到的是所谓的金属间化合物,这是焊料和印刷电路板上的东西的混合物。 它们在回流时相互混合,随着时间的推移,随着焊料的老化,金属间化合物层会增长,变得更脆。 因此,老化效应会产生新的潜在失效模式。 同样,如果温度出现波动,就会产生大量的热膨胀系数(CTE)不匹配问题。 不同的材料会以不同的速度膨胀和收缩,从而产生机械应力,导致不同的失效模式,无论是在封装上还是在焊点上,甚至是在 C4 凸点、倒装芯片凸点或微凸点上。 然后,你可能会在芯片级出现电迁移和介电击穿,以及许多其他与温度相关的问题。"
未来的变化
解决所有这些问题没有单一的最佳实践。Siemens EDA 混合和虚拟系统副总裁 David Fritz 说:"有一种蛮干的方法。我们在设备中实际安装了分析仪,它们会检测到'哦,两年前,这只需要两毫秒就能完成。 现在则需要 10 毫秒。 于是"检查发动机"的灯就亮了。 但也有另一种方法。 我会见了中国的一家供应商,他们正在利用最新、最先进的技术将人工智能应用到他们的芯片中。 它被称为 Focused Transformer。 它与这些大型语言模型所使用的是一样的东西,但它可以按比例安装到单个芯片中。 它能监测情况,确定何时出现性能下降,然后决定还能做出哪些改变。 因此,也许我的频率没有达到最大值。 我可能想把这辆车的频率再提高 10 兆赫,这样就能延长使用寿命。 这不仅仅是监测。 它是决策和改变设备功能的方式,可以延长设备的使用寿命。"
这与苹果公司在其 iPhone 上采用的方法类似,但正好相反。 苹果降低了其应用处理器的时钟速度,以防止其因电池老化充电减少而关机。 在这种情况下,与车辆电机所需的能量相比,对电池的消耗相对较小。
然而,这种弹性很难管理,尤其是在复杂的系统中。 由于热梯度会导致电迁移,减少电子在导线中的流动,因此并非所有芯片都会均匀老化。 在炎热的气候条件下,这种情况变得更加难以控制。 虽然可以使用冗余电路来规避电磁干扰,但在 5 纳米和 3 纳米工艺中这并不可行,因为增加电路会影响整体性能。 更糟糕的是,在这些先进的节点上,互连器件非常薄,这加剧了热室中的热效应。 更薄的绝缘薄膜也是如此,会随着时间的推移而分解(随时间变化的介质击穿,或 TDDB)。
那么接下来会发生什么呢?"最能说明问题的是下一版 ISO 26262 标准,"Synopsys 的 Pateras 说。"一直致力于预测性维护的工作组正在将其纳入标准的第三版,该工作组真正谈论的是监控和恢复能力。 它能够获取硅数据,对其进行监控,并以此来预测故障。 业界正朝着这一方向发展,在这一过程中需要主动监控硅片,而不仅仅是通过其他方式建立固有的弹性。 功能安全将始终存在,人们会考虑使用各种技术。 但监控将是管理这种弹性的关键工具。"
安全问题
加速老化和高环境温度的影响远不止单一电路。 在汽车领域,安全性和安全性可能会以独特的方式重叠。
Rambus 硅 IP 产品管理高级技术总监 Scott Best 说:"几年前,在 GOMACTech(政府微电路应用与关键技术会议)上有一篇论文,他们将 PUF 放入 FPGA 的可编程结构中,然后对 FPGA 进行超电压、超温度供电。"他们基本上是将其放入烤箱,进行快速老化试验。 然后,他们把 PUF 放回织物中,由于地段织物老化,无法恢复原始关键材料。"
过去阻挡网络攻击最常用的方法之一是混淆,混淆的本质是在设备中添加噪音,让人更难确定芯片是如何工作的。 问题是,人工智能算法可以识别出人类无法识别的噪音,这就很容易被阻断。
"我曾在一次会议上向一位客户介绍电源分析侧信道对策,"贝斯特说。"他们制作了一个噪声电路,向电源发出大量噪声。 因此,如果你测量电源,就会被这些随机噪声淹没,就看不到加密操作的特征了。 我们的回答是,如果你进行两次测量并将它们相减,随机信号就会消失。 人类无法观察到这一点,但使用一些工具和 1000 个示波器轨迹,它就能计算出结果。 它不会被数字或图像所迷惑。 '有信号,有噪音,顺便说一下,这是关键值'"。
结论
目前还不清楚电路中的热量增加是否会使电介质分解时的信号更加明显,但这肯定是未来要讨论的一个话题。 总之,热是所有电路都会遇到的问题,但如果再加上比预期更高的环境温度,与热有关的老化速度就会加快。 这引发了许多汽车制造商始料未及的一系列挑战,他们更需要提高汽车芯片的最高持续工作温度,或者找出更好的方法来监控汽车电子设备,以确定何时应该更换以及如何冷却。
随着自动驾驶汽车使用率的提高,以及汽车制造商使用更先进的节点芯片和芯片组,基板、导线和电介质越来越薄,这些挑战只会更加严峻。 在汽车应用中,安全和安保与电路老化相结合,需要实现微妙的平衡。 但是,随着亚利桑那州凤凰城等地采用 5 纳米和 3 纳米芯片运行高级算法,这种平衡就变得更加难以实现。
参考文献
Weather Underground 2024 年的最高日气温取自菲尼克斯天港国际机场的每日报告。
Patrick-Emil Zörner, CC BY-SA 3.0, via Wikimedia Commons.