特斯拉的自动驾驶汽车看上去似乎是机器学习的奇迹。但实际上,该公司依赖于一小群人类“数据标注员”。这些标注员通过审查来自成千上万的特斯拉车主的摄像头视频,不断改进汽车的驾驶方式,并教汽车如何像人类司机一样驾驶,比如决定何时使用闪光灯或识别施工锥。
据美国《商业内幕》杂志了解,这些标注员将精力集中在了两类备受瞩目的车主身上:特斯拉CEO埃隆·马斯克(Elon Musk)和一组精选的“VIP”车主。
《商业内幕》采访了十几名特斯拉现任和前任员工,除一人之外他们都要求匿名。这些员工表示,马斯克的特斯拉汽车图像和视频片段受到了细致的审查,而来自YouTube等知名网红的数据则得到了“VIP”待遇,这么做的目的是识别和解决完全自动驾驶系统(FSD)的问题。结果,特斯拉的自动辅助驾驶系统(Autopilot)和FSD系统可能会为马斯克和其他知名网红提供更佳的路线导航,让他们的驾驶更顺畅、更简单。
专家称,这意味着特斯拉的资源分配不均,可能会影响该公司实现真正自动驾驶这一更大使命。每辆特斯拉都配备了9个摄像头,车主可以选择分享这些摄像头的视频,以改进特斯拉的系统。
特斯拉的数据标注员队伍会审查车主与特斯拉分享的视频片段,并使用这些图像来训练系统,让汽车执行正确的左转或识别停车标志(并在此停车)。他们还审查系统未能正确响应,导致车主不得不重新控制车辆的情况。
这些标注员会在视频中标注系统正常工作的地方和出现故障的实例。通过识别问题,数据标注员团队可以用新的信息更新特斯拉的全球数据库,为其他遇到同样情况的特斯拉消除任何可能存在的困惑。简单来说,他们要教会特斯拉的人工智能(AI),让AI知道第一大道和主大道的停车标志是四向停车标志的一部分。
马斯克优先
多名标注员表示,自该项目启动以来,分析马斯克车辆的数据一直是首要任务。
八名标注员称,他们记得标记了一些他们认为与马斯克相关的数据。两名员工说,他们在2021年标记了一条进出加州希尔斯伯勒一栋豪宅车道的路线,后来他们发现这条路线属于马斯克。马斯克在2021年11月以3200万美元的价格出售了这座房子。
几名标注员透露,他们花了大量时间标记进出特斯拉得州奥斯汀、加州弗里蒙特工厂以及加州霍桑SpaceX办公室的路线。
马斯克
虽然标注员可能也查看了来自其他特斯拉员工或拥有特斯拉汽车的SpaceX员工的数据,但他们表示,加州或其他地方的其他工厂或办公室停车场并没有得到同样的关注度。此外,其中一人记得在2022年底和2023年初标记了一系列与推特旧金山总部有关的视频片段。这名标注员说,其团队被告知要关注推特总部附近区域的数据,当时恰好正值马斯克收购推特。
前Autopilot分析师兼试驾员约翰·伯纳尔(John Bernal)和其他三名前员工称,他们被告知正在研究马斯克汽车上的数据,并被特别嘱咐要小心对待这些视频片段。虽然数据标注员的考核通常会根据他们标注数据的速度进行评分,但伯纳尔和另外两名员工表示,他们被告知要花更多时间处理马斯克汽车上的数据,而且这些片段还会经过额外的质量保证检查。
“很明显,马斯克的体验会比其他任何人都要好,他享受的是最佳系统表现。”一位前员工表示。
另一名员工表示,他们对这一举措有些疑虑。“我们似乎是故意让他的车变得更好,让Autopilot看起来和实际不一样,”这位前员工表示,“感觉不诚实。”
另外四名员工表示,他们认为自己已经标注了与马斯克相关的路线,但没有得到主管的明示。当标注员查看数据时,他们可以看到拍摄时间戳和地理位置,但他们无法查看任何明确识别特定车辆或驾驶员的信息。相反,标注员说他们可以依靠上下文线索判别,特别是车辆经过的路线和地点。
一些员工表示,未能正确标记马斯克数据的代价可能很高。两名前员工回忆起一起事件,一名数据标注员在给他们认为来自马斯克汽车的视频片段贴上标签后不久就被解雇了。员工们说,这名标注员被护送出了位于纽约州布法罗的特斯拉工厂,原因是数据标签没有正确标记高速公路出口标志。一名前员工表示,数据标注员在没有任何警告的情况下被解雇是极不寻常的。如果员工没有达到指标,他们通常会接到通知。
一位前员工告诉《商业内幕》,他们记得曾在2020年标记了一条路线,该路线从洛杉矶的一所房子到SpaceX霍桑总部。结果,特斯拉Autopilot很难识别通往匝道道路上的标记。过去,特斯拉Autopilot一直难以追踪不完整的车道标记。马斯克传记作者沃尔特·艾萨克森(Walter Isaacson)在书中透露,在Autopilot项目早期,特斯拉说服了加州交通部的一位“马斯克粉丝”,让他重新粉刷405号州际公路的标记,因为此前马斯克的Autopilot系统遇到了车道标记褪色的问题。
不过,一名前员工表示,任何标注员都无法确切地知道视频片段是否属于某一名车主,任何自认为知道该车车主的人都是“纯粹猜测”。
网红享受VIP待遇
马斯克并不是唯一一个得到特殊待遇的车主。
自从FSD在2020年发布以来,特斯拉的粉丝和评测者在社交媒体上分享了这项技术成功和失败的视频。有的视频展示了FSD在无需人类干预的情况下成功行驶过艰难路线,其他视频则展示了汽车碾过幼童大小的假人或将月亮误认为停车灯。
特斯拉员工不会忽视这些视频。三名现任和前任员工透露,该公司创建了一个系统,优先考虑最有可能在网上分享体验的车主数据。他们称,这些车主在公司内部被称为“VIP”用户,他们的数据有时会被放入VIP队列。
VIP用户包括在YouTube上发布内容的高知名度特斯拉车主,这些数据会受到更严格的审查,也更有可能被贴上标签。员工透露,团队的领导特别告诉他们,他们正在研究“VIP数据”,并因为在FSD更新前处理这些数据获得加班费。
“我们会标注汽车经常驶入的每个区域。”一名前员工说。经理告诉他们,他们正在处理“特斯拉网红”数据。“我们会找到他们住的地方,并在这条路线上尽可能地标记所有东西。”他说。
伯纳尔说,特斯拉派出了多名试驾员前往YouTube网红驾驶过的路线,包括拉杰·巴尔瓦尼(Raj Balwani)和查克·库克(Chuck Cook)驾驶的路线。这两位网红经常对FSD进行评测。
伯纳尔透露,在巴尔瓦尼发布了一段FSD多次试图驶出伦巴第街的视频后,他是前往这名著名弯道寻找解决方案的八、九名试驾员之一。伯纳尔说,该公司最终在系统中编码了看不见的障碍,专门为伦巴第街解决了这个问题。2022年,伯纳尔被解雇。他说,这是因为他在自己的YouTube频道上分享了他的特斯拉在使用FSD时发生故障的一系列视频。
巴尔瓦尼对此回应称,特斯拉员工从未就他的视频联系过他,但他认为该公司对在线反馈的关注是一个积极的迹象。“我认为这只是意味着他们的团队正在监控并参与他们需要参与的领域,”他表示,“自从我使用FSD以来,我记录和遇到的大部分问题几乎都已经解决了,这真是太不可思议了。
库克在视频中指出了特斯拉的左转问题
2022年,马斯克在推特上祝贺网红库克给特斯拉挑出了一个“棘手的问题”。此前,特斯拉推出了一个更新,旨在解决库克在视频中指出的未受保护的左转问题。
库克告诉《商业内幕》,他非常清楚特斯拉对他的内容的关注。他说,实际上,他每周都会在他的街区看到特斯拉试驾员。这位YouTube网红表示,他曾试图通过电子邮件和社交媒体联系Autopilot的工程师,但他们从未回应,出现在他的社区的试驾员对他们的工作“守口如瓶”。
库克说,他在2020年向FSD beta测试者的一个账户发了一封电子邮件,询问特斯拉是否真的在查看他的数据。“他们发来了一张30分钟前我的摄像头在我车里看到的视频内容截图。”他说。
库克认为,特斯拉不太注重挑选网红,而是更多地专注于为训练收集最好的数据。“他们知道我并不是在夸夸其谈、盲目崇拜或过度批评,”库克说,“我是公平的。”
一位了解该问题的员工称,特斯拉VIP系统的设计不是为了给予特殊待遇,而是为所有车主改善FSD的一种额外方法。
这名员工说,YouTube博主们“不断尝试挑战系统的极限”,他们发现的问题可能会影响到其他路线并引起注意,“在某种程度上,他们是第二梯队的试驾员。”
但是,美国国家公路交通安全管理局前安全顾问米西·卡明斯(Missy Cummings)认为,特斯拉对马斯克和VIP用户的关注可能不利于该公司实现真正的自动驾驶。“如果自动驾驶汽车只能在马斯克家附近运行良好,那么他们就很难为大众制造出一辆自动驾驶汽车。”卡明斯表示。
卡内基梅隆大学的计算机工程专家菲利普·库普曼(Philip Koopman)告诉《商业内幕》,问题在于,特斯拉对VIP用户的关注是否只是有助于小幅功能改进(像修复伦巴第街问题),还是会使整个社区受益。
“我认为特斯拉在市场营销方面存在压力,要让VIP车主在视频中表现良好。如果特斯拉不公布每次改变带来的安全提升程度,我们很难知道这其中有多少是虚构的,有多少是真实的。”库普曼称。
监管目标
特斯拉的自动驾驶系统和该公司对这项服务的营销受到了监管机构越来越多的审查。今年4月,美国国家公路交通安全管理局对特斯拉Autopilot和FSD系统的调查,将其与数百起车祸和数十人死亡联系起来,理由是没有采取足够的措施确保车主的注意力。
此外,美国司法部正在调查特斯拉是否涉嫌证券欺诈或电信欺诈,因为特斯拉被指控在其电动汽车的自动驾驶能力方面误导了投资者和消费者。
与此同时,马斯克一再表示,特斯拉正在接近其自动驾驶目标,包括计划在今年晚些时候推出自动驾驶出租车服务。
马斯克认为,Autopilot和FSD对特斯拉的生存至关重要。他在2022年的一次采访中说,特斯拉到底是值很多钱,还是基本上一文不值,自动驾驶是真正的区别所在。
截至发稿,特斯拉和马斯克的代表没有回复记者的置评请求。