GPT-4o 的发布又一次惊艳了全世界,而 Ilya 的辞职也引起了热议,甚至是被视为一个时代的结束。就在 Ilya 辞职之前,有着“ChatGPT 之父”称号的 OpenAI 的联合创始人兼首席执行官 Sam Altman 接受了专访。
访谈中,Sam 从 GPT-4o 的使用体验,到 GPT-5 出现的时机与新形式,以及 AI 为企业和个人带来的机会,为我们揭示了不少发布会的幕后细节,对人工智能助理的前景表达了自己的兴奋和忧虑。
以下是采访全文:
GPT-4o 让我爱不释手
Logan:欢迎来到《Logan Show》,这是一档与科技领域领导者和投资者对谈的节目。本期你将听到我与 OpenAI 的联合创始人兼首席执行官 Sam Altman 的对话。
我们将会深入探讨与近期非常热门的人工智能相关的多个话题,以及 OpenAI 的发展方向,还有 Sam 对于 AI 这一前沿领域的看法。
Logan:好的,让我们从轻松的问题开始。在执掌 OpenAI 的过去四五年间,你生活中发生的最大改变是什么?有没有什么不同寻常的改变呢?
Sam:发生了很多,其中最奇怪的就是我无法再在公共场合当个“小透明”。如果之前听到这种话,我可能只会觉得“好吧,是有点奇怪”,实际上它比想象中更奇怪,这是一种很奇特的孤立的生活状态。
Logan:你曾经非常坚信人工智能和商业的力量,那么你难道没有想过执掌这样一个公司可能带来的连锁反应吗?
Sam:我没想到很多事情,比如公司会成为一个非常有影响力的公司,更没想到仅仅是在自己的城市出去吃个晚饭都会变得如此困难,这真的很奇怪。
Logan:不久前,你刚发布了多模态模型 GPT-4o。它可以跨越文本、语音和视觉工作,你能解释一下多模态的突破为什么很重要吗?
Sam:因为我认为多模态的方式是使用计算机的一种革命性的飞跃。实际上,我们很久以前就有了语音控制计算机的想法。你知道的,我们有 Siri,之前还有其他类似的技术,但它们从来没有让我感觉到使用起来很自然。
但 GPT-4o 这个技术,由于多方面因素的结合——它的功能、速度、增加的多模态支持、语调的自然性等——让使用体验大大提升。你可以轻松地调整说话速度或改变声音,它的流畅性和灵活性让我非常喜欢。
Logan:Spike jonze(电影《Her》的导演)会对它感兴趣哈哈。有没有什么特定的使用场景吸引了你?
Sam:嗯,虽然我才用了一周左右,但有个特别惊喜的用途是:在我全神贯注工作时,将手机放在桌子上。然后在不需要切换窗口或停下我的工作,就能够将 GPT-4o 作为一个新的信息渠道。这样我就不需要打断我的工作流,就可以询问它并得到答案,这很不错。
Logan:那么,这一切的背后是架构上的变革还是更多的算力?
Sam:其实这就是我们在过去几年间在研究中的积累,我们一直在研究音频模型,我们一直在研究视觉模型,我们也一直在尝试把它们结合起来,我们还一直在寻找更高效地训练模型的方法。这并不是说我们发现了某个革命性的新技术,而是所有这些的结合。一次性把所有技术拼凑在一起确实不简单。
Logan:考虑到延迟的问题,你觉得是否需要开发一种在设备上运行的模型,以减少延迟,达到实用性所需的水平?
Sam:对于视频来说,处理网络延迟可能会成为一个难题。我一直对 AR 眼镜这种能实时与世界交流、感知事物变化的东西情有独钟,但网络延迟可能会让这变得很困难。不过,两到三百毫秒的延迟,人会感觉非常快,在很多情况下这个延迟比人类的响应速度更快。
Logan:好的,你最近提到了下一次的大型发布活动可能不会是 ChatGPT 5。似乎有一种迭代式的模型开发方法正在被你们采用。我们可以这样理解吗?
Sam:未来发布的大模型可能不会是一个标志性的大版本,如 GPT-5,我确信我了解到的一点是,AI 和惊喜不是很搭。虽然,你知道科技公司通常遵循发布产品的传统方式,但我们可能应该采取不同的策略。
现在,我们仍然可以称它为 ChatGPT 5,并以不同的方式发布,或者我们可以考虑其他名称,但我认为我们还在摸索如何为这些东西命名和定位。我觉得以 GPT-1 到 GPT-4 这样的命名是合理的,但现在很明显 GPT-4 已经有了很大进步。
我们也有这样的设想,可能会有一种潜在的像是“虚拟大脑”一样的基础模型,在某些情况下,它可能比其他情况进行更深入的思考,或者可能是探索不同的模式,但用户也许并不在意它们是否存在差异,我认为我们还不知道如何让这些产品在市场受到青睐。
Logan:这是否意味着,计算在模型上取得增量进展的需求可能比以往要少?
Sam:我更倾向于认为,我们会尽可能地利用我们能获得的所有计算资源。我们现在正在取得难以置信的效率提升,这非常重要。
你知道,今天我们发布的一个很酷的功能显然是语音模式,但或许最重要的是我们做到了如此高效,以至于我们能够向免费用户提供服务,达到世界顶尖的水准。
任何想免费下载 ChatGPT 的人都可以得到它,而且它相对于 GP4 和 GP4 Turbo 在某些场景有了显著的效率提升。我们在这方面还有很多进步的空间。
当我们从几十年后回望,会说:“某些事情改变了”
Logan:我听说你提到过 ChatGPT 实际上并没有真正改变世界,但可能只是改变了人们对世界的期待。
Sam:是的,我不认为你可以从任何经济指标中找到太多证据表明 ChatGPT 真的影响了生产力或其他领域,或许客户支持或某些特定领域是例外。但如果你查看全球 GDP,你能发现 ChatGPT 发布的影响吗?恐怕不行。
Logan:会不会存在一个我们可以明确地看到 GDP 增长的时间节点?
Sam:我不确定是否能够说这是因为某一个模型的影响,但我认为如果我们从几十年后回望,会说:“嗯,某件事情改变了。”
Logan:在接下来的 12 个月里,我认为哪些应用或领域最有前景?
Sam:我可能会因为所在领域的限制,存有一些偏颇,但我认为编程是一个非常重要的领域。
Logan:关于“惨痛教训”,你最近也花了一些时间进行讨论。你曾详细讨论了深度专业化模型与通用模型的主要区别在于,专业化模型是为了特定的数据和目的训练的,而通用模型则具备真正的推理能力。
Sam:我相信,未来真正有影响力的将是通用模型。如果一个能进行通用推理的模型发现新事物,那么当需要处理新类型的数据时,我们只需提供新的数据,它就能够适应并处理。但专业化模型在这方面是不可能的。
我认为许多专业化模型组合在一起,也无法进行通用推理。所以,编写特定模型的重点可能在于,我认为我们最应该弄清楚的是真正的推理能力,然后我们可以将其应用于各种场景。
自然语言是人和 AI 之间很好的交流方式
Logan:你认为未来两年内人类与 AI 之间的主要交流方式将是什么?
Sam:自然语言似乎是一个很好的选择。我对这个想法很感兴趣,那就是我们应该设计一个人类和 AI 可以共同使用的未来机制。我对类人机器人比其他类型的机器人更感兴趣,因为我觉得现在的世界是为人类设计的,我不想让它为了某种更高效的模式而被重新设计。
我喜欢这样一个想法,即我们用非常适合人类的语言与 AI 交流,它们甚至也可以用这种方式相互交流,这个想法可能还有待探索。尽管无法预知未来,但我认为这是一个值得推动的有趣方向。
Logan:你最近提到,随着时间的推移,模型可能会变得越来越走向大众,但最重要的可能会是关于模型的个性化,我理解你的意思了吗?
Sam:我不是很确定,但我觉得这听起来很有道理。
Logan:那么,除了个性化,你认为最终对用户而言,普通的商业用户界面和易用性最终会成为胜出的关键吗?
Sam:这些因素当然很重要,它们总是如此。我可以想象还有其他因素,但我认为,常规的商业规则仍然适用。
每当出现新技术时,我们总是很容易认为旧规则不再适用,但这种想法通常是错误的,传统的创造和流失价值的方式如今仍然很重要。
Logan:当你看到开源模型开始追上基准标准的时候,你怎么想?
Sam:我觉得这非常好。我认为,就像其他技术一样,开源将有其一席之地,托管模型也是如此,这很好。我不会询问任何具体的细节,但已经有媒体报道关于筹集大量资金的消息。华尔街日报是其中一个可信的报道来源,这些资金是为了在半导体行业激励投资。像台积电和 NVIDIA 这样的公司一直在积极扩张,以满足对 AI 基础设施的期望。
Logan:你最近说过你认为世界需要远超目前水平的更多 AI 基础设施。那么,你是不是观察到需求端有些什么需要比我们目前从台积电和 NVIDIA 获得的更多的 AI 基础设施?
Sam:所以首先,我有信心我们会找到方法降低现有系统的成本。其次,随着成本的降低,人工智能系统的需求必然激增。我相信,通过打造更大更强的系统,需求将会进一步飙升。
我们都应该期待一个智能资源廉价到不需计价的世界,在那里,智慧资源丰富到人们可以随意使用,甚至不用考虑太多。比如说,我是希望它帮我阅读回复所有邮件,还是用来治疗癌症?当然,治愈癌症更重要,但理想情况是两者都能实现。我关注的是确保我们拥有足够的资源,让每个人都能享受到智能技术带来的益处。
Logan:我想请教你对于Humane、Limitless等公司推出的不同物理设备助手有何看法?你认为它们有哪些不足之处,或者为何它们的普及程度尚未达到预期的用户需求?
Sam:我认为它们都太早期了。我一直是多种计算设备的早期用户,有着丰富的使用体验。我曾经拥有并非常喜欢 Compaq TC1000,觉得它超酷,那是我大学新生时期的事了,它与 iPad 相比还有很长的路要走,但方向是对的。
后来我又用上了 Treo,我用的是老款的 Palm Treo,那时候孩子们并不会拥有它,而它与 iPhone 相比也有很长的距离。但最终我们还是实现了。这些设备似乎朝着一个非常有前景的方向发展,只是还需要一些时间的打磨和技术的迭代。
适应 AI 进步:建立有长期竞争力的企业
Logan:你最近提到,很多在 GPT-4 上构建的业务在未来将会被更先进的 GPT 技术“碾压(steamrolled)”。你能详细解释一下这个观点吗?谈到 AI 领域的企业特点,哪些企业能在 GPT 的不断进步中生存下来?
Sam:我发现的有效方法是,在构建业务时,你其实是在做两种选择:要么赌下一代模型不会太出色,要么就是赌模型会更进一步,并从中受益。
举个例子,如果你投入大量努力,仅仅是为了让某个应用案例勉强可以运作,这个应用案例恰好是 GPT-4 所不能处理的。然后当你终于成功时,但后来 GPT-5 出现了,并且它能够更出色地完成这个任务以及其他任务,那么你之前为那个单一案例所做的努力可能就会感到有些尴尬了。
但如果你有一个产品,在各个方面都表现得还不错,人们自然会去使用它,而你并没有投入大量精力去实现某个特定功能,然后 GPT-5 或者其他名称的模型出现了,表现得更好,你就会享受到“水涨船高(the rising tide lift at all your boats effect.)”的影响。
我想说的是,大多数情况下你不是在创建一个 AI 企业,而是在创建一个业务,AI 只是你采用的一种技术。在应用商店的早期阶段,有很多产品填补了某些明显的空缺,但随后苹果解决了这个问题,我们现在已经不再关注应用商店里的手电筒应用,因为它们的功能已被集成到操作系统中。这将是未来人工智能业务可能的发展方向。
然后有些应用,比如 Uber,它们虽然是由智能手机的普及带动的,但实际上它建立了一个非常稳固且长期可行的业务模式,我认为这正是我们应该追求的方向。
Logan:我明白你的意思,而且我能想象出很多应用你们技术理念的企业,它们在某种程度上都符合这一框架。那么,你能否给出一个具体的例子或新型概念,它符合我们之前讨论的模式?例如,Uber这样的公司,它不必是一个真实存在的企业,即使是一个假设性的公司、一个玩具概念,或者只是你认为以这种方式实现的某个想法也可以。
Sam:我更倾向于押注那些新兴的初创企业,一个典型例子是,当人们尝试创建类似于人工智能医生的人工智能诊断工具,人们常说,“我不想在这个领域创业,因为像梅奥诊所(Mayo Clinic)等知名机构肯定会做这件事”,但我更倾向于认为会有新公司涌现出来做这样的事情。
Logan:对于那些想要主动准备迎接这些巨大变革的 CEO,你有何建议?
Sam:我敢打赌,智能作为一种服务,每年都在变得越来越好、越来越便宜,这是取得胜利的必要条件,但并不足以让你取胜。大公司虽然需要时间来做到这一点,你可以借此优势超越它们,但同样意识到这一点的其他创业公司也会这么做。
所以你需要搞清楚让你的业务长期保持竞争力的策略。现在的竞争环境比往常都要开放,有许多令人兴奋的新事物等着去做,但这并不意味着你可以忽视打造核心价值这一艰苦的过程,尽管现在有更多种方式可以实现。
Logan:鉴于人工智能的飞速发展,你能否预测在未来五年内可能涌现或成为主流的新职位类型?这些职位可能是当前鲜为人知或尚未存在的。
Sam:这是一个很棒的问题,我以前从未被问及过。人们总是问,什么工作会消失,但提问新工作更加有趣。让我想可能有1亿或5千万人可能会涉足的新领域。这可能涉及全新的艺术形式、娱乐方式,以及更加注重人与人之间的联系。
虽然我不知道这些职位的具体名称,也无法确定我们是否能在五年内达到这样的规模,但我认为面对面的体验将会变得非常珍贵,可能会形成一个新兴的巨大市场。
我们可能会见证断崖式的技术飞跃
Logan:OpenAI 最新的公开融资估值大约是 900 亿美元。除了 AGI,你认为还有哪些里程碑能让 OpenAI 成为一个万亿美元的公司?
Sam:我相信如果我们能持续以目前的速度改进技术,并且继续开发出好产品,收入也会继续增长。我不确定具体的数字,但我认为我们的前景是光明的。
至于目前的商业盈利模式是否能创造 1 万亿美元的股权价值,订阅模式对我们来说很有效。虽然我原本对此并不抱有太大期望,但结果却相当不错。
Logan:至于 OpenAI 目前的结构,虽然不想老调重弹,但你提到了途中的一些改变,你认为未来更适当的结构是什么?
Sam:我认为我们已经准备好了讨论这个问题,我们一直在积极探讨和头脑风暴。我希望在今年内,我们能够就此进行更深入的交流。
Logan:嗯,一个有趣的点是,关于人工智能的既定印象,有一个特别有趣的话题是你的货币化模型观点。我们曾听你提及,首先是取代体力劳动,然后是白领工作,最后是创意工作。
但显然,事情与预期完全相反。是否有其他出乎意料之外的事情呢?比如,我本以为会是这样,但实际上却是完全相反的情况。
Sam:这对我来说确实是一个巨大的意外。除了你提到的那一点,还有其他一些事情,比如我没想到人工智能会如此擅长法律工作,并且会这么早就展现出这样的能力。因为我一直认为法律工作是非常精确和复杂的。
Logan:对于那些还没有听你讲过 AGI,以及你为什么不喜欢这个术语,你能详细解释一下你的观点吗?
Sam:因为我知道AGI不再是一个明确的时间点。显然,当你创办一家公司时,你会有很多天真的想法,特别是在这样一个快速发展的领域。OpenAI成立之初,我也曾天真地认为,我们将从没有AGI的时代开始,然后实现AGI,这将是一个真正的飞跃。
我仍然认为可能会有一些突然出现的飞跃式发展,但总的来说,我认为它还是会像一个持续增长的曲线一样呈现波动上升的趋势,关键是进步的速度。你和我可能不会在具体的月份或年份上达成一致,到那时我们会说好吧,现在这就是通用人工智能了。我们可以设计其他测试,我们或许会对此达成共识,但是即使这样,事情比表面上看起来要困难得多。
你知道,当前的 GPT-4 显然还没达到普遍意义上的 AGI水平,我也不觉得我们下一个大型模型会达到。但我可以想象,我们可能只差一两个创新的想法,再加上一些规模扩展,就能创造出一些让我们觉得真的不一样的东西。我认为,对此保持警觉是很重要的。
Logan:是否有更现代的类似图灵测试,我们可以称之为巴特利特测试呢?
Sam:当它达到某个阈值时,我认为,如果它能够进行比所有 OpenAI 研究人员甚至是一个 OpenAI 研究人员更优秀的研究,那将是一个非常重要的标志。但这样的进展是否即将到来,目前还不太确定,但我不会完全排除这种可能性。
Logan:你认为达成 AGI 的最大的挑战是什么?听起来你认为目前的规模化原则可能还行得通,至少在接下来几年内是这样。
Sam:是的,我认为最大的障碍是需要新的研究。你知道,我从互联网软件转向 AI 的过程中不得不学到,研究并不像工程那样有固定的进度表。这通常意味着它需要更长的时间,并且不总是有效,但有时候它的进展速度却又远超任何人的预期。
Logan:能不能详细解释一下,为什么它的进展不是线性的呢?
Sam:我想,通过历史例子来解释可能是最好的方式。
嗯,我记得中子最初是在 20 世纪初被理论化,大概在 20 年代首次被探测到,关于原子弹的研究始于 30 年代,并在 40 年代取得了成果。
从几乎没有任何关于种子的理论概念,到能够制造出原子弹,甚至彻底动摇我们对物理学的直觉,这样的速度简直令人震惊。
还有一些不那么纯粹属于科学的例子,例如关于莱特兄弟曾在在 1906 年他们认为人类飞行还要 50 年,然后在 1908 年他们就实现了飞行,类似的例子在科学和工程领域比比皆是。
当然,也有很多我们预测的事情从未发生,或者比我们预期的要花费数十甚至数百年的时间更久。但有时候,进步确实是突飞猛进。
Logan:关于可解释性,我们目前在这一领域处于怎样的位置?它对人工智能的长期发展有多关键?
Sam:可解释性有不同的层次,包括我是否理解网络在机械层面上的每一层运作方式,或者我是否能够通过查看输出来指出其中存在的逻辑错误。我对OpenAI以及其他机构在可解释性方面的研究充满期待。我认为,作为一个更广泛的领域,可解释性具有巨大的潜力和令人兴奋的前景。
Logan:我不会催你,但我想你们在准备好要宣布什么的时候,会有一个精彩的公告。这里还有几个问题,随着人们对AGI的期待日益高涨,关于OpenAI等组织单方面利用其并做出决策的担忧也在增加。这促使一些政府机构介入,希望由选举产生的领导者来做出这些决策,而非完全依赖OpenAI等公司。
Sam:是的,我认为对于像我这样的人来说,严格规范现有模型能力将是个错误。但当模型对世界构成重大的灾难性风险时,我认为实行某种监督措施可能是件好事。
目前,如何设定这些风险的阈值以及如何有效测试它们,我们确实还仔细权衡。如果因为过度担忧潜在风险而限制了这项技术的巨大优势,让那些希望在自家地下室训练模型的人望而却步,那将是一个巨大的损失。
但话说回来,如果我们用国际核武器规则作为参照,我认为对人工智能进行某种形式的监管是合理的。
Logan:嗯,你认为他们没有看到人工智能中潜在的风险吗?
Sam:我认为他们就是没有整体上认真考虑过 AGI。但我确实同情他们的立场,像看看欧洲的技术产业发生了什么,我理解,我真的理解。然而,我认为有一条我们正在接近的界限,超过这个界限,我们可能都会有不同的感受。
Logan:你认为开源模型本身就存在固有的危险吗?
Sam:目前没有哪个模型是这样,但我可以想象将来可能会有。
Logan:我听你说过,安全在某种程度上被当作了一种错误的框架,因为它更多地关注我们明确接受什么。
Sam:确实如此,这并不是一个非黑即白的事,就好比你愿意坐飞机,因为你觉得它们相对安全,尽管你知道它们偶尔会出事。那么关于什么样的航空公司才算安全,这个问题有许多讨论,每个人的看法都不尽相同,这是个当前的热门话题。
航空业已经变得极其安全,但安全并不意味着绝对没有人在飞机上丧生。同样,医学领域我们也非常重视副作用,因为有些人会对药物产生不良反应。此外,安全还有其隐性的一面,比如社交媒体可能带来的负面影响。
Logan:你能想象在什么情况下,你会在安全范畴上做出与推进相反的决策呢?
Sam:我们有一个叫做“准备框架”的东西,就是为了针对这些,也就是在特定的类别和层面上,我们的行动策略会有所不同,以应对潜在的风险和挑战。
Logan:考虑到众多快速涌现的应用场景,我认为我们当前面临的一个主要瓶颈是人工智能基础设施的不足。假设有研究人员对现有的神经架构Transformer进行了某种突破性的改进,使得所需的数据量和硬件大幅减少,甚至接近人脑的水平,那么你认为这是否会加速“技术飞跃”?
Sam:当然,这是有可能的,并且可能不需要任何修改。虽然我认为这并不是最有可能发生的情况,但我并不完全排除这种可能性,重要的是,我们要在可能发生的各种情况中考虑到这一点。
我认为,即使技术发展在加速,这个过程也会是渐进的。我不认为我们可能某天睡觉时还处在初步的人工智能阶段,然后第二天醒来就面对真正的超级智能。但即使技术突飞猛进仅发生在一年或几年之内,那也算是相当快速了。
另一个要考虑的是,即使我们拥有了真正强大的AGI,它在短期内对社会的影响也是有限的。我猜测,大多数情况下,它不会在一年或两年内产生足够大的影响,但在十年内,世界绝对会发生巨大的变化。在这方面,社会的惯性实际上可能是一个积极的因素。
多年后,人类仍然会关心其他人类
Logan:嗯,你追求AGI的动机是什么?抛开股权不谈,即使我相信大多数人都会觉得,即使他们追求的是更高的使命,得到相应的报酬也会是一种安慰。那么,你每天来工作的动力是什么?你又从哪里获得最大的满足感?
Sam:我一直对人们说,我现在愿意做很多其他生活上的调整和牺牲,因为我认为这是我将会接触到的最激动人心、最重要、最好的事情,这是一个充满变革的时代,我很高兴这不会永远持续下去。
你知道,将来某天我可以退休去农场,我会怀念这段时光,但会想,哦,那些是压力很大、非常漫长的日子。但这也是非常酷的,我简直不敢相信这些事情真的发生在我身上,这就像是不可思议的奇迹。
Logan:我们回到那个你因名气而不能在自己城市出门的例子,是否有过一个最超现实的瞬间,那种让你惊叹:“哦,天哪”的瞬间?让你感到仿佛置身于一个超现实的场景之中?
Sam:每天都会有一些事情让我惊叹。比如那个星期(去年11月份被董事会罢免),我收到了来自世界上一些重要人物,如总统、国家总理等的10到20条短信,但这并不是让我感到奇怪的部分。让我感到真正奇怪的是,当这一切发生时,我像是在正常地回应他们,发送“谢谢”之类的信息,感觉一切都非常自然。
我们度过了那四天半疯狂而紧张的时光,我几乎没有睡觉,也没有怎么吃东西,但我的精神却出奇地好,头脑清晰,极度专注。
几乎每天都有那么一些事情,让你惊叹,如果我能稍微腾出一些心思去回想,这就会觉得太疯狂了。有点像鱼儿在水里的感觉,但是,是的,就是那种效果。
Logan:所以,当你想到模型变得越来越智能,你之前稍微提到的那样,关于创造性方面,在你看来,随着人类和大模型开始承担更多过去仅由人类完成的任务,哪些特质或能力仍将是人类所独有的呢?
Sam:我相信,即使很多年之后,人类仍然会关心其他人类。
我在网上稍微搜了一下,大家都在说,“哦,现在大家都会爱上 ChatGPT 了”,大家都会谈论 ChatGPT 女友什么的。我敢打赌不会,我认为我们内心深处非常关心其他人,无论是大事小情,以各种不同的方式,这种对人的关心将会持续存在,我们对他人的关心几乎可以说是一种固有的执着。
虽然你可能听说过许多关于人工智能,但我想不必在意,毕竟我们不会把观看机器人踢足球当作主要的娱乐爱好。
人和 AI 助手的分离是有价值的
Logan:当你管理 OpenAI 公司时,你在制定了很多运营企业的规则或框架,然后你同样打破了许多规则。OpenAI 是否引入了不同类型的高管?或者你是根据不同的特质来招聘的?
Sam:我通常并不倾向于从外部聘请高管,但我认为,如果公司总是仅从内部提拔高管,可能会导致公司文化的单一化。我认为公司需要引入一些新的高级人才来注入活力。但在这里,我们主要还是依赖本土人才,考虑到我们所做的与其他地方的工作很不同,我认为这是一件好事。
Logan:在 OpenAI 的发展过程中,有没有一个决策在你做出的时候感觉特别重要?
Sam:很难只指出一个,或许有一个就是:我们决定采用所谓的迭代部署策略,也就是我们不会秘密地构建 AGI 然后一次性发布到世界上,这是过去的普遍看法,这是当时许多公司和人们的普遍观点和计划。但我认为这个决定非常关键,而且在当时看来确实非常重要。
Logan:关于押注语言模型的背后故事我一直很好奇,这一决策是如何产生的?
Sam:嗯,当时我们团队正专注于多个项目,包括机器人开发和视频游戏。然而,在这个多元化的背景下,一个相对较小但充满热情的团队开始投身于语言建模的研究。伊利亚(Ilya Sutskever,OpenAI前首席科学家)对此方向深信不疑,他坚信语言模型的发展潜力,最终成了我们专注的语言模型。
于是,我们着手进行 GPT-1 的开发,接着是 GPT-2,我们深入研究了缩放定律,进而升级到了 GPT-3,然后我们做出了重大决策,决定将作为我们的主攻方向。尽管事后看这些决策似乎显而易见,但在当时,确实是一个经过深思熟虑的决策。
Logan:你最近提到了关于 AI 的两种不同方法:复制自己和打造最聪明的雇员。
Sam:这并不是关于 AI 本身,而是关于你想如何使用 AI,当你想象使用你的个人 AI 时。
Logan:能否请你进一步详细解释呢?因为我认为这对你关于未来人工智能用例的思考具有深远的影响,你能再次解释一下那个观点吗?
Sam:当然。当我在未来五年内收到你的短信时,我希望能够清楚地知道,这是你直接发给我的,还是由你的人工智能助手代为转发的。
我认为保持人和 AI 助手的分离是有价值的,AI 助手也不能简单地认为完全是人的延伸。对我来说,我不想感觉这个东西只是我身上的一个奇异附属物,而是一个可以跨越障碍与我沟通的独立实体。
你在音乐或创意领域就能看到这一点,复制德雷克或泰勒·斯威夫特的音频变得很容易,因为我们可能需要某种验证机制或系统来确认,这确实是某个人的创意作品,个人层面大概也是如此。
当我们思考教育体系,想象一下 2030 年或 2035 年的大学新生,或者未来的某个群体,大学教育体制中应该做出哪些具体改变来为未来做好准备,我认为最重要的一点是,学生不仅应该被允许使用,而且应该被要求使用。
在使用这些工具时,有时候我们更倾向于让人们采取传统方式行事,因为这样有助于加深理解。
我还记得在数学课上,有些时候你不能在考试中使用计算器。但实际上,在现实生活中,你是可以使用计算器的,因此你需要理解它的原理,并且要能熟练操作计算器。如果你在数学课上从没用过计算器,那你在以后的工作中会遇到困难。
如果 OpenAI 的研究人员都不使用计算器,那么 OpenAI 可能至少在计算机方面不会取得如今的成就。我们不会教导人们不使用计算器或电脑,同样,我认为我们也不应该训练人们不使用 AI。AI 将成为未来从事有价值工作的重要组成部分。
Logan:最后,在规划通用人工智能(AGI)及其未来时,你曾写道第一个 AGI 只是智能连续体上的一个节点,我们之前讨论过这个话题。
Sam:我们认为,从那一点开始,进步可能会持续,未来很长一段时间内可能会保持过去十年的发展速度。
Logan:那你是否曾经私下停下来思考未来会是什么样子?或者是否它太过抽象,以至于已经无法具体描绘了?
Sam:我一直在思考。但我不是说我能想象出有飞行汽车的《星球大战》式未来城市场景,但我确实在思考,当一个人能够完成数百上千个协作无间的人的工作时,这意味着什么?当我们能够探索到所有科学领域时,那会是什么感觉?肯定非常酷。
Logan:是的。Sam,感谢你接受这次访谈。