Google发布了一种新的"推理"人工智能模型--但它还处于实验阶段,新模型名为 Gemini 2.0 Flash Thinking Experimental(一个拗口的名字),可在 AI Studio 中使用,这是 Google 的人工智能原型开发平台。 模型卡将其描述为"最适合多模态理解、推理和编码",能够在编程、数学和物理等领域"推理最复杂的问题"。
在 X 上的一篇帖子中,负责 AI Studio 产品的 Logan Kilpatrick 称 Gemini 2.0 Flash Thinking Experimental 是"(Google)推理之旅的第一步"。 Google人工智能研究部门 Google DeepMind 的首席科学家杰夫-迪恩(Jeff Dean)在自己的帖子中说,Gemini 2.0 Flash Thinking Experimental"训练使用思想来加强推理"。
迪恩说:"当我们增加推理时间的计算量时,我们看到了可喜的成果。"推理时间指的是模型在考虑问题时"运行"所使用的计算量。
Gemini 2.0 Flash Thinking Experimental 基于Google最近发布的Gemini 2.0 Flash 模型而构建,在设计上似乎与 OpenAI 的o1 和其他所谓的推理模型相似。 与大多数人工智能不同的是,推理模型可以有效地自我检查事实,这有助于它们避免一些通常会绊倒人工智能模型的陷阱。
缺点是,推理模型通常需要更长的时间(通常是几秒到几分钟)才能得出解决方案。
给定一个提示后,双子座 2.0 快速思维实验系统会暂停一下再做出反应,同时考虑一些相关的提示,并沿途"解释"其推理过程。 一段时间后,模型会总结出它认为最准确的答案。
Google的推理模型有时会在计算字母上遇到困难。图片来源:Google
在OpenAI o1 发布之后,不仅是Google,其他竞争对手的人工智能实验室也纷纷推出了推理模型。 11 月初,由量化交易员资助的人工智能研究公司 DeepSeek 推出了其首个推理模型的预览版DeepSeek-R1。 同月,阿里巴巴的 Qwen 团队 发布了 它声称这是 o1 的第一个"开放"挑战者。
彭博社在 10 月份报道,Google有几个团队正在开发推理模型。 随后,The Information在 11 月份的报道显示,该公司至少有 200 名研究人员专注于这项技术。
并不是每个人都相信推理模型是最好的发展方向。 首先,由于运行推理模型需要大量的计算能力,因此推理模型往往价格昂贵。 虽然到目前为止推理模型在基准测试中表现出色,但推理模型能否保持目前的发展速度还很不确定。