沉寂了数月的全球AI龙头OpenAI,似乎马上要有大动作了。根据《信息报》周二援引多名知情人士报道,OpenAI计划在大约两周时间里,正式推出以推理能力为核心的“草莓”AI模型,并加入ChatGPT服务。由于OpenAI CEO奥尔特曼等人对“草莓”的大力宣传,叠加公司的确也有一阵子没有令人兴奋的消息了,外界对于这个新产品也算是有一定的期待。
会主动“沉思”的大模型
报道称,作为以推理为卖点的大模型,“草莓”在面对复杂、多步骤的提问时,会比现在的GPT-4o能力更强、更加易用。
在使用GPT-4o时,如果要提出一个多步骤推理的问题,为了避免机器胡乱回答,用户往往需要明确告知机器人解答问题时的每一个推理步骤——类似于输入“思考链的提示词”。使用“草莓”时则没有那么麻烦,输出的结果也会更好。例如,这个模型能够解答《纽约时报》字谜游戏。
(来源:《纽约时报》)
因此,除了数学、代码外,“草莓”也适合回答更加宽泛、主观的问题。例如要求它“头脑风暴”一个市场营销策略,“草莓”给出的回答更加贴近用户所在的实际场景,也更加关注细节,例如生成一个以周为单位的执行计划。
造成回答质量差异的核心原因,在于“草莓”模型不会立即回答用户的提问,而是会进行“思考”,也会向用户提出追加的问题,从而更加全面地给出答案。
当然,这个步骤也是“草莓”作为互联网产品的潜在弱点——报道称,模型可能需要10-20秒的时间才会开始回答问题。对于日益强调与AI实时交流的行业而言,付费用户能否接受交互间隔拉大到十秒以上会是个问题。
更致命的问题是,在回答一些GPT-4o也能推理的问题(事实上人类至今都不清楚AI的能力边界在哪里),“草莓”可能会出现思考一段时间后,只给出稍稍好一些的回答。体验过这种差异的知情人士称,结果的提升并不值得等待这么长时间,能做到“脱口而出”的GPT-4o反而体验更好。
知情人士同时表示,在内部测试中,“草莓”也出现难以记住对话历史等问题。同时这个模型目前只能输入和输出文字,并不能处理图像,尚未跨过关键的多模态门槛。
商业策略也是看点
即使爆料准确,这件事情的看点除了“草莓”本身的能力外,还有OpenAI对商业策略的考量。
根据早些时候的报道,OpenAI在内部商讨中,考虑给即将推出的推理专长“草莓”大模型,或下一代旗舰模型Orion订一个更高的价格。更符合实际的操作是,OpenAI可能会在现有的ChatGPT Plus外新增一个付费档次,提供“草莓”的无限制访问或响应速度提升。当然,这一切的前提是有大量用户认可“草莓”能力的提升。
在目前的定价体系中,面向个人用户的ChatGPT Plus每月收费20美元,企业用户的收费标准介于每月25-60美元/每个账号不等。
上个月曾经有消息称,OpenAI每月能通过企业服务和ChatGPT订阅赚到2.83亿美元的收入,但公司层面依然处于净亏损的状态。