据 The Information 报道,Google最快将于 12 月份预览 Rabbit 的大型行动模型概念。据报道,Jarvis 由未来版本的Google Gemini提供支持,只能在网络浏览器上运行(专门针对 Chrome 浏览器进行了调整)。
The Information 写道,该工具旨在通过截取和解释屏幕截图,然后点击按钮或输入文本,帮助用户"自动执行基于网络的日常任务"。 在目前的状态下,两次操作之间显然需要"几秒钟"。
目前最大的几个人工智能公司都在开发类似 The Information 所描述的模型。 微软的 Copilot Vision 可以让您与它讨论您正在浏览的网页。 Apple Intelligence预计将在明年的某个时候感知屏幕上的内容,并在多个应用程序中为提供服务。 Anthropic 首次发布了"繁琐且容易出错"的 Claude 测试版更新,但功能强大,可直接接管电脑,据报道,OpenAI 也正在开发这种AI版本。
The Information 提醒说,Google在 12 月份展示 Jarvis 的计划可能会发生变化。 据报道,该公司正在考虑将其发布给少数测试人员,以发现并帮助公司解决漏洞。