3月15日,经济学人发文称,长时间使用Manus会发现,它要成为稳定有用的工具还有很长的路要走。令人困惑的回答、令人沮丧的延迟和无休止的循环让体验大打折扣。开发者显然秉持着“先完成再完美”的理念,匆忙将其推向了市场。
Manus智能体是一个建立在现有模型之上的系统,可以与互联网互动,并执行一系列任务,而无需征得人类用户的许可。开发者声称,他们打造出了世界上首个能将“你的想法转化为行动”的通用智能体。然而,全球的AI实验室此前已经在私下对这种智能体方法进行过实验。Manus之所以引人注目,并非因其存在本身,而在于它被其创造者完全投放使用了。一个AI研发的新时代已经到来,但它并非发生在实验室里,而是在现实世界中。
这与美国大型AI实验室的做法形成鲜明对比。出于对创新成果安全性的考虑,他们将技术雪藏,反复调试直至达到可用的1.0版本。OpenAI在2019年等待了九个月才完全发布GPT-2。Google的LaMDA聊天机器人早在2020年就能内部运行,但公司雪藏了两年多才以Bard之名面世。
大公司对AI智能体同样保持谨慎,这有其合理考量。赋予智能体自主解决问题的自由,而非依赖人类逐步提示,可能放大其危害隐患。例如Anthropic和Google虽然展示了Computer Use功能,但都未广泛发布。在各种测试和开发者预览版中,这些系统既受制于技术局限,也受限于政策约束,会定期或在处理复杂任务时交还用户控制权。
然而Manus的存在使这种审慎态度难以为继。随着初创公司与人工智能巨头之间的技术差距缩小,行业巨头已失去从容打磨产品的余裕。这也意味着它们原有的安全策略不再可行。
值得庆幸的是,目前尚无迹象表明Manus造成了任何危害。但安全保障不能再局限于大公司发布前的大规模测试。监管机构和企业需要实时监控已投入使用的系统,对发现的危害快速响应,必要时完全停用行为失当的系统。无论人们是否接受,Manus都昭示着人工智能研发的未来将在开放环境中展开。