研究人员已经开发出一种算法,可以让机器人自主地找出自己技能的弱点,然后进行系统的练习来改进。这相当于给机器布置自己的家庭作业。由麻省理工学院计算机科学与人工智能实验室(CSAIL)和人工智能研究所开发的新型"估计、推断和定位"(EES)算法最近在机器人:科学与系统大会上发表。下面是它的工作原理:
首先,机器人利用视觉系统评估周围环境和手头的任务,比如打扫房间。然后,算法会估算机器人当前执行特定动作的能力,例如操作扫帚进行清扫。如果 EES 认为对某项技能进行额外练习可以提高整体性能,它就会开始练习。
研究人员在波士顿动力公司(Boston Dynamics)的 Spot 四足机器人上测试了 EES,该机器人在完成类似任务方面已经有了很好的记录,尤其是在背上装有手臂附件的情况下。不过,这次它工作得更聪明,而不是更卖力。
算法指导机器人练习和完善有用的技能。在一次试验中,EES 使 Spot 只用了大约三个小时就学会了如何将球和戒指稳稳地放在倾斜的桌子上。在另一项试验中,经过大约两小时的集中练习,机器人在将玩具扫入垃圾箱这一看似随意的任务上取得了进步。
研究人员指出,虽然这些任务相对基础,但这项技术最终可以制造出机器人,让它们学会如何在工厂、咖啡店、家庭或医院等各种环境中提高自己的性能。
展望未来,他们希望整合模拟器,使机器人能够结合虚拟和物理练习,从而加快学习过程。他们的目标还包括开发能够对一系列练习进行推理的算法,而不是只关注孤立的技能。
"让机器人能够自主学习既非常有用,又极具挑战性,"佐治亚理工学院教授、NVIDIA AI 研究科学家 Danfei Xu 告诉《麻省理工新闻》(MIT News)。"未来,家用机器人将被出售给各种各样的家庭,并被期望执行各种各样的任务。我们不可能事先对它们需要知道的一切进行编程,因此它们能够在工作中学习是至关重要的。"
有了像 EES 这样的数字道场作为依托,未来的机器人也许能像人类一样通过老式的练习轻松掌握新技能。该项目论文可在Arxiv 上查阅。