闷热的场馆里,兴奋的议论声,所有人生怕错过这场AI让机器人进化的盛宴。8月21日,2024世界机器人大会(WRC)在北京开幕。在这场由169家企业携600余款产品的展会中,具身智能以几乎单独“承包”一个场馆的阵仗,27家公司的人形机器人和机器狗吸纳了最多的观众。
人山人海的会展现场 光锥智能拍摄
在众多机器人的演示中,光锥智能发现各家企业执行复杂任务的能力明显变强,实用性也得到了很大的提升。
相比去年机器人更多演示跳舞、对话、走两步的简单任务能力,今年有伟景智能机器人摘水果、优必选机器人检修汽车、星辰智能机器人写毛笔字、加速进化的人形机器人足球比赛。宇数科技在表演了连续侧身翻跳跃的机器狗外,还带来了定价9.9万元的人形机器人——G1。在众多厂商机器人的能力演示和价格的发布中,人形机器人距离走向现实的时刻越来越近。
宇树科技G1机器人动作演示
“大模型的发展,极大地促进了人形机器人的进步。”
科大讯飞副总裁、研究院院长刘聪对光锥智能称,不管是“大脑”感知和理解的能力,还是“小脑”的运动控制能力都大幅提升。
进一步,逐际动力联合创始人兼COO张力认为,AI的进化让机器人实现了跨越式的提升,“通用人工智能让软件、算法能够帮助机器人去实现很多以前根本完成不了的事”,
随着AI大模型的突破,今天的人形机器人开始向着自动驾驶的方向发展。在借鉴了端到端大模型让汽车一边理解世界,一边快速迭代的进化中,机器人也展现出了能够理解复杂指令和学习更流畅的动作。同时,在大模型训练需求下,人形机器人也来到了数据驱动智能迭代的阶段。而各家机器人厂商也在试图从家用、工业、仓储物流、零售等一系列场景中占得一席之地。希望以单一场景为中心取得数据和迭代的闭环后,打通不同领域,最终走向通用。
尽管在过去AI发展的十年中,机器人曾经历多次希望和幻灭。但通过本次机器人的明确进化方向,星尘智能创始人来杰兴奋地称,“下一个十年,最值得做的就是人形机器人”。
机器人正在掀起一场资本、技术和产业的共同狂欢。
资本相信人形机器人
“这两年看到最多的投资,除了大模型就是机器人”,刘聪对光锥智能称。
虽然人形机器人行业尚处能力演示的阶段,但投资者和创业者们都知道,不能错过这场风口。
在回顾近一年来的投资趋势后,我们发现人形机器人作为热度最高的机器人终极形态,技术和难度都最高的同时,也在资本市场中占领了高地。
创业者层面,IT桔子数据显示,2023年1月至今国内共成立了29家人形机器人公司,其中有22家已经获得至少1轮融资。其中,由前华为天才少年“稚晖君”创立的智元机器人,在成立17个月就完成了七轮融资,投前估值已达70亿元。
站在资本的角度,根据《中国电子报》的不完全统计,2024年上半年全球人形机器人领域融资事件超过22起,融资金额超过70亿元。对于人形机器人的投资热情,不少投资机构的布局堪称“扫货”。
蓝驰创投合伙人曹巍表示,在机器人领域已经投资了超过10家早期项目。经纬创投更是手握宇树科技、智元机器人、银河通用、星尘智能,四家人形机器人公司的“明星天团”。
“行业和资本都对机器人的未来很乐观,毕竟这是个万亿的市场”。在大会现场,优必选全球营销总监李卓对光锥智能称。
于是,人形机器人在软件、硬件、资本推动、前沿应用效果的共同作用下,成了AI时代最热门的赛道。
以宇树科技在2023年初才开始探索人形机器人的经验为例。之前不做人形机器人的理由,王兴兴认为,“全球人形机器人的控制技术,大家都做的不是特别理想。性能上不去,达不到实用或者干活的阶段,所以过去很多年都没做人形机器人”。
如今,随着机器人软硬件技术升级,人形机器人正逐渐从实验室走到实际的运用场景中。今年7月,马斯克称特斯拉工厂已有两台Optimus机器人在进行电池搬运工作。在本次机器人大会现场,我们也看到了优必选的人形机器能执行简单的汽车质检任务。
优必选机器人演示质检场景
诚然,以人类熟练工的角度来衡量,机器人“员工”的效率还是太低。但若是与规模叠加,人形机器人24小时连轴工作的特性,还是吸引了汽车、物流、科研院所、AI科技等不同行业的尝试意愿,共同催促着人形机器人的交付进程。
“在2022年底,我们还没做人形机器人,但已经有一些客户找我们想买人形机器人了”,王兴兴认为宇树科技的人形机器人进展都是顺势而为的结果。
不过,猎豹移动董事长兼CEO、猎户星空董事长傅盛认为机器人行业还有很多方面需要打磨,尤其是“两条腿走路”的人形机器人要面临物理学的限制,“双足机器人的技术过于复杂,它必须依赖于机械结构。机械结构的迭代不会像自动驾驶那么快,每年能进步的幅度不多。”
但总之,行业内的玩家们在人形机器人的预计成熟时间上,达成了基本的一致意见。李卓对光锥智能表示称,“预计行业还有3-5年才能彻底成熟”。
在头部创业者们看来,此时此刻的人形机器人恰如2019年,特斯拉刚推出FSD芯片、百度Apollo刚拿到多张测试牌照的自动驾驶,一切都充满了希望。
一切,都是因为人形机器人在本轮AI大模型的影响下,实现了根本性的改变。
AI进化,机器人更像人
“一个是大语言模型,另一个是端到端算法。”
光轮智能创始人兼CEO谢晨如此总结着本轮机器人进化的最大原因。
在大会现场,无论是人形机器人、机器狗,甚至差异化设计的餐饮机器人都表现出了“更合理”的动作表现。以一年周期为对比,今年大会上的机器人操作明显流畅了许多。
较为明显的例子,可以从机器人做冰淇淋这一简单任务中看出。在去年的世界机器人大会上,机械臂的运动基本上是单调地执行“转圈”。而今年遨博智能的冰激淋机器人动作明显更加流畅,机械臂仅转了一圈,就将冰淇淋接了出来。
2023年(上)和2024年(下)冰淇淋机器人的动作表现对比
不同的动作流畅度,意味着机器人任务执行的底层逻辑发生了改变。
“原先机器人操作设计是模块化的,底层是学习加规则混合的方案。”星海图联合创始人、清华大学交叉信息学院助理教授、MARS Lab主任赵行解释称,“这种模式有点像之前自动驾驶的物体检测-决策-规划-控制的过程。例如做一个抓取策略,之前我们要对物体进行检测、状态和姿态估计。但现实情况的物体大多没什么姿态可言,就像一张纸铺在桌子上,很难定义姿态和关键点。”
这与自动驾驶的发展过程如出一辙。此前的机器人动作规划与自动驾驶发展到“端到端”前,遇到得是同样的问题——在特定场景的开发模式下,只能靠规则写有限的动作,无法适应真实世界的无限场景。
机器人只能操作有限形状和种类的物体,就像是自动驾驶只能在封闭路段使用一样“鸡肋”。而有了“端到端”的机器学习之后,如同汽车能够自己学习如何掉头一样,机器人也能学习如何抓取不同形状、颜色、柔软程度不同的物体。
优必选机器人听指令抓东西
参考自动驾驶结合大模型的趋势,机器人在结合了多模态大模型后,也开始能理解现实世界。在现场,银河通用机器人展示的便是药店值班的场景。机器人在拿取货架上的药品之余,看到有东西掉到地上还能自己捡起来。
银河通用机器人演示药店值班场景
AI大模型对于机器人能力提升的重要性,刘聪认为主要体现在三个方面:
首先,大模型显著提升了机器人解决复杂任务的能力,根据理解,把复杂任务拆解成一系列可执行的任务。
接下来,在多模态大模型的能力下,机器人可以依托视觉、触觉等在更复杂地场景里做事。
最后,体现在运动能力上,机器人可以根据AI合成的数据做模拟训练。如果没有大模型,机器人实现的功能会相对受限。
由此也看出,数据是除了大模型技术外,制约机器人下一步进化最关键的要素。
为了获取足够用于机器人训练的数据,不少厂商通过真实数据和仿真数据结合的方式解决。在真实数据的获取中,厂商一般通过真人动作和机器人遥操作的方式,将任务过程中的数据“喂”给大模型。而仿真数据则是通过搭建一个尽量真实的场景,设定尽可能多的建模和现实参数,让虚拟化的机器人进行训练。
不过,上述的两种方式还是存在着各自的短板,当前机器人行业还远未达到数据飞轮的启动时刻。一方面真实数据的成本极高,机器人当前还达不到自动驾驶般的普及度。在真实数据足够多之前,厂商需要花长时间和配备数据标准团队来一点点积累。而对于仿真数据而言,最大的问题还是现实仿真不够真实。机器人在模拟世界能成功,但导入到现实世界就会有一定的失败率。
“现阶段,对机器人行业最大的一个限制,还是AI不太够。AI模型、AI的训练数据集、AI的场景的落地部署,都完全远远不够。”王兴兴称。
而随着AI的发展,赵行预判,“随着更高效的算法和算法的泛化能力提升,未来机器人学习一个技能的数据量将会从现在的几千、几万,下降到一千甚至几百几十的数量级。”
参考自动驾驶行业由量产带来的数据飞轮,为了进一步解决数据问题,不少机器人厂商正在探索从量产中“拿”数据了。
抢销量
人形机器人站在量产前夜
价格,是人形机器人走向量产的一大制约因素。
据光锥智能在世界机器人大会上向各家了解,智元机器人合伙人兼营销服副总裁姜青松称,一台1.7m高的人形机器人行业内售价大概为60-70万。
相比前几年数百万起的波士顿动力,这些价格已经是少数行业能接受的“尝鲜价”,但离大规模普及还非常遥远。
王兴兴称,“现在还没有真正到商业闭环。一台机器人达不到比人还低的成本,商业价值依旧不是正向的。”
这是因为,从研发成本角度,由于人形机器人的不成熟,公司的研发过程会在技术布局、硬件选用、场景设计等环节中设置充分的冗余空间。这导致产品在前期研发成本的分摊下,“背”上了大量除必要硬件之外的“隐性成本”。
而在销售环节结束之后,机器人公司还要继续为应用效果负责。“厂商要为工业应用试点客户,配置专门的驻场团队来进行后续研发和维护”,在大会现场,一位参展商这样告诉光锥智能。
虽然当前的客户需求和产品都非常不标准化,但是光锥智能在大会现场发现,不少厂商已经尝试在不同的需求下,制定了相应的产品策略,试图让机器人的销售更加顺畅。
基本上,光锥智能了解到多家厂商的通用人形机器人售价集中在50-60万元的区间,并搭配廉价的量产版本作为产品线补充。例如,四足机器人销量最高的宇树科技,其通用人形机器人H1售价就定在了50-60万,最新的G1人形智能体也发布了量产版本,售价仅9.9万人民币起。
另一边,众擎机器人的人形机器人销售更加极致,为了降低成本,在拿掉了机器人的“头和双臂”后,众擎DG01干脆把“大双足机器人”的价格干到了3.85万。
这或许意味着,人形机器人的第一轮价格战快要来了。
众擎机器人定价3.85万 光锥智能拍摄
但更大规模的降价,还得依靠量产。
日前,智元机器人预计今年的出货量为200台,已经是行业头部水平。而上一个阶段中,商用清洁机器人的单家出货量也仅在一年千台左右。
什么时候能突破一年万台,甚至十几万台的销量,才是机器人真正的“iPhone时刻”。
为了达到量产目标,头部人形机器人厂商已经把第一个场景瞄向了工厂。
在全球范围,除了特斯拉正在使用的自家机器人Optimus外,OpenAI 投资的Figure已经与宝马合作,计划在美国南卡罗来纳州落地Figure 01机器人。而美国机器人制造商Apptronik则与奔驰合作,Apollo机器人已经在奔驰的流水线上搬箱子了。
在国内,当前落地最快的还是人形机器人唯一一家上市公司优必选。今年以来,优必选的人形机器人已经进入蔚来汽车、东风柳汽、吉利汽车、一汽等多家车企“打工”。随着优必选在经典制造业场景的落地,人形机器人在质检、搬货、分拣、拧螺丝、装配等环节,初步验证了行业应用的可行性。
“目前机器人行业尚在早期,但随着大模型的加持,技术和产品的从0到1,有望在三年内一起突破。”谢晨总结道。