在电影《星球大战》中,从劳动到生活陪伴,人形机器人在各领域扮演着关键角色。近两年,随着新一代人工智能出世,以及资本市场加强对未来产业的投入,人形机器人开始逐渐从科幻走向现实。
从资本市场近期表现看,人形机器人概念持续火热,部分公司涨停连板。花旗全球洞察分析师指出,预计未来25年,人形机器人市场规模将达到惊人的7万亿美元。
与此同时,人形机器人部分产品也已开始出售交付,大有批量“进厂打工”趋势。如2024年5月,特斯拉研发的二代Optimus人形机器人已进厂实训,计划2025年年底前量产销售。在国内,如宇树科技、达闼科技等厂商也均已布局。
除了工业领域,人形机器人离我们的生活还有多遥远,何时能“飞入寻常百姓家”?当前行业发展难点又有哪些?
近日,杭州宇树科技有限公司创始人兼CEO王兴兴接受了《每日经济新闻》记者(以下简称NBD)采访。
杭州宇树科技有限公司创始人兼CEO王兴兴 图片来源:受访者供图
五年内能有终端产品出现
NBD:去年国内很多人形机器人“进厂打工”,您怎么看这个现象?宇树人形机器人的落地现状和未来规划是怎样的?
王兴兴:我觉得这是一个趋势。我们过去几个月与蔚来的汽车工厂有合作,就现场部署了人形机器人做现场搬运。这个领域目前基本处于试点阶段,大家觉得这个方向有价值,就共同推进落地部署,不过目前还没有到真正的商业闭环阶段。
我们公司主要是卖本体,如果是做科研教育、AI公司或者个人买来玩,我们完全欢迎。
但工业领域也在推进,比如我们希望去工厂帮忙做一些简单的生产装配,或者一些简单的搬运工作,蔚来汽车工厂就是典型例子。我们其实没有给自己定目标或者逼迫那么紧,还是尊重整个市场的反应,等技术、产品和大家接触到一定程度了,已经有一些更好的商业势头了,我们再大规模去推广。
NBD:在人形机器人技术迅速发展的当下,面临的最大瓶颈是什么?目前人形机器人应用领域中,哪些方面有可能实现突破性进展?
王兴兴:当下的最大瓶颈,包括人形机器人、四足机器人等,是基层AI在全球范围内都没有达到一个像初代GPT或者初代通用AI的能力,这也是目前整个行业最大的问题。
目前机器人本身,比如双臂机器人或者工业机器人,如果加了AI以后产生的能效比人低,如速度比较慢、精度比较差、能干的活比较少,其实很难替代人在工业领域的价值,整个商业闭环没法跑通。
如果机器人AI的能力能突破一个临界点,工厂基本工序能跑起来了,而且效率比较高,价格也比较便宜,可以实现商业闭环并大规模推广,我觉得是最有价值的。
当然,目前硬件方面也有些挑战,比如硬件的机械臂负载能力不够,精度不太够,成本有点高,但这只是工程上的问题。
所以,最大的问题还是整个机器人AI没有突破一个临界点,目前在具身智能或者机器人AI这个领域,当下大家还觉得机器人有点笨拙,只能干一些固定的活,但我个人比较乐观。再过三四年,不会超过五年,比如在工业或服务业,能有终端产品出现。
大语言模型是机器人模型的一部分
NBD:近期人形机器人火热至极,但公司早期也不看好人形机器人,请问宇树是怎样调整发展战略的?
王兴兴:2020年以前就有很多投资人问我,你们做不做人形机器人,我非常斩钉截铁地说不做,但为什么我们2023年初又开始做人形机器人了?
其实最早在2009年和2010年,我自己做过小的仿生人形机器人,当时远没有达到我的预期,最大原因是当时全球人形机器人的控制技术不是特别理想,性能上不去,没办法看到实用价值,当时我就坚持不做人形机器人。
但到了2021年、2022年,全球科技对人形机器人非常关注,并且在2022年底大语言模型出来以后,AI技术产生了质变,已经看到AI赋能机器人带来的潜力。大家可能想象不到,2022年底,我们还没做人形机器人,但已经有一些客户找上我们想买人形机器人。我觉得社会的共识、热度,客户对它的期待程度,已经足够了,所以我们2023年开始正式做人形机器人。
我们一直希望公司的商业化是相对比较正向和积极的,本身产品是有人愿意采购、社会对它有认可度的。当年选择做四足机器人,是因为行业已经有些苗头了,现在选择做人形机器人也是基于这样的情况。
NBD:从目前人形机器人的研发来看,大模型可重点解决哪些技术问题?主要应用在哪些方向?大模型和人工智能的应用有望降低研发成本吗?
王兴兴:目前大家说大模型,一般在说大语言模型或者多模态模型,实际上这部分是可以给机器人用的,2023年我们就结合了OpenAI的大语言模型接口,但实际上大语言模型本身是机器人模型的一部分,并不是全部。
比如跟机器人沟通的时候,肯定需要语言部分,但实际上我个人认为机器人的AI模型,本质上和语言模型还是有很大区别。举个最直观的例子,在工厂里做事的机器人,完全可以不说话,我给它一个任务,它只要能干活就行了,我并不需要让它说话。
机器人具身智能的核心在于其执行任务的能力,而不仅仅是对话。手机已经可以完成简单的对话任务,因此机器人需要更高级的功能。但这部分训练其实跟大语音模型没多大关系,更多依赖于模仿学习,而且这个模型结构跟大语言模型结构也偏差比较大。这是目前大家已经看到的方向了,但是整个体系没有大语言模型那么成熟。
在机器人具身智能领域,每家公司的想法都不太一样,技术路线和共性都不太一样,这就导致了其实很难评价发展路径是正确还是错误。
举个最简单的例子,在大语言模型圈,ChatGPT模型出来以前,就有非常多语言模型结构,但大家现在已经忘了,因为发现GPT模型的架构更有价值的。现在人形机器人具生智能有点像ChatGPT出来的前一两年,大家已经发现了这个方向,要往这个方向做,但还没有哪家敢说自己的方向绝对正确。
中小公司保持灵活至关重要
NBD:随着AI技术不断进步,对未来机器人高效辅助人类工作方面,您有什么期待?
王兴兴:“干活”是分好几个阶段的,目前AI模仿学习,做一些固定工序的事情,已经完全可行。前段时间特斯拉展示过,在某个时间将一件东西拿到这里,这个技术很多公司都能做,而且可以接近100%成功率。如果换件事,就要有新的数据去做新的训练,但这类事情已经能做简单的商业化了。
更进一步的话,还是希望机器人能在工厂里做更复杂的事情。比如把零部件更好地装在一起或拆了,现在都不在话下,而要做更复杂的事情,我觉得可能要到明年后年了。
更往前一步,就希望机器人能通用,随便找一个机器人,我只要给它看一张照片,就可以把产品装起来;或者把一个机器人带到你家里,不知道你家原本什么样子,就知道洗衣做饭,把房间整理好。
NBD:当前互联网大厂、巨头等都在加速进军机器人领域,您觉得中小公司的机会在哪?贵公司商业化进展预期如何?
王兴兴:我们公司成立至今已有8年时间,早期对于未来趋势和方向还没有那么清晰的认识,但经过几年的发展,尤其是与国内外多家大公司接触后,我逐渐意识到,对于中小公司来说,保持对前沿技术的敏感性、预见未来并保持灵活性是至关重要的。如果能够预测未来1-5年的技术发展、产品形态和市场格局,并提前做好准备,那么公司至少能够稳定发展。虽然不能保证成为行业第一,但能在早期阶段有一席之地。
相比之下,大公司由于内部流程复杂,资源和沟通可能不够顺畅,有时候甚至在招聘方面也不如中小公司灵活,这限制了他们的快速发展。
对于商业化,我们公司一直非常重视,并不断探索合适的商业模式。公司2016年成立,我们在2017年开始接受四足机器人的预订订单,2018年开始正式发货,这表明我们一直将商业化放在重要位置。无论是四足机器人,还是人形机器人,我们都是以市场需求为导向进行研发的。
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
封面图片来源:受访者供图