具身智能爆发的前夜,距离我们还有多远?

3月17日—19日,2026亚布力中国企业家论坛年会在哈尔滨亚布力召开,作为论坛新一届理事,宇树科技创始人、CEO王兴兴与会发言,并抛出了两项关键判断,其中一个就是预计到今年年中时,全球尤其中国人形机器人应该会跑得比人还快,比博尔特更快一些。

另一个则是关乎具身智能行业发展的"GPT时刻"。在他看来,目前距离这个时刻,仍需2-3年的时间。

王兴兴认为,只有当机器人能在80%陌生场景中仅凭语言指令完成80%任务时,赛道才会迎来爆发式增长。比如将机器人带到一个完全陌生的场景,它不认识任何人,然后要求它帮忙把一瓶水带给谁,或者让它帮忙去找一支笔过来。在不需要提前建图,它就能完全自主实现,这才算得上真正的突破。

既然如此,要真正要达到具身智能或者机器人ChatGPT时刻,目前还面临着哪些挑战?

王兴兴指出,首先是当前人形机器人面临的最大挑战是AI泛化能力不足,需要提高模型对整个机器人运动的表达能力。否则提前训练过的特定场景中,机器人成功率可达100%,但场景一旦更换,成功率便急剧下跌。

而数据稀缺则是另一道坎。与语言模型拥有互联网海量数据不同,机器人领域的数据"非常非常稀缺"。但这个问题,目前宇树已经有解决的思路。去年下半年,宇树开发了全身遥操作系统,计划今年年底前部署数千台甚至一万台人形机器人,每天采集10小时数据,"最近的一两年,甚至两三年之内,人形机器人数据的问题就可以完全解决"。

第三个挑战,则是强化学习的一些功能和效应都需要进一步提升。王兴兴分析称,行业目前全球范围内具身智能或者机器人领域一些模型的进步,存在两大技术流派:一是在语言模型基础上叠加机器人模型的VLA方案,二是通过对世界进行预测建模的世界模型路线。而王兴兴个人更看好后者,"如果AI生成的视频质量足够好,只要把这个视频对齐到机器人上,它就可以去干活了"。

但这世界模型路线中也有个问题,就是视频和机器人动作没有办法很好的对齐和统一。王兴兴认为,一旦这个问题被解决,机器人具身模型基本上就可以诞生了。

另外,针对人形机器人目前的用途和普及形势,王兴兴则表示乐观。他称真正让一款技术普及起来,最大的挑战之一是有更多的人用起来。就像当年的电脑一样,刚出来时大家都在用来打游戏,人形机器人也是如此。在他眼里,人形机器人目前也处在这个阶段,不论是如今用来跳舞还是表演武术,各种偏娱乐或者是偏商业都已经应用,但进入家庭或者是工厂大规模应用,还偏早期一点。

王兴兴相信,随着全世界有越来越多的人去开发各种的应用和软件,人形机器人的的功能越来越强,受众也将越来越多,整个规模体量也会更快的起来一下。这也是解决目前具身智能技术瓶颈的破局路径——全球合作。他强调,当下的AI和机器人"不是靠单家公司做的",而是"全球共创的结果"。

这家成立于2016年的杭州企业,目前已成长为全球出货量最大的人形机器人厂商,其客户遍布全球顶尖科技公司、实验室和高校。据王兴兴透露,宇树2024年全球出货约五千台人形机器人,其中1.3米高的轻量化机型成为市场主流。而使用宇树机器人、平台以及软件的客户越多,也将会持续推动行业技术的进步,比如包括英伟达在内的企业,就已经开源了大量软件,让整个行业的技术进步非常快。

而这种开放生态,也正在重塑产业格局。王兴兴认为,中国企业已占据有利位置,当下,包括宇树乃至整个中国机器人产业,都有非常非常好的先发优势。"真的非常感谢这个时代,有这么多优秀过去的企业家给我们做了很好的铺垫,”王兴兴在发言中感慨。他表示,当下是AI与具身智能发展的黄金窗口,"如果再早个五年,或者晚个五年,其实都没有这么好的机会"。

可以预见,当2-3年后的"GPT时刻"真正到来,人形机器人或将如智能手机般重塑人类生活。而在这场全球竞速中,中国企业正凭借技术积累与开放生态,抢占爆发式增长的前置位。