文 | 周天产业分析
不久前,我完成了一次与王兴兴的深度对谈,他是时下最具话题的机器人公司宇树科技创始人,是刷爆欧美社交媒体的东方神秘力量代表,我印象最为深刻的是,在我们聊天中,他很乐于当场播放人形机器人被故意殴打的画面,一根棒球棍都打断了,机器人也只是一个趔趄而已,以展示性能。
王兴兴是一名成本控制狂,从仅售9.9万元的人形机器人,到仅售千元级别的自研激光雷达,或许是因为草根创业者出身,创业初期拿的融资不多,他习惯了花小钱自己动手设计电机驱动器、控制算法,早期做出了机器狗XDog,这个习惯延续至今,他仍然坚持多数零部件进行自研。
这也让他并不打算用scaling law这种大力出奇迹的方式来进行机器人研发,尽管他在2024年年初,已经融到了10亿量级的巨额资金。
王兴兴并非清华上交这样的机器人金牌科班出身,却一手缔造了迄今最炙手可热的机器人公司宇树科技。
王兴兴也是个狂想者,他认为,通用机器人真正成为生产力工具之后,人类将告别上班,人均住大宅,尽享吃喝玩乐。而人类改造地球的能力会继续飞升,牟其中口中的画面会成为现实:机器人埋头苦干,在喜马拉雅山脉凿开一个口子,让印度洋的暖湿气流深入青藏高原,使其变得宜居。
对于人形机器人,从短期和中期视角,王兴兴都给出了诸多乐观的预判,以下是王兴兴与周天财经(以下简称周天)在雪球嘉年华的对谈文字实录,为文气通顺,有适度书面化微调:
周天:什么关键变量让机器人行业有了现在这样的热度和投入度?
王兴兴:行业热度高的关键变量还是整个AI行业的增量带来的,2022年底ChatGPT出来后,AI行业的信心更足了。通用AI解决一些文字问答和管家之类的任务,但要涉及行动和线下功能,还得通用机器人来解决,这会带来生产力的提升,大家变得更期待这件事发生。
另外就是硅谷巨头们的行动,马斯克宣称要做人形机器人,把整个产业拉出了低谷期。以上两个因素直接让我们决定在2023年重新做人形机器人。2023年市场热度很高,2024更甚,这两年有相对于过去几十倍的资金涌入。对于宇树来说,2024年年初那笔融资其实是在2023年下半年就敲定的。
周天:拿到大额融资才算是拿到初步的入场券吗?
王兴兴:10亿融资只是小的起点,还是小火苗,真正大的竞争者和增量资金还没进来,大家都在等待一个临界点,突破了临界点才是大资金进来之时。我们拿的资金量不算大,很多背景不错的公司起步融几个亿也是很普遍的。
周天:现在是概念热,还是真的有相当大的技术突破?
王兴兴:其实现在水面下,每年每个月都有很多技术突破,但真正的临界点还没到,现在的格局就很像是GPT出来前的一两年。
周天:机器人行业会不会存在被关键零部件和核心技术卡脖子的情形?以新能源汽车行业来举例,相比于整车,目前是电池公司拿到更多利润,机器人行业会出现这种产业卡点吗?
王兴兴:机器人产业大概率不会出现新能源汽车行业的情况,机器人是一种介于3C消费电子和汽车之间的中间业态,工程量和复杂度低于汽车,并且电池本身的价值占比不大,汽车的关键技术指标是续航,机器人则不是那么在意续航,大家对于机器人最关注的还是智能化。
如果说未来有卡脖子的地方,最可能的卡点还是芯片领域。并且瓶颈不是终端部署的消费级芯片,而是一些用于训练的服务器端的算力。机器人尺寸是有限制的,不可能部署很大的算力进去,电池也吃不消,所以终端部署就还好。
周天:机器人行业如果从零部件角度看,没有汽车产业链那么复杂,那是不是意味着汽车企业从高维度来降维打击,会更有机会做好机器人产品,在竞争中占上风?当前也有很多汽车公司把研发机器人作为战略上的明牌对外讲故事了,比如最近理想老板李想就在大谈AI和机器人。
王兴兴:大家都有机会,汽车是百年产业,零部件是非常成熟的体系,行业变化趋于稳态。而机器人行业还比较前沿,日新月异,大公司要做的话,把现有团队拉来直接做,做成的概率不一定大。因为当下的技术,明天就可能完全过时了,对团队的要求反而更高,需要顶级人才和突破性的魄力,敢于自己颠覆自己过去的方案,把擅长的东西放弃掉,很考验人性,宇树就可以做到随时换技术路线,我们更年轻更灵活,我们有随时「打自己脸」的魄力。
周天:目前人形机器人有哪些技术路线?
王兴兴:现在还没有完全统一,光硬件就有好几个技术路线,比如特斯拉的技术路线,宇树自己更低成本、轻量化的技术路线,还有线驱动的技术路线。硬件技术路线还好,未来2-3年硬件上肯定会收敛到更加确定性的技术路线上。
但问题就在于AI上,机器人通用模型最大的问题还是整个AI模型架构,大家没有统一,非常多变,没有哪个模型架构特别好,大家都在尝试一些新的技术路线,比如大语言模型的技术路线,模仿学习、深度强化学习的技术路线,空间模型的技术路线。
具体来说,目前比较常见的有两种。一种是把大语言多模态模型直接给机器人用,然后再加一部分机器人底层的操作运动集等,让大语言模型去调用一下,完成一些任务,这是目前最常用的架构。另一种是,有些公司比如特斯拉希望更端到端一点,它就采用模仿学习,人为采集大量的动作数据去训练机器人。比如今天干这个任务堆一部分数据,明天干一个活堆另外一部分数据,最后这两种任务都能完成,可能堆数据是有效果,但是再大规模的验证就不好说了。
这些技术路线,大家都在尝试,还没人敢说哪条路线是绝对没问题的,还没迎来ChatGPT时刻。
目前来看,单独让机器人做单一的特定动作或者表演,会很容易,只需要训练两天到一周就足够了,但单一动作能力对于整个机器人产业落地是不够的,但还是需要更好的通用模型出来,大部分动作用一个模型就能满足,还能无缝切换就更好了。
周天:人类殴打机器人的画面流传出来,以后被机器人看到,会不会报复我们人类?
王兴兴:机器人不需要担心自己受伤和死亡,对死亡和受伤的痛感和恐惧没那么强烈,比如硬件载体随时可以换的,手断了可以直接换个新手,新手的性能说不定还更好,因此对硬件伤害的感受不会有人类那么强烈。
周天:聊到大模型,人形机器人领域会不会出现自己的通用大模型?
王兴兴:大家都希望有通用的机器人大模型出来,工厂和家用都能用一套通用的就好了,这是大家的目标,国内国外的团队都有机会,目前来说,海外会更有机会先做出了,这是概率性的,我们还是希望宇树能先做出来,但概率会低一些。
周天:AI方面会比机器人本体的工程实施难度大很多吗?
王兴兴:AI很热,聪明人很密集,而资深的硬件人才现在更难招到。但是,硬件产业更成熟一些,AI还是靠一些天才的AI人才驱动的,AI领域不是靠人海战术,而是靠头部的几个顶尖AI人才驱动着行业发展。
周天:具身智能上,中美之间有差距吗?可以用年来衡量吗,现在大家很关心中美技术竞争。
王兴兴:相信合作的地方会更多点,但是中国在人才储备上相对吃亏的,主要是教育上,大家在学校里学到的东西太老了,在海外,教授教的就是最前沿的东西,教育体系决定了人才储备的差距。
周天:在具身智能,我们能追赶上去吗?
王兴兴:过去几十年的历史积累可以不作数,大家都是现在差不多的起点同时出发的,但我们国家的人才相对缺一点,如果人才培养体系不能补齐,长远看还是吃亏一点的。
周天:请你预判一下具身智能领域的市场格局接下来会是怎样的。
王兴兴:热度非常高,最大的点还是行业天花板是机器人AI的天花板决定的,如果AI天花板不突破的话,增长也就是50-100%的线性增速,如果突破了临界点,整个产业就会大爆发,所有大公司都会加入进来的。
我很乐观,在2025年年底之前,通用机器人初代的AI模型,至少全球范围内会有一个实验室或公司能做出来,我认为在2026年推广到工厂或服务业场景进行落地应用,是非常有可能的。3-5年,全球还是会发生很大的变化的。比如宇树的人形机器人也就做了一年半,产品已经比较成熟了。AI驱动下,技术进步会是日新月异的,水面下,每个月每周都有很多AI技术的进步。
周天:为什么你认为会是某一家公司做出来?会是哪一家?
王兴兴:主要是靠顶尖人才的突然灵光一现,具体哪家做出了,很难说。我为何预判未来一年会有大量的技术进步呢,因为我看到水面下已经有了相对清晰的技术路线方向,有顶级公司在朝着这个方向在努力了。对于这种节奏是有一些感觉的,我比较确信这个判断。
周天:如果是靠少数天才就能完成,那么行业里囤积资金的军备竞赛是必要的吗?
王兴兴:你提的军备竞赛很贴切,但是行业里真正的竞争还没开始,很多公司虽然拿到了不少投资,但是大家花得是很克制的,不会出现像早期互联网一样集体使劲砸钱的情况。AI临界点到来之前,大家要活着,活到爆发的临界点,活不到啥都白干,所以大家都很克制,我们对AI的投资也比较克制,因为AI太烧钱了。技术路线没那么清晰时,死命砸钱,大部分的钱会打水漂的。
但一旦确定了技术路线,我可以瞬间把产能提上去,比如提到十万台,这是没问题的。
周天:怎么判断临界点到来?看到什么迹象可以下这样的判断呢?
王兴兴:如何评价临界点,那就是在工厂里,一个十万块钱的机器人已经能替代一个人去完成工作,能把一个人家里的大部分任务跑通,简单说,评价标准是,拉到陌生环境,可以把一系列的十几样事情给干了,无需人的干预,任务成功率很高,这是2025年年底临界点的任务目标。当下的问题是,一个任务目标可以完成,但是场景和任务稍微换一下,成功率就会暴跌。
2025年年底的技术进步会上升一个台阶,会给全球产业界打一个更大的鸡血,热度、市场规模翻十倍是没问题的。
周天:最后替消费者问一个问题,让消费端承受得起的人形机器人,我们中短期内能等到吗?
王兴兴:人形机器人这个品类,未来的降价空间,硬件成本还有可挖空间,我感觉5年之后,一台人形机器人的硬件成本可能也就相当于几台空调。仅从硬件物料角度来看是如此,如果加上AI这部分成本暂时还不好估价,家用的话,价值评估是比较难的,还是会率先在工厂里用起来,人力成本,工厂是可以直接算账算清楚的。