机器之心报道
作者:泽南
构建机器人的「眼睛」和「大脑」,vivo 其实早有准备。
下一场科技浪潮已经开始了。
刚过去不久的「AI 超级碗」英伟达 GTC 大会上,黄仁勋把「物理 AI」放在了 AI 发展的最高点上,引发了人们的又一轮讨论。
老黄说,AI 的下一个发展方向就是机器人。
所谓物理世界的 AI,就是在现在爆发的生成式 AI 的基础上进一步升级,使其能够理解物理世界的空间关系和交互行为,进而构建出新一代的机器人。
这样的机器人能感知、会规划,可以快速学习,具备此前无法想象的能力。最近一两年 AI 技术的快速发展,正在让设想逐渐成为现实。机器人技术的进展肉眼可见,比如最近,波士顿动力就和宇树科技就较上了劲。
也有更加「接地气」的机器人,比如 1X 就表示自己的双足机器人一直在家庭环境中经历测试,可以完成扫地、擦桌子之类的家务。
从这些公司发布的 demo 上看,机器人的运动能力、功能性已经非常接近于实用化,未来似乎距离我们不远了。
纵观整个科技领域,投身机器人的创业公司正不断涌现,科技公司也在纷纷加码。不过在这个未来方向上,究竟是什么样的机器人会成为主流?它们会来自哪些公司?我们还看不出端倪。
最近,情况又有了新变化:手机大厂也要加入战局。
目标家庭机器人,vivo 官宣入场
本周的博鳌亚洲论坛 2025 年年会现场,vivo 宣布成立「vivo 机器人 Lab」 ,正式进军机器人行业。
vivo 执行副总裁、首席运营官、vivo 中央研究院院长胡柏山在博鳌论坛上进行了演讲。
vivo 希望依托自身在 AI 大模型与影像领域的积累,叠加自研混合现实头显积累的实时空间计算能力,着重研究孵化机器人的「大脑」和「眼睛」,让机器人可以「看得懂场景,听得懂需求,给得了回应」。
目前正在博鳌论坛现场展示的「vivo 混合现实头显」 就是 vivo 机器视觉能力的一个阶段性成果,在下个月即将发布的 X200 Ultra 上,也会集成 vivo 在影像领域最新技术突破。
vivo 为自身制定的目标是聚焦消费级市场,打造面向个人和家庭场景的机器人产品,让技术走出实验室,走进用户的真实生活,回归场景,解决痛点。
vivo 执行副总裁胡柏山表示:「机器人是手机行业的未来,将成为联接物理世界和数字世界的桥梁。不久前,我们成立了机器人 Lab,布局机器人赛道。在新的发展阶段,为联接物理世界与数字世界,vivo 致力于创造极致的机器人产品。」
为实现这一愿景,vivo 已经开始招揽人才,我们在公司的招聘网站上能看到机器人首席科学家的需求。
vivo 还在招聘高级技术规划专家等机器人相关职位,招聘条件相当丰厚,开出的年薪达到了百万。
从现在开始,vivo 预计要花费三到五年造出实现体验闭环的原型机,随后会在更远的未来推出家庭机器人商用产品。未来,vivo 将与产业伙伴一道「让机器人走进千家万户」。可以想象,机器人会应用在家庭服务、养老、医疗健康、教育等多个领域。
造机器人,手机大厂的独特优势
vivo 进军机器人领域的战略蓄力已久。虽然从造机到造「人」看起来跨界很远,但从更高的角度来看,这也可以说是顺势而为。
毫无疑问,这会是一次对前沿技术应用的重要探索,但并不意味着从零开始:智能手机其实已经是如今技术水平含量最高的消费级产品,如今 AI 技术的很多应用也是以手机作为载体。vivo 认为手机可以联接 AI 与物理世界,正是生成式 AI 技术的发展方向。
依托手机业务积累的 AI 算法(蓝心大模型)、影像空间感知技术(MR 视觉)及用户需求洞察能力,vivo 已具备了机器人领域核心的「大脑 + 感知」技术。通过手机生态积累的规模化数据与应用场景经验,这套能力可以快速适配新一代机器人的需求。
博鳌论坛上,vivo 展示的混合现实头显。
与此同时,vivo 一直以来的思路是只做自己最擅长的部分,这就能够充分发挥产业链伙伴的能力。
vivo 还具备「人无我有」的两方面优势:
众所周知,vivo 长期深耕移动影像领域,构建了一套业内领先的视觉感知系统,可以构成机器人智能化的核心技术基础。
在钻研手机影像能力的过程中,vivo 自研了 VCS 仿生光谱技术、微云台防抖、超大底传感器等光学硬件,可实现高精度的视觉捕捉能力,帮助机器人实现精准、高效的环境感知。结合夜景降噪、运动防抖(EIS)、HDR 等技术,其方案可以实现复杂环境下视觉信息的高效稳定处理。
与此同时,这套 AI 驱动的视觉感知还可以提升到实时视觉理解的程度。融合图像识别算法与多模态大模型,vivo 可赋予机器人实时理解环境、人类意图与任务指令的能力。
在此之上,基于已在手机数字影像以及开发混合现实头显过程中得到应用的 3D 视觉、SLAM 空间计算等技术,vivo 可以快速建立起机器人的空间感知与环境建模能力,实现精准的定位、导航和避障,并为 AI 模型构建出立体感知与空间交互能力。
基于自研影像芯片,vivo 还提供低功耗、高性能的视觉边缘计算能力,可以帮助机器人降低云端算力的依赖,提升自主运行、交互时的效率。
我们知道,因为设备端算力存在上限,未来机器人等 AI 应用的核心挑战之一在于端云结合以及数据的高效互通,vivo 作为手机厂商还有构建设备互联的绝对优势。
在博鳌的展台上,vivo 展示了 6G 通信与感知一体化 + 数据面技术原型机。利用通信系统在传输用户数据的同时,它可以实现对物体感知的能力,覆盖健康监控、低空经济、障碍物感知等场景。同时,带有隐私和安全属性的数据可利用数据面技术在通信网络内部安全传输。
vivo 还应用 AI 技术解决了信道多变带来的应用体验下降的问题,并预告了下一代旗舰手机将会接入全球标准的卫星通信技术。
根据国际标准化组织目前的规划,6G 大概会在 2028 年完成标准制定,2030 年前后实现全球商用。一系列新能力和场景将会被很快引入,包括通信与感知的一体化、算力与 AI 的端侧 + 云端集成,机器人等智能设备势必将会变得更加聪明、更加小型化。
综上所述,vivo 应用在手机等设备端的一系列技术,将会成为其投身机器人领域的优势。
把目光再放到更远,从产业上下游的角度看,vivo 已背靠一套高度整合的产业链。手机产业覆盖了芯片、屏幕、精密制造等核心环节,规模化的生产一直在推动上下游技术迭代。在投身机器人领域之后,vivo 这样的大厂也能充分与产业链合作,在做好 AI 能力、感知技术的同时,专注于用户场景。
正如胡柏山所言,科技公司的责任是通过科学技术和创新能力,不断解决未来的社会问题。此次发布官宣专注于「家庭机器人」,证明了 vivo 在新的赛道上仍然会着力于解决用户实际需求。这是 vivo 一直在践行的道路,并且已在过去不断被证明是对的。
在新一代机器人的开发过程中,数据和训练是人们面临的重要挑战。当 vivo 入局机器人之后,其覆盖全球,数量已达到 5 亿的智能设备用户将为机器人场景落地提供试验场。
这或许会成为机器人领域格局发生变化的开始。
机器人领域,正在重估
物理 AI 的爆火,让我们不得开始重估机器人领域。
根据中国信通院发布的《人形机器人产业发展研究报告(2024 年)》估计,到 2028 年我国机器人整机市场规模约在 20 至 50 亿元,2035 年规模会达到约 500 亿元,到 2045 年后,在用人形机器人将超过 1 亿台,整机市场规模可达到约 10 万亿元级别。
英伟达 CEO 黄仁勋此前也曾表示,到 2030 年全球至少将会出现 5000 万劳动力的短缺,机器人将会是一个价值 10 万亿美元的产业。
在这其中,消费级机器人无疑将占据很大比例。vivo 的入局,势必将再次掀起机器人赛道更为激烈的竞争。
我们可以期待,实用化的消费级机器人会很快浮出水面。