作者 |耿宸斐

编辑 |宋婉心

封面来源 |企业供图

不久前,3D大模型公司影眸科技完成了数千万美元A轮融资。这一轮融资由美团龙珠、字节跳动领投,老股东红杉中国种子基金、奇绩创坛连续跟投,光源资本担任独家财务顾问。

据影眸科技创始人吴迪介绍,本轮融资将主要用于影眸科技在3D大模型的前沿探索,并加速以3D生成大模型Rodin为核心的Hyper3D系列产品在全球市场的商业化落地。

2024年,资本及市场对AI的关注迅速从技术前沿进展转向商业化收益。据了解,影眸科技推出的大模型Rodin自上线仅45天,年度经常性收入(ARR)就已突破100万美元,成为当前AI创业公司中少有的商业化成功案例。


图:Rodin界面;图片来源:企业供图

Rodin的快速增长折射出3D生成市场的巨大潜力,尤其是随着元宇宙、虚拟现实、具身智能等新兴应用场景的迅猛发展,3D内容的需求量正迎来爆发。

综合相关行业数据,游戏和娱乐、影视和动画、建筑与房地产(AEC)、制造业与产品设计、电⼦商务与虚拟展示的3D建模外包市场TAM总规模高达149-335亿美元。

然而,传统的基于几何建模的手工创作3D模型不仅耗时费力,还有着较高的技术门槛,极大地限制了3D内容生产的效率和规模。在此背景下,生成式AI工具被视作是提高3D生成效率,降低3D内容创作门槛的关键。

但问题在于,尽管AIGC的热潮已席卷全球,目前,我们熟悉的大部分主流AIGC工具依然集中在图像和视频等2D内容的生成上,属于3D生成的“ChatGPT”时刻尚未真正到来。

这背后的原因是,受限于技术,3D大模型的生成质量瓶颈尚未得到真正突破。

相较于图像、视频等形式,生产级的3D内容需要满足更为复杂和更严格的标准。除了生成速度、质量,还要兼顾3D网格的结构和拓扑质量、UV图结构以及纹理清晰度等。

吴迪坦言,虽然3D生成的质量已经被抬升到一个新的高度,目前的3D生成在材质可用性、拓扑结构、UV展开等方面还不能满足实际应用的需求。这些技术方面的短板,已经成为3D生成行业前沿待攻克的重点问题。

这一背景下,全球范围内,3D生成技术的迭代正加速推进。去年,影眸团队与上海科技大学合作提出的“可控3D原生DiT生成框架CLAY”和“3D服装生成框架DressCode”,显著提升了3D生成的质量,被认为是新一代3D生成的基础框架。

与此同时,海内外已经集中爆发了一批AI生成3D产品。

在海外,Meta推出文生3D模型Meta 3D Gen,可1秒生成3D素材;谷歌发布基础世界模型Genie2,根据一张图片生成可供人类或AI智能体控制动作、可玩的3D环境;英伟达发布Edify 3D,支持从文本提示或图像直接生成4K级别的3D实体与场景。

在国内,除了影眸科技上线了AI 3D模型生成产品Rodin,腾讯也发布了3D生成开源模型Hunyuan3D-1.0,可同时支持文字、图像转3D资产,最快10秒完成端到端生成。

可以说,全球3D大模型选手们都在暗中较量、默默发力,从a16z押注的Yellow、Kaedim、BackFlip,到李飞飞的World Labs,AI 3D生成的技术迭代正在加速逼近质变的临界点。

不过,从市场层面看,3D生成现阶段所辐射的用户群体仍集中于游戏、视频制作、电商、工业设计等B端领域,C端市场的渗透率相对较低。

吴迪在和36氪的对谈中对这一现象分析称,与视频、图像以及音乐不同,3D资产现阶段还无法轻松地通过社交媒体进行分享和传播。

尤其是在当前以二维为主的设备环境下,普通用户对3D资产的需求尚未成熟,消费场景也较为有限,这一现状很大程度上影响了3D生成技术在C端市场的普及与推广。

“但随着3D打印、AR和VR等消费级产品的不断发展和普及,3D生成有望在C端市场迎来爆发式增长。”在吴迪看来,随着技术的成熟,3D生成一定可以运用在越来越多的领域,甚至像文字、图像和视频一样成为普通用户日常创作和分享的一部分。


图:影眸团队在SIGGRAPH Real-time Live!环节展示Rodin 3D生成;图源:企业供图

正是基于对商业化的洞察,影眸在研发阶段便以落地为目标,比如公司专注的“生产就绪(Production-Ready)”标准。

这个标准指的是生成的3D模型可以直接适配后期制作管线,进入实际生产流程,从而将用户的兴趣转化为真正的生产力工具,并产生实际商业价值。

“在更加遥远的未来,当元宇宙、机器人成为生活中的一部分时,3D生成必然会迎来真正的爆发。”吴迪表示。

近期36氪和影眸科技创始人吴迪进行了对谈,以下为采访精编:

36氪:作为一家由高校孵化的企业,影眸的商业化进展很多都基于学术研发,可以简单介绍一下吗?

吴迪:影眸孵化于上海科技大学,2016年起就在三维建模领域进行研发。2024年,我们有两篇和3D生成大模型相关的文章获得SIGGRAPH最佳论文荣誉提名,两次入选SIGGRAPH Real-time Live!,是该项目50年来首次入选的中国大陆团队。

36氪:Rodin为什么能做到上线仅45天就达到了100w美金ARR?

吴迪:主要得益于对市场的精准定位以及产品力。在研发和产品开发的过程中,我们始终把“Production- Ready”作为研发的核心指标,我们要做的就是可直接使用的技术的研发。而且,在研发的过程中,我们对比了所有技术路线,没有选择当时更被广泛关注的“2D升维”的技术路径,而是选择了当时并不被看好的“3D原生”路线,即从该模型的训练、监督、生成都在三维中进行。这虽然让我们的产品比同行晚了半年发布,但也让我们产品的生成效果在当时的行业内实现了代差级的领先。

36氪:在技术路径上,影眸并没有跟随大多数人去采用2D升维的技术路线,而是选择3D原生,这背后的考量是什么?

吴迪:2D升3D的路径是当时行业内被普遍认同,也是用的最多的,因为从多视角的二维图像来得到三维信息最符合大家直觉,同时大家普遍觉得三维资产不够,需要用二维资产补足,但我们在最开始接触目标客户的时候,我们就发现他们其实不只是需要能生成3D模型,更重要的是这个3D模型的可用性要足够好。

我们当时结合自己在图形学领域数年的研究经验,认识到当三维数据被压缩到二维时,无论有多少视角,都无法完整表达物体三维结构中的每个细节,这会导致2D升3D的路径很难达到客户的使用标准,同时3D原生能保留更多信息,生成质量的上限会更高。

如果当时选择了2D升维这条路的话,我们可能很快就能推出产品,但最后还是没这样做,Rodin Gen-1比别人晚发半年左右。

36氪:但其实很多企业都会担心自己的产品发布落后于同行,在做这个选择的时候不会有顾虑吗?

吴迪:这确实是一个“敢为天下后”的决定,但在当时我们几乎没有犹豫,因为我们坚定认为只有3D原生的技术路径才能达到更接近商用的标准,我们在内部把他称为“Production- Ready”,这也是影眸研发和开发产品的核心标准。要达到“Production- Ready”,除了建出模型,还在3D表达、拓扑、UV展开、材质等方面有更多要求。Rodin Gen-1虽然比其他产品发出的更晚,但它是最早跨过“可用性”那条标准线的3D大模型产品。当然即使我们现在这一代模型已经提升了质量上限,它与真正可以接入到流程还有距离。

36氪:这种差距具体表现在哪里?

吴迪:由于在一些场景,比如游戏中要使用一个模型,他会有很严格的要求,比如在刚说到的拓扑结构、UV展开还有一些绝对的细节量上,即使我们已经做的非常不错,但仍旧会有距离。客户在使用的过程中还是需要经过修改甚至是重新制作。

36氪:公司的收入分布是怎样的?

吴迪:我们有70%的收入来自海外,在美国、欧洲、日韩都有业务布局,其中欧美的份额占比较大,占大约50%以上。比如有一个来自德国的用户,调用我们的API做了一个非常有吸引力的产品,这个产品甚至本身就超过了50万美元的ARR。

36氪:影眸的核心客户群体有哪些?

吴迪:目前还是集中在游戏、视频制作、电商这些泛娱乐、新消费场景。但3D生成也正在不断地拓展使用边界,像3D打印、具身智能、工业设计都是我们未来目标的的核心用户群。

36氪:有没有具体的案例可以讲一下?

吴迪:以我们与拓竹的合作为例,我们之间合作实际上是拓竹基于我们的技术开发出产品,然后将产品开放给客户。在拓竹官方的printmo项目中,用户仅需上传一张图片,AI就能把它转换成宠物小精灵的风格,然后由我们的技术完成3D生成,再由用户的3D打印机打印为实体。这也是我们在3D打印领域的第一次尝试。

36氪:这些客户的需求对于影眸在技术上的迭代有哪些影响?

吴迪:影眸的所有技术层面的迭代几乎都是基于客户需求的。比如说游戏、视频制作等领域需要的模型都是拓扑规整且合理、UV利用率高的模型,我们接下来的技术研发就会朝着这个目标前进。但当我们横跨到工业设计等领域,需求就完全不同。所以从最长期的角度考虑,我们希望能够找到一种一统天下的3D表达方式,可适配不同场景,对各种需求下的三维模型都能做到很好的转换和适配。

2024年底,我们最新上线了Rodin Gen-1.5版本的模型,这次升级通过新一代3D原生表达,全面解决了行业内长期存在的薄面与边缘锐度问题,让生成的模型有更加锐利和平直的边缘。这个需求在游戏,尤其是产品设计领域中尤为重要。这次升级也让我们的产品领先幅度再次扩大。

36氪:影眸如何看待3D生成的未来发展?

吴迪:在未来3D生成还有很大的可供挖掘的空间。要实现在AR/VR/虚拟世界中的个人创作,就要解放用户的3D内容创作能力。作为构建在三维空间中的世界,未来机器对世界的理解也必然基于三维。3D生成会实现空间智能的最重要组成部分。

关注获取更多资讯

ad1 webp
ad2 webp
ad1 webp
ad2 webp