依图科技联合创始人林晨曦

进入2025年,全球 AI 行业面临新变局。

狂飙两年多的ChatGPT热潮呈现“放缓”迹象,GPT-5迟迟未发布,谷歌、Meta全面挑战OpenAI,后者目标也从通用人工智能(AGI)转向超级智能。与此同时,国内“大模型六小虎”(智谱、百川、零一万物、月之暗面、MiniMax、阶跃星辰)不再一味追求顶尖技术,字节跳动、阿里云等互联网大厂后来居上,资源“弹药”比六小虎更充足,导致大模型公司逐步出现分化,甚至有些企业正面临困局。

1月7日,爱奇艺证实其起诉MiniMax侵犯其版权素材用于AI模型训练,索赔10万元,开国内视频平台AI侵权诉讼先河。与此同时,李开复对外辟谣阿里收购零一万物,但确认部分预训练团队成员会并入阿里,公司不再追求AGI方向,引发关注。

李开复随后强调,零一万物要追逐训练更快、更便宜的模型,而且应用能够实现商业落地。“Scaling Law 在变慢,我们从信仰它到怀疑它只花了一年时间。仰望星空追寻 AGI 需要充足甚至不计代价的弹药储备,脚踏实地来看,我们现阶段的最高优先级是先巩固拿到弹药的实力。”

“这些‘大模型六虎’正在以三倍速,走当年我们‘AI四小龙’(依图、旷视、云从、商汤)2017-2019年的老路,短短1~2年估值就增长到200亿,之前我们则用了7~8年时间估值增长到200亿。”依图科技联合创始人林晨曦近日对钛媒体AGI表示。

这是林晨曦时隔五年多,首次面对媒体讲述依图的过往和进展。

早在2012年,在深度学习鼻祖Yann Lecun的纽约大学实验室担任研究员的朱珑决定回国,他拉上福建师大附中同学、当时在阿里云担任技术总监的林晨曦一起创办了依图科技。

创立之前,彼时林晨曦是阿里云计算的资深专家,在王坚带领下开始搭建国内最大的拥有自主知识产权的飞天分布式云计算操作系统,而加入阿里之前,林晨曦还曾在微软亚洲研究院从事机器学习、计算机视觉、信息检索以及分布式系统方向的研究工作。

过去13年,依图科技经历了 AI 行业多轮波峰与波谷:高光时被称为国内规模最大的 AI 创业公司之一,员工规模增长到数千人,2019年曾尝试启动科创板IPO最终无果,经历低谷时,市场也对其亏损业绩表达担忧。

如今,随着ChatGPT引发了新一轮生成式 AI 热潮,林晨曦告诉我,依图仍然在 AI 产业这个“牌桌上”,不仅利用安防和智慧城市业务,连续几年实现利润和现金流为正,而且正瞄准李飞飞、黄仁勋看中的“空间智能”、世界模型,正在探索该前沿技术。

这次三个小时的独家对话当中,林晨曦给到钛媒体AGI最大的感受是:直率、不盲从、不认输。

他反复向钛媒体AGI强调,如果 AI 创业公司比如“大模型六小虎”,想在国内 C 端产品中获得商业化,能力和最终结果远不及互联网大厂,后者有大量的流量与用户规模,而如果在To B端,医疗 AI 对于大模型六虎也不是(不一定是)一个正确的方向。

展望未来,林晨曦告诉钛媒体AGI,依图现在不谈五年以上的发展目标,更专注在三到五年内的能商业化、能落地的发展战略,脚踏实地做好自己的 AI 核心技术。

“回头来看这十年,我们算是吃上了AI行业早出发的“红利”。也是AI商业化探索的先行者,而盈利赚钱这件事我们这两三年也做到了。”林晨曦称,“在我看来,技术绝不是时间的朋友,从长远角度上来讲,AI 能否产生商业化价值更加重要。”

以下是林晨曦与钛媒体AGI之间独家对话,经钛媒体AGI编辑整理:技术绝不是时间的朋友,商业价值的重要性远高于技术本身

钛媒体AGI:您距离上次媒体沟通,间隔多少时间了?

林晨曦:差不多四、五年。

钛媒体AGI:为什么这几年依图都不怎么对外发声?过去三、四年依图发生了什么变化?

林晨曦:2021年我们IPO申请撤回后,我们就很少对外讲了。这有很多客观原因,这个阶段关注自身发展远比出来讲要重要的多。有一个很经典的认知曲线“愚昧之巅、绝望之谷、开悟之坡”,这个曲线和企业发展是蛮像的。

所以,不管外面怎么看依图,尤其在IPO撤回以后,外界可能会认为这是一个很负面的事,但对我们内部来讲,反而是一个蛮大的重生机会,也使我们迅速的经历绝望之谷并迈向了开悟之坡。

宏观层面,我觉得 AI 创业主要围绕两个大的话题:

第一是 AI 算法性能解锁应用场景,就是AI怎么给这个场景创造价值;

第二是 AI 如何大规模商业化。这是对于我们作为一家AI企业来讲,永恒的两个话题。

如果回顾前十年,从2012年到2021年,我们的创新的重心都在 AI 算法性能解锁场景这一侧,过去10年也做了蛮多事情的。但对于规模化商业落地这个课题,我们一直没解决,我觉得四小龙都没解决,这可能就是大家都在探索的最大命题了。所以,我们在2021年之后,内部有一个很大的“纠偏”过程。

21年以前我们更多的是追求所谓的“极致”,技术创新的“极致”。那个时候是不太考虑性价比,加之当时 AI 四小龙总体的发展还是比较顺利,手上的资金也还蛮多。但随着企业员工越来越多,人员规模增长速度和烧钱速度几乎同步就起来了。有多少人,你就得烧多少钱。而如果你商业化的规模没有起来的话,人员规模和商业化能力就会出现脱节,任何企业都经不起这样不健康的发展模式。当然,2020年、2021年之后我们经历了人员调整、业务调整,就是我们清晰看到了这个核心问题。而每年烧掉的现金流,绝大多数的支出是在人上。

2021年IPO撤回之后,我们就在“绝望之谷”这个底部,而这一切是因为 AI 的商业化规模没有做起来。如果仅谈技术和创新,依图是不缺创新的。我们可以同时探索计算机视觉、语音识别、自然语言理解,并把人脸识别做到世界第一,而我们也有实力和信心继续保持技术的先进性。

钛媒体AGI:依图 AI 技术这么强,但企业无法做到商业化,你觉得这是一件“悲哀”的事吗?

林晨曦:我不觉得悲哀,我们从创业第一天就很清楚,商业化是一道难题。这就跟解一道方程式一样,你只是还没有把这个方程式解出来。但你一定需要知道,这是你必须面对和解决的题。之前你解不出来,是你的账配不平。所以这么多年我们都在思考怎么解这个题,统一AI创新和AI商业化这二者之间的关系。所以我们最近几年主要是在修炼内功,这是我们过去这几年的一种状态。

钛媒体AGI:您最近应该有注意到商汤、旷视很多消息,“AI四小龙”经历10年之后大家变化很多,您怎么评价您和依图过去十年?

林晨曦:回头来看这十年,我们算是吃上了AI早出发的“红利”,也是AI商业化探索的先行者,而盈利赚钱这件事我们这两三年也做到了。

2021年尝试IPO之后,我们内部进行了反思,业务和运营上也做了比较重大的调整,包括停掉医疗业务之类。虽然最近三年我们没赚大钱,收入规模也没有涨得很快,但整体来讲,公司是盈利的,同时业务现金流为正,算是对AI商业化这个方程式有了基础的解。

钛媒体AGI:现在再看中国 AI 公司,你认为,为什么当初 AI 公司要亏这么多钱?到底是能力强的技术比较重要,还是有更强商业化能力更重要一些?

林晨曦:先讲一下我这么多年的感受与理解。

我们2012年成立依图的时候,内部也没有什么口号,一个大概的愿景和心愿是“想探索和看到三岁小孩的智能”。当时谈 AI 还比较早,AlexNet论文还没发布,风口还没来的。而当时,语音识别和机器视觉是两个非常重要的发展趋势。当时的一个讨论话题是,场景任务到底是通用的还是单一的,这也是 AI 这两年发展和过去十年最大的跃迁。

过去十年 AI 技术主要在单一任务的进展。而 AI的能力与人类之间的对比参考线,除了学术上的意义价值以外,体现了很重要的是商业价值。当AI达到人类的90分线,会有对应的商业价值;当AI跟人类的能力持平,会有对应的商业价值;而当AI在特定任务上超过人类10倍~100倍,也有对应的商业价值。当时在我们看来,计算机视觉的应用场景和商业价值是很大的。

中国在视觉数据积累是比较好的,然后客观上又有比较强的业务诉求。从商业化的角度来讲,当时我们看到,行业刚需非常明显。过去十年,视觉领域大家的确烧了很多钱,但还是能从里面获得了稳定的业务,拿到一定的收入,不是说完全没有。商业化的过程还遇到一定的局限,其本质的原因在于解锁的还是垂直的单一任务,而不是通用任务。众多的长尾任务未被解锁,这是AI商业规模化未能发生的本质原因。

至于商业化路径和技术水平到底哪个重要?在我看来,技术绝对不是时间的朋友。所以仅从这个角度来看,技术并不太重要。你看OpenAI,这么牛的公司到底领先了多少?领先价值大不大?开源是不是都追得上?如果商业价值够大,有可能技术真没“壁垒”,无非就是落后半年一年而已。

总的来说,我觉得技术是重要的,给了你一定先发的时间,但是从长远角度上来讲,商业更重要。

“大模型六小虎”C端 AI 应用商业化将死

钛媒体AGI:你第一次看到ChatGPT是什么时候,当时是什么感受?

林晨曦:客观讲,ChatGPT通用模型对我们触动是很大的。我们想未来10年怎么做,通用智能的道路已经开始摆在你眼前了,可以跨场景解决问题,不再是垂直行业里的事情。

我们在2019年在《Nature Medicine》发表了一篇文章,做的是基于自然语言处理人工智能儿科诊断技术,当时的AI 技术可以作为儿科医生参与问诊全流程,已经达到和超过初级医生水平。但是,ChatGPT一出来,就全部“洗牌”了,老的技术不成立了,AI 产品的成本也降低了。2021年以前如果你想做个 AI 医生,需单独投个团队,单独去做儿科这件事情,要花一个很长的周期才能做完,也可以达到人类医生的水平,但是ChatGPT一出来,类似这样的话题一夜之间就全都被解决了,这就是通用模型带来的威力。

钛媒体AGI:大家一直在问,为什么过去十年中国发展了很多 AI 公司和整个CV产业,互联网大厂都在做云和 AI,但没有出现OpenAI这样的公司?

林晨曦:这个问题非常难谈,与其谈为什么OpenAI做出来了,中国公司没人做出来?还不如谈为什么OpenAI做出来的时候,微软没做出来?Google没做出来?对于参照系的来讲的话,他们是更有竞争力的参照系。

我个人认为,第一,大厂没做出来很大原因之一是,有可能他们觉得商业更重要,你做出来我再来追就好。这是根子里的模式差别,大厂的后发优势很大,你今天发布之后,差一年半载就能追上来了,那时候可能都还没到关键决战。如果从今天的结果来看,谷歌好像也没失去什么,未来5年谁能胜出,也还未知。第二,这和组织形式有关系,OpenAI 这种形式需要大量资源,是自上而下的创新,而谷歌AI团队是发散的,是自底向上的创新,不可能冒险去做3年、5年单点上的创新。

从中国整体来说,我们不缺钱,不缺场景,不缺课题,不缺人,都不缺,客观上来说我们都不太缺,缺的还是生长原创性技术的“土壤”。

钛媒体AGI:近两年,生成式 AI 创业这一波发展很快,诞生出了“大模型六虎”,大家说就是仿照“AI 四小龙”,但他们现在与大厂处于竞争关系,你怎么看?

林晨曦:这一波AI创业和上一波有两个明显区别:一是互联网巨头全都下场。第二,我觉得六小虎可能是在三倍速走过去10年的路。

具体来说,从估值层面看,以前(四小龙时期),起码要3年起估值才能到几十亿,(六小虎)现在一年差不多,就全都到了。200亿估值我们当时要7-8年,但六小虎两年估值就到了。再从商业化的期待角度看,一年前,六小虎还在比拼谁的模型大,现在投资人和市场就开始追问公司商业化盈利的问题了。

所以我个人认为,现在基本上是三倍速在加速 AI 创业成长的过程。他们(六小虎)也正在走当年我们(四小龙)2017年-2019年时期的老路。主要原因是生成式 AI 新技术速度发生变化,投资速度和方式也发生了改变。10年前,没有人谈通用人工智能(AGI)什么时候到来,但现在美国都在探讨AGI是2年、5年还是8年到达。

此外,现在 AI 领域的外部环境也发生着巨大的变化,包括大国博弈,AI 行业在这里又比较特殊。现在很多大模型公司都在做认知模型,比当年“AI 四小龙”之间的区分度还小。从一些toB的项目上看,今天(大模型公司)最大问题是,客户买闭源的模型,和直接拿开源模型做有何区别。

钛媒体AGI:很多人认为,过去10多年国内 AI 行业巨大的波峰波谷变化与投资人的“短视”有关,最近也有投资人对于200亿估值保持谨慎态度,您如何看待此现象?

林晨曦:资本本身就是要关注短期利益的,这天经地义。对企业来讲也需要看短期利益。企业不能整天只喊着“长期利益”,然后短期就不交任务,这本身违背商业伦理。从客观的角度上讲,AI 公司也是商业企业,否则你是在学术机构里做研究不是更好。

从创业开始,就需要融资。所以我们需要从对投资人的角度看,投资人给了我们一个很重要的视角,叫做“尺子”,使得你知道你自己的工作到底有没有价值。如果你完全不接受这把尺子的度量,要做成研究机构,就不应该出来创业。

钛媒体AGI:比较独特的现象是,这一轮ChatGPT热潮有很多在C端落地的 AI 产品产生收入,你如何看待“大模型六虎”在To C端的发展前景?当年四小龙做To B安防和智慧城市业务的时候,没有阿里、腾讯、字节的参与吗?

林晨曦:我觉得ChatGPT收会员费这个事情,在中国几乎不成立,因为中国的巨头跟美国巨头的态度就不太一样。

我们其实是出发的比较早,如今回头看依图发展,我认为,我们做对的一件事,是躲开了To C端的竞争。我们2012年的时候有过讨论,但我们觉得我们没有资格做,巨头就在那里,不太可能有一个路线你能突击出来,能够从夹缝中跑出来,(我们)做不到这件事情。

如今也是如此,很多 C 端应用其实在商业化层面很难打得过大厂,后者是有流量有用户的。

当年我们进安防赛道,这个行业的特点就是细碎慢、比较垂直的场景应用,因为巨头关心的都是特别大的场景,所以我们其实可以关注小一点的产业,并非大的产业。

钛媒体AGI:你们如果跟大厂做一样赛道的商业化,比如云、SaaS等,肯定就没戏了?

林晨曦:我们创业,是需要要找大厂不注意的地方。现实的讲,你在他关注的地方肯定受到的炮火更大。创业公司都是要在夹缝中找出一条路来,一定得找到一条属于自己的通道,趁别人不注意的时候成长起来。从新一轮 AI 创业公司视角看,To C 的会员费几乎是没戏的,除非做To C中间的垂直领域可能有,但也不一定能成功。

另一方面,如果AI公司去做云卖卡,这和AI公司的核心竞争力无关,长远看这就是投机或者仅是短期贸易的行为,不可重复。创业的过程中,碰到风口浪尖都很正常,风口浪尖过了也很正常,一个风口就会赶着一个风口走,这是很正常的态势,但这些其实都不是商业本质,只是资本关注的热点。

钛媒体AGI:2021年IPO撤表之后,依图卖掉了医疗业务,当时是怎么想的?如今大模型出来之后,很多 AI 公司依然在做医疗 AI,依图还会考虑重新做这个业务吗?

林晨曦:之前我们认为,AI 不仅要解决单一领域的问题,还要在通用层面产生价值。所以我们希望能在安防垂直领域之外有更多探索,比如医疗,我们想证明我们实践过的方法论,也可以在医疗领域走的通。当时在医疗领域,我们做了除CV以外很多的事情,语音识别、自然语言理解、知识图谱,都进行了实践。

然而跳回来看,其实医疗 AI 的商业环境比安防差很多,安防有固定的项目、有需求,有收入。但医疗不同,要卖医疗 AI 软件,销售即便跑断腿,也就给你20万的合同,这个账不会平,因为客单价太薄了。我们当时已经是一线AI医疗团队,一年大概要在医疗 AI 业务上烧掉几个亿,营收也只做到小几千万。

所以在当时看来如果上市成功,可能(医疗 AI)能撑得住,可以接着做,但上市不成,烧钱太多,只能停掉。但目前,我觉得即便有了大模型,医疗AI行业“几乎还是死路一条”,这个行业的商业环境本质上没有什么变化。

钛媒体AGI:那腾讯、百度也在做医疗 AI 啊?

林晨曦:巨头们也几乎没有机会,他们自己也证明过做医疗 AI 行不通。

医疗行业是非常难的,美国可能有机会,因为整个商业环境不一样,中国医疗 AI 现在很难找到路,我们试过很多的商业路径,但最后都不是技术不行,而是销售通道不行。对我们来讲,这些方案几乎全试过了。

钛媒体AGI:依图一直在做 To B 安防赛道,其他三家都撤退了,为什么大厂不做,依图却在做?

林晨曦:从业务模式上讲,与互联网巨头们深耕的 To C 赛道相比,安防业务模式比较偏项目制、“不性感”,但安防市场规模还是比较大的,我们和海康、大华卖摄像头等设备不同的是,依图更偏智能化,解决安防的智能化问题,毛利润率能到60%左右。

下一步:留在 AGI 热潮牌桌,冷静去做视觉多模态智能方向

钛媒体AGI:作为当年“AI四小龙”,也是AGI坚定者,如今 AI 2.0下,你认为依图还在 AI 头部企业这个“牌桌”上吗?

林晨曦:当然在。首先,十分清晰的是,未来的一切都是 AI。

2024年,连诺贝尔奖都重点在 AI 领域了。这两年大语言模型一来,大家都更热衷去做语言模型,“吟诗作画”,但大家对于视觉、空间智能布局并不多。而我们是这么理解的,AGI 大的层面包括三个方面:第一是以人类语言为基础的认知模型;第二是对物理世界进行建模的感知模型,其中视觉是最重要的(也叫空间智能);第三是运动(和控制),比如自动驾驶、具身智能、机器人等。

依图专注在做“以视觉为中心的多模态模型”。我们也看到,最近李飞飞、谢赛宁发表的关于Thinking in Space的研究,哪怕最先进的以语言为中心的多模态大模型,在空间认知方面与人类相比仍有显著差距。我们需要了解到机器是如何看见这个世界,如何理解这个世界,而以视觉为中心的多模态模型就是一个方向,可以将物理世界和认知世界更好进行衔接。


钛媒体AGI:你认为大厂不会去做这种视觉核心的“空间智能”吗?依图有充足“弹药”吗?

林晨曦:当然会。但目前“空间智能”还没发生,还有很多的问题需要解决,乐观的是很多人预测2025年会有重大的提升。对于依图来说,我们不缺场景,不缺课题,不缺人,这些都不缺。

钛媒体AGI:你现在怎么理解 AI 公司的To B策略?

林晨曦:本质上,To C 和To B 商业化是两套逻辑,To C是花钱买用户规模,To B更重要的是精细化运营。

To B企业需要的精细化运营是看你的销售管理好不好、你的销售通道对不对,项目交付的时候成本抠的够不够细,库存管没管好,供应链谈得怎么样,有没有内控上的漏洞。它是很多环节,任何一个环节你有短板你就会亏钱。所以,AI 公司To B发展是一个特别困难的事情。

但如果To B领域10年涨10倍的收入,企业就会一直赚钱,它享受的是复利。所以 To B 赛道更看重“精细化运营”,然后从时间中间要复利。

钛媒体AGI:依图未来10年的最终目标是什么?

林晨曦:坦率说,我觉得10年这么长的目标目前很难谈。因为我个人觉得这是个探索的过程,我们并不知道终点定在哪里。

钛媒体AGI:没有目标AI公司如何往前发展呢?

林晨曦:如果拿 AGI 作为目标,但是这个目标对我们而言太大了。喊一个非常宏观的、远的目标其实没有意义。我们需要比较务实。对公司发展来说,我们很少谈三年以上的事情,更多的在谈未来三个月、三周的事情,因为发展不是“口号”喊出来。

钛媒体AGI:你觉得这么多大厂想要做AI,最后谁会是赢家?另外,你觉得“大模型六虎”都会最终发展吗?

林晨曦:这应该是巨头的问题,我们并没有资格回答这个问题。

我们更关注还谈比较小和具体的问题,小的问题才能让你沉淀,当然前提是不要偏离大的路径,大的方向。

钛媒体AGI:如果空间智能这条路如同BERT、GPT类似竞争最终失败了,依图还有很多“容错空间”吗?

林晨曦:首先空间智能还是很难的。当然巨头有足够多的容错空间,而我们创业公司则更需要探索。

所以,认知很重要。也就是说当你认知不够的时候,再好的东西摆在你面前,你伸手就可以拿,你拿了就可以获利,你都不会去伸手。这就是认知的重要性,因为你不知道好不好,或者哪个时间点拿好。所以,认知的红利是很难获得的。你得对技术原理、脉络、AI商业化的路径都有独特见解,而不同的企业就是在不同的见解中走出千差万别的样子。是否有更多的“容错空间”,取决于能否获得更正确的认知。

钛媒体AGI:按你的说法,依图现在现金流状况这么好,还要探索新的 AI 技术,那依图还要融资,还考虑重启IPO上市吗?

林晨曦:客观来讲,我们(未来)肯定是要上市的。

(本文首发于钛媒体App,作者|林志佳)

ad1 webp
ad2 webp
ad1 webp
ad2 webp