本文来自微信公众号:安贞投资,作者:博实挚珍

百度发布财报,营收1331亿,同比下降1%,主要受搜索引擎广告拖累。净利润234亿,同比增长21%。各种降低成本推动盈利吧。你懂的。

有关数据的罗列,我就尽量减少了,因为DeepSeek同学已经做的很好了。我只在分析中,引用必要的数据。

在DeepSeek以前,对百度搜索分流最明显的是小红书,微信搜索可能是个隐藏要素。而AI搜索并不是很成熟,所以只能作为一个参考工具。自建数据库,自己训练成本又太高,很难普及。

但是在DeepSeek横空出世以后,尤其是当微信接入DeepSeek-R1,AI搜索对百度的冲击,我认为将会是巨大的。

据DeepSeek微信版提供的数据(仅供参考),百度搜索份额从2021年90%降至2024年52.79%。年轻用户尤其流失严重,小红书和B站有可能也是分流原因。

近几天微信接入DeepSeek后,日均7亿次搜索。

我以前搜内容会用微信搜索,微信搜索满足不了的情况下用百度。

现在的习惯,先用DeepSeek原版,如果原版满足不了或者服务器思考中,我就直接用微信版本,微信版本虽然有公众号等内容的影响,但关键在于稳定。

而且,随着微信版DeepSeek不断地训练调试,再加上很多问题是新问题,必须得结合最新的内容和信息,比如百度财报分析。微信公众号里本就有许多优质内容,可以成为训练资料。

当然,微信DeepSeek,当前需要解决的问题,我觉得是对微信公众号/视频号内容进行专业且严格系统的专业标注、交叉验证。

以我过往在搜索业务中的经验,我认为数据标注工作反而是重中之重。人力物力技术投入可不能马虎。

千里之行始于足下,万丈高楼平地起。第一步,地基是大模型大厦的基石,好用的大模型和不好用的大模型,除了算法、投入、训练的数据质量以外,数据最初的标注往往最容易被忽略,但往往这就像科研中最基础的证据和数据一样,差之毫厘谬以千里。

所以,大模型其实很像科研,如果没有足够的情怀、足够认真和热爱。我觉得很难做好。


遥想百度当年,李彦宏以图书馆和计算机双专业背景,以图书馆学为索引,带着最前沿的搜索引擎技术回到北大资源宾馆创业。

俞军一腔热血,凭着热爱,在搜索、贴吧、知道等多个产品中,形成了产品经理12条。

梁冬从凤凰卫视从南到北,让“百度一下,你就知道”,“百度更懂中文的家喻户晓”。

百度2005年上市,今年刚好20年了。

从Mp3产品开始用百度,搜索和互联网,给我打开了信息获取的新天地。关键词和打标签成为我这些年生活的重要部分,每一次搜索都在考验关键词的选取能力,而每一次信息出现,又何尝不是对其进行归类和打标签呢。

DeepSeek横空出世,于我的认知而言,我觉得这可能是真正搜索引擎的下一代产品。不是头条、抖音的推荐,推荐是被动的,搜索是主动的。

就像家长不一定知道孩子要什么,你推荐给我的,怎么确定就是我要的呢?

但是,我主动找的,可以通过不断地优化我的搜索词,搜索语句,以及我对结果的反馈追问不断优化出我最想要的结果。

DeepSeek可能就是那个真正搜索引擎的下一代产品,可能就是苹果之于诺基亚那样的产品。

但无论是图书馆索引,还是计算机数据库检索,又或是搜索引擎,又或是DeepSeek,本质上,你得先打好地基,你打好地基和标签了么?

故宫的夯土,可以给我们大模型最大的启示。

古建的木结构、四梁八柱和榫卯,可以给我们更多的智慧。

那个热爱国学的梁冬老师,重新发现中华文化太美的梁冬老师,你现在睡得怎么样?

百度一下,你就知道。

道是什么?

本文来自微信公众号:安贞投资,作者:博实挚珍

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

ad1 webp
ad2 webp
ad1 webp
ad2 webp