回头看过去一年,在 AI 席卷全球、全行业的大势之下,最常被提及的一个词就是:「智能体(AI Agent)」,从国内的百度、字节(豆包)、阿里巴巴到海外的 Anthropic 和 Google,都在力推智能体的落地。

就连 OpenAI 也注定要下场。去年 11 月起就不断有报道指出,OpenAI 计划在 2025 年 1 月上线「智能体」,稍早前还被海外科技媒体 The Information 把范围缩小到了本月底。更确凿的证据是,OpenAI 这两天刚刚上线的 ChatGPT「任务(Tasks)」功能。



图/雷科技

macOS、iOS 以及 Android 的最新版本中(Windows 版本暂未更新),OpenAI 已经在 GPT-4o、GPT-o1 系列模型之外增加了一个 GPT-4o Tasks 模型。在 ChatGPT「任务模式」下,ChatGPT 砍掉了对图片、文档等文件的支持,但保留了对始终联网的支持,更新增了「执行计划任务」的支持。

表面来看,ChatGPT「任务模式」似乎就是多了定时提醒和回答问题的能力,比如在每天早上提醒你锻炼计划,或是每周五给你发一份新闻周报。但根本的变化在于,Tasks 的引入意味着 ChatGPT 正在从一个完全被动的 AI 聊天机器人,开始转变成主动执行任务的 AI 数字助手。

这也被普遍看成 OpenAI 正式推出智能体前的关键一步,因为「智能体」核心的一点就是独立规划并执行任务的自动化能力。OpenAI 官方也在媒体采访中表示:「任务模式」将是 ChatGPT 成为更有用 AI 伙伴的重要一步。

要注意的是,这是一句进行时,而非完成时。

ChatGPT让米粉天天看「小米简报」

北京时间 17:50,iPhone 叮的一声收到一条 ChatGPT 通知和邮件通知,提醒我该看「小米简报」了。



图/雷科技

如果你是一个米粉,各种 APP 里的信息流可能早就塞满了小米的相关新闻,但分散在不同 APP 里的海量资讯实质上很容易「信息冲击」,导致好像都看,好像又都没看。

互联网海量信息流带来的冲击,在今天已经不言而喻了,很多人都开始尝试各种「筛选」。作为科技编辑,更是如此。所以在 ChatGPT「任务模式」上线后,我就进行了一个尝试,让 ChatGPT 每天在固定时间发送一份小米当天的新闻简报

事实证明,ChatGPT 确实能够「如约而至」,整理了一份 2025 年 1 月 16 日的小米相关新闻列表。首先从回答来看,「高盛看好小米汽车」「小米挺进韩国」都是是当天媒体重点报道的新闻。



图/雷科技

但「小米 15 降价」则是多天以前的新闻,ChatGPT 的引用来源是自媒体的一条「过期」资讯。「小米景明」,更是和我们大众认识的「小米」毫无关系。

当然,这里面的原因可能是多重的,比如 ChatGPT 检索中文报道的能力不足,u 以及对国内的信息生态不了解,也在于之前没有强调是大众熟知的那个「小米」。事实上,我们也可以告知 ChatGPT,让其明白问题所在并改正。

时间也是可以改的。直接在对话中指明,就能让 ChatGPT 修改任务执行时间,包括将默认的英文任务名调整为中文。



图/雷科技

你还能让 ChatGPT「任务模式」执行更复杂、更定制化的任务,比如在整理新闻列表的同时,每个新闻附带一句话的重点分析或辛辣评价。

相比之下,你可以让豆包整理一份当天关于小米的新闻列表,实际的索引结果会更丰富、更准确,但豆包并不支持每天固定时间执行的自动化能力,还提醒我可以在每天下午向它提问。



豆包,图/雷科技

这就体现出 Tasks 功能的含金量了。

不只是准备新闻简报,ChatGPT「任务模式」也能每天晚上写一个睡前故事让你读给孩子,定时追踪股市动态,甚至是在越来越多人利用 ChatGPT 进行学习的当下,在特定时间督促你。

至于天气、喝水等提醒,自然也是可以,就是多少有点大材小用。

ChatGPT向日常「助手」进化,却不太聪明

坦白讲,刚开始知道「任务模式」的时候,想当然地认为不过是加了一个定时回答问题的功能。但实际使用起来,「任务模式」确实带来了明显有别于平常使用 ChatGPT 的体验。

一般来说,我们使用 ChatGPT 都是寻求即时的回答,越快越好。但也必须承认,我们的需求是复杂的,不管是定期的相关主题简报、睡前故事还是学习督促,也都是实实在在存在的需求。



图/雷科技

这也是 ChatGPT「任务模式」当下的价值所在,尤其随着 ChatGPT 在我们工作、学习、生活中的使用程度越来越深。换个角度看,「任务模式」也在丰富 ChatGPT 的使用场景,从而改变「角色定位」,让 ChatGPT 从遇到问题打开对话的的 AI 聊天机器人,变成经常主动联系我的 AI 数字助手。

然而作为测试功能,ChatGPT「任务模式」目前来看还很不完善,只能称得上一个不成熟的「助手」。比如让 ChatGPT 规划一份旅行或者减肥计划之后,并不支持按照时间段将计划转为多个任务,一次只支持一个。并且现在这个测试阶段,ChatGPT 最多也只能开启 10 个任务。

与此同时,ChatGPT 还有一个「任务」管理页面,目前仅支持在网页端(macOS 下)显示,iOS、macOS、Android 最新版本中均为出现。而在我的实际体验中,网页端却始终加载失败(同时 ChatGPT 能正常运行)。



点击就是「内容加载失败」,图/雷科技

更重要的还是能力的局限。不同于我们在 Claude 操控电脑、荣耀 YOYO 操控手机上看到的图景,ChatGPT「任务模式」还是停留在对话生成内容上,甚至无法像常规模式一样调用苹果的「备忘录」,写入每晚生成的睡前故事。

这就遑论更复杂的场景和操作要求了。而这个问题,我们或许只能等到传闻中的 OpenAI 首个智能体——Operator(操作员)推出,才可能解决。

ChatGPT“任务模式”将引爆真·智能体浪潮?

2024 年 10 月 1 日,在 OpenAI 开发者日上,OpenAI CEO Sam Altman 曾公开表示 2025 年将会是智能体的元年。在Reddit AMA中,首席产品官 Kevin Weil 更是回应:

ChatGPT 向用户主动发送消息以及独立执行任务,将是 2025 年的一大主题。



AMA,图/雷科技

2025 年来了,ChatGPT「任务模式」也来了,但更关键的智能体大爆发,会来吗?

首先必须要说,目前为止很多厂商宣传的「智能体」其实更多只是定制了上下文,比如一个角色类的「智能体」可能只是内置了一段「人物设定文本」,并把问题进行拆分执行,实际上更像是软件模块,而非代替我们进行操作或者行动的「真·智能体」。

那么被称作 AI 时代原生应用的「真·智能体」到底是什么?典型的代表就是支持「Computer Use」的 Claude,以及一句话自动执行任务的荣耀 YOYO 智能体,尽管这种自动化能力还不够「通用」。



YOYO 智能体自动订购的咖啡,图/雷科技

关键还需要模型层面的进化。几乎所有大模型厂商都在看好智能体的方向,但也无一例外需要面临挑战,就像线性资本总结的:专业化(不只是上下文)、经济高效的推理以及可控性。

2024 年 12 月 12 日,Google 发布了新一代原生多模态模型 Gemini 2.0,几乎获得了全方位地升级,也被很多人视为 Google 的「逆袭之作」。而在 Google 看来,Gemini 2.0 目标非常明确,就是成为「我们智能体时代的最新 AI 模型」。

不仅是 Google,几乎可以预见到 2025 年大模型厂商都会进入这一场新的战斗,推出新一代更适合智能体的大模型。反过来,我们作为普通用户或许也会再次刷新对 AI 的认知:

AI 不只是可以聊天、对话,还可以真正深入我们日常的数字体验,帮我们跳过繁琐的操作步骤,开关系统里藏得太深的「功能」,在更复杂的场景下满足更复杂的需求。

一言以蔽之,AI 不只是「站着说话不腰疼」。

美国当地时间1月10日,CES 2025落下帷幕,雷科技第二次派出官方报道团,对CES进行立体无死角的报道,一共输出41条内容,内容整体超过10万字,涵盖了AI硬件新物种、AI电视、AI家电、AI眼镜、AI PC、AI+AR、智能清洁、AI芯片、AI PC、教育硬件、AI汽车、智能配件、可穿戴、AI机器人、AI耳机、智能镜、AI存储等领域。欢迎全网搜索“雷科技CES”获取一手报道,洞见AI硬科技未来。



ad1 webp
ad2 webp
ad1 webp
ad2 webp