Anthropic创始人眼中的AI智能体进化：工具、上下文、代码与安全

（来源：MIT Technology Review）

AI 智能体目前是科技领域的热门话题。从 Google DeepMind、OpenAI 到 Anthropic，各大顶尖公司正竞相为 LLM 赋予自主完成任务的能力。这类系统在行业内被称为 Agentic AI（代理式人工智能），是硅谷新的热议焦点。从英伟达到 Salesforce，各家公司都在探讨如何利用这项技术颠覆行业格局。

Sam Altman 在上周的一篇博客文章中表示：“我们相信，2025 年第一批 AI 智能体可能会加入职场，并实质性地改变企业的产出。”

广义上看，AI 智能体是一种能够自主执行任务的软件系统，通常只需极少甚至完全不需要监督。任务的复杂程度越高，智能体所需的智能水平也越高。对于许多人来说，如今的 LLM 已经足够智能，可以驱动智能体完成一系列实用任务，例如填写表格、查找食谱并将所需食材添加到线上购物车，或者在会议前通过搜索引擎快速完成最后的研究并生成简明的要点总结。

2023 年 10 月，Anthropic 展示了一款先进的 AI 智能体：Claude 的一项扩展功能“Computer Use”。顾名思义，这项功能使用户能够像指挥人类一样指导 Claude 操作电脑，包括移动光标、点击按钮和输入文本。用户不仅可以与 Claude 对话，还可以要求它直接在屏幕上完成任务。

Anthropic 指出，这项功能目前仍然存在繁冗和容易出错等问题，但已向一小部分测试人员开放，包括来自 DoorDash、Canva 和 Asana 等公司的第三方开发者。

这个项目展现了 AI 智能体未来发展的一个缩影。为进一步探讨趋势，MIT Technology Review 采访了 Anthropic 的联合创始人兼首席科学家 Jared Kaplan，他分享了 AI 智能体在 2025 年可能发展的四个方向。

（Kaplan 的回答经过轻微编辑以适应篇幅和提升表述的清晰度。）

更擅长使用工具

“我认为可以从两个维度来理解 AI 的能力。一方面是 AI 系统能够完成任务的复杂程度。随着系统变得越来越智能，其在这一方面的能力不断提升，而另一个关键维度是 AI 可以使用的环境或工具类型。”Kaplan 表示。

“举个例子，如果我们回顾近10年前 DeepMind 的围棋模型 AlphaGo，它已经在下棋方面超越了人类。然而，如果 AI 的能力仅限于棋盘游戏，它的应用环境就非常受限。即使拥有极高的智能，这种 AI 在现实中没有实际用途。随着文本模型、多模态模型的进步，以及像‘Computer Use’这样的功能（甚至未来可能涉及的机器人技术），AI 正逐步融入多样化的环境和任务中，从而变得更加实用。”他继续说道。

“我们对‘Computer Use’感到兴奋的原因也在于此。直到最近，大语言模型还必须依赖特定提示或工具，且局限于特定环境。而我认为‘Computer Use’将快速提升模型在完成不同任务及更复杂任务方面的能力。此外，AI 也将逐渐学会识别自己的错误，并在面对高风险问题时意识到需要寻求用户的反馈。”他指出。