新智元报道
编辑:KingHZ
【新智元导读】AI发展日新月异,未来扑朔迷离。近日,Web框架Django之父Simon Willison,预测了未来1、3、6年不同阶段的AI发展以及影响。
AI发展日新月异,可谓「乱花渐欲迷人眼」,很难预测未来的世界到底如何。
而Web框架Django之父Simon Willison,这一次他走出舒适区,大胆跨界预测未来AI发展趋势!
在近日的播客中,他预测了未来1、3、6年不同阶段的AI发展以及可能的结果。
参加完播客之后,Simon Willison把对未来的预测扩展为博客文章。
主要预测如下:
1. 一年内,除了编程和科研智能体,其他智能体难以落地。
2. 三年内,某人将在GenAI工具辅助下,拿下普利策奖;在日常工作,记者熟练利用LLM,处理数据;在个人数据保护上,法律取得实质性进展。
3. 六年后,AI将简化艺术创作,解放人类的艺术创意。但如果AGI取代大部分人类的工作,可能会引发大规模社会动荡,后果不堪设想。
一年内智能体预测:第一部分
在2024年,Simon评论到「智能体」还没有真正发生。
Simon认为,在2025年将看到更多关于智能体的炒作,但结果将让大多数「智能体」的粉丝感到失望。
在智能体(Agent)上,Simon预见将有大量资金被白白浪费。
「旅行智能体」不会成功
如果问十个人,你会得到十个稍微不同的答案——Simon收集并用AI总结了不同的答案。
链接:https://gist.github.com/simonw/beaa5f90133b30724c5cc1c4008d0654
为了简化论证,Simon选了一个他认为不会实现的定义:可以代表用户去半自主行动的AI助手。
Simon把这个定义称为「旅行智能体」式的智能体,因为当描述「智能体」时,不知为何,人们总会联想到预定航班、酒店以及规划行程。
让当前的LLM做出重要决策——比如花钱买什么——是一个非常糟糕的主意。
它们不可靠,但更重要的是,它们太容易受骗了。
如果你给AI助手一张信用卡,并放任它的行动,你要确保,在第一个声称提供最佳优惠的网站上, 它不会马上点击「购买」按钮!
因为点击一下「购买」,就能把你的银行账户信息转给黑客,从而掏空你的「钱包」。
而现在还无法避免这一点。
之所以还没有看到LLM驱动的智能体,就是因为可靠性。
Simon对这点深信不疑,尽管自从ChatGPT首次发布以来,这个想法就吸引了大量关注。
接下来的12个月,发布的模型中,只要有一个能完全避免这一点,Simon都会喜出望外。
因为他认为解决受骗问题非常难,难得出奇。
一年内:编程和科研智能体行得通
Simon相信有两类「智能体」确实可行,而且事实已经证明它们确实有效。
编程助手
第一类是编程助手——让LLM写代码、执行并根据结果修改代码,不断循环。
在2023年3月或4月,Simon第一次看到这种模式:OpenAI用Code Interpreter演示了这一点。
ChatGPT可以利用Python解决问题:它会编写代码,并在安全沙箱中(可能是Kubernetes)执行代码,然后根据输出或错误信息判断目标是否已达到。
这种模式非常好,在2023年初的模型(最初使用的是GPT-4)中效果非常好,今天依然如此。
在同年10月,Claude也发布了自己的版本(Claude Analysis,使用在浏览器中运行的JavaScript),Mistral和Gemini也有类似的功能,还有许多其他工具实现了相同的模式。
科研助手
第二类智能体是科研助手——LLM能够多次搜索,收集信息,并将其整合成答案或者撰写报告。
在这一领域,Perplexity和ChatGPT Search已经运作了一段时间,但Simon印象最深刻的是Google Gemini的Deep Research工具。
比如,他向Deep Research提出这样的问题:
Pillar Point Harbor是北美西海岸最大的棕色鹈鹕栖息地之一。 找到其他的栖息地。
Gemini会起草计划,利用、谷歌搜索访问几十个网站,然后整合报告(并附上重要的引用),描述发现的内容。
它给出的计划是:
Pillar Point Harbor是北美西海岸最大的棕色鹈鹕栖息地之一。找到北美西海岸其他大的棕色鹈鹕栖息地。 1. 查找北美西海岸棕色鹈鹕栖息地的列表。 2. 查找关于棕色鹈鹕栖息地及其大小的研究论文或文章。 3. 查找来自鸟类观察组织或政府机构关于棕色鹈鹕栖息地的信息。 4. 将(3)中找到的栖息地大小与Pillar Point Harbor栖息地的大小进行比较。 5. 查找与棕色鹈鹕栖息地和其种群相关的新闻文章或最新报告。
它挖掘了大量的细节,包括2016-2019年太平洋棕色鹈鹕调查报告中的PDF文件,而Simon最关心的就是这些——其中包含的列表让他很满意:
十大超级栖息地(通常栖息超过500只鹈鹕的地方): - 阿拉米达防波堤(Alameda Breakwater),加利福尼亚州(3,183) - 支柱点港(Pillar Point Harbor),加利福尼亚州(1,481) - 东沙岛(East Sand Island),俄勒冈州(1,121) - 阿诺新月州立公园(Ano Nuevo State Park),加利福尼亚州(1,068) - 萨利纳斯河口(Salinas River mouth),加利福尼亚州(762) - 博利纳斯泻湖(Bolinas Lagoon),加利福尼亚州(755) - 莫罗岩(Morro Rock),加利福尼亚州(725) - 莫斯兰丁(Moss landing),加利福尼亚州(570) - 克雷森特城港(Crescent City Harbor),加利福尼亚州(514) - Tomales鸟岩(Bird Rock Tomales),加利福尼亚州(514)
Simon才知道,他所在的支柱点港(Pillar Point Harbor)是第二大栖息地!
对Simon来说,利用当前的LLM,完全可以自己构建科研助手。
它们能够驱动工具,能提出相对浅显的研究计划(寻找新闻文章和研究论文)。而且如果搜索并收集到适当的上下文,它们就能合成合理的答案。
Google尤其擅长此道:他们拥有全球最大的网站搜索索引,而且Gemini模型的上下文可以包含200万token。
Simon预计Deep Research会越来越好,并且吸引来大量竞争者。
三年后:AI辅助拿下普利策奖
Simon做了一个有点自利(self-serving)的预测:认为三年之内,有人将因由生成式AI工具辅助的调查报道而获得普利策奖。
但并不是说LLM会写这篇文章!
他依然认为,让LLM代替人写文章,是最无趣的应用之一。
之所以称这个预测是自利的,是因为Simon希望他能推动这一事件的发生!
他开源了数据新闻工具套件Datasette,还在不断增加AI功能。
比如,利用LLM来数据增强;从非结构化文本中,提取结构化数据并转化为表格。
他的梦想是这些工具——或者类似的工具——能够被用于获奖的调查报道。
他之所以选择三年这个时间,就是因为让人们普遍了解如何负责任地、有效地使用这些工具,并将应用于实际工作,需要这么长时间。
LLM并不是新闻业的天然的契合点:记者寻求真相,而LLM通常容易产生幻觉,捏造事实。
但是,记者也非常擅长从不可信的来源中提取有用信息——这也是新闻工作的重要部分。
一下两个领域,他认为LLM特别适合新闻业:
结构化数据提取。如果利用《信息自由法》,成功获得了1万份PDF文件,那么需要有人或某些工具来阅读这些文件,并找到暗藏的故事。而LLM非常擅长处理大量信息,并整理出有意义的内容。它们可以生成线索,帮助找出值得深入调查的故事。
编程辅助。编写代码、分析数据是现代数据新闻的重要部分——从SQL查询到数据清理脚本、定制网络抓取工具或可视化工具,都可以帮助从杂乱的信息中找到有价值的信号。但大多数报社并没有程序员团队:Simon认为在三年内,将围绕这种模式构建足够强大的工具,能让非程序员记者在报道过程轻松使用这些工具。
Simon希望他自己能够开发这类工具!
所以他对未来三年的具体预测是:有人将凭借少量的LLM辅助赢得普利策奖。
更普遍的预测是:三年后,大多数专业消息人士将LLM作为日常工作流的一部分,而且使用方式也越来越复杂,但大家却习以为常、熟视无睹。
三年后:隐私法将落地
另一个三年后的预测涉及隐私立法。
定向广告和人们粘贴到模型的数据到底会发生什么,已经引起了人们的杯弓蛇影(往往是有理由的),而且还在不断增长。
Simon曾写过,苹果通过监听手机麦克风来定向广告,是「无法根除的阴谋论」。
过去, 他也曾写过关于AI信任危机的文章:许多人拒绝相信模型并不会基于他们的输入数据进行训练,而且背后的公司已经反复否认。
他认为,AI行业本身将从立法中受益匪浅,特别是在明确用户提交数据训练方面,而更一般的科技行业,也亟需在数据保留和定向广告等方面制定更严格的规则。
在未来四年,Simon不指望美国联邦政府能通过相关立法,但预计,在州级或国际层面,会看到更多具有实际执行力的隐私法规。
Simon希望不要因此产生新一代的cookie同意条款。
六年后的乌托邦:令人称奇的艺术
对于六年后的预测,Simon选择了两个对立的预测,一个乐观的,一个悲观的。
他认为六年足够长,人类会找到利用AI技术的方法,创作出真正伟大的艺术作品。
Simon不认为GenAI用于艺术创作——如图像、视频和音乐——能像基于文本的LLM那样,得到同等的尊重。
生成式艺术工具很有趣,但它们对输出缺乏精细的控制。
这大大限制了它们的实用性,现在这些工具只能生成一些供个人消遣的内容。
更重要的是,它们缺乏社会认同。整体社会氛围上,大家对AI生成的艺术观感不好。许多有才华的艺术家,强烈反对这些工具,甚至在社会中,「AI」这一术语也开始变成某种意义上的贬义词。
图像和视频模型也是AI训练数据伦理争论的核心,原因很简单:未经允许,没有艺术家愿意看到他们的作品,被用来训练模型,然后这些模型反过来直接与他们竞争!
Simon认为六年的时间足够让这一切尘埃落定——让社会找到真正提升人类表达方式的可行方法。
让他兴奋的是,真正有才华、有远见、有创意的艺术家,将利用这六年内演变出的工具,创作出有意义的艺术作品。而且这些工具不可或缺,否则这些艺术就不可能实现。
在播客中,Simon谈到了《瞬息全宇宙》(Everything Everywhere All at Once),这部电影赢得了2023年七项奥斯卡奖项。
电影的视觉特效团队,核心只有五个人。
试想如果能使用六年后才出现的GenAI工具,他们能做出什么样的作品!
自从播客录制以后,Simon从Swyx那里了解到,Runway ML已包含在《瞬息全宇宙》的工具集中:
Evan Halleck曾在这支团队,他利用Runway的AI工具节省时间,自动化了编辑的繁琐环节。特别是在电影的岩石场景中,他使用Runway的转描机技术(rotoscoping)快速、干净地剪辑岩石,同时沙子和灰尘在镜头周围移动。这把原本需要几天的工作缩短到了几分钟。
Simon在播客中预测,使用GenAI工具的电影,将在六年内获得奥斯卡奖。
这样看来他已经迟了八年!
六年后的反乌托邦:大规模社会动荡
2031年的悲观预测则是关于「AGI」的,AGI这个术语一直在不断被重新定义。
如果假设AGI能够执行目前人类承担的几乎全部的岗位,那么很难不看到潜在的负面后果。
奥特曼可能尝试过全民基本收入。但美国现在连全民医保问题都无法解决,更何况全民基本收入!
当大多数工作被机器取代时,很难想象未来的经济怎么能为大多数人服务。
所以,他为2031年做的悲观预测是:如果这种形式的AGI到来,那么它将带来极其糟糕的经济后果和大规模的社会动荡。
他心目中的AI乌托邦是能够增强当前人类能力的AI工具。
这正是迄今为止利用LLM所做的事。
他理想中的状态是这些工具不断改进,最终使人类能够完成更加宏伟的工作。
如果有一种AGI能实现这种乌托邦,他愿意全力以赴。
作者介绍
Simon Willison是一位英国程序员,Lanyrd社交会议目录的联合创始人,以及Web框架Django的联合创造者。
2010年末,他作为联创推出了社交会议目录Lanyrd,后被收购。
2019年-2020年,他在斯坦福大学担任约翰·S·奈特研究员(JSK fellow),开始构建服务于数据新闻学的、开源的工具生态系统。
从2002年,他开始坚持在个人博客上发表文章。
参考资料:
https://simonwillison.net/2025/Jan/10/ai-predictions/