十年前,当AlphaGo在围棋棋盘上击败李世石时,人类第一次感受到被机器碾压的震撼;十年后,谷歌的Gemini 2.5 Pro因为通关一款29年前的低像素游戏《宝可梦:蓝》登上热搜。

这一幕看似荒诞——毕竟连我邻居家的小学生都能轻松通关的休闲游戏,为何成了AI界的高考?

答案藏在莫拉维克悖论的阴影下,对人类而言,下棋需要复杂的策略,但对AI来说,理解一堵由16×16像素组成的墙是否可通行,却比解微分方程更难。

初代《宝可梦》看似简单,实则暗藏AI的终极考题,如何像人类一样,用模糊的感知、试错的勇气和不按套路出牌的灵光一现,去探索一个未知的世界。



当科技巨头们纷纷将《宝可梦》设为AI试验场,这场复古游戏挑战赛背后,是一场关于通用人工智能(AGI)的隐秘战争。

▌AI玩《宝可梦》的迷惑行为大赏

今年2月,Anthropic公司的Claude 3.7在直播中表演了史诗级人工智障现场,卡在真新镇的栅栏前疯狂撞墙、与路边的钓鱼大叔重复对话20次、在常磐森林原地转圈3小时……最终止步于第三枚徽章。而它的前辈Claude 3.0甚至走不出初始小镇。

但戏剧性的是,当Claude遇到属性相克的对战时,却能瞬间化身战术大师,它会分析比比鸟的飞行系技能对电系宝可梦效果一般,选择伤害最高的招式速战速决;

甚至懂得故意输掉战斗触发传送机制这样的高阶操作。这种对战天才与路痴白痴的反差,恰似一个拥有博士智商却分不清左右手的机器人。



反观Gemini 2.5 Pro,它的通关过程更像一场精心策划的作弊——通过Agent Harness框架为游戏画面标注坐标、可通行区域等元数据,甚至调用专门的路径规划AI(Pathfinder Agent)破解迷宫。即便如此,它仍需10.6万次操作才能通关,相当于普通玩家的30倍时长。



▌为什么儿童游戏成了AI的成人礼?

初代《宝可梦》的魔力,在于它用最简单的规则构建了一个复杂系统,没有明确的任务箭头,NPC的提示语焉不详(比如大木博士在等你,但地图全黑);

允许玩家迷路、折返、甚至故意触发失败机制,培养宝可梦的属性搭配需要跨越数十小时的时间维度;



这正是当前大语言模型的致命短板,它们擅长从海量数据中总结规律,却难以像人类一样在信息残缺时脑补场景。当Claude将穿白大褂的路人错认为大木博士时,它暴露的不仅是图像识别的弱点,更是理解人类隐喻式表达的困境。

有趣的是,AI在硬核领域的表现反而更优异,属性克制系统(18种属性×数百种技能)能被迅速建模;

对战策略可通过概率计算优化,甚至能通过内存数据反推隐藏数值。

这种高智商低情商的表现,恰似一个精通量子物理却不会系鞋带的天才儿童——而这正是AI从专用工具向通用智能进化必须跨越的鸿沟。



▌当AI开始玩游戏,人类玩家会被取代吗?

谷歌工程师Joel Z在直播中的一次干预颇具象征意义,他禁止Gemini使用穿洞绳道具强制脱困,迫使AI学习人类的路径记忆能力。

这种戴着镣铐跳舞的设计,暗示着当前AI的局限性——它们可以通关游戏,但无法真正体验游戏。

不过,游戏行业早已嗅到变革的气息,网易《逆水寒》让大模型化身NPC沈秋索,与玩家自由对话;

腾讯用AI引擎将《火影忍者》场景制作效率提升40倍;

微软专利允许玩家用自然语言指令生成新剧情、角色;

但Take Two CEO的冷水泼得犀利:AI能拼接既有元素,却创造不出《GTA》式的颠覆性创意。



这揭示了一个残酷现实:AI或许能取代画师、测试员、甚至编剧,但游戏的灵魂——那些让人拍案叫绝的脑洞、戳中人心的情感共振——依然需要人类掌舵。

▌在人工智障与智能觉醒之间,我们走到了哪一步?

当Gemini终于击败四天王,屏幕前欢呼的不仅是工程师,还有整个AI行业——通关《宝可梦》的象征意义,不亚于阿波罗11号登月。它证明了一件事:AI可以在未知环境中自主探索、试错、成长,而不只是执行预设程序。

但对玩家而言,更值得玩味的是另一个问题,如果某天AI能像人类一样享受游戏的乐趣——为捕捉稀有宝可梦熬夜刷怪、因剧情反转热泪盈眶、甚至开发出非主流通关玩法;

那时的游戏,究竟是人类与AI共创的乌托邦,还是硅基生命对碳基文明的优雅嘲讽?

或许正如《宝可梦》的经典台词:“我明白的,宝可梦和训练家是共同成长的。”当AI开始玩游戏,人类也在这场游戏中重新认识自己。

*每天推送游戏资讯、新游推荐、游戏杂谈等,带你了解不一样的游戏世界。

ad1 webp
ad2 webp
ad1 webp
ad2 webp