新智元报道

编辑:英智

【新智元导读】苹果在2024年全球开发者大会上为Siri描绘了诱人的蓝图,承诺将成为iPhone的「超级大脑」。然而,仅仅九个月后,内部技术方向的反复摇摆和高管间的矛盾让这一愿景化为泡影。

去年6月,苹果展示了AI版Siri。

随后的几个月,Siri团队对实现这些功能的基础技术方案摇摆不定。

据一位知情的前苹果员工透露,团队曾计划打造一小一大两种模型,分别命名为「迷你鼠」(Mini Mouse)和「大力鼠」(Mighty Mouse)。

小模型在iPhone上运行,处理像设闹钟这类简单任务。大模型则在云端运行,负责更复杂的任务,比如帮用户叫车,赶赴下一场会议。

但后来,Siri负责人改变主意,决定构建一个全能大模型。

这意味着Siri软件得在云端运行,与先前为保护用户隐私,将大部分软件部署在设备端的做法相悖。


技术方向大幅调整,让Siri团队成员疲惫不堪,备受挫折,甚至有人因此离开。

这让公司今年发布Siri新功能的目标,变得岌岌可危。

这种犹豫不决,导致苹果上个月做出惊人决定:将Siri新功能发布时间推迟到2026年。

据知情人透露,苹果将解除其AI主管John Giannandrea及负责日常运营的副手Robby Walker对Siri的管理职权。

苹果的软件工程主管Craig Federighi将主管Siri,此前领导Vision Pro开发的Mike Rockwell将接手Walker的工作。

演示,几乎全是假的?

去年6月,苹果发布一系列名为Apple Intelligence的AI功能,涵盖写作、图像生成、全新的照片编辑、邮件功能,以及Siri升级。


一反此前的立场,苹果宣布与OpenAI合作,引入ChatGPT作为补充,用于其模型无法解决的问题或任务。

发布会的现场演示中,一位苹果高管问Siri母亲航班的降落时间。Siri通过访问其电子邮件和实时航班数据,给出了到达时间。

接着,她又让Siri提醒午餐计划,Siri从短信中提取细节,并规划了从机场到餐厅的路线。

然而,Siri团队成员对此演示却颇感意外。一位前苹果员工称,他们从未见过这些功能可以实际运行的版本。

该员工还表示,当时演示中唯一在测试设备上激活的新功能,是用户唤醒Siri时,iPhone屏幕边缘出现的闪烁彩色光带。

以往,苹果在大会上仅展示已在测试设备上运行、且经营销团队审核确保能按时发布的功能和产品。


苹果2024年开发者大会上对Siri新功能的演示

即便如此,仍给外界留下深刻印象。

宣布这些功能后的两天内,苹果股价上涨超10%,华尔街对苹果推出AI计划表示认可。

一些前苹果员工表示,他们对Federighi和Rockwell扭转Siri局面充满信心。

与更依赖下属管理具体事务的Giannandera和Walker相比,他俩更倾向于亲力亲为。

Federighi对软件项目技术细节的了解,有时甚至超过负责这些项目的初级工程师。

Rockwell被视为富有远见的领导者,既能为项目注入新思维,又能巧妙适应公司文化。

Federighi已着手做出改变。

他指示Siri的机器学习工程师,要不惜一切打造最顶尖的AI功能,即使需要在软件产品中使用其他公司的开源模型,而非苹果自研模型。

AI热潮兴起

2022年11月,OpenAI发布ChatGPT,在科技界和公众中引发轰动。

然而,Giannandrea团队的前工程师称,团队高层领导并未表现出紧迫感。

相比之下,Federighi的软件工程团队则反应迅速。

多名前苹果员工表示,Intelligent Systems团队领导者迅速分享LLM的论文,并公开探讨如何用这些技术改进iPhone。

Intelligent Systems团队向Federighi演示了AI在iPhone上的功能后,软件工程团队内部热情高涨。

这些demo借助OpenAI模型,展示了AI如何理解用户手机屏幕内容,并能通过更自然的对话,操作应用程序、执行其他任务。


AI团队和软件工程团队的高管们随即开始争夺LLM驱动的新功能主导权。

凭借交付方面一贯的好声誉,软件工程团队占据上风。

尽管苹果内部试用了OpenAI模型,但在2023年,管理层告知工程师,最终产品不得使用外部公司模型,只能用于与自研模型对比测试。

打造旨在与OpenAI抗衡的苹果大模型,是Giannandrea团队的职责。

然而,据多位在2023-2024年使用过这些模型的前苹果员工称,其性能表现远不及OpenAI。

AIMLess(漫无目的)

对全球市值最高的苹果来说,如何有效利用AI,是当下最为关键的挑战之一。

这关乎iPhone和其他产品能否继续保持技术领先地位。

Siri因创新迟缓饱受诟病,随着OpenAI ChatGPT等AI产品爆火,外界的不满愈发强烈。

仅仅九个月前,在开发者大会上,苹果还向投资者保证,将通过Siri升级和其他功能,在AI领域迎头赶上。

对苹果而言,此次延迟发布极为尴尬。

这种困境部分源于其根深蒂固的企业价值观。


苹果对用户隐私的高度重视,使其难以获取大量数据用于模型训练,也难以验证AI功能在设备端的实际效果。

然而,多位曾在AI和软件部门工作的人士透露,苹果内部高层的个性冲突,也是重要原因。

超过六位曾在Giannandrea领导的AI/ML团队工作的前苹果员工表示,领导不力是问题的根源。

他们指出,Walker不仅缺乏雄心,还缺乏承担风险的魄力。

在苹果内部,AI/ML团队松散的氛围和较差的执行力,为其赢得了一个有讽刺意味的外号「AIMLess」(漫无目的,由AI/ML首字母组合变化而来)。

苹果内部对AI/ML团队的负面评价,与Federighi领导的软件工程团队形成了鲜明对比。

软件工程团队凭借在操作系统、信息、照片、邮件和其他应用上的出色工作,声名远扬。

耗时两年,只为去掉「嘿,Siri」的「嘿」

实际上,Siri的问题已存在多年。

2018年,Giannandrea从谷歌跳槽至苹果,负责新成立的AI团队,科技界普遍认为苹果挖到了一位关键人才。

知情人士称,尽管当时一些高管认为Giannandrea可能对负责自动驾驶更感兴趣,但他却对Siri格外关注。

彼时,苹果在2011年推出的Siri,发展已陷入停滞。它对常识性问题表现不佳,对第三方应用的支持也极为有限。

在Giannandrea接手之前,Siri团队的成员在苹果内部就感觉不受重视。

Siri工程师对软件工程团队主导iOS更新不满,认为他们未优先考虑修复Siri的问题。软件工程团队则认为,Siri团队跟不上节奏,无法为Federighi团队推出的新功能提供支持。

Giannandrea曾表示,他有信心借鉴谷歌打造AI语音助手的方法,来改进Siri。

他认为苹果只需获取合适的训练数据,并提升从网络抓取信息,以回答常识性问题的能力。

与Giannandrea共事过的人形容他随和、安静,不爱与人起冲突,这与苹果高管团队中要求严苛、性格强势(A型人格)者形成鲜明对比。


从左至右:Tim Cook、John Giannandrea和Craig Federighi

Giannandrea常向员工阐述他的理念,他坚信机器学习能让产品逐步改进,最终实现重大突破,他称为「爬山」。

他也表达过不看好聊天机器人的观点,在ChatGPT发布后,还曾表示,他认为聊天机器人对用户价值不大

Walker是一位经常受到同事批评的Siri领导者。他于2013年加入苹果,2022年底开始负责Siri日常运营。

在批评者眼中,Walker不愿进行大刀阔斧的冒险,只关注性能提升有限的指标,缺乏革新Siri的长远规划。

他常为一些微小进展沾沾自喜,比如将用户向Siri提问的响应时间缩短几个百分点。

Walker的一个得意之作,是去掉唤醒Siri的语音指令「嘿Siri」中的「嘿」字,这项任务耗时两年多才完成。

Walker还否决了一个提案。团队计划用LLM赋予Siri更强的情感感知能力,使其识别出处于困境中的用户,并作出恰当的回应。

然而,该项目的工程师绕过他,继续与软件工程团队的安全和定位小组合作开发这些功能。

更高的薪酬,更快的晋升?

Federighi领导的软件工程团队和Giannandrea的AI/ML团队,关系愈发紧张,时常陷入僵局。

从管理风格来看,两人截然不同。

Federighi管理严格、要求颇高,Giannandrea则更随和。

开会时,Federighi常常连珠炮似地向同事发问,Giannandrea更倾向于倾听。


John Giannandrea

其他方面的不满情绪也在悄然积累。

软件工程团队部分成员对AI团队同事薪资高、晋升快感到恼火。

他们还愤懑于,一些AI团队工程师能享受更长假期,周五还能提前下班,自己却要面对繁重的工作安排。

两个团队之间的不信任感日益加深。

今年早些时候,Giannandrea的副手要求详细记录一个联合项目的开发过程,以防项目失败后,Federighi团队将责任归咎于AI团队。

Federighi还组建了自己的机器学习团队,这进一步加剧了紧张关系。

Intelligent Systems团队成员达数百人,由其高级副手Sebastien Marineau-Mes负责运营。

他们训练了自己的模型,并构建了多个demo,让用户通过语音指令控制应用程序,且通常无需Siri团队协助。

在一次内部演示中,一名团队成员展示了一张幻灯片,两座山碰撞后夷为平地,一些人认为这是对Giannandrea「爬山」理念的隐晦嘲讽。

2022年,Intelligent Systems团队开始与Walker以及负责Vision Pro的高管Rockwell合作,启动了一个代号为Link的项目,但该项目很快陷入困境。

项目旨在为混合现实头显及AR眼镜开发语音指令,以控制应用程序、完成任务。


Mike Rockwell

参与三方会议的工程师对Rockwell和Marineau-Mes对Walker公开表露的敌意深感震惊。

两人常因Siri在支持Vision Pro方面进展缓慢,对Walker表达不满。

例如,Rockwell期望佩戴头显的用户能用语音通过Siri浏览网页、调整窗口大小。他还设想,在虚拟空间交流的两人能共同与Siri互动,比如一起规划度假。

但Siri团队的部分成员对此表示怀疑。最终,因Siri团队能力所限,Rockwell为Vision Pro设想的许多功能被削减。

参考资料:

https://www.theinformation.com/articles/apple-fumbled-siris-ai-makeover?rc=epv9gi

ad1 webp
ad2 webp
ad1 webp
ad2 webp