在国内爆火后,Manus的热度终于传递到了海外。
周末,X平台上关于Manus的讨论逐渐多了起来。推特联合创始人杰克·多尔西称赞Manus为杰出的工作;Hugging Face的产品负责人Victor Mustar在体验后认为,Manus是他体验过的最好的AI工具;甚至有人喊出了“第二个DeepSeek时刻”。
然而,随着使用案例的增多,一些潜在的问题也浮出水面。部分用户指出,Manus在使用过程中经常遭遇服务器错误,还容易产生幻觉等问题。有用户认为,Manus或许在内容生产领域上表现不俗,但在编程和科学应用上,还不如传统的谷歌搜索。科技媒体TechCrunch评论称,这只是创新前的一次炒作罢了。
还有用户在测试时发现,Manus运行时的沙盒代码调用的是Anthropic的Claude Sonnet模型,并且加上了开源应用browser_use的代码。
对此,3月10日,Manus联合创始人季逸超在社交平台透露,Manus产品使用了不同的基于阿里千问大模型的微调模型,以及Claude等其他模型。
不过,对于Manus的“套壳”问题,海外讨论较少。他们普遍认为,Manus本身就是一个重要的技术进步,无关套壳与否。这是因为,硅谷已将AI“套壳”应用视作下一个投资风口。
比霉霉演唱会还火,Manus热度传到海外,“第二个DeepSeek时刻”来了?
周末,Manus的热度终于传到了海外。有媒体称,在周末Manus引发的关注度甚至超过了泰勒·斯威夫特(霉霉)的演唱会。
在X平台上,首先是科技作家Rowan Cheung讨论起了Manus。他认为中国的“第二个DeepSeek时刻”来了。
Rowan并不只是看了Manus展示出来的Demo,而是花了一上午去实测。他首先命令Manus创建一个关于他个人的传记并基于此传记部署一个网站。Manus通过他的社交渠道、浏览文章,成功部署了网站,且信息100%准确。
之后,Rowan决定测试一点更贴合现实的用法,他命令Manus找到旧金山最好的租车地点,要符合三个要素:低犯罪率、大量的AI活动和众多野心勃勃的年轻企业家。之后Manus为他提供了四个很准确的选项供他选择。
最后他测试了一项长时间研究任务,要求Manus创建一门关于内容创作人工智能的完整课程。Manus花了近2个小时完成,最终提供了一门包含8章的课程,其中包含工具、用例和提示示例。
经过这些测试后,Rowan认为,Manus并不是炒作,而是实实在在的产品。
在他之后,越来越多的硅谷人士开始关注到了Manus。
Hugging Face的产品负责人Victor Mustar使用Manus编写了一个飞机小游戏,并称其为他体验过的最令人印象深刻的AI工具。之后,他还在评论区补充说道:“Manus会杀死Vibe Coding。”(Vibe Coding是由OpenAI联合创始人Anderj Karpathy提出的概念,即只需要提出需求就能让电脑自行生成代码,)
推特联合创始人杰克·多尔西也转发了Manus的发布视频,并评论道,“杰出。”
风投公司Menlo Venture的AI投资负责人Deedy Das认为,Manus应该被大力宣传,它就是被承诺已久的AI代理。
生物医学科学家Derya Unutamz更是对于Manus在研究方面的潜能大加赞赏。他认为,Manus比OpenAI的Deep Research更具有创新性和全面性。
“与其他AI代理并无区别”,Manus服务器容量不足,幻觉仍是严重问题
随着Manus的热度在海外不断的提升,不少“幸运”用户也开始体验起了Manus。但是,随着使用案例的增多,Manus开始暴露出了一些使用上的问题。
首先是服务器容量不足导致的服务器错误和无限循环。
上文所提到的生物学家Derya Unutamz使用Manus帮助生成研究报告,在接近完成报告的时候发生了错误,在他第二次尝试生成报告时也出现服务器错误,导致失败。而OpenAI的Deep Research只花费了极短的时间就完成了报告。
科技媒体TechCrunch做测试时也遭遇了同样的问题。TechCrunch测试了包括订外卖,预定餐厅位置,买机票等一系列任务,但是无一例外都发生了错误导致任务中止或任务完成质量不高。
因此TechCrunch评论称,目前看来,Manus只是技术创新之前的一次炒作。
除此之外,有用户还指出,Manus容易出现幻觉问题,它更适合做内容输出,而不是编码或是科学研究。
有用户发现,有时Manus输出的结果并不可靠。该用户在尝试做游戏机市场分析时,Manus居然遗漏了任天堂的游戏机,这是一个显而易见的错误。
也有人觉得Manus和市面上的其他代理没有什么区别。
硅谷已将AI“套壳”应用视作下一个风口
有的用户在测试时发现Manus运行时的沙盒代码调用的是Anthropic的Claude Sonnet模型,并且加上了开源应用browser_use的代码。
对此,Manus联合创始人季逸超解释道:“我们确实使用了browser_use的开源代码。事实上,我们使用了许多不同的开源技术,这就是为什么我在发布视频中特别提到,如果没有开源社区,Manus就不会存在。我们将推出一系列致谢和合作。”
季逸超还补充道,在不久的将来,Manus团队将开源不少好东西。
除此之外,季逸超还承认,Manus调用的模型是Claude和微调后阿里的Qwen模型,之后还将更新到Claude 3.7。
针对Manus的“套壳”问题,海外鲜少讨论。他们普遍认为Manus本身就是一个重要的技术进步,无关套壳与否。
海外用户对于Manus的争论主要还是集中其功能是不是像它宣传得那么强大。之所以海内外讨论的焦点不同,是因为硅谷早已将AI“套壳”应用视作下一个风口。
据外媒报道,现在硅谷的每一家风投公司都在热议一种新的初创公司类型,这些初创公司提供AI聊天机器人、研究工具和其他用于编程、临床医生和客户服务的软件应用程序,但是这些应用几乎都基于其他AI开发商创建的大语言模型构建。
近日,专注于为律所提供服务的AI助手Harvey最新一轮融资获得了3亿美元,估值高达30亿美元。
同样地,开发AI编程Agent的Anysphere上一轮融资获得了1.05亿美元融资,估值达25亿美元,年化经常性收入高达一亿美元。最近有消息称,Anysphere还将以100亿美元估值完成新一轮融资。加密货币交易所Coinbase的CEOBrian Armstrong表示,公司所有程序员都在使用Anysphere的Cursor。而Anysphere自己并不研发基础模型,而是套用其他AI公司的大模型进行技术支持。
据外媒报道,Harvey的CEO温斯顿·温伯格回忆道:“那时候市场看不起我们,认为我们就是GPT套壳,完全没有创新。投资人只想把钱投给Anthropic或是OpenAI”。
但现在情况变了,AI公司Decagon CEO Jesse Zhang认为:“目前,很明显应用程序绝对是最好的投资标的,因为有收入,有客户。”
著名风投家Michael Mignano表示,如果人们“认为这些大模型供应商会为每一个可能的用例构建垂直化的应用程序”,那就太“天真”了。相反,将AI引入到从法律到医学等等行业的机会,可能会落到小部分初创公司身上。
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。