昨晚到今天,AI圈有3个重磅消息,中国科技的叙事持续加强。


阿里通义开源RL新模型

阿里通义没有食言,说这周再开源一个RL新模型,昨晚放出来了。最厉害的是32B性能比肩满血DeepSeek R1,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型,现在已经可以在通义APP和网页端体验了。


而且看起来,这个RL训练并没有花费太长时间,阿里的朋友反馈,与以往奖传统励模型不同的是,说这次是通过校验生成答案的正确性来为数学问题提供反馈。


高性能大模型本地化部署门槛进一步降低,现在一个4090就可以了,极限一点大于24G内存(苹果的架构内存GPU可以共享)的Mac mini就可以部署,国补下,4位数内搞定。

影响就是RL的潜力又被放大了,智能硬件的能力的提升可能很快会到来?应用的需求又会爆发,又利好了Agent的发展。


Mac studio可以本地满血DS-R1

苹果发布Mac studio 7w多的价格可以本地满血DS-R1,预计20token/s;(R1满血本地化门槛大幅降低,从70多万到7w多)



Manus AI刷屏

Manus AI这个Monica团队打造的Agent刷屏(虽然很明显是软文广子),但市场对Agent能力有了更多认识和期待,应用端期待更高了。(算力、算力、算力);


这三条,又要改变一些市场对AI的叙事,但可以预见,RL的大规模强化学习的scaling law已经出现,以阿里为代表的中国科技公司将会迎来持续的重估。

⭐星标华尔街见闻,好内容不错过

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

觉得好看,请点“在看”

ad1 webp
ad2 webp
ad1 webp
ad2 webp