CBA

未开始

新疆

04-29

广州

CBA

未开始

浙江

04-29

上海

CBA

未开始

广东

04-28

广厦

CBA

未开始

辽宁

04-28

深圳

CBA

未开始

上海

04-26

浙江

CBA

未开始

广州

04-26

新疆

CBA

未开始

深圳

04-25

辽宁

CBA

未开始

广厦

04-25

广东

CBA

未开始

广州

04-24

新疆

CBA

未开始

上海

04-24

浙江

CBA

未开始

深圳

04-23

辽宁

CBA

未开始

广厦

04-23

广东

西甲第32轮

未开始

皇马

04-22

巴萨

法甲第30轮

未开始

大巴黎

04-22

里昂

西甲第32轮

未开始

阿拉维斯

04-22

马竞

英超第34轮

未开始

富勒姆

04-21

利物浦

德甲第30轮

未开始

多特蒙德

04-21

勒沃库森

CBA

未开始

新疆

04-21

广州

中超第7轮

未开始

北京国安

04-21

青岛西海岸

CBA

未开始

浙江

04-21

上海

中超第7轮

未开始

梅州客家

04-21

上海海港

NBA

未开始

湖人

04-21

掘金

美职联第9轮

未开始

迈阿密国际

04-21

纳什维尔SC

NBA

未开始

太阳

04-21

森林狼

西甲第32轮

未开始

吉罗纳

04-21

加的斯

英超第34轮

未开始

狼队

04-21

阿森纳

沙特联第28轮

未开始

哈森姆

04-21

吉达联合

NBA

未开始

魔术

04-21

骑士

意甲第33轮

未开始

恩波利

04-21

那不勒斯

中超第7轮

未开始

南通支云

04-20

上海申花

CBA

未开始

辽宁

04-20

深圳

CBA

未开始

广东

04-20

广厦

中超第7轮

未开始

成都蓉城

04-20

深圳新鹏城

中超第7轮

未开始

山东泰山

04-20

沧州雄狮

意甲第33轮

未开始

卡利亚里

04-20

尤文

沙特联第28轮

未开始

利雅得胜利

04-19

费哈

CBA

未开始

新疆

04-19

广州

CBA

未开始

浙江

04-19

上海

欧联1/4决赛

未开始

罗马

04-19

米兰

欧联1/4决赛

未开始

西汉姆联

04-19

勒沃库森

欧联1/4决赛

未开始

马赛

04-19

本菲卡

欧联1/4决赛

未开始

亚特兰大

04-19

利物浦

CBA

未开始

广东

明日

广厦

CBA

未开始

辽宁

明日

深圳

NBA

未开始

老鹰

明日

公牛

NBA

未开始

热火

明日

76人

欧冠1/4决赛

未开始

曼城

明日

皇马

欧冠1/4决赛

未开始

拜仁

明日

阿森纳

NBA

已结束

勇士

94

国王

NBA

已结束

湖人

110

鹈鹕

欧冠1/4决赛

已结束

巴萨

1

大巴黎

欧冠1/4决赛

已结束

多特蒙德

4

马竞

U23亚洲杯第1轮

已结束

韩国U23

1

阿联酋U23

U23亚洲杯第1轮

已结束

日本U23

1

中国U23

CBA

已结束

上海

118

北京

英超第33轮

已结束

切尔西

6

埃弗顿

CBA

已结束

深圳

117

北控

CBA

已结束

广厦

109

山西

NBA

已结束

火箭

116

快船

NBA

已结束

掘金

126

灰熊

NBA

已结束

独行侠

86

雷霆

NBA

已结束

湖人

124

鹈鹕

NBA

已结束

爵士

116

勇士

NBA

已结束

活塞

95

马刺

NBA

已结束

太阳

125

森林狼

NBA

已结束

开拓者

82

国王

意甲第32轮

已结束

国米

2

卡利亚里

NBA

已结束

老鹰

115

步行者

NBA

已结束

公牛

119

尼克斯

NBA

已结束

奇才

122

凯尔特人

NBA

已结束

猛龙

103

热火

NBA

已结束

雄鹿

88

魔术

NBA

已结束

黄蜂

120

骑士

NBA

已结束

篮网

86

76人

意甲第32轮

腰斩

乌迪内斯

1

罗马

CBA

已结束

广州

92

青岛

CBA

已结束

北京

116

上海

CBA

已结束

山西

132

广厦

CBA

已结束

北控

99

深圳

CBA

已结束

青岛

96

广州

CBA

已结束

上海

110

北京

CBA

已结束

深圳

106

北控

CBA

已结束

广厦

107

山西

CBA

已结束

上海

95

浙江

CBA

已结束

广州

109

南京

CBA

已结束

山西

117

北控

CBA

已结束

山东

128

宁波

CBA

已结束

深圳

102

北京

CBA

已结束

新疆

121

江苏

CBA

已结束

吉林

107

福建

CBA

已结束

青岛

87

四川

CBA

已结束

天津

113

广东

CBA

已结束

辽宁

101

广厦

GPT-4.5登顶6小时即失守！Grok-3上演1分逆袭

2025-03-04 13:29:54

梦晨发自凹非寺
量子位 | 公众号 QbitAI

基础模型竞争又紧张刺激起来了！

GPT-4.5刚登顶竞技场且全任务分类第一名，6小时后总榜就被马斯克的新版Grok-3反超。

两者都是获得3000+票数，总分1412：1411只差一分

目前Grok-3总分第一，只在总体带风格控制、困难提示词带风格控制和略输GPT-4.5一点。

DeepSeek-R1总分第6，数学和困难提示词带风格控制分项与GPT-4.5并列第一。

也有用户对此结果产生了怀疑，仅仅6个小时就能发生如此大的变化吗？

有人解释原因在于，大模型竞技场有一个投票数量门槛，两个一周前发布的模型刚好先后达到3000票才会出现在榜单上。

不过抛开跑分之外，GPT-4.5的口碑也在悄然翻转。

GPT-4.5口碑翻转

GPT-4.5刚发布时显得又大又贵，官方强调情商看起来很虚，看跑分也没比GPT-4o高到哪里去了。

但几天后，夸他情商高的用户确实多了起来。

奥特曼本曼也发表一条感言：有时高品位测试者是对的。

他还爆料，这是这辈子第一次有人发邮件求他承诺以后不会下架这个模型

奥特曼也晒出了一些自己与GPT-4.5对话的聊天记录，针对奥特曼自己写的六个单词小故事“临近奇点，不清楚在哪一侧”，GPT-4.5的看法如下：

作为GPT-4.5，在反思这个有趣的故事时，我认为我们已经超越了奇点的事件视界，但只是刚刚越过。
我们已经进入了人工智能重塑人类思想、创造力、沟通甚至身份的世界。然而，确切的含义——无论是解放还是担忧——仍未定论。
换句话说，我们已经踏入了奇点的引力范围，但要完全理解它可能带来的后果还为时过早。

One More Thing

与此同时GPT-4.5还登顶了一个另类榜单，类似大模型狼人杀：

AI模型参加多轮淘汰赛，比赛中需要公开辩论、私下制定策略并投票淘汰其他人，最终获胜者由被淘汰的参赛者组成的陪审团决定。

在结盟、欺骗、背叛、表现得不具威胁性等方面都是第一，且比人类优秀。

[1]https://x.com/lmarena_ai/status/1896675400916566357
[2]https://x.com/sama/status/1896651354648818121
[3]https://x.com/AISafetyMemes/status/1896579947830849970

又有20+院校初试排名公布！

考研帮 2025-03-03 20:01:27

王天一五度弃子大战德国薛涵第妙手不断登顶世界之巅象棋大师

王天一五度弃子大战德国薛涵第妙手不断登顶世界之巅象棋大师

李全峰全球自驾游 2025-03-01 16:30:32

乐高忍者城攻占钱包，帕恰狗盲盒萌到中风，奥特曼竟能合体成高达

乐高忍者城攻占钱包，帕恰狗盲盒萌到中风，奥特曼竟能合体成高达

酷玩潮CHAO 2025-03-03 09:47:51

时间是什么？爱因斯坦认为：时间是人类的幻觉，原本并不存在

时间是什么？爱因斯坦认为：时间是人类的幻觉，原本并不存在

世良游戏霸 2025-03-03 10:03:09

宇宙中让人不能深思的五个问题，越想越觉得不可思议

宇宙中让人不能深思的五个问题，越想越觉得不可思议

世良游戏霸 2025-03-04 14:30:08

宇宙大爆炸理论遭质疑，宇宙可能没有起点，历史无限久远？

宇宙大爆炸理论遭质疑，宇宙可能没有起点，历史无限久远？

世良游戏霸 2025-03-04 16:05:16

1个表情背后能藏一篇文章，emoji让推理模型大翻车

1个表情背后能藏一篇文章，emoji让推理模型大翻车

量子位 2025-02-23 12:06:20

美国叫停飞机船上运输的援乌武器

美国叫停飞机船上运输的援乌武器

央视新闻 2025-03-04 10:05:24

谁说陀螺不是罗？皇马完败皇家贝蒂斯，痛失登顶良机

谁说陀螺不是罗？皇马完败皇家贝蒂斯，痛失登顶良机

蜡笔足球 2025-03-02 04:42:28

悄悄把媳妇手机换成模型，然后假装生气摔媳妇手机，最后媳妇发飙

悄悄把媳妇手机换成模型，然后假装生气摔媳妇手机，最后媳妇发飙

野外露营分享者 2025-03-03 13:18:14

帅化民：大陆很坏啊，把七代机的模型也拿出来，你美国跟不跟？

帅化民：大陆很坏啊，把七代机的模型也拿出来，你美国跟不跟？

龙悦军急送 2025-03-02 12:56:28

奥特曼公开回怼马斯克：他一生缺乏安全感

奥特曼公开回怼马斯克：他一生缺乏安全感

量子位 2025-02-15 12:09:37

爱因斯坦半辈子也没解决的矛盾！

爱因斯坦半辈子也没解决的矛盾！

宇宙时空 2025-03-04 15:14:21

当年要是真拿到奥特曼版权，那就炸裂了

当年要是真拿到奥特曼版权，那就炸裂了

小六一影视 2025-03-03 09:59:43

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%

量子位 2025-03-04 15:38:32

拳皇98c：爆发速度比莉安娜还夸张！国服一众高手残酷淘汰赛

拳皇98c：爆发速度比莉安娜还夸张！国服一众高手残酷淘汰赛

绯闻游戏解说 2025-03-03 21:26:05

直通南京世锦赛！梁小静排31位基本锁定，16岁陈妤颉入围榜单

直通南京世锦赛！梁小静排31位基本锁定，16岁陈妤颉入围榜单

凌晨4点洛杉矶 2025-03-02 17:23:03

百年轮回，欧洲正在被列强瓜分

枫冷慕诗 2025-03-03 18:16:48

95年我去当兵的名额被挤掉，被迫复读，可如今我们天差地别

95年我去当兵的名额被挤掉，被迫复读，可如今我们天差地别

精英出鞘官方 2025-03-04 13:34:43

沙特外长发布宣传片，脱掉了长袍，换上了西装

沙特外长发布宣传片，脱掉了长袍，换上了西装

青蛙视频 2025-03-03 21:25:29

LOL官方发布全球战力榜！T1登顶BLG排第二，记得向G2索要版权费

LOL官方发布全球战力榜！T1登顶BLG排第二，记得向G2索要版权费

风尘Game 2025-03-04 11:07:06

巴雷特狙击枪跌出前三，全球最强7把狙击枪榜单揭晓！

巴雷特狙击枪跌出前三，全球最强7把狙击枪榜单揭晓！

小宋聊军工 2025-03-03 09:50:58

叠纸、米哈游、腾讯、网易都在这发力，2025年游戏营销三大风向

叠纸、米哈游、腾讯、网易都在这发力，2025年游戏营销三大风向

钛媒体APP 2025-03-04 10:01:06

取“真经”！湖南全省县委书记、县长等跨省赴阿里巴巴、吉利汽车

取“真经”！湖南全省县委书记、县长等跨省赴阿里巴巴、吉利汽车

政知新媒体 2025-03-04 09:07:54

强到让人颤抖！八倍镜还原巴萨连进4球秒杀皇社，6连胜登顶西甲

强到让人颤抖！八倍镜还原巴萨连进4球秒杀皇社，6连胜登顶西甲

董老师看竞技 2025-03-03 04:37:35

中国对原产于美国的部分进口商品加征关税

中国对原产于美国的部分进口商品加征关税

界面新闻 2025-03-04 13:06:12

你到底是谁？你，其实只是波动！

你到底是谁？你，其实只是波动！

宇宙时空 2025-03-04 15:07:48

目前无法解释的5个物理问题，每一个都困扰科学界近百年的时间

目前无法解释的5个物理问题，每一个都困扰科学界近百年的时间

世良游戏霸 2025-03-04 16:05:07

国民党“精准罢免”！赖士葆呛民进党：罢掉也要选得上

国民党“精准罢免”！赖士葆呛民进党：罢掉也要选得上

新时光点滴 2025-03-04 13:04:00

网易财报透露《漫威争锋》即将与其他媒体进行联动

网易财报透露《漫威争锋》即将与其他媒体进行联动

3DM游戏 2025-03-04 14:42:04

GPT-4.5智商测试94，登上LLM竞技场榜首！网友质疑黑幕，实测结果惊人

GPT-4.5智商测试94，登上LLM竞技场榜首！网友质疑黑幕，实测结果惊人

新智元 2025-03-04 16:18:44

GPT-4.5“既差还贵”，再不出GPT-5，OpenAI就难了

GPT-4.5“既差还贵”，再不出GPT-5，OpenAI就难了

华尔街见闻官方 2025-03-04 09:30:49

本科学历但创造出GPT，奥特曼盛赞为「爱因斯坦级」天才

本科学历但创造出GPT，奥特曼盛赞为「爱因斯坦级」天才

量子位 2025-01-01 14:17:10

聊天机器人有时候会“胡说八道”，GPT等模型的“幻觉率”有多高？

聊天机器人有时候会“胡说八道”，GPT等模型的“幻觉率”有多高？

医咖会 2025-02-02 19:05:14

视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

机器之心Pro 2025-03-04 16:23:43

为DeepSeek MoE带来免费午餐加速,专家链可大幅提升LLM的处理能力

为DeepSeek MoE带来免费午餐加速,专家链可大幅提升LLM的处理能力

机器之心Pro 2025-03-04 16:49:07

全球首个人形机器人马拉松来了！机器人将与运动员同时起跑，中途可更换电池

全球首个人形机器人马拉松来了！机器人将与运动员同时起跑，中途可更换电池

每日经济新闻 2025-03-04 17:00:10

宇宙起源于奇点，奇点外面又是什么？

宇宙起源于奇点，奇点外面又是什么？

宇宙时空 2025-03-03 18:47:38

是谁在背后控制着宇宙的一切？或许爱因斯坦的猜想是对的

是谁在背后控制着宇宙的一切？或许爱因斯坦的猜想是对的

世良游戏霸 2025-03-04 13:26:07

奇点回响，从硅基纪元到生态重置的艺术探索

奇点回响，从硅基纪元到生态重置的艺术探索

外滩TheBund 2025-03-03 17:02:12