CBA

未开始

新疆

04-29

广州

CBA

未开始

浙江

04-29

上海

CBA

未开始

广东

04-28

广厦

CBA

未开始

辽宁

04-28

深圳

CBA

未开始

上海

04-26

浙江

CBA

未开始

广州

04-26

新疆

CBA

未开始

深圳

04-25

辽宁

CBA

未开始

广厦

04-25

广东

CBA

未开始

广州

04-24

新疆

CBA

未开始

上海

04-24

浙江

CBA

未开始

深圳

04-23

辽宁

CBA

未开始

广厦

04-23

广东

西甲第32轮

未开始

皇马

04-22

巴萨

法甲第30轮

未开始

大巴黎

04-22

里昂

西甲第32轮

未开始

阿拉维斯

04-22

马竞

英超第34轮

未开始

富勒姆

04-21

利物浦

德甲第30轮

未开始

多特蒙德

04-21

勒沃库森

CBA

未开始

新疆

04-21

广州

中超第7轮

未开始

北京国安

04-21

青岛西海岸

CBA

未开始

浙江

04-21

上海

中超第7轮

未开始

梅州客家

04-21

上海海港

NBA

未开始

湖人

04-21

掘金

美职联第9轮

未开始

迈阿密国际

04-21

纳什维尔SC

NBA

未开始

太阳

04-21

森林狼

西甲第32轮

未开始

吉罗纳

04-21

加的斯

英超第34轮

未开始

狼队

04-21

阿森纳

沙特联第28轮

未开始

哈森姆

04-21

吉达联合

NBA

未开始

魔术

04-21

骑士

意甲第33轮

未开始

恩波利

04-21

那不勒斯

中超第7轮

未开始

南通支云

04-20

上海申花

CBA

未开始

辽宁

04-20

深圳

CBA

未开始

广东

04-20

广厦

中超第7轮

未开始

成都蓉城

04-20

深圳新鹏城

中超第7轮

未开始

山东泰山

04-20

沧州雄狮

意甲第33轮

未开始

卡利亚里

04-20

尤文

沙特联第28轮

未开始

利雅得胜利

04-19

费哈

CBA

未开始

新疆

04-19

广州

CBA

未开始

浙江

04-19

上海

欧联1/4决赛

未开始

罗马

04-19

米兰

欧联1/4决赛

未开始

西汉姆联

04-19

勒沃库森

欧联1/4决赛

未开始

马赛

04-19

本菲卡

欧联1/4决赛

未开始

亚特兰大

04-19

利物浦

CBA

未开始

广东

明日

广厦

CBA

未开始

辽宁

明日

深圳

NBA

未开始

老鹰

明日

公牛

NBA

未开始

热火

明日

76人

欧冠1/4决赛

未开始

曼城

明日

皇马

欧冠1/4决赛

未开始

拜仁

明日

阿森纳

NBA

已结束

勇士

94

国王

NBA

已结束

湖人

110

鹈鹕

欧冠1/4决赛

已结束

巴萨

1

大巴黎

欧冠1/4决赛

已结束

多特蒙德

4

马竞

U23亚洲杯第1轮

已结束

韩国U23

1

阿联酋U23

U23亚洲杯第1轮

已结束

日本U23

1

中国U23

CBA

已结束

上海

118

北京

英超第33轮

已结束

切尔西

6

埃弗顿

CBA

已结束

深圳

117

北控

CBA

已结束

广厦

109

山西

NBA

已结束

火箭

116

快船

NBA

已结束

掘金

126

灰熊

NBA

已结束

独行侠

86

雷霆

NBA

已结束

湖人

124

鹈鹕

NBA

已结束

爵士

116

勇士

NBA

已结束

活塞

95

马刺

NBA

已结束

太阳

125

森林狼

NBA

已结束

开拓者

82

国王

意甲第32轮

已结束

国米

2

卡利亚里

NBA

已结束

老鹰

115

步行者

NBA

已结束

公牛

119

尼克斯

NBA

已结束

奇才

122

凯尔特人

NBA

已结束

猛龙

103

热火

NBA

已结束

雄鹿

88

魔术

NBA

已结束

黄蜂

120

骑士

NBA

已结束

篮网

86

76人

意甲第32轮

腰斩

乌迪内斯

1

罗马

CBA

已结束

广州

92

青岛

CBA

已结束

北京

116

上海

CBA

已结束

山西

132

广厦

CBA

已结束

北控

99

深圳

CBA

已结束

青岛

96

广州

CBA

已结束

上海

110

北京

CBA

已结束

深圳

106

北控

CBA

已结束

广厦

107

山西

CBA

已结束

上海

95

浙江

CBA

已结束

广州

109

南京

CBA

已结束

山西

117

北控

CBA

已结束

山东

128

宁波

CBA

已结束

深圳

102

北京

CBA

已结束

新疆

121

江苏

CBA

已结束

吉林

107

福建

CBA

已结束

青岛

87

四川

CBA

已结束

天津

113

广东

CBA

已结束

辽宁

101

广厦

树搜索也存在过思考与欠思考?腾讯AI Lab与厦大高效树搜索框架

2025-03-21 14:22:26

通讯作者包括腾讯 AI Lab研究员宋林峰与涂兆鹏，以及厦门大学苏劲松教授。论文第一作者为厦门大学博士生王安特。

本文探讨基于树搜索的大语言模型推理过程中存在的「过思考」与「欠思考」问题，并提出高效树搜索框架——Fetch。本研究由腾讯 AI Lab 与厦门大学、苏州大学研究团队合作完成。

论文题目：Don't Get Lost in the Trees: Streamlining LLM Reasoning by Overcoming Tree Search Exploration Pitfalls
论文地址：https://arxiv.org/abs/2502.11183

背景与动机

近月来，OpenAI-o1 展现的卓越推理性能激发了通过推理时计算扩展（Test-Time Computation）增强大语言模型（LLMs）推理能力的研究热潮。

该研究领域内，基于验证器引导的树搜索算法已成为相对成熟的技术路径。这类算法通过系统探索庞大的解空间，在复杂问题的最优解搜索方面展现出显著优势，其有效性已获得多项研究实证支持。

尽管诸如集束搜索（Beam Search）、最佳优先搜索（Best-First Search）、A*算法及蒙特卡洛树搜索（MCTS）等传统树搜索算法已得到广泛探索，但其固有缺陷仍待解决：树搜索算法需承担高昂的计算开销，且难以根据问题复杂度动态调整计算资源分配。

针对上述挑战，研究团队通过系统性解构树搜索的行为范式，首次揭示了该推理过程中存在的「过思考」与「欠思考」双重困境。

「过思考」与「欠思考」

研究团队选取最佳优先搜索算法为研究对象，基于 GSM8K 数据集开展系统性研究。实验设置中逐步增加子节点拓展数（N=2,3,5,10）时发现：模型性能虽持续提升但呈现边际效益递减规律（图 a），而计算开销却呈指数级增长（图 b），二者形成的显著差异揭示出传统树搜索在推理时计算扩展的效率瓶颈。

通过深度解构搜索过程，研究团队首次揭示搜索树中存在两类关键缺陷：

节点冗余：由于大语言模型采样机制的随机性，搜索树中生成大量语义重复节点（图 c）。量化分析采用基于语义相似度的节点聚类方法，定义重复度为平均类内节点数，该指标与计算开销呈现显著正相关，此现象直接导致算法重复遍历相似推理路径，形成「过思考」困境；
验证器不稳定性：引导搜索的验证器存在一定的鲁棒性缺陷，节点评分易受推理路径表述差异影响而产生非必要波动（图 d），在复杂数学推理场景中尤为明显。这种不稳定性可能引发搜索路径的局部震荡，迫使搜索算法过早终止高潜力路径的深度探索，从而产生「欠思考」现象。

Fetch

为应对「过思考」与「欠思考」问题，研究团队提出适用于主流搜索算法的高效树搜索框架 Fetch，其核心包含两部分：

冗余节点合并（State Merging）：通过合并语义重复的节点，有效避免冗余节点的重复探索。
验证方差抑制（Variance Reduction）：采用训练阶段与推理阶段的双重优化策略，降低验证器评分的非必要波动。

冗余节点合并

实验结果

实验结果表明，Fetch 框架在跨数据集与跨算法测试中均展现出显著优势。例如，对于 BFS 及 MCTS 算法，相较于基线，Fetch 计算开销降低至原有的 1/3，并且保持 1~3 个点的准确率提升。

当测试时计算规模逐步提升时，Fetch 带来的增益也更加显著，验证了框架的效率优势。

总结

本研究由腾讯 AI Lab 联合厦门大学、苏州大学科研团队共同完成，首次揭示基于树搜索的大语言模型推理中存在的「过思考-欠思考」双重困境。

分析表明，该现象的核心成因源于两个关键缺陷：搜索树中大量语义冗余节点导致的无效计算循环，以及验证器评分方差过高引发的探索路径失焦。二者共同导致树搜索陷入计算资源错配困境——即消耗指数级算力却仅获得次线性性能提升。

针对上述挑战，研究团队提出高效树搜索框架 Fetch，其创新性体现在双重优化机制：

冗余节点合并机制，实现搜索空间的智能压缩；
验证方差抑制机制，保障搜索方向稳定性。

结果表明，Fetch 在 GSM8K、MATH 等基准测试中展现出显著优势：相较传统树搜索算法，框架实现了计算效率和性能的同步提升。该成果为提升大语言模型推理效能提供了新的方法论支持。

DeepSeek的横空出世，让AI+腾讯云数据库产生了什么化学反应？

DeepSeek的横空出世，让AI+腾讯云数据库产生了什么化学反应？

量子位 2025-03-04 20:07:47

世界模型在机器人任务规划中的全新范式：通用机器人规划模型FLIP

世界模型在机器人任务规划中的全新范式：通用机器人规划模型FLIP

机器之心Pro 2025-03-19 14:50:58

小小冰淇淋机，为何惊动美国总统？ 2017年，3个佛罗里达人因为麦当劳冰淇淋殴打店员；在2024年的

小小冰淇淋机，为何惊动美国总统？ 2017年，3个佛罗里达人因为麦当劳冰淇淋殴打店员；在2024年的

量子位 2025-01-31 10:53:29

敲诈台积电2000亿，特朗普彻底摊牌？巧了，大陆也已做好万全准备

敲诈台积电2000亿，特朗普彻底摊牌？巧了，大陆也已做好万全准备

闫树军论评 2025-03-21 10:50:01

o3并非独门秘技，谷歌已发背后关键机制，方法更简单、成本更低

o3并非独门秘技，谷歌已发背后关键机制，方法更简单、成本更低

量子位 2024-12-23 14:42:33

尼日尔恩将仇报，暴力驱逐中石油高管！中国万亿投资打水漂？

尼日尔恩将仇报，暴力驱逐中石油高管！中国万亿投资打水漂？

丹哥热评 2025-03-20 17:26:38

腾讯2024年净利润1940.7亿元，同比增长68%

腾讯2024年净利润1940.7亿元，同比增长68%

每日经济新闻 2025-03-19 17:45:59

腾讯北极光A2工作室总经理杨峰离职 MMO赛道竞争激烈引发行业深思

腾讯北极光A2工作室总经理杨峰离职 MMO赛道竞争激烈引发行业深思

GPLP 2025-03-22 09:55:08

腾讯2024年报5大亮点

财联社 2025-03-19 22:27:17

欧盟超过一半国家使用华为5G，郭正亮：很多国家不理特朗普！

欧盟超过一半国家使用华为5G，郭正亮：很多国家不理特朗普！

金日无事 2025-03-21 21:15:34

尼日尔恩将仇报，侵吞中国海外资产，中石油22年心血一夜被抢

尼日尔恩将仇报，侵吞中国海外资产，中石油22年心血一夜被抢

躬耕牛 2025-03-19 16:38:30

谷歌新版Gemini免费一句话P图，网友：再见PS

谷歌新版Gemini免费一句话P图，网友：再见PS

量子位 2025-03-20 09:05:32

微软AI模型MatterGen能根据需求生成新材料

微软AI模型MatterGen能根据需求生成新材料

量子位 2025-01-21 18:07:40

杜特尔特翻身有望，眼看马科斯结局不妙，美火速调整对华策略

杜特尔特翻身有望，眼看马科斯结局不妙，美火速调整对华策略

曹兴教授TALK 2025-03-21 17:40:39

超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover

超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover

机器之心Pro 2025-02-25 15:29:28

视频可以精准控制了！一句话给熊戴眼镜的那种，扩散模型立功

视频可以精准控制了！一句话给熊戴眼镜的那种，扩散模型立功

量子位 2025-03-21 15:43:34

铁血龙皮实盘后续：金币盈利超200%，实际盈利超80% #魔兽世界# #网易大神# #我们比你们多一

铁血龙皮实盘后续：金币盈利超200%，实际盈利超80% #魔兽世界# #网易大神# #我们比你们多一

我在右 2025-03-18 14:45:28

尼日尔突然翻脸，驱逐中石油高管，翻脸背后的真相！

尼日尔突然翻脸，驱逐中石油高管，翻脸背后的真相！

执笔写思念 2025-03-21 06:34:21

特朗普：破坏特斯拉的嫌犯可能会被判至多入狱20年

特朗普：破坏特斯拉的嫌犯可能会被判至多入狱20年

财联社CC新闻 2025-03-21 12:10:41

华为获得土耳其5G大单，时讯专家蔡正元深度精辟分析！

华为获得土耳其5G大单，时讯专家蔡正元深度精辟分析！

金日事 2025-03-21 10:55:02

马斯克被白宫背刺，数万人走上街头抵制特斯拉

马斯克被白宫背刺，数万人走上街头抵制特斯拉

阳春三月天晴 2025-03-21 00:37:42

苹果微软特斯拉，最大股东都是它！

苹果微软特斯拉，最大股东都是它！

华商韬略 2024-11-27 18:03:46

数学不好就不要当坏人

乐活影视 2025-03-20 10:21:53

俄方最新对华表态

环球时报 2025-03-21 20:49:28

加拿大超80辆全新特斯拉遭蓄意破坏：利器划花引擎盖，轮胎被扎破

加拿大超80辆全新特斯拉遭蓄意破坏：利器划花引擎盖，轮胎被扎破

凤凰卫视 2025-03-21 11:18:19

直播增速行业第一，京东内容生态成大牌增长新阵地

直播增速行业第一，京东内容生态成大牌增长新阵地

华商韬略 2025-03-21 22:23:20

敲诈中石油，尼日尔突然“翻脸”，4亿美元投资打水漂？

敲诈中石油，尼日尔突然“翻脸”，4亿美元投资打水漂？

火星方阵 2025-03-21 12:03:34

英伟达开源自适应多模态「世界生成」模型！开启机器人、自动驾驶训练革命

英伟达开源自适应多模态「世界生成」模型！开启机器人、自动驾驶训练革命

新智元 2025-03-22 09:10:51

哪有什么简便算法这题？大家帮忙看一下

哪有什么简便算法这题？大家帮忙看一下

公考客栈店小二 2025-03-21 00:00:47

Roblox发布3D智能基础模型Cube，一句话生成游戏资产

Roblox发布3D智能基础模型Cube，一句话生成游戏资产

机器之心Pro 2025-03-21 14:56:44

腾讯混元深度思考模型T1正式版来了

腾讯混元深度思考模型T1正式版来了

华尔街见闻官方 2025-03-22 00:53:59

IBM和Hugging Face联合开源多模态小模型SmolDocling

IBM和Hugging Face联合开源多模态小模型SmolDocling

DeepTech深科技 2025-03-20 17:08:03

240元打造擅长数学的多模态版R1，基于DeepSeek核心思想

240元打造擅长数学的多模态版R1，基于DeepSeek核心思想

量子位 2025-03-20 16:35:32

13年后，AlexNet源代码终于公开：带注释的原版

13年后，AlexNet源代码终于公开：带注释的原版

机器之心Pro 2025-03-21 14:40:38

SPSS 数据分析，掌握这 6 大模块就够了

SPSS 数据分析，掌握这 6 大模块就够了

生物学霸 2025-03-21 18:01:29

AI单季支出390亿，腾讯把钱花哪儿了？

AI单季支出390亿，腾讯把钱花哪儿了？

财天COVER 2025-03-21 18:43:06

中方同意提供帮助，法国打来电话对表，空客CEO下机直奔会面地点

中方同意提供帮助，法国打来电话对表，空客CEO下机直奔会面地点

万俊很zun 2025-03-20 12:54:42

马斯克的特斯拉被打砸烧，司法部长下令严办，美国要进入内战了吗

马斯克的特斯拉被打砸烧，司法部长下令严办，美国要进入内战了吗

王强老师 2025-03-21 15:51:56

美俄即将精诚合作，法国连夜拨通北京电话，空客承诺扩大对华投资

美俄即将精诚合作，法国连夜拨通北京电话，空客承诺扩大对华投资

记者陈彬 2025-03-20 13:25:22

俄乌大结局将至，法国外长要到北京见王毅，空客承诺扩大对华投资

俄乌大结局将至，法国外长要到北京见王毅，空客承诺扩大对华投资

凤凰张霆锋 2025-03-21 14:52:04