计算机视觉与模式识别会议(CVPR)作为全球计算机视觉与人工智能领域最具影响力的顶级学术会议,将于 2025 年 6 月 11 日至 15 日在美国田纳西州召开。
来自清华大学、牛津大学、UCSC、UCLA、中科院等顶尖高校及学术机构的学者届时将联合举办 CVPR 首届计算机视觉推理扩展研讨会(Test-time Scaling in Computer Vision, ViSCALE)。本次研讨会旨在深入探讨 Test-time Scaling(推理时计算扩展,TTS)如何赋能计算机视觉模型、算法及应用。
研讨会介绍
Test-time Scaling 已在大语言模型(如 OpenAI o1/o3 和 DeepSeek-R1 等模型)中取得显著进展,极大提升了模型在复杂任务上的推理能力,正在引领新一轮人工智能浪潮。这一技术同样为计算机视觉的未来发展带来了巨大潜力和广阔前景。通过在分配更多的推理计算资源,视觉模型也能够在感知、理解、推理和决策等复杂任务中实现更高的准确性、鲁棒性和可解释性。更进一步,当 Test-time Scaling 拓展至多模态基础模型,这将促进更复杂的多模态理解和推理能力,以及更高质量的内容生成,进一步推动计算机视觉乃至多模态技术的发展。
本次 ViSCALE 研讨会希望汇聚全球顶尖的学者,共同推动 Test-time Scaling 技术在计算机视觉中的创新应用,探索如何突破现有技术的瓶颈,推动视觉模型在复杂任务中的性能提升。
投稿信息
ViSCALE 研讨会诚挚邀请研究者提交论文,共同探索这一技术对于计算机视觉领域发展的影响,主题包括但不限于:
- TTS 在计算机视觉中的理论分析与应用
- TTS 在多模态理解模型和生成模型中的扩展应用
- 针对视觉模型的高效算法设计,以支持测试时计算扩展
- TTS 带来的可信问题,包括鲁棒性、安全性与可解释性
- TTS 在具身智能、自动驾驶等场景中的应用
- TTS 所带来的新挑战与解决方案
研讨会特别鼓励提交新颖观点和创意思路的研究,将会接受多种类型的投稿:长摘要(Extended Abstracts,1 页)、短文(Short Papers,4 页)、长文(Long Papers,8 页 wo)。研讨会将评选出最佳论文、最佳论文提名等奖项,并奖励以丰厚奖金!
提交方式
OpenReview 提交:https://openreview.net/group?id=thecvf.com/CVPR/2025/Workshop/ViSCALE
截止日期:2025 年 3 月 15 日(AoE)
演讲嘉宾
组织委员会
Test-time Scaling 作为一项前沿技术,正在为模型推理增强带来革命性的变化。欢迎大家积极参与,踊跃投稿并参与讨论。详细信息参见:https://viscale.github.io/