CBA

未开始

新疆

04-29

广州

CBA

未开始

浙江

04-29

上海

CBA

未开始

广东

04-28

广厦

CBA

未开始

辽宁

04-28

深圳

CBA

未开始

上海

04-26

浙江

CBA

未开始

广州

04-26

新疆

CBA

未开始

深圳

04-25

辽宁

CBA

未开始

广厦

04-25

广东

CBA

未开始

广州

04-24

新疆

CBA

未开始

上海

04-24

浙江

CBA

未开始

深圳

04-23

辽宁

CBA

未开始

广厦

04-23

广东

西甲第32轮

未开始

皇马

04-22

巴萨

法甲第30轮

未开始

大巴黎

04-22

里昂

西甲第32轮

未开始

阿拉维斯

04-22

马竞

英超第34轮

未开始

富勒姆

04-21

利物浦

德甲第30轮

未开始

多特蒙德

04-21

勒沃库森

CBA

未开始

新疆

04-21

广州

中超第7轮

未开始

北京国安

04-21

青岛西海岸

CBA

未开始

浙江

04-21

上海

中超第7轮

未开始

梅州客家

04-21

上海海港

NBA

未开始

湖人

04-21

掘金

美职联第9轮

未开始

迈阿密国际

04-21

纳什维尔SC

NBA

未开始

太阳

04-21

森林狼

西甲第32轮

未开始

吉罗纳

04-21

加的斯

英超第34轮

未开始

狼队

04-21

阿森纳

沙特联第28轮

未开始

哈森姆

04-21

吉达联合

NBA

未开始

魔术

04-21

骑士

意甲第33轮

未开始

恩波利

04-21

那不勒斯

中超第7轮

未开始

南通支云

04-20

上海申花

CBA

未开始

辽宁

04-20

深圳

CBA

未开始

广东

04-20

广厦

中超第7轮

未开始

成都蓉城

04-20

深圳新鹏城

中超第7轮

未开始

山东泰山

04-20

沧州雄狮

意甲第33轮

未开始

卡利亚里

04-20

尤文

沙特联第28轮

未开始

利雅得胜利

04-19

费哈

CBA

未开始

新疆

04-19

广州

CBA

未开始

浙江

04-19

上海

欧联1/4决赛

未开始

罗马

04-19

米兰

欧联1/4决赛

未开始

西汉姆联

04-19

勒沃库森

欧联1/4决赛

未开始

马赛

04-19

本菲卡

欧联1/4决赛

未开始

亚特兰大

04-19

利物浦

CBA

未开始

广东

明日

广厦

CBA

未开始

辽宁

明日

深圳

NBA

未开始

老鹰

明日

公牛

NBA

未开始

热火

明日

76人

欧冠1/4决赛

未开始

曼城

明日

皇马

欧冠1/4决赛

未开始

拜仁

明日

阿森纳

NBA

已结束

勇士

94

国王

NBA

已结束

湖人

110

鹈鹕

欧冠1/4决赛

已结束

巴萨

1

大巴黎

欧冠1/4决赛

已结束

多特蒙德

4

马竞

U23亚洲杯第1轮

已结束

韩国U23

1

阿联酋U23

U23亚洲杯第1轮

已结束

日本U23

1

中国U23

CBA

已结束

上海

118

北京

英超第33轮

已结束

切尔西

6

埃弗顿

CBA

已结束

深圳

117

北控

CBA

已结束

广厦

109

山西

NBA

已结束

火箭

116

快船

NBA

已结束

掘金

126

灰熊

NBA

已结束

独行侠

86

雷霆

NBA

已结束

湖人

124

鹈鹕

NBA

已结束

爵士

116

勇士

NBA

已结束

活塞

95

马刺

NBA

已结束

太阳

125

森林狼

NBA

已结束

开拓者

82

国王

意甲第32轮

已结束

国米

2

卡利亚里

NBA

已结束

老鹰

115

步行者

NBA

已结束

公牛

119

尼克斯

NBA

已结束

奇才

122

凯尔特人

NBA

已结束

猛龙

103

热火

NBA

已结束

雄鹿

88

魔术

NBA

已结束

黄蜂

120

骑士

NBA

已结束

篮网

86

76人

意甲第32轮

腰斩

乌迪内斯

1

罗马

CBA

已结束

广州

92

青岛

CBA

已结束

北京

116

上海

CBA

已结束

山西

132

广厦

CBA

已结束

北控

99

深圳

CBA

已结束

青岛

96

广州

CBA

已结束

上海

110

北京

CBA

已结束

深圳

106

北控

CBA

已结束

广厦

107

山西

CBA

已结束

上海

95

浙江

CBA

已结束

广州

109

南京

CBA

已结束

山西

117

北控

CBA

已结束

山东

128

宁波

CBA

已结束

深圳

102

北京

CBA

已结束

新疆

121

江苏

CBA

已结束

吉林

107

福建

CBA

已结束

青岛

87

四川

CBA

已结束

天津

113

广东

CBA

已结束

辽宁

101

广厦

港大马毅团队等开源新作：用编码率正则化重构视觉自监督学习范式

2025-03-08 12:02:52

SimDINO团队投稿
量子位 | 公众号 QbitAI

最新开源的视觉预训练方法，马毅团队、微软研究院、UC伯克利等联合出品！

SimDINO和SimDINOv2，通过编码率正则化简化DINO和DINOv2模型训练流程得到的两个最新模型。

在目前视觉预训练领域，DINO和DINOv2是最强视觉模型梯队选手，也是目前最常用的方法。在多模态大模型火热的当下，DINOv2也经常被用作VLM中的视觉编码器提供视觉特征。

此外，图灵奖得主、Meta首席AI科学家杨立昆团队近期关于世界模型的工作，也基于DINOv2而来。

（当然了，DINO模型本身就是四年前Meta AI团队提出的）

但DINO系列目前仍然需要基于非常复杂的工程方法来实现。

而SimDINO通过去除DINO中复杂的后处理步骤等，解决了DINO系列的训练难题。

更令人惊喜的是，简化后的模型不仅训练更容易，性能反而更强。

或许这就是“简单即是美”的设计理念在深度学习中的重要价值？（手动狗头）

马毅表示：

我们不是在修补DINO，而是在重新发现视觉表示学习的本质规律。

核心方法：化繁为简

自监督学习（Self-Supervised Learning，SSL）在处理大规模未标记图像数据方面取得了显著进展。

在CV领域，DINO系列模型堪称自监督学习的标杆选手。

这个无需人工标注就能从海量图像中自主学习特征的模型，不仅在下游任务中屡创佳绩，更成为多模态大模型视觉编码器的标配。

但是，DINO系列模型的强能力，伴随着「需要被精心呵护」：

需要精心设计的温度调度策略（温度参数τ要精确到小数点后三位）
依赖复杂的中心化-锐化操作（堪比精密仪器的校准流程）
必须搭配高维原型投影层（特征维度动辄破万）

这些“保命装置”虽然能防止模型陷入特征崩溃，却让训练过程变成了超参数调优的噩梦。并且当研究人员尝试改进模型架构或适配新领域时，往往牵一发而动全身，稍有不慎就会让整个系统停摆。

为了解决这些问题，SimDINO和SimDINOv2模型闪亮登场～

通过引入编码率正则化，简化训练流程，提高模型的鲁棒性和性能。

这俩模型的核心思想，是通过编码率正则化防止表示崩溃，从而去除原始DINO和DINOv2训练流程中许多经验性设计组件。

具体方法包括：

移除经验性组件：删除权重归一化的线性层、平衡操作（如中心化、锐化）以及各种超参数（如温度调度、中心化动量）等。
引入编码率正则化：在损失函数中添加一个简单的编码率正则化项，以防止表示崩溃。

SimDINO和SimDINOv2模型的主要创新点除了上述2种方法外，还有一点，即简化的训练流程。

通过上述2种具体方法的改进，SimDINO和SimDINOv2的训练流程更加简洁，减少了对超参数的依赖，提高了训练的稳定性和效率。

引入编码率正则化，训练更稳定、性能更强

回顾自监督对比学习“同类相聚，异类相斥”的原始出发点，研究团队发现，DINO中许多复杂设计（如输出层高维投影、教师网络输出中心化-锐化操作、温度调节等）都是在间接地利用负样本信息来防止模型习得的表示“崩溃”。

而SimDINO系列研究团队提出这一需求，可以转而使用马毅提出的数据编码率失真估计方法（可参考MCR2等系列工作），采用显示度量模型表征的质量作为正则化项。

基于这一发现，研究人员提出了一个解决方案：

引入编码率（coding rate）正则化，通过在损失函数中添加一个显式的编码率正则项来避免表示崩溃。

这个简单的改动就能替代原本复杂的设计，将训练流程向简约靠近。

而简化的模型训练流程可以带来几个关键优势，即「更清晰的优化目标、更少的组件依赖、更容易的理论分析、更好的可扩展性」。

具体而言，SimDINO保留了DINO模型的EMA自蒸馏方案和多视图数据增强方法，但在对比学习方案上进行了修改。

抛弃输出层高维原型投影+交叉熵多分类，直接使用欧几里得距离/余弦相似度比较学生网络（student network）和教师网络（teacher network）生成的特征。

加入编码率正则化项促使模型学习到更具区分性的表示，移除教师网络输出中心化-锐化操作、温度调节等避免表示崩溃的技巧。

通过引入编码率正则化，SimDINO能够有效防止特征崩溃，确保学习到的信息具有较大的信息熵，从而提高模型的泛化能力。

SimDINOv2 则进一步将DINOv2 引入的 iBOT机制进行替换。

它直接使用余弦相似度监督掩码区域token与教师网络表示间的对齐，而Sinkhorn-Knopp centering、KoLeo正则化等复杂设计也被简化移除。

相比于原版DINO， SimDINO的训练流程更为简洁，去除了许多繁琐的组件和超参数，降低了模型训练的复杂度，使得研究人员和工程师更容易理解和实现这些模型。

从实验角度看，这一系列操作可以让模型训练更稳定，性能也更强。

各种评估均优于DINO系列

为了验证SimDINO和SimDINOv2的有效性，研究团队在多个数据集和任务上进行了广泛的实验评估，包括图像分类、目标检测、语义分割以及视频对象分割。

实验结果表明，SimDINO系列在计算效率、训练稳定性和下游任务性能上均优于DINO系列。

ImageNet-1K图像分类

SimDINO和SimDINOv2在ImageNet-1K上进行了评估，包括k-NN 分类和线性评估（linear probing）。

还与DINO、DINOv2进行了对比。

COCO val2017无监督目标检测与实例分割

在目标检测任务中，研究团队采用MaskCut作为基础检测框架，并在COCO val2017数据集上进行了评估。

具体来说，主要对比了AP50、AP75和AP三个指标：

ADE20K语义分割和DAVIS-2017视频对象分割

在语义分割任务上，研究团队采用linear head并在ADE20K数据集上进行了评估。

这个任务上主要对比了 mIoU（平均交并比）和 mAcc（平均像素精度）。

特别要提到的是，SimDINO还在DAVIS-2017上进行了评估，包括 (J&F)m、Jm和Fm三个标准指标。

结果显示，它在定性的特征可视化分析上也展现出了DINO系列工作中表现突出的语义表达能力涌现现象。

与此同时，SimDINO和SimDINOv2对超参数和数据的变化更稳健了。

其它

此外，项目论文中通过理论分析，提出了一个关于SimDINO超参数选择的理论：

如何平衡编码率正则化项和距离项的梯度范数。

通过理论推导，作者给出了一个关于超参数γ的选择方法，使得两个项的梯度范数在优化过程中保持平衡。

下图显示的是在SimDINO和DINO下训练 ViT-B/16的训练动态。

X轴表示训练周期（epochs），Y轴表示在ImageNet-1K上的k-NN评估性能。

其中，左图显示的是两个模型均在ImageNet-1K数据集上训练。

为更好地展示优化过程，研究团队省略了早期训练阶段的数据。

右图显示的是两个模型均在 COCO train2017 数据集（大约是 ImageNet-1K的1/10）上训练。

作为一个验证实验，该结果表明SimDINO需要更少的超参数调优，并且优化过程更加简单。

研究团队

SimDINO系列由多所学校与机构的研究者共同完成，包括UC伯克利、忆生科技、微软研究院、香港大学等。

一作是UC伯克利三年级博士生吴梓阳，导师是马毅。

他主要研究方向为表征学习与多模态学习，致力于通过数学与统计理论构建高效、可解释的深度学习模型。

此前，吴梓阳本硕均就读于康奈尔大学。

在论文最后，SimDINO研究团队进一步提出和建议了SimDINO的几个潜在改进方向：

在SimDINO框架基础上进一步探索不需要自蒸馏优化的自监督目标。
简化后的框架为自监督学习的理论分析提供了更好的切入点。
将”显式化隐式设计选择”的范式推广到其他框架，启发并探索其他模型的简化改进方法。

论文地址：

https://arxiv.org/abs/2502.10385
项目主页：

https://robinwu218.github.io/SimDINO
GitHub：

https://github.com/RobinWu218/SimDINO

在野外放一个假的鹿模型，公鹿好不容易鼓起勇气，却换来一生内向

在野外放一个假的鹿模型，公鹿好不容易鼓起勇气，却换来一生内向

嗡嗡生活说 2025-03-06 08:50:32

枫叶漫谈：欧洲人没得选

枫叶漫谈 2025-03-09 13:06:46

绿军终结湖人8连胜双探花合砍71分詹姆斯22+14伤退

绿军终结湖人8连胜双探花合砍71分詹姆斯22+14伤退

网易体育 2025-03-09 12:01:34

中东美军悬了，美国曝光伊朗要用中国卫星图像，给反美组织供坐标

中东美军悬了，美国曝光伊朗要用中国卫星图像，给反美组织供坐标

珠宝鉴赏室 2025-03-10 00:42:06

国家卫健委：我国人均预期寿命达79岁

国家卫健委：我国人均预期寿命达79岁

央视新闻 2025-03-09 15:42:35

函数与几何有关的中考数学真题分析

函数与几何有关的中考数学真题分析

吴国平教育研究社 2025-03-05 17:26:34

美国停止卫星图像支持！乌军困难时刻能否挺住？

美国停止卫星图像支持！乌军困难时刻能否挺住？

二虎涛哥 2025-03-08 08:36:07

用纸壳做的迷你坦克模型，上面安装太阳能板，遇到阳光就会走！

用纸壳做的迷你坦克模型，上面安装太阳能板，遇到阳光就会走！

搞笑包租婆 2025-03-09 13:54:29

美国暂停卫星图像服务，乌克兰对抗俄技术优势受损

美国暂停卫星图像服务，乌克兰对抗俄技术优势受损

数码八叔 2025-03-08 20:07:19

耗时三年，水陆两栖还能开火！男子用不锈钢“手搓”航母模型#高手在民间#国防教育#强大

耗时三年，水陆两栖还能开火！男子用不锈钢“手搓”航母模型#高手在民间#国防教育#强大

荆门晚报 2025-03-09 13:36:32

美女和男友生气，直接给自己气成模型了，男友差点笑进ICU

美女和男友生气，直接给自己气成模型了，男友差点笑进ICU

旅行指南者 2025-03-07 10:48:32

英伟达提出首个Mamba-Transformer视觉骨干网络！打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络！打破精度/吞吐瓶颈 | CVPR 2025

新智元 2025-03-08 11:55:39

返回官邸的尹锡悦：总统职权暂停当晚与夫人共进晚餐

返回官邸的尹锡悦：总统职权暂停当晚与夫人共进晚餐

红星新闻 2025-03-09 16:00:16

尾号“8个7”手机号拍出254.4万元，只有使用权最低月消费1000元

尾号“8个7”手机号拍出254.4万元，只有使用权最低月消费1000元

现代快报 2025-03-09 13:20:13

美国停止向大乌提供卫星图像

菲儿爱追电影 2025-03-09 03:39:26

15岁高一少女解决世界难题拒央视采访：别让我妈看到

15岁高一少女解决世界难题拒央视采访：别让我妈看到

北回归线 2025-03-10 07:55:59

无数据不智能，数据闭环重塑高阶智驾未来

无数据不智能，数据闭环重塑高阶智驾未来

钛媒体APP 2024-10-11 10:25:11

近十年爆火发文流量密码原来是 ta ，想要自学就用这款分析工具

近十年爆火发文流量密码原来是 ta ，想要自学就用这款分析工具

生物学霸 2025-01-13 16:15:51

山东家有老人的快看！最新补贴来了→

山东家有老人的快看！最新补贴来了→

鲁中晨报 2025-03-09 16:03:23

想做企业级智能体的「AutoAgents」，获数千万元天使轮融资 | 涌现好项目

想做企业级智能体的「AutoAgents」，获数千万元天使轮融资 | 涌现好项目

36氪 2025-03-10 09:06:06

重庆北碚区长黄祖英已任重庆市社科联党组书记

重庆北碚区长黄祖英已任重庆市社科联党组书记

澎湃新闻 2025-03-09 18:44:31

量子计算机揭秘山海经

沙雕解说 2025-03-09 03:28:21

两名正部级干部首次亮相两会记者会

两名正部级干部首次亮相两会记者会

上观新闻 2025-03-09 15:29:03

外交部发布重磅视频：行大道，不信邪，不怕鬼

外交部发布重磅视频：行大道，不信邪，不怕鬼

上观新闻 2025-03-09 13:00:20

朝鲜版空警2000惊艳亮相，它的这个雷达组件会是从哪里来的呢

朝鲜版空警2000惊艳亮相，它的这个雷达组件会是从哪里来的呢

施涛说 2025-03-08 16:01:42

住建部：住宅层高标准将调整为不低于3米

住建部：住宅层高标准将调整为不低于3米

央视新闻客户端 2025-03-09 16:30:30

英国数学竞赛题求最大值，学霸构造函数的解法太妙了！

英国数学竞赛题求最大值，学霸构造函数的解法太妙了！

三乐大掌柜 2025-03-08 06:20:12

科学家已制造出反物质，宇宙某处一定存在你的镜像也就是“反你”

科学家已制造出反物质，宇宙某处一定存在你的镜像也就是“反你”

宇宙时空 2025-03-09 20:01:17

女子晒爸爸网购，本想买个板凳，没想到是模型

女子晒爸爸网购，本想买个板凳，没想到是模型

童话鹤壁 2025-03-08 16:28:18

突然爆火！上海确认：1天涌入超4万人！占着不走？拍个不停？有人坦言：被骂习惯了

突然爆火！上海确认：1天涌入超4万人！占着不走？拍个不停？有人坦言：被骂习惯了

上观新闻 2025-03-08 22:29:20

余弦相似度可能没用？对于某些线性模型，相似度甚至不唯一

余弦相似度可能没用？对于某些线性模型，相似度甚至不唯一

机器之心Pro 2025-01-14 14:34:09

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

机器之心Pro 2025-01-30 11:42:50

AI视觉图灵时代来了！字节OmniHuman，一张图配上音频生成视频

AI视觉图灵时代来了！字节OmniHuman，一张图配上音频生成视频

机器之心Pro 2025-02-05 17:10:00

微软AI模型MatterGen能根据需求生成新材料

微软AI模型MatterGen能根据需求生成新材料

量子位 2025-01-21 18:07:40

小红书等给AI图像检测上难度！数据集均通过人类感知“图灵测试”

小红书等给AI图像检测上难度！数据集均通过人类感知“图灵测试”

量子位 2025-02-20 13:27:23

征稿倒计时！CVPR 2025 Workshop共话“基础模型+X”的鲁棒性挑战

征稿倒计时！CVPR 2025 Workshop共话“基础模型+X”的鲁棒性挑战

量子位 2025-03-08 11:51:21

8卡32B模型超越o1预览版、DeepSeek V3等提出层次化RL推理新范式

8卡32B模型超越o1预览版、DeepSeek V3等提出层次化RL推理新范式

机器之心Pro 2025-02-12 11:21:55

10²⁶参数，AGI还需70年！清华人大预测届时GPU总价达4000万倍苹果市值

10²⁶参数，AGI还需70年！清华人大预测届时GPU总价达4000万倍苹果市值

新智元 2025-03-09 14:49:54

AI为赢棋不择手段？篡改代码、窃取棋路，未来或渗透现实决策

AI为赢棋不择手段？篡改代码、窃取棋路，未来或渗透现实决策

DeepTech深科技 2025-03-09 19:01:28

Ilya错了？Scaling另有他用，ViT大佬力挺谷歌1000亿数据新发现

Ilya错了？Scaling另有他用，ViT大佬力挺谷歌1000亿数据新发现

新智元 2025-03-09 12:56:33