编者按:2月23日,中国科协创新战略研究院副研究员程豪在 上发言指出,希望我们在面对DeepSeek时,都能“拥抱便利,应对挑战”。现将其发言整理发布如下:
今天的题目是《DeepSeek:“遇见”与“预见”》,DeepSeek的出现给我们的生产生活带来了很多便利。在构思主题报告题目时,我想聊一聊关于DeepSeek当前发生的故事和未来的展望,所以想到了“遇见”和“预见”这两个词汇。希望我们在面对DeepSeek时,都能“拥抱便利,应对挑战”。
今天的内容分为两部分。第一部分讲“遇见”的事情。“路漫漫其修远兮,吾将上下而求索”,DeepSeek的“Seek”其实就是求索的意思。在“遇见”当中包含三个点。从我们遇见了DeepSeek,到探寻DeepSeek发展的缘由,再到人工智能发展,DeepSeek实际上就是人工智能发展至今的一个产物,从深度学习到深度求索。第二部分是我们对于“预见”未来的预测。我们希望能够在拥抱便利的同时发现更多的需求与挑战,而且在应对挑战的同时,给人们的生产生活带来更多的便利。
第一,如何看待人类历史发展的结晶。实际上人类历史发展至今留下了很多宝贵的财富和典型的代表人物。例如中国历史上杰出的数学家高斯,提出了很多数学理论,对于后来的人工智能,对于现在DeepSeek的算法以及数学原理有奠基作用;例如文艺领域的国师张艺谋;例如中国优秀运动员韩晓鹏。他们是人类智慧从学术、文艺、体育三个方面发展至今的一些杰出代表;巧合的是,在他们重要的人生时刻也与2月23日今天研讨会的日期相同。
1855年2月23日,即170年前,高斯去世,今天就是他170周年的诞辰。铭记他的去世,代表很多人对于数学的重视,到达一种缅怀的程度,给人类的数学发展历史带来了浓墨重彩的一笔。张艺谋在1988年2月23日,37年前,凭借《红高粱》电影在第38届柏林国际电影节获金熊奖,开启了他国师光彩璀璨的人生。韩晓鹏在2006年2月23日,第20届冬奥会上,获得了中国第一枚自由式滑雪项目金牌。他们都是历史中的代表人物。
第二,传统的数据科学当中统计学的关系。统计学是数据的收集、处理、分析、解释,并发现重要结论的学科。从统计学的角度来说,需要通过清晰地认识到这种工具、方法的边界,来结合人类的思考推动实际问题的解释。从猿人到直立行走的人类,需要解释身高测度的问题。原始人类是无法完全直立的,那时如何测量身高呢?距离现在2.7万到3.4万年前的时候,旧石器时代山顶洞人的时候,仿佛已经能够稍微直立一点,距离现在大家比较挺拔能站起来有一些差距。到现在我们测身高,站在机器上,身高、体重、BMI完全给出测度结果。对于我们来说,测身高从200万年以前至今的测度方式,提醒我们可以分段测度,即用分位数,把身体不同的位点分成测量身高的段,测完之后再进行加总,实现对于200万年前猿人身高的测度方式的解决。
在XY二维的散点图可以看到,左侧是常规意义上使用的传统回归,右侧是基于分位数的回归,不仅仅是平均意义上回归的因果关系,更重要的是可以看到不同分位数下,随着北太平洋风速变化的不同规律。这是我们通过从均数到分位数,这样一种测度方式体现我们传统的统计学。
随着计算机的科普、普及以及数据收集、存储功能的强大,和最后可视化分析能力的提高。实际上DeepSeek在“慢思考”并给予我们很大能量,使我们更加接受便利的时候,能够快速地得到估算结果。
接着,统计学这样一个学科发展产生,并达到互联网统计的状态。2016年,我有幸参加了人大统计学院教授一本《互联网统计学》,后来自己也写了一本这个主题的书。统计学随着时代的发展,能够更好地智能化,实现全球化、一体化,为人类提供各种分析、解释、发现规律的智能化工具提供参考。
关于DeepSeek和互联网统计学的双向奔赴,我想从数据科学的角度解释一下它们之间是如何形成具体联系的。拿到数据的过程包含两部分,一个是要收集数据,一个是要进行数据的预处理。什么是预处理?就是要剔除异常值,要把数据的问题清理干净以后,再拿去训练DeepSeek,就是大模型在做的事情。如果数据清理有问题,过多的噪声数据会产生或者导致大模型估计出来的结果有偏差,甚至是错误的。我们一方面希望能够通过统计的推断和预测,用有限的样本和有限的客观事实和案例去推动或者推测整个总体相关的结论;另一方面努力让我们能够通过现代和历史的规律识别出来时间序列的特点,去预测出未来的发展趋势以及未来的发展动态。后者是引入到下一个部分“预见”的领域。传统的统计理论为DeepSeek研发提供了思路和帮助,而传统统计学的创新和发展,包含互联网统计学,也为DeepSeek发展、完善,不断满足人类需求提供一些帮助。
第三,人工智能从深度学习到深度求索。我们已经从学习的状态到了求索的状态。其中“求”就具有很强的目的性和目标性,而“索”是已经进入到一种自由,非常饱满、自由、自主地探索的状态。所以在这里我们说,从神经的生物学、仿生学上的单个神经元,到人工神经元、神经网络、再到深度学习,如今的深度求索(DeepSeek)。在一定程度上,说明人们从模仿学习的状态已过渡到创新求索,不远的将来还会出现特色引领。
“预见”方面,通过结合DeepSeek,可以帮助解决三类问题:一是阈值信号的监测,帮助我们识别主责主业和工作要点;二是用先验信息进行推断,通过学习大量案例和数据形成先验经验预测未来;三是形成网络关系的联系,让DeepSeek提供更加智能化、便捷化、高效化的处理方式和高端、智能、可视化、定制化的可视效果。而且,在充分使用DeepSeek的过程中,人类的智慧、情感、温度、逻辑和思想,是不会被冰冷的机器和制式的程序所取代,在科学应对挑战和提升安全意识的前提下,迎来的是更加便利的共荣和美好。
我们希望在每一个内容当中都能够加入DeepSeek帮我们赋能。路漫漫其修远兮,吾将上下而求索,谢谢大家!
重要!重要!重要!
微信改版打乱发布时间
常有读者朋友错过文章更新
大家可以将“人大重阳”设为星标
点击上方的公众号卡片
再点右上角三个点
就能看到“设为星标”
保持联系,一起前行
// 人大重阳
RDCY
中国人民大学重阳金融研究院(人大重阳)成立于2013年1月19日,是重阳投资向中国人民大学捐赠并设立教育基金运营的主要资助项目。
作为中国特色新型智库,人大重阳聘请了全球数十位前政要、银行家、知名学者为高级研究员,旨在关注现实、建言国家、服务人民。目前,人大重阳下设7个部门、运营管理4个中心(生态金融研究中心、全球治理研究中心、中美人文交流研究中心、中俄人文交流研究中心)。近年来,人大重阳在金融发展、全球治理、大国关系、宏观政策等研究领域在国内外均具有较高认可度。
别忘了“点赞”+“在看”