导语
长久以来,鲸鱼歌声被视为神秘现象,科学家难以解析其含义。2025年发表在《Science》的研究突破性地发现,座头鲸和蓝鲸的歌声遵循与人类语言相同的统计规律——齐普夫定律和门泽拉特定律。研究团队通过模仿婴儿语言学习模式分析鲸歌,证明即使在亲缘关系遥远的物种间,文化传递的交流系统也能发展出相似结构。这一发现不仅揭开了鲸歌的秘密,还为理解跨物种交流和改进AI语言模型提供了全新视角。
研究领域:齐普夫定律、门泽拉特定律、跨物种交流、文化传递、语言统计结构、进化语言学
郭瑞东| 作者
论文题目:Whale song shows language-like statistical structure 论文地址:https://www.science.org/doi/10.1126/science.adq7055
刘慈欣在其科幻小说《鲸歌》中提起鲸鱼的歌声,文中写到:“海洋科学家们研究鲸歌有很长时间了,至今无法明了其含义。”长久以来,鲸鱼的歌声被视为神秘现象,众多文学作品中对其充满了瑰丽的想象。 2025年发表在《科学》杂志上的一项突破性研究通过模仿儿童学习语言的过程,惊奇地发现鲸鱼的歌声与人类使用的语言存在统计相似性。这一发现不仅揭开了鲸歌的部分秘密,还为理解跨物种交流乃至人工智能语言模型提供了全新视角。
从齐普夫定律看语言的简洁性
为了理解鲸鱼歌声与人类语言的相似性,我们需要先了解语言学中的重要规律。1949年, 语言学家乔治·齐普夫 (George Kingsley Zipf) 发现了一条简单却普适的规律: 在任意语言中,最常用词汇的出现频率大约是第二常用词的2倍。用公式表示即为“排名×频率≈常数”。例如,英语中“the”的使用频率远超其他词汇 (见下表) 。
这种规律性并非语言独有。将单词的使用换成城市的人口,网页的访问,甚至人群的收入,类似齐普夫定律的现象,我们会发现类似齐普夫定律的现象在多个领域中普遍存在。科学家为这类现象起了个更有代表性的名字“幂律法则 (Power Law) ”,读者可参考韦斯特的科普书《规则》或张江的《规模法则》一书了解更多相关内容。
除了上述的齐普夫定律,语言学中还存在齐普夫简洁定律 (Zipf's law of abbreviation) ,该定律指出:使用频次越高的词汇,其时长往往越短。从上表中可以看出,使用最多的十个词,大都是简单的单音词。在法语,德语等众多语言系统中,简洁定律也被证实存在。从进化的角度来看,简洁定律的出现是物尽天择的自然结果。动物发出声音需要消耗能量,也会增加在捕食者面前暴露的风险。但凡话痴,都会被进化淘汰。
除了齐普夫定律,语言学中还存在类似的门泽拉特定律 (Menzerath's law) ,即单词越长,组成单词的音节就越短;句子越长,每个单词的时长就越短。该定律描述了当较长的单词或歌曲由较短的元素 (如音节和音符) 构成时,如何提高交流效率。读者可以想象那些十几个字母的英文单词,例如especially,incredible等,其中每个音节都很短,而在句子层面,复杂的从句大多是由简单的单词组成,不会出现特别长的词。 这一定律揭示了语言为提高交流效率而自然形成的结构特性——通过较短元素构建较长单位的巧妙机制。
简洁的语言,小鲸鱼学起来也更容易
齐普夫定律和门泽拉特定律揭示了一个共同的进化原理:为了应对交流的复杂性,生物会通过使用更短的基本单元来提高信息传递效率,实现“在最短的时间内以最少的能量传递最多的信息” 。
既然是进化的产物,就决定了其不局限于人类,例如对海南树蛙的研究发现,其鸣叫中位置越靠后的音节[1],其时长越短,该现象与门泽拉特定律预测相符,这可能是由蛙类的能量或呼吸限制所致。而蛙类的鸣叫不符合齐普夫定律,对此可能的原因是蛙类的鸣叫功能只在于吸引配偶,而非像人类语言这样用于相互交流。类似的黑猩猩的肢体语言也被发现 遵循门泽拉特定律,但齐普夫定律在它们的肢体语言中并不明显[2]。
那有没有一种动物,其语言即满足齐普夫定律,又满足门泽拉特定律了?如果有,这种动物需要有足够大的社群,足够支撑它们展开内部沟通与代际传播。同时这种动物最好和人类没有多少直接交流,不然研究会模仿人类语言的鹦鹉,那发现的规律到底是动物自然进化的产物了,还是受人类影响的所致了?
鲸鱼和人类的最早共同祖先,可以追溯到一亿年前,其生活的环境也与人类截然不同,但然而,2025年《科学》杂志的一项突破性研究发现,座头鲸及蓝鲸,其发出的声音,遵循齐普夫简洁定律,其中高频使用的音符往往较短,而较少使用的音符则较长[3]。
图1:图中的每个点在代表一个鲸鱼歌声中的子序列,统计在整套数据中发现的所有子序列的频率分布(纵轴),横轴按长度(声音元素的时长)绘制。更频繁的子序列比不那么频繁的子序列更短,符合齐普夫定律。
图2:声音序列的出现次数和持续时间之间呈现幂律
https://doi.org/10.1126/science.adq7055
https://www.science.org/content/article/humpback-whale-songs-are-structured-human-language
破译鲸歌的密码
读者也许会好奇,如果鲸鱼的歌声,真的结构高度有序,由嵌套的层级组件构成——声音元素组成短语,短语重复形成主题,主题组合成歌曲,那科学家是如何从头开始破译这些声音的?答案是科学家借鉴了人类婴儿学习语言时的方法,婴儿听到的是连续的声波信号,他们必须找出词语的边界在哪里,从而识别出一个个词汇。
婴儿的策略很简单:聆听成人话语中不寻常的声音组合。每当婴儿识别出一个,很可能找到了单词之间的边界,因为这些不常见的过渡在单词内部不太可能发生。同样的方案,可用于识别鲸鱼歌声中的“单词”。
图3:将婴儿学习语言的方法用在鲸鱼歌声识别中的示例
除了座头鲸之外,其它鲸类的歌声又是什么情况了?同期刊登的另一项研究[4] ,分析了包括海豚、齿鲸和须鲸在内的16种鲸类动物的歌声序列。发现大多被研究的鲸类遵循门泽拉特定律,而只有蓝鲸和座头鲸遵循齐普夫定律。对此,可能的解释是门泽拉特定律源于生物体的物理限制 (说长句时需要换气) 。而齐普夫定律对应着社会学习和语言的代际传播,考虑到蓝鲸和座头鲸具有复杂的社会结构和文化传承,因此其语言符合齐普夫简洁定律。
研究者还对比了不同物种声音的结构特征。图4展示了不同语言和物种声音的频谱图比较,从上至下依次为英语句子、座头鲸歌声、虎鲸叫声、海豚爆发脉冲以及抹香鲸尾声。可以很明显的看出来,座头鲸和人类的语言之间存在相似,而其余的鲸鱼,其歌声如同鼓手打鼓,通过节奏间隔而非不同声音元素的组合来编码信息。座头鲸歌声呈现的模式,揭示了座头鲸在进化过程中,可能也面临着与人类类似的高效交流需求,而能够进行高效的交流方式则殊途同归。这一研究突显了学习和文化传承在塑造跨物种交流方面的深远作用,挑战了语言的结构特性只属于人类的传统观念。
图4 :英语句子(第一行)、座头鲸歌声(第二行)、虎鲸叫声(第三行)、 海豚爆发脉冲(第四行)以及抹香鲸尾声(第五行)的频谱图
语言的结构很大程度上是由于它如何从一代传到下一代。因此,齐普夫定律不仅在人类中出现,也可能在任何其他通过文化学习 (从一个个体传给另一个个体) 的顺序性声信号的地方出现。这个群体包括鸣禽、蝙蝠、非人灵长类动物、大象、海豹、海豚和鲸鱼。如今我们已经在部分物种中发现了其遵循齐普夫定律,期待未来的研究,能够为我们更多地揭开万千生灵的神秘面纱。
从听懂鲸鱼的歌声到创造一个全新的语言
既然鲸鱼的声音系统遵循着与人类语言相似的规律,那么我们不禁要问:能够识别人类语言的AI模型是否也能解析鲸鱼的声音,甚至理解鲸鱼“语言”中的含义?这一思路已经开始转化为实际研究。。24年来自谷歌的研究团队,开发一种新的鲸鱼生物声学模型。该模型可以识别目前已知的 94 种鲸鱼种类中的 8 个不同的物种[5]。除此之外,鲸鱼 - 地外文明搜索计划” (Whale-SETI) ,更是试图理解鲸鱼的沟通系统,以助力寻找地球之外的生命。这一研究方向基于一个有趣的假设:如果我们能够理解与人类完全不同环境中进化出的复杂交流系统,或许就能为识别和理解潜在的地外智能通信提供关键线索。
这些发现对于理解跨物种交流有何启示?对鲸鱼歌声的研究,说明即使是亲缘关系较远的物种的交流系统可能仍会趋同于相似的结构, 尤其是那些通过文化学习获得且能有效传递信息的复杂系统。而当下人们面对的最复杂的交流系统,正是由人类和大模型共同构成的,23年一篇基于chapGPT 4的研究[6],发现大模型产生的文本,同样符合齐普夫定律。
图5:大模型产生的英文文本和真实英文文本的出现频率和排序
更有趣的是,当用户让大模型产生一个虚拟的语言时并使用产生的虚拟语言进行交流时,大模型产生的语言,以及其对应的英文翻译,同样遵循齐普夫定律。
图6:大模型产生的虚拟语言的词汇频率和排序
当然,这里用到的是较早的chatGPT 4,在以DeepSeek为代表的推理模型上,我们是否还能见到类似的规律,目前还不清楚。不过我们常说的某段文字“AI味太重”,这背后的问题,或许对应着这段文字没有遵循齐普夫定律或门泽拉特定律。例如人类的话语,语言结构 (如句子) 越长,其组成部分 (如句子的从句) 就越短,但推理模型却喜欢用大词或长句。研究者可以招募普通人,让用户对大模型产生的文本有多少AI味进行打分,看看那些人们普遍认为AI味过重的文本,是否偏离齐普夫定律,从而使得用户下意识的觉得这样的句子不适合高效交流。
除此之外,之后人工合成数据,用于大模型训练时,也需要考虑用于训练的数据是否符合齐普夫定律和门泽拉特定律,24年的一篇Nature论文[7 ]指出大模型产生的数据训练大模型,反复数次会导致大模型产生无意义的句子 (模型崩溃) 。明白了鲸鱼如何在代际之间,是如何稳定地传播具有复杂含义的语言,是否能够启发研究者,去了解大模型为何会由于使用自身数据而崩溃的本质原因,甚至创造出更符合进化天道 (齐普夫定律) 的模型了?如果大模型变得如此喜欢用一些似是而非的生僻词汇,是由于其没有对应的身体,不需要面对进化的压力,那是否进化算法,能够成为如今强化学习一般,训练下一代大模型的钥匙了?这些都是从对鲸鱼等动物的研究中能够获得的启示。
https://www.nature.com/articles/s41586-024-07566-y
参考文献
[1] Ke Deng, Yu-Xiao He, Xiao-Ping Wang, Tong-Liang Wang, Ji-Chao Wang, You-Hua Chen, Jian-Guo Cui,
Hainan frilled treefrogs' calls partially conform to Menzerath–Altmann's law, but oppose Zipf's law of abbreviation,Animal Behaviour,Volume 213,2024,Pages 51-59,ISSN 0003-3472,
[2] Chimpanzee gestures follow the same laws as human languages | Royal Society. (2023, November 16). https://royalsociety.org/blog/2019/02/chimpanzee-laws-human-languages/
[3] Arnon, I., Kirby, S., Allen, J. A., Garrigue, C., Carroll, E. L., & Garland, E. C. (2025). Whale song shows language-like statistical structure. Science, 387(6734), 649–653. https://doi.org/10.1126/science.adq7055
[4] Youngblood, M. (2025). Language-like efficiency in whale communication. Science Advances, 11(6). https://doi.org/10.1126/sciadv.ads6014
[5] Whistles, songs, boings, and biotwangs: Recognizing whale vocalizations with AI. (n.d.). https://research.google/blog/whistles-songs-boings-and-biotwangs-recognizing-whale-vocalizations-with-ai/
[6] "Genlangs" and Zipf's Law: Do languages generated by ChatGPT statistically look human?Justin Diamond https://arxiv.org/abs/2304.12191
[7] Shumailov, I., Shumaylov, Z., Zhao, Y., Papernot, N., Anderson, R., & Gal, Y. (2024). AI models collapse when trained on recursively generated data. Nature, 631(8022), 755–759. https://doi.org/10.1038/s41586-024-07566-y
本文为科普中国-创作培育计划扶持作品 作者 | 郭瑞东 审核 | 张江(北京师范大学系统科学学院教授) 出品 | 中国科协科普部 监制 | 中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
AI+Social Science读书会
集智俱乐部联合美国东北大学博士后研究员杨凯程、密歇根大学安娜堡分校博士候选人裴嘉欣,宾夕法尼亚大学沃顿商学院人力资本分析研究组博士后研究员吴雨桐、即将入职芝加哥大学心理学系的助理教授白雪纯子,共同发起。读书会已完结,现在报名可加入社群并解锁回放视频权限。
详情请见:
1.
2.
3.
4.
5.
6.