The Geometry and Dynamics of Meaning
意义的几何与动态
https://onlinelibrary.wiley.com/doi/pdf/10.1111/tops.12767
摘要
人类语言中的一个谜团是,儿童能够极其快速地学会理解母语中的词汇。认知科学至今尚未完全理解这一高效学习过程背后的机制。为至少部分解答这个问题,我开发了一个关于自然语言语义的认知模型,该模型以概念空间为基础。我提供了概念空间的背景知识,并简要总结了其主要特征,特别是它如何处理概念的学习。然后,我将该模型应用于对不同词类语义的几何解释。具体而言,我提出了一个“单域假设”,用于解释除名词以外的所有词类的语义。这些假设为词汇学习之谜提供了一个部分答案。接着,我引入了一个动态认知事件模型,该模型取代并扩展了论元角色的功能。我将其应用于分析不同类型动词的意义。我认为,该模型还解释了句法结构的一些方面。特别是,我提出句子通常指代一个事件。最后,我简要介绍了概念空间的一些进一步应用。
关键词:认知语义学;词汇学习;几何表征;概念空间;事件认知;力动态
1. 一个谜团
掌握一门语言不仅仅是掌握词汇(词汇表)和将它们组合在一起的规则(语法),更重要的是掌握词汇的意义(语义)。我们并非生来就拥有语言,因此词汇与其意义之间的映射必须通过学习获得。儿童学习新词汇的速度惊人地快。一个青少年在高中毕业时通常能理解母语中的50,000到60,000个词汇。简单的计算表明,她在童年时期平均每天学习9到10个词汇(Carey, 1978)。没有任何其他形式的学习如此高效。然而,其背后的学习机制在很大程度上仍然是未知的。
儿童学习词汇的过程可以与人工神经网络的学习过程进行比较。例如,像ChatGPT这样的系统在普通语言交流方面已经变得非常熟练。然而,这些系统在能够令人满意地运作之前,必须经过数十亿个示例的训练(而且它们是否真正理解文本仍然存疑)。相比之下,儿童往往只需一个词汇使用实例就能学会其意义。谜团在于儿童的学习过程是如何运作的。
第一个线索是,词汇的意义并不是任意的。我们的思维感知到世界中存在的各种结构,而词汇的意义在很大程度上遵循这些结构。另一个线索是,新词汇的句法标记通常会揭示其词类(Bloom, 2002)。这些标记帮助儿童在听到名词时寻找一个物体,在听到形容词时寻找物体的属性,在听到动词时关注事件的某个方面,依此类推。
在我的研究中,我关注的是自然语言的语义。在我的逻辑研究阶段,我曾研究模型论语义学,包括蒙塔古语义学,但我发现自然语言中表达式的许多意义类型很难用这种语义学进行分析。因此,我转向了认知语义学。我发现图像图式(image schemas)的概念——由兰加克(Langacker)、拉科夫(Lakoff)、塔尔米(Talmy)、赫斯科维茨(Herskovits)等人发展出来——很有吸引力。然而,我也意识到,什么可以被算作图像图式并没有太多限制。因此,我试图提出一个更具原则性的解释。
研究成果已在我出版的《概念空间》(2000年)和《意义的几何》(2014年)两本书中呈现。第二本书的主要贡献是对不同词类的语义分析。语言学家通常根据句法特性定义词类:名词有复数形式,动词有时态,等等。然而,在学校入门级教学中,通常使用语义标准来教授词类——例如,名词表示事物,动词描述动作——但这些标准很少以系统且严谨的方式呈现。我的目标是展示基于认知和交际约束,可以为词类提供一种(无句法依赖的)语义分析。在第2节中,我介绍了概念空间作为一种几何方式来表示意义。在第3节中,总结了对一些主要词类的分析。
由兰加克(1987年)和拉科夫(1987年)发起的认知语义学聚焦于普通空间作为基础意义结构。然而,塔尔米(1988年)在早期便指出,力(force)也扮演着重要角色。当我描述动词的语义时,我将他的力动力学推广到一般动词。动词可以分为方式动词和结果动词。结果动词的意义可以用属性空间中的向量来描述。然而,方式动词需要力域(force domain)。换句话说,要发展一个令人满意的语义认知理论,既需要几何学也需要动力学。
词汇并不是孤立存在的,而是通常组合成句子。在逻辑传统中,句子的意义通过真值条件来定义。然而,这对于我们如何理解词汇意义的方式并没有太大启发。作为替代方法,我和马西莫·瓦尔利恩(Massimo Warglien)共同提出了一个认知事件模型(Gärdenfors & Warglien, 2012)。该模型的基本结构包含四个组成部分:施事者(agent)、力向量(force vector)、受事者(patient)和结果向量(result vector)。这些元素通过概念空间赋予结构(Gärdenfors & Warglien, 2012)。基本语义论题认为,句子通常表达事件(或作为特殊情况的状态)。第4节将介绍事件模型及其在语义学中的一些应用。第5节总结了我的语义学研究计划,并将其应用于语言学中的一些基本问题。第6节简要介绍概念空间理论的一些进一步应用。
2. 概念空间
概念空间理论(Gärdenfors, 2000, 2014)基于关于概念结构的两个核心思想:(i) 信息被分类到诸如空间、力、颜色和形状等域中;(ii) 域具有几何或拓扑结构。该理论是一种新康德主义项目,旨在揭示人类思维的基本结构。例如,概念空间的域可以被视为康德提出的“直观形式”(Anschauungsformen)的延伸。概念空间被提出作为理论实体,假设它们能够反映认知结构。
2.1. 域
在认知语言学中,域的概念是核心。根据兰加克(Langacker, 1987),文献中普遍倾向于以一种包罗万象的方式解释域的概念。兰加克(2008,第44页)写道:“该术语被广泛解释为表示任何种类的概念或经验领域。”我和西蒙·勒恩多夫(Simone Löhndorf)一起指出,兰加克对域的概念混淆了多个在词汇意义分析中涉及的组成部分(Gärdenfors & Löhndorf, 2013)。特别是,我们认为他对位置域和配置域的区分具有误导性。他的配置域更适合被视为与部分和整体之间关系相关的分体论信息,而不是与域相关的内容。
我将自己局限于兰加克所谓的“维度性”域。这似乎也是认知心理学中“域”的用法。即使我们对许多域的几何结构知之甚少,但显然存在一些非平凡结构的例子。心理学有长期分析感知结构维度的传统。谢泼德(Shepard, 1987)认为,一旦与特定域相关的感知可以通过相似性进行分级,就可以使用数学技术提取一个低维空间来表示相似性判断。通过这种方式,已经识别出大量感知空间。
域由质量维度组成。一维域包括高度、温度、时间和音高。然而,许多域是多维的,例如(物理)空间、颜色、味觉和力。
域的概念被定义为一组与其他所有维度分离的积分维度。例如,颜色属性包含颜色感知的三个基本维度:色调、饱和度和亮度(见图1)。概念空间理论的一个核心论题是,自然属性(如颜色)对应于单一域中的凸区域。这在Gärdenfors(2000)中被称为“准则P”。当区域中任意两点x和y之间的所有点也都在该区域内时,该区域即为凸区域。这一论题已获得实证支持,例如针对颜色类别(Jäger, 2010)。
概念空间的核心概念被定义为一个或多个域的集合,以及一个表示对象之间相似关系的距离函数:空间中两点越接近,它们所代表的对象就越相似。
在此框架内,对象被视为概念的实例,并映射到空间中的点,而概念则被表示为空间中的区域。
2.2. 神经科学相关性
大脑皮层中充满了拓扑图,这些图保留了感觉外围的邻接关系,并在中枢神经系统的不同区域中以神经元排列的形式呈现出来。例如,可以找到表示身体上感觉位置的躯体拓扑图;还有音高拓扑图,将声音的音高维度转换为沿耳蜗的空间维度。这些拓扑图对应于不同的表征域,因为它们中的大多数都保留了感官的模块化特性。
最近,海马系统被提出不仅用于表示普通空间中的位置,还可以表示不同种类的概念空间(Bellmund, Gärdenfors, Moser, & Doeller, 2018; Constantinescu, O’Reilly, & Behrens, 2016; Theves, Fernandez, & Doeller, 2019)。动态映射系统通过跨不同概念域的正交表征之间的重新映射,能够快速重组“坐标系统”。结果是在不同分辨率和层次结构上形成了多种认知空间。
在普通空间导航过程中,海马体中的位置细胞在特定位置表现出增强的放电活动。而相邻的内嗅皮层中的网格细胞则在环境中的多个位置放电,这些位置形成一个六边形网格。结合位置细胞和网格细胞的信息,这些细胞生成自我定位。这种编码还支持几何计算,在规划空间导航时通过距离和方向的表征进行运算。
多项研究表明,类似的机制也被用于涉及其他概念空间的任务中(Zheng et al., 2024)。一个例子由Nitsch等人(2024)提供,他们研究了在决策任务中使用的二维价值空间如何在大脑中表征。结果表明,内嗅皮层呈现出一种网格状表征,其方向与对选择最相关的价值空间轴线对齐。这些实验表明,网格细胞充当了一种“通用坐标系统”,可用于表征多个不同的概念空间。
2.3. 属性与概念
我在技术上区分了属性和概念:属性是单一域中的凸区域,而概念则是多个域中凸区域的综合体。正如我将在下一节中论述的那样,形容词通常指向单一域,而自然语言中大多数名词的意义只能被描述为多个域中属性的集群。
以“狗”这一对象类别为例,作为范例。当我们还是孩子时遇到狗,我们学习的主要域包括形状、大小、声音、气味、颜色和纹理。我们还学习不同类别的物质组成,例如狗和其他动物一样由皮肤、肌肉和骨骼构成。同时,我们还学习有关狗的其他域,例如它们的典型行为(动作域)、生物学特性以及它们在人类社会中的角色。我们还会学习狗的各个部分及其相互关系。
即使多个域参与了对一个类别的表征,并非所有域在确定对象相似性时都具有相同的显著性。例如,狗的形状比它的气味更显著。一个域的显著性可以定义为对该域所给予的关注程度。这意味着显著性是依赖于上下文的。为了建模显著性,我假设一个类别的表征还包含关于域权重的信息(参见Gärdenfors, 2000, 第4.2节)。这些权重用于确定空间中的距离函数以及不同对象之间的相似程度。由于一个属性被分配到特定的域,该域的显著性可以用作衡量某一属性对特定类别特征性的指标。这种构建意味着相似性判断与特征属性之间存在密切联系(Gärdenfors & Osta-Vélez, 2023)。
2.4. 与原型理论的联系
属性和概念由凸区域表示的标准,从罗施(Rosch)及其合作者发展出的分类原型理论中得到了独立支持(例如,参见Hampton, 2007; Lakoff, 1987; Mervis & Rosch, 1981; Rosch, 1975)。原型理论的核心思想是,在一个对象类别(例如那些实例化属性或概念的对象)中,某些成员被认为比其他成员更能代表该类别。例如,知更鸟被认为比乌鸦、企鹅和鸸鹋更能代表“鸟类”这一类别。一个类别中最具代表性的成员被称为原型成员。
当自然属性被定义为概念空间中的凸区域时,确实可以预期会出现原型效应。在凸区域中,可以描述位置为更中心或更边缘。特别是,如果空间具有度量,则可以计算一个区域的重心。通过使用概念空间的度量,可以将属性表示为空间中更典型或更不典型的类别成员,具体取决于它们与原型的距离(Hampton, 2007; Osta-Vélez & Gärdenfors, 2022a)。
也可以反过来论证,并表明如果采用原型理论,那么至少在度量空间中,属性作为凸区域的表征是可以预期的。假设给定了某个概念空间S的一些质量维度,例如颜色空间的维度,并且希望将其划分为多个类别,例如颜色类别。如果从一组类别的原型p1, …, pn开始,例如焦点颜色,那么这些原型应该是它们所代表类别的中心点。如果假设S是一个度量空间,则可以利用关于原型的信息生成分类。为了理解这一点,假设S配备了欧几里得度量,使得对于空间中的每个点p,可以测量p到每个原型的距离。如果现在规定p属于离它最近的原型所在的类别,则可以证明这一规则将生成空间的划分——即所谓的沃罗诺伊镶嵌(Voronoi tessellation)。沃罗诺伊镶嵌的示意图见图2。
沃罗诺伊划分的一个关键性质是,沃罗诺伊镶嵌总是将空间划分为凸区域(参见Okabe, Boots, & Sugihara, 1992)。
2.5. 概念学习模型
原型理论并未解释原型效应是如何作为概念使用学习的结果而产生的。该理论既无法说明新概念如何从相关范例中创建,也无法解释当同一类别中的新概念被学习时,概念的外延是如何变化的。接下来,我将概述概念空间如何至少部分地解释词汇学习之谜。概念空间域的划分并非先天的,因此概念空间的相关区域必须借助语言学习者的经验来创建。为了有用,这些概念不仅必须适用于已知案例,还应能够推广到新的情境中。
学习一个概念通常通过对该概念有限数量的范例进行归纳来进行(例如,参见Langley, 1996; Nosofsky, 1988; Reed, 1972)。采用概念具有原型的观点,我们可以假设从这些范例中提取出该概念的典型实例。如果范例被描述为概念空间中的点,则可以使用一个简单的规则来从一组范例中计算原型:代表原型的点p被定义为所有范例的平均值(Langley, 1996, 第99页)。以这种方式定义的原型随后可用于生成沃罗诺伊镶嵌。
应用这一规则意味着原型并非被假定为先验给定的,而是由主体的经验决定的。图3展示了一组九个范例(用不同填充的圆圈表示),分为三个类别。取这三个组的平均值,在空间中生成三个原型点(用黑色十字表示)。这些原型随后决定了空间的沃罗诺伊镶嵌。
这里展示的学习机制表明,如何基于每个概念的少量范例对概念的应用进行归纳。归纳所需的额外信息是从底层概念空间的几何结构中提取的,这种几何结构用于计算原型和生成沃罗诺伊镶嵌。通过这种方式,概念空间的几何结构为经验提供的信息增添了新的内容。这里概述的学习机制为词汇意义如何快速学习提供了线索。
3. 词汇意义的几何学
为什么会有词汇的存在?为什么我们不像鸟类和鲸鱼那样用无词的歌声交流?简短的回答是,我们需要用词汇来交流概念——尤其是对象、动作和空间概念(Carey, 2009; Spelke, 2000)。
我主要将概念空间作为一种工具,用于表征自然语言中词汇的意义。在本节中,我总结了Gärdenfors(2014)对一些主要词类的分析。不同语言以不同的方式分类词汇。由于对其他语言群体的知识有限,我在此研究印欧语系的主要词类。我专注于儿童在早期发展阶段学习的基本词汇,而将更抽象词汇的分析留待后续研究。
3.1. 形容词
这里的核心思想是,基本形容词表达属性,例如颜色、形状和大小。根据我对属性的定义,这引出了以下论题:
形容词的单域论题:形容词的意义可以表示为单一域中的凸区域。
例如,我在Gärdenfors(2000)中假设,自然语言中的所有颜色术语在颜色域中都表达凸区域。这意味着,例如,没有任何一种语言会用一个词来表示“绿色或橙色”,因为这样的词会在颜色域中代表两个不相连的区域。这一假设得到了Jäger(2010;另见Douven & Gärdenfors, 2020; Regier, Kemp, & Kay, 2015)的强有力支持。此外,单域论题还意味着,例如,没有形容词会表示“长且热”,因为这样的词会涉及两个不同的域。
形容词还用于比较事物:大多数语言都有应用于一维域的比较级,例如“更高”和“更聪明”。许多语言还有最高级,例如“最高”和“最聪明”,它们可以从比较级中定义出来。
3.2. 名词
普通对象的类别可以被视为涉及多个域的概念,这与属性形成对比。例如,一个苹果有大小、形状、颜色、味道、重量等特征。我将这样的类别视为名词最基本的意义。儿童最早学习的名词就是这种类型。
当然,也有名词指代许多其他类型的实体。例如,抽象名词没有物理参照物,如“法律”、“退休”、“通货膨胀”和“心智”。莱昂斯(Lyons, 1977,第442-445页)区分了三种基本的“阶”:(1) 物理对象;(2) 事件、过程、事态;以及 (3) 超越时空的命题、模式等。第(2)类和第(3)类名词需要使用不同于第(1)类对象类别的意义域。
更正式地说,名词可以被表征为多个域中凸区域的乘积。不同域显著性的信息也包含在名词意义的表征中。兰加克(Langacker, 1987)称此为域的“凸显”(profiling)。例如,“鱼卵”和“鱼子酱”都指鱼卵,但“鱼卵”使生物学方面更加显著,而“鱼子酱”则突出了食物域。更简单的例子是,水果不包括情感域,抽象名词不包括物质域,因此这些域不包含在概念的表征中。
对于大多数名词,构成它们的域可以以不同的方式相关联。例如,在“水果”的情况下,大小域和重域或成熟度、颜色和味道域之间存在共变关系。奥斯塔-贝雷斯和加登福斯(Osta-Vélez & Gärdenfors, n.d.)提出,与某一对象概念相关的域之间的共变越多,该概念被认为越连贯。一般来说,自然种类被认为比人工制品更连贯(Gelman, 2003)。如果一个概念,比如“鸟”,具有相互关联的属性簇,例如“飞行”、“羽毛”、“翅膀”和“喙”,那么它的连贯性值会很高。这种属性簇通常不会出现在人工制品中。
即使是在表示物理对象的名词中,也可以找到不同类型。一个重要语义区别在于质量名词(如“银”、“沙”、“水”)和可数名词(如“汽车”、“房子”、“花”)之间的差异。一些名词可以两种方式使用:比较“碗里有五个苹果”(可数用法)和“在馅饼皮上放两杯苹果”(质量用法)。我对质量-可数区别的解释是,对于质量名词,物质域最为显著——形状域的重要性较低。例如,“苹果”作为质量名词仅涉及物质。对于可数名词,则相反。这是另一个通过调整域显著性来改变词汇意义的例子。
对于抽象名词,物质域和空间位置都不相关。对于表示地点的名词,只有空间域是相关的。这些例子表明,可以通过考虑哪些域显著、哪些域无关,对名词进行语义分类。
分析不同名词显著的域还可以解释为什么某些形容词和名词的组合在语义上显得别扭。例如,“圆形的银”难以理解,因为形状域对于质量名词“银”来说是无关的。同样,“快乐的苹果”听起来不恰当,因为对于“苹果”来说,情感域是无关的。
3.3. 动词
在描述动词语义时,考虑所涉及的域也很有用。传统上(Levin & Rappaport Hovav, 1991; Talmy, 1975, 1985),动词的划分主要有两种方式:
1. 方式与路径,例如“慢跑”与“穿过”;
2. 方式与结果,例如“擦拭”与“清洁”。
莱文和拉帕波特·霍瓦夫(Levin & Rappaport Hovav, 2013; Rappaport Hovav & Levin, 2010;另见Talmy, 2001,第1章)将这两种划分简化为一种,通过区分方式动词和结果动词——“方式动词的意义中包含执行动作的方式,而结果动词的意义则指结果状态的发生”(Rappaport Hovav & Levin, 2010,第21页)。
从域的角度来看,方式动词表示动作。根据我之前对动作的分析(Gärdenfors, 2007, 2014),力域是显著的。例如,“推”可以通过施事者施加的力向量来描述。相比之下,结果动词表示位置变化(路径动词),即空间域的变化,或物体属性的变化,这使得物体类别的域变得显著。例如,“移动”指的是结果向量的空间域变化,而“加热”指的是温度域的变化。这些变化可以用从域的初始状态到最终状态的向量来表示。
关于动词语义的关键论题可以总结如下:
动词的单域论题:方式动词指向力域中的凸区域,结果动词指向空间域或某些物体类别域中的凸向量集合。
动词的单域论题与形容词的单域论题类似。同样,我认为这些空间的区域是凸的。这一约束意味着没有表示“走路和燃烧”(多域)的动词,也没有表示“爬行或奔跑”(非凸)的动词。
动词的单域论题结合域的分类,可以解释为什么方式动词和结果动词自然地构成两个类别。该论题的一个结果是,方式/结果的区别基本上是原因/效果的区别:方式动词指向原因,结果动词指向效果。
一个重要的问题是,如何借助概念空间表达方式动词的意义。一个想法来自Marr和Vaina(1982),他们扩展了Marr和Nishihara(1978)的圆柱模型,用于分析动作。在Marr和Vaina的模型中,动作通过微分方程描述身体部位的运动,例如行走的人体。应用牛顿力学可以清楚地看出,这些方程可以从作用于腿部、手臂和其他身体运动部分的力推导出来。尽管我们的认知可能并非完全按照牛顿力学构建,但我相信我们的大脑能够提取不同种类运动和动作背后的力(见第4.1节)。与此一致,我认为动作的基本认知表征由生成它的力模式组成(Gärdenfors, 2007; Gärdenfors & Warglien, 2012)。例如,跑步时的力模式与行走时的力模式不同;敬礼的力模式与投掷的力模式也不同(Gharaee, Gärdenfors, & Johnsson, 2017; Malt等, 2014; Vaina & Bennour, 1985)。然而,需要强调的是,大脑表征的“力”是理论构造,而非牛顿引入的科学维度。
3.4 介词
大多数介词可以分为两类:表位置的介词,表示某物在哪里;以及表方向的介词,表示某物正在往哪里去。表位置的介词在空间域中指定一个位置(区域)。另一类功能由表方向的介词完成。例如,在句子“奥斯卡去了图书馆”中,“去图书馆”这一短语具有与结果动词相同的语义功能:它指定了事件的结果向量(参见第4.1节)。我的提议是,表位置的介词由点的凸集表示,而表方向的介词由路径的凸集表示。
表位置和表方向的介词依赖于空间域。通常,这个域通过笛卡尔坐标系来表示,该坐标系包括宽度、深度和高度,并且距离使用欧几里得度量进行测量。然而,还有另一种表示空间的方式,即通过极坐标来表示,这种方式通过原点的距离以及水平角和垂直角来描述空间中的点。可以在极坐标的框架下定义一种新的“中间”概念,从而形成与标准欧几里得中间性不同的凸性定义(关于技术细节,参见 Gärdenfors, 2014, 第11章;Zwarts & Gärdenfors, 2016)。例如,围绕原点的半圆上的点集合根据极凸性的定义构成一个凸集。基于这种凸性的定义,可以证明大多数表位置的介词,如“inside”(内部)、“outside”(外部)、“near”(附近)、“far”(远处)、“in front of”(前面)和“behind”(后面),都可以用点的凸集来表示。
类似地,路径的中间性关系也很容易定义(Zwarts & Gärdenfors, 2016),从而定义路径集合的凸性。基于这样的定义,很容易证明表方向的介词的意义,例如“to”(到)、“from”(从)、“into”(进入)、“out of”(出来)、“through”(穿过)、“along”(沿着)和“across”(横越),都对应路径的凸集。
与语言学中的许多分析不同(Herskovits, 1986;Zwarts & Winter, 2000),我认为介词不仅仅涉及空间域。一些介词涉及时间域。在英语中,最常见的例子是“before”(之前)和“after”(之后)。此外,大多数典型用法的介词“against”(对抗)、“over”(上方)、“on”(在…上)和“in”(在…内)依赖于力的领域(有关论证,参见 Gärdenfors, 2014, 第11章;Vandeloise, 1991)。
对于介词“on”,其语义表示涉及接触和来自下方的支撑。仅依靠空间区域不足以确定“on”的意义。我提出“x 在 y 上”的意义是,来自 x 的力向量使 x 与 y 接触,而来自 y 的反作用力平衡了这个力向量。通常,这个力向量是由重力产生的。因此,力的维度对于建模“on”的意义是必需的。力与反作用力之间的相互作用如图4所示,其中人们会犹豫是否说灯在气球“上”,因为与“on”的典型用法相比,这里的力关系被颠倒了。
与形容词和动词语义分析一致,我提出了以下论点:
介词的单域论题:介词在单一领域内表示点、路径或向量的凸集。
在此,我讨论了介词的基本意义,并将其分配到单一领域中。然而,介词经常被隐喻性地使用,这时领域会发生变化。例如,在“We meet at noon”(我们在中午见面)中,“at”的基本空间域被隐喻性地转换为时间域;而在“Oscar is in pain”(奥斯卡感到痛苦)中,“in”的领域被转换为情感域,从而使奥斯卡的体验位于代表痛苦的区域中。介词无处不在的隐喻性用法使它们更难分析。
3.5 副词
在上述动词的语义模型中,动词指代向量。向量可以在维度、方向和大小上有所不同。因此,作为动词修饰语的副词应指这些特征的变化。例如,在“我唱得很慢”(I sing slowly)中,副词从“sing”的声音域中选择了多个维度中的一个。“我唱得很大声”(I sing loudly)则选择了另一个维度。在“我向前跳了”(I jumped forwards)中,副词指代我的运动方向。最后,在“维多利亚用力推车”(Victoria pushed the cart strongly)中,表示“push”的力向量的大小被副词加强了。当一个动作涉及一种力模式时,副词可以通过提供动态信息来修改整个模式,例如,“维多利亚无力地走着”(Victoria walked limply)、“奥斯卡苦笑了一下”(Oscar smiled wryly)或“维多利亚猛烈地踢了一脚”(Victoria kicked aggressively)。这些例子的共同点是,副词限制了与方式动词语义相关的区域。
类似地,对于描述一系列变化(如路径)的结果动词,副词可以提供关于路径形式的信息,例如,“维多利亚歪歪扭扭地穿过了足球场”(Victoria crossed the football pitch crookedly)。简而言之,修饰动词的副词功能与形容词修饰名词的功能是平行的。
只要副词在一个特定领域内作为倍增器(减弱器或放大器)起作用,凸性原则就可以成立。例如,如果某些音量 v1 和 v2 都被视为“大声说话”,那么介于 v1 和 v2 之间的任何音量也将被视为“大声”。对于表达路径形式的副词,则可以应用第 3.4 节提到的路径凸性。因此,对于修饰动词的副词,单一领域假设是可以成立的。至于凸性原则是否也适用于其他副词,以及单一领域假设是否对它们同样适用,这仍然是一个开放的问题。单一领域论题的一个局限性在于,修饰形容词的副词可能是零维的,例如“非常”(very)和“完全”(completely)。因此,这类副词可以与任何领域相关联。
3.6 指示词
语言在包含哪些指示词方面差异很大(Diessel, 1999)。一些语言只有位置指示词(如“这里”和“那里”),一些语言还包含物体远近指示词(如“这个”和“那个”),而另一些语言,例如克罗地亚语,则拥有一套非常复杂的指示词系统,涉及多个领域。Gärdenfors 和 Brala-Vukanovic´(2018)认为,指示词和冠词的意义可以通过结合空间领域(这是指示性方面所必需的)和少量其他领域来分析。它们可以被视为形容词与指示性成分的结合。因此,对于这一词类,也可以提出一种单一领域假设的形式。
3.7 单一领域假设的作用**
总结本节,我试图论证以下一般语义规则:
普遍单一领域论题:所有实词类中的词(名词除外)都指代单一领域。
我不确定这个论题可以推进到什么程度。在很大程度上,其有效性取决于如何描述抽象领域。然而,我想将这一论题作为一个强有力的启发式规则提出,语言学习者(隐性地)在学习一个新词的意义时会应用它。默认规则是,如果遇到的新词不是一个名词,那么它的意义仅依赖于单一领域。这条规则将简化学习者对其意义的识别过程(参见 Bloom, 2002)。
各个单一领域论题的另一个重要方面是它们是经验上可验证的。即使它们最终对某一特定词类中的所有词并不适用,它们仍可能适用于儿童在该词类中首先学习的词汇,从而作为学习启发式支持这些论题。
4. 事件模型及其在语义学中的作用
语义学的几何特性在领域结构中表现得非常明显,而凸性是概念意义的一般组织原则。然而,在分析方式动词和某些介词时,力的领域显得尤为突出。在这些领域中,动态成为核心的语义特征。Talmy(1988)是力动态作用的经典研究,同时 Vandeloise(1991)也在其对介词的分析中引入了力的概念。
在前一节中,我讨论了各个词类的语义。本节将转向句子的语义。在 Gärdenfors(2014)中,我提出句子指代事件(或作为特例的状态)。为了支持这一提议,我必须引入一个由我和 Massimo Warglien 共同开发的认知事件模型(Gärdenfors, 2014, 2024; Gärdenfors & Warglien, 2012)。
4.1 核心元素
在描述事件时,语言学家通常会采用一种主题角色结构,其中基本角色是施事(agent)和受事(patient)(Dowty, 1991; Gisborne & Donaldson, 2019; Levin & Rappaport Hovav, 2005; Rissman & Majid, 2019)。一些研究者将主题角色视为原始的语义概念,但 Gisborne 和 Donaldson(2019)提出了几个反对这一观点的论据(另见 Langacker, 2008 关于“概念原型”的讨论)。相反,我认为事件结构是原始的,主题角色可以从事件结构中推导出来(另见 Gisborne & Davidson, 2019, 第 239 页)。有趣的是,力向量和结果向量几乎从未被包括在这些角色中。
一个典型的事件包含四个基本组成部分:施事、受事、力向量和结果向量。这些组成部分相互关联,使得施事的行为生成一个力向量(更一般地说是一个力模式),该力向量作用于受事,导致受事状态的变化,这种变化由结果向量描述。图 5 展示了基本的事件模式。
举一个简单的例子,考虑奥斯卡将雪橇拉到山顶的事件(见图 6)。在这个例子中,拉动的力向量由施事(奥斯卡)生成。结果向量是受事(雪橇)位置的变化(也许还包括其他属性的变化,例如它变得潮湿)。结果取决于受事的属性以及周围世界的其他方面:在所描述的事件中,例如重力和摩擦力作为反作用力对抗奥斯卡生成的力向量。另一个事件是球滚下山坡。球是受事,但在这种情况下没有施事。力向量由重力生成,同时伴随着摩擦力和地面支撑等反作用力。结果向量是球的运动。
我在这里提出的事件模型类似于认知语义学中使用的意象图式(image schemas)。特别是,它与 Talmy(1988)、Wolff(2007, 2008)、Croft(2012)和 Copley(2019)提出的力动态相关。该模型旨在捕捉(与 Dowty, 1991 类似的精神)典型事件的结构。这意味着事件有时会包含额外的特征,例如反作用力、工具和接受者。事件模型被提出为一种理论实体,假设其反映了认知结构。
根据 Gärdenfors(2014, 2020),事件的四个主要组成部分可以通过概念空间加以阐释。简而言之,这涉及将施事和受事建模为对象类别,使用各种属性领域,例如大小、形状、颜色、重量、温度、目标等。每个空间都有自己的几何或拓扑结构。力向量在一个三维的力空间中表示。结果向量描述属性的变化,因此是某个领域内的向量。这些概念空间组成部分的更详细描述可以在 Gärdenfors(2020)中找到。
事件的结构由从力向量到结果向量的映射决定。事件的核心对象是受事。(在语言学文献中,它通常被称为“主题”。)力向量可以更一般地描述为力模式。同样,结果向量可以描述为一系列变化,即结果路径。例如,如果事件是维多利亚步行去图书馆,她的轨迹可以分解为一系列较小的段(取决于所需的粒度级别)。
在确定结果向量时,不仅要考虑施事的力向量 FA,还必须考虑反作用力。通常,受事会施加反作用力 FP,例如通过不同形式的阻力。这种反作用力是 Talmy(1988)分析力动态在动词语义中作用的核心。然而,反作用力也可以是外部的,例如上述例子中的重力。合力向量 FR 是 FA 和所有反作用力的总和,决定了结果向量。在 Gärdenfors(2024)中,我沿用 Talmy(1988)和 Wolff(2007, 2008)的思路,分析了施事力向量和反作用力的不同组合。
有时还会在事件模型中添加另一个组件——工具。工具的一般功能是修改施事施加的力。例如,使用锤子会放大施事手臂的力,使用扳手会放大施事的旋转力,使用扬声器会放大施事的声音。这意味着事件的力向量被确定为施事施加的力和工具产生的修改的结合。
需要强调的是,力向量和结果向量并非存在于真空中,而是始终相对于概念空间的某个领域构建,因此继承了所有结构性领域信息。例如,由于温度领域是一维的,加热向量只有一个方向;而在三维的颜色领域中,结果向量可能有多个方向。将向量扎根于概念空间使事件模型比以往的模型(例如 Croft, 2012 的模型)具有更丰富的结构。
此外,向量的数学性质有助于理解事件结构。首先,在定义它们的概念空间中,向量可以彼此更接近或更远离(Gärdenfors, 2000, 2014)。对于力向量来说,这对应于动作的相似性(通过相应的力向量或力模式的接近程度来体现)。同样地,结果向量的相似性也可以被确定。Warglien、Gärdenfors 和 Westera(2012)认为,向量的相似性为动词意义的相似性提供了自然的解释。据我所知,没有其他动词语义理论能够解释这种相似性。
其次,向量可以相加和相乘。作用于受事的力向量可以与受事施加的反作用力相加。此外,在许多情况下,力向量会被反作用力平衡,从而导致一种状态而非动态事件(例如,当门被阻止打开时)。
第三,向量集合可以形成凸集。特别是,Gärdenfors 和 Warglien(2012)将一个动作类别定义为力向量(力模式)的凸集。由于凸性也被用来表征属性和对象类别(Gärdenfors, 2000, 2014),因此很自然地提出动作概念具有类似的结构(Hemeren, 2008, 第25页)。事实上,有充分的理由相信,动作概念表现出许多 Rosch(1975)提出的对象概念的原型效应。支持这一点的是,Hemeren(2008)和 Malt 等(2014)的研究表明,动作概念呈现出与对象概念类似的层级结构,并且具有类似的典型性效应。
4.2 与句法的一些联系
事件模型的结构有潜力解释许多普遍的句法特征。在此,我仅简要概述一些一般性方面。首先,在描述一个事件时,施事和受事通常由名词或名词短语表达,而动作和结果则由动词或动词短语表达。因此,事件模型解释了名词短语和动词短语之间的基本区别。与主流语言学中乔姆斯基式的句法方法不同,这种区别是基于从事件的认知表征中得出的语义基础。
其次,力向量和结果向量的区别解释了方式动词和结果动词之间的区别(Levin & Rappaport Hovav, 2005)。路径动词可以与描述属性变化的动词归为一类,因为人们倾向于对变化的事物和移动的事物使用相同的语言结构(Gruber, 1965; Jackendoff, 1972; Pinker, 1979):两者都涉及受事属性的变化,而方式动词不涉及。Rappaport Hovav 和 Levin(2010)从他们的 ACT-BECOME 事件模型以及“动词根只能在事件模式中与一个原初谓词相关联(作为论元或修饰语)”的约束条件中推导出这一论点。由于他们假设方式根修饰 ACT 谓词,而结果根是 BECOME 的论元,因此方式/结果互补性得以成立(Rappaport Hovav & Levin, 2010,第2节)。力向量和结果向量的区别与他们的 ACT 和 BECOME 概念相当清晰地对应,但增加了概念空间的基础,从而能够做出更多预测,例如关于动词意义相似性的预测。
第三,不及物结构(如“维多利亚走路”和“奥斯卡跳跃”)通常出现在受事与施事相同的情况下。在这种情况下,施事对自身施加力。换句话说,施事修改了其在施事空间(=受事空间)中的位置。
事件中所承担的角色与句子中主语、宾语或间接成分的指派之间并不存在简单的映射关系。在英语(以及许多其他语言)中,最受关注的角色被指定为主语,次要关注的角色被指定为宾语。与 Givón(2001,第198页)的观点一致,我认为焦点的选择并非直接属于事件表征的一部分,而是构建过程中的核心元素。因此,这些构建是情境化的,取决于对话伙伴已经知道或相信的内容,或者他们认为最有趣的部分。
例如,考虑一个事件:维多利亚(施事)擦洗(动作)桌子(受事),使其变得干净(结果)。这一事件可以产生多种不同的构建(标记了使用的动词类型):
“维多利亚擦洗”(施事,方式,不及物)。
“维多利亚清洁”(施事,结果,不及物)。
“桌子被清洁了”(受事,结果,被动)。
“桌子被擦洗了”(受事,方式,被动)。
“维多利亚擦洗桌子”(施事、方式、受事、及物)。
“维多利亚清洁桌子”(施事、结果、受事、及物)。
“维多利亚把桌子擦洗干净”(施事、方式、受事、结果、及物)。
不同语言对构建的表达有不同的偏好。对于所谓的**动词框架语言**(Talmy, 1985),例如罗曼语族语言,施事-结果-受事结构是最典型的。一个西班牙语的例子是“La botella entra en la cueva”(瓶子进入洞穴)。另一方面,所谓的**卫星框架语言**,例如日耳曼语族语言,则更倾向于施事-动作-受事结构。上述事件在英语中通常被描述为“The bottle is floating into the cave”(瓶子漂进洞穴)。在最后一个例子中,介词“into”表达了结果向量。如果想在西班牙语的例子中添加动作,则变为“La botella entra en la cueva flotando”(瓶子漂浮着进入洞穴)。
在此,我仅提供了一些简单的例子,说明如何利用事件模型来解释句法特征。我相信这种方法可以在许多方向上扩展,并且我计划在未来继续探讨这一主题。一个例子是对不同类型的动作类型(Aktionsart)进行分析(Gärdenfors, 2024)。
5. 总结语义学纲领
我的语义学纲领的基础是概念空间理论。事件模型的组成部分——施事、受事、力向量、结果向量——都可以用概念空间来描述。作为总结,我概述了这些结构如何作为基础来回答一些语言学家很少探讨的基本问题。
1. 儿童为何能如此高效地学习词汇?
Bloom(2002)对儿童如何学习词汇意义的研究进行了出色的综述。然而,这种学习为何能如此迅速完成的谜团仍未得到解答。在第2.4节和第3节中,我提出了一些机制,可以至少部分解决这一谜团。其中一个机制是,一个词通过句法线索被标记出它属于哪个词类。如果是一个形容词,孩子应该寻找某个领域中的属性;如果是一个名词,则有一组属性相互关联;如果是一个方式动词,孩子应找到适当的动作;如果是一个结果动词,孩子应寻找某种属性的变化,以此类推。普遍单一领域假设声称,对于所有词类(除名词外),在某个领域中都有一个区域代表该词的意义。一旦领域被识别,只需要少量例子就可以大致确定适当的区域,如第2.4节所示。
2. 为什么语言中的词汇被划分为不同的词类?
我认为,常见的词类可以通过我们如何在心理上表征事件来解释。事件模型的不同组成部分由不同的词类表达。名词指代施事和受事。为了识别唯一的指称对象,它们有时会被形容词修饰。力向量和结果向量分别由方式动词和结果动词表达。在结果向量是位置变化(包括隐喻性变化)的情况下,结果向量也可以通过介词短语表达。副词可用于修饰力向量和结果向量。代词的使用遵循表达经济性的原则,因为它们使名词短语的重复变得多余。
3. 为什么句子是语言的核心单位?
在所有语言中,句子都是基本单位。奇怪的是,语言学家几乎没有考虑过为什么会这样。从弗雷格开始的哲学家们回答说,句子表达命题,但命题仍然是缺乏认知基础的抽象实体。我在第4节中提出了我的答案。简而言之,我主张句子表达事件(状态),而事件是人类因果思维的基本单位(Gärdenfors, 2024)。
4. 为什么句子由名词短语和动词短语组成?
同样,在语言学中,句子具有这两个基本组成部分被视为理所当然,但对于为什么会这样却没有解释。正如第4.2节所解释的,我对这个问题的回答也源于事件心理模型的结构:施事和受事由名词短语描述,力向量和结果向量由动词短语描述。
在本文中,我的重点是展示如何利用概念空间理论生成一个认知上具有坚实基础的丰富语义学理论。本纲领中使用的几何和向量表示的一个优势在于,它们易于进行计算实现,因此在人类与机器人及其他人工智能系统之间的通信中可能变得有用(Gärdenfors, 2019)。这是一个具有巨大潜力的应用领域。
第二个应用领域涉及基于概念的推理。尽管心理学、哲学和认知科学在理论和实证方面取得了显著进展,但尚未有一个统一的框架来理解概念结构如何影响其在推理中的使用。我和 Matías Osta-Vélez 开始了一项研究计划,在其中我们主张概念空间理论能够填补这一空白(Gärdenfors & Osta-Vélez, 2023)。
我们的策略是展示如何使用源自概念空间的原则对各种显然依赖于概念结构信息的推理机制——包括基于相似性、典型性和诊断性的推理——进行建模。我们首先分析了归纳推理中期望的作用及其与概念结构的关系(Osta-Veléz & Gärdenfors, 2022a)。我们还研究了自然语言中使用泛化表达与常识推理之间的关系,作为第二个主题(Gärdenfors & Osta-Vélez, 2024)。我们提出,泛化的强度可以通过概念空间中属性与原型之间的距离来描述。第三个主题是基于类别的归纳推理。我们证明了概念空间理论可以作为这种推理类型的综合模型(Osta-Vélez & Gärdenfors, 2020)。最后一个主题是类比(Osta-Vélez & Gärdenfors, 2022b)。我们提出了类比关系的分类,并展示了如何通过概念空间中的距离对其进行建模。我们还讨论了该模型对人工系统中基于概念的推理的意义。
第三个应用领域涉及科学理论的结构和动态。Frank Zenker 和我将物理定律解释为几何实体而非语言实体。依靠概念空间作为建模工具,我们展示了如何描述理论结构以及如何评估其连续性(Gärdenfors & Zenker, 2013;Zenker & Gärdenfors, 2015, 2016)。我们关注经验理论所预设的概念框架,从而获得理论结构的几何表示。我们强调测量程序在区分概念结构与经验结构中的相关性。这使我们对科学定律的理解更接近科学实践。
总之,我展示了这些概念空间应用的例子,以表明该理论具有生产力,并且可以应用于涉及概念的广泛领域。
https://onlinelibrary.wiley.com/doi/pdf/10.1111/tops.12767