Thoughts and thinkers- On the complementarity between objects and processesthoughts-thinkers-PLR-final
思想与思考者:论对象与过程的互补性
https://chrisfieldsresearch.com/thoughts-thinkers-PLR-final.pdf
摘要
我们认为,“过程与对象”之间的二分法并无实际用处。相反,将“对象”和“过程”视为描述时间中持续存在的互补方式具有重要的理论价值,从而也体现出观察与操控的可能性。这种思维方式突出了记忆 作为观察基本资源的核心作用,并清晰地表明,“记忆”与“时间”同样是相互定义、互为补充的概念。我们以弗里斯顿(Friston)及其同事提出的自由能原理 (FEP)为基础展开论述,并结合量子理论中的一个基本观点:物理交互可以用线性算符来表示。继 Levin(《自我即兴的记忆:一种关于记忆作为代理性、动态解释性认知粘合剂的观点》,Entropy 26 (2024) 481)之后,我们强调,记忆首先是一种解释功能 ,而将记忆视作对过去事件在某种程度上精确记录的观念,是由此派生出来的。我们得出结论:对象与过程之间的区分总是人为构建的,且常常具有误导性 ;科学应当完全放弃这一区分。
关键词 :主动推理(Active inference);认知光锥(Cognitive Light Cone);涌现(Emergence);进化/发育/生态(Evo/devo/eco);多尺度胜任力架构(Multiscale competency architecture);生态位构建(Niche construction);语义学(Semantics)
要点
一种信息论视角下的生物学在每一个尺度上都使“物体”和“过程”可以互换。
形态发生(Morphogenesis)在每一个尺度上都是记忆构建的过程。
生命依赖于其组成谱系之间在每一个尺度上的横向信息流动。
将生命系统视为多尺度的能力架构(multi-scale competency architectures),突出了通过尺度适配的界面进行交流的重要性,而不是对组件的操控,这种方法可作为治疗干预和生物工程的策略。
思想本身就是思想者。
——威廉·詹姆斯 [1] 第401页
1 引言
像怀特海(Whitehead)等人所建议的那样,用“过程”而非“物体”的方式来思考世界是否更有优势?特别是,将有机体视为过程而不是物体,是否更有优势?这样做是否能够解决、或至少避免“时间中的同一性”这一问题,还是仅仅只是对该问题的重新表述?
例如,采取一种生物学的过程视角,是否有助于我们理解“一个个体人类为何是一个个体”——即尽管在多个层面上持续发生变化,却能从出生到死亡保持单一的身份?这种视角是否有助于我们理解“智人亚种(Homo sapiens sapiens)在过去约25万年间始终保持着相同的亚种身份”这句话的意义?它是否有助于我们判断:一整培养皿的成年涡虫(planaria),如果它们都是由实验室中被切割成碎片的一只涡虫再生而来,那么它们应被视为一个“个体生物”还是多个独立个体?
再进一步考虑其在再生医学和生物工程等实证领域中的应用价值:采用过程视角是否能够促进有趣的新发现、新能力以及新的研究计划?
数学中广泛使用的符号体系暗示了——虽然并不强制要求——一种以过程为基础的解释方式。例如,写作“f(x)”就暗示了一个作用于对象x的过程f;而符号“A → B”则暗示了一个由“→”表示的过程,它将A转化为B,或将某物从A移动到B。
当前数学的基础语言是范畴论(category theory)。一个(小)范畴包含一个对象集合O和一个态射(morphism)或箭头(arrow)的集合M,满足以下条件:
对于集合O中的每一个对象o,存在一个态射Idₐ ∈ M,称为“o的恒等态射”,使得 Idₐ : o → o;
对于所有对象o₁、o₂、o₃,以及态射m₁₂ : o₁ → o₂ 和 m₂₃ : o₂ → o₃,存在一个态射m₁₃ : o₁ → o₃。
正如Adámek、Herrlich和Strecker在他们广受欢迎的教材中所指出的那样 [3],用其中一个恒等态射来替代每个对象(它们通常不是唯一的),就足以仅用态射来表达任何范畴论陈述。Yoneda引理和无对象范畴的概念正式化了这一事实。因此,从深层意义上讲,数学并不需要“对象”。它只需要一些态射,其中某些保留了一种被称为“恒等”的抽象属性,而另一些则不保留。
类似的做法在物理学中也比比皆是。量子理论将“物体的性质”——如位置、动量、自旋等——替换为算符,这些算符在一个观察者进行观测时给出这些性质的具体值 [4]。量子场论则将“粒子”替换为作用于渗透时空的场上的产生、湮灭和数量算符。费曼图则以一种著名的方式将“粒子”替换为过程的总和,这些过程在被观测打断时能够产生等效的结果。甚至“量子系统”也可以被替换为用于识别该系统的操作程序 [5]。操作程序是一种过程,它可能或不可能保留它所作用的系统,或者实施该程序的系统(通常称为“观察者”或“感知者”)的身份。
“对象是由感知者构建的”这一观点在二阶控制论中具有基础地位 [6,7]。Maturana和Varela 将这一思想引入进化与发育生物学 [8],形成了“共构”(enaction)的概念,即一个对象是由有机体与其环境共同建构的。Gibson 则在其知觉心理学研究中提出 [9],认为对象及其属性是一个特定行为体所处环境所提供的“可供性”(affordances)。在所有这些表述中,“被感知的对象”都是由感知者与其环境共同活动而产生的结果,而不是传统本体论学者所寻求的那种世界的基本“家具” [10]。
然而,所有这些以过程为中心的思想方式,在其表述中仍然使用了类似对象的概念。例如,我们可以简单地把态射m₁₂ : o₁ → o₂ 看作一个有序对 (o₁, o₂);这种有序对记号暗示的是一个对象,而非一个过程。量子理论中的测量算符必须由观察者来执行才能获得结果 [11];而观察者本身也是量子系统,也就是对象。当这些系统被替换为识别标准时,这些标准仍需由一个系统——一个对象——作为观察者来实现。共构机制要求两个系统或对象,即有机体与其环境,以某种良好定义的方式相互作用(如下文所述)。可供性总是相对于某个东西而言的——一个有机体,也就是一个对象,并且是由某个东西提供的——有机体所处的环境,另一个对象。换句话说,对象似乎终究还是必不可少的。
我们将在本文中论证:在物理学或生命科学中,“过程 vs. 对象”并不是一个有用的二分法。相反,将“对象”和“过程”视为描述时间中持续性的两种互补方式,对于理解观察与操控的可能性,具有重要的理论价值。这种思维方式突出了记忆作为观察之必要资源、时间作为行动之必要资源的核心角色,并清楚地表明,“记忆”与“时间”也是一对彼此定义、互为补充的概念,它们都建立在“身份”这一持续存在的基本概念之上。
我们的方法基于Friston及其同事提出的自由能原理(Free Energy Principle, FEP)[12,13,14,15,17,18]。我们注意到,FEP与物理学中的全息原理(Holographic Principle, HP)密切相关 [19,20,21,22],并且这两个原理都蕴含着一个根本理念:通过一个表面的信息可以表示为被编码在这个表面上的信息。这个想法早已隐含在散度定理中——这是向量微积分的基本定理之一,最早于19世纪初被提出 [23]。FEP将所有时间上持续存在的物理系统刻画为执行一个过程,即主动推理(active inference)[24,25],它是对环境的反应(学习)与作用(操控)的结合。作为一种对持久性物理系统作为信息处理系统的通用描述,FEP提供了一种统一的方式来思考跨生物尺度的信息与记忆问题,从形态发生中的分子网络到进化动力学。
在简要回顾FEP及其概念基础(见第2节 ➜2)之后,我们将在第3节 ➜3 中将“对象”与“过程”作为互补关系应用于进化与发育,探讨“什么在进化?”、“什么在发育?”等问题。我们将展示,如果将进化与发育视为作用于过程的过程,就能建立起一个完全无尺度的生物学体系,也就是说,可以用一套统一的概念和方法来描述每一个尺度上的过程。接着,在第4节 ➜4 中,我们将把“观察者”视为一个发育系统,探讨一个观察者需要具备哪些条件,才能将其自身建模为一个持续存在的系统,从而将其观察建模为一个历史序列。在第5节 ➜5 中,我们将重新审视“外显记忆”(stigmergic memory)——特别是那些被编码为永久公开记录的记忆,比如本文——与隐性或程序性记忆之间的区别,后者包括机器学习系统、细胞网络 [26,27] 或生化通路 [28,29] 所存储的记忆。借鉴Levin的观点 [30],我们强调,记忆首先是一种解释功能,而将记忆看作是对过去事件的某种精确程度的记录,这一点是衍生出来的。最后,在第6节 ➜6 我们得出结论:对象与过程之间的区分总是人为设定的,而且往往具有误导性,科学应当彻底放弃这种二分法。我们还展望了这种做法如何能够促成一门整合生物医学与生物工程的“能动材料生物学”(bioscience of agentive materials)——这门科学难以从传统的视角出发加以理解,因为在传统视角下,有机体(人类可能是个例外)被视为主要甚至完全由其基因组固定的生物机器,运行着预先编好的程序。
2 系统、可区分性与持续存在
自由能原理(FEP)是一个用于讨论时间中持续存在 的数学框架;事实上,FEP 可以以明显是同义反复的形式表述为:任何在时间中持续存在的系统,必须以一种使其能够在时间中持续存在的方式行事 [14]。
从形式化的角度来看,FEP 是对动力系统的一种解释,这种系统可以被分解为一些组分,这些组分在一段时间内维持着条件概率上相互独立的状态。请注意,FEP 仅在一个系统持续存在 ——即其状态在条件概率上与其环境的状态保持独立——的时间范围内对其做出描述,而没有说明任何一个系统在其行为中能够持续成功地维持这种持续存在的时长。
要将 FEP 理解为一个原则性的陈述,就需要理解“持续存在”、“时间”和“行为”分别指的是什么。实际上,FEP 的形式理论正是对这三个问题的回答。自该原理首次提出以来,其形式理论已经经历了显著的发展;参见 [14,17,18] 中使用经典统计物理语言对当前理论的阐述,[15] 中用量子信息理论语言对该原理的重新表述,以及 [16] 中对经典与量子表述的详细比较。
我们在此不会重复这些形式化的表述,而是将以逆序的方式探讨该理论是如何回答“持续存在”、“时间”和“行为”这三个基本问题
2.1 自由能原理中的行为与时间
物理相互作用可以分为两种类型:系统内部的相互作用(内部或“自我”相互作用),以及系统之间的相互作用。为了描述这些相互作用,我们做出一个基本假设:标准的或教科书式的量子理论——即以 Dirac-von Neumann 公设为基础的量子理论(例如见文献 [35])——是正确的。基于这一假设,物理系统的状态空间可以表示为希尔伯特空间(Hilbert spaces),为方便起见,我们假设它们是有限维的;而物理系统之间的相互作用则可以表示为(同样有限维的)线性算符,特别是哈密顿量或总能量算符,作用在这些希尔伯特空间上。这一假设特别排除了任何量子系统之间的非线性相互作用,从而也排除了任何客观的、与观察者无关的“波函数坍缩”。虽然这类非线性相互作用从未被观察到,但目前尚未通过实验最终排除 [36, 37]。
在假设标准量子理论成立的前提下,我们可以将任何孤立系统 U 的总能量写成一个算符,即哈密顿量 分别代表 U、S 和 E 的内部相互作用,而 HsE 则代表 S 与 E 之间的相互作用。图1展示了这个方程。 因此,“系统内部”与“系统之间”的相互作用之间的区别,依赖于我们将整体系统(如 U)分解为其组成部分(如 S 和 E)的方式。如果我们采用不同的方式来分解 U,例如将其写成 U = AB,并令 A = S,则会定义出不同的相互作用形式:。这说明,“自我相互作用”与“其他相互作用”(即系统之间的相互作用)之间的区别依赖于对 U 的分解方式,因此这一区别不是根本性的。U 的物理本身并不偏向于任何一种特定的分解方式——也就是任何一种组分边界的位置设定。
假设标准量子理论也提供了一个严格的标准,用于判断系统U分解所指定的组成部分S和E是否具有可以独立指定的,因此是条件统计独立的状态,这是自由能原理(FEP)适用的必要条件。组成部分S和E具有可以独立指定的状态,当且仅当它们的联合状态可以分解,即当且仅当在狄拉克符号中|SE⟩ = |S⟩|E⟩。如果联合状态不能分解,那么根据定义,它是纠缠的。物理系统之间的相互作用通常会诱导纠缠;因此,假设两个系统没有纠缠,意味着它们之间的相互作用非常弱,并且即使这种微弱的相互作用也已经经过了无限长的时间而未被观测到。从实验上判断两个系统是否纠缠是非常困难的;2022年诺贝尔物理学奖授予了阿斯佩克特(Aspect)、克劳瑟(Clauser)和蔡林格(Zeilinger),以表彰他们展示了如何做到这一点。因此,在实际应用中,那些看起来可以相互区分的相互作用系统被假定为没有纠缠,即假定它们具有可以分解的联合状态。自由能原理只适用于每个系统都可以假定具有自己的、可以独立指定的、条件统计独立的内部状态的系统。如果在实践中可以假定满足这一条件,我们将称系统为“不同的”或“可区分的”。
上述讨论涉及“系统”U及其组成部分,即不同的“系统”S和E。系统自然被看作是一个对象:一个由“自由度”组成的集合,每个自由度都可以处于某种状态。然而,如图1所示,每个系统也由其自我相互作用来表征。这种自我相互作用是一个过程;在量子形式主义中,传播子PU(t) = exp((−i/ħ)HU(t)),其中ħ是约化普朗克常数,是将U的状态在假设的“背景”[38]时间t中向前演化的酉算符。此外,U的每个自由度x都可以用一组二进制自由度来替换,每个可区分的x值对应一个二进制自由度。因此,我们可以将U简单地看作是一组物理实现的比特,或者在量子情况下,是一组量子比特。换句话说,我们可以将U的任何状态视为数据的编码,并将PU对任何这种状态的作用视为对这些数据的计算;如[39]所示,这样做只需要找到一个映射——一种语义解释——从U的状态到某种数据结构,以及从PU的有限样本作用到该数据结构上某个函数的作用。此外,总是存在许多这样的映射[40]。只要它们的联合状态保持可分离,对于S和E也是如此。
如果HU、HS和HE可以被解释为实现计算,那么我们该如何解释相互作用HSE呢?假设信息以某种可测量的形式由离散的、可检测的物理系统携带,例如单个光子,每个光子编码一位信息。散度定理告诉我们,任何系统内源发出的光子数量,因此以比特为单位的信息量,可以通过计算围绕系统的任何闭合边界穿过的光子数量来计算。霍金-佩奇定理(HP)扩展了这一结果,假设外部观察者能够从系统中获得的唯一信息是通过能够穿越边界的物理系统携带的信息。它还指出,对于任何有限系统,能够穿越其边界的物理信息载体的最大数量——例如光子——是有限的,并且实际上与边界的面积成正比(形式上,边界的最大经典熵S(B)是AB/4,其中AB是以普朗克单位表示的边界的面积)。因此,将S与E分隔开的边界B也可以被视为一组离散的、物理实现的比特,或者在量子情况下,是一组物理实现的量子比特(数学细节见[16]或[22],非正式讨论见[41])。因此,相互作用HSE可以被视为S和E之间的有限比特交换,即S和E之间的通信。
有了对行为的这种理解,我们现在可以讨论时间,即上面用于构建传播子PU(t)的背景时间t。自由能原理是关于在时间上的持续性,但“时间”是从哪里来的,它在理论中扮演了什么角色呢?
2.2 示例:检测信号和物体的变化
让我们首先考虑在某种介质中检测信号。采用幅度调制(AM)或频率调制(FM)的模拟收音机提供了一个特别清晰的例子,这个例子对感知理论具有历史重要性。模拟收音机发射器将信号编码到环境光子场中,而环境光子场也编码了视觉可获取的信息。我们通过适当的检测器,即模拟收音机,来获取这些信号。
假设你现在正在收听收音机里的歌曲。你和你的收音机组成的联合系统是如何从环境光子场中提取感兴趣的信息——即歌曲的呢?提取歌曲是一个两步过程,这与编码歌曲的两步过程相对应。你的收音机是一个可调谐的共振器,它能够检测发射器的“载波”(CW)。这个载波是一个在某个指定频率上的恒定信号。它实际上编码了发射器的名称。一旦收音机找到了这个信号,它就会通过滤波器和反馈(即当前状态与预期状态之间的差异测量)来减少噪声,从而放大载波的微小、非常缓慢的(与GHz相比,仅为10Hz到kHz)幅度调制(AM)或频率调制(FM)的扰动。正是这些微小且缓慢的扰动编码了歌曲。
收音机从环境光子场中提取歌曲的能力在历史上引起了人们的兴趣,因为吉布森(Gibson)[45]将其用作视觉感知的模型,并特别用它来论证通过“共振”进行的感知不需要感知者对先前信息的记忆。这一论点后来被广泛用来论证生物体既不存储也不处理信息[46, 47]。上述简要描述突出了这一论点遗漏的存储信息:收音机存储了关于载波的信息,例如,与收音机大小和重量相似的石头就没有这些信息。收音机还存储了大量关于载波如何被收音机发射器调制的信息。这些信息使它们能够处理正确类型的载波扰动,并在正确的时间尺度上提取编码的信息,例如歌曲。
使用收音机来寻找歌曲的人类面临着与收音机相同的问题,并以类似的方式解决这个问题。为了使用收音机找到歌曲,人类必须首先找到收音机。这通常是通过与环境光子场交互完成的,即通过视觉感知。人类必须扫描这个场的可用组成部分,以找到一个预期的恒定信号,我们通常称之为收音机的“外观”。
只有在完成这一操作之后,人类才能检测或操纵收音机随时间变化的属性,例如它所调谐的电台(即载波)。图2说明了恒定(或“参考”)属性和可变(或“指针”)属性之间的这种差异。用于识别一个系统(例如一台收音机,甚至是无线电频谱中的一个载波)的参考态的特异性(使用狄拉克符号表示为|Ri⟩)决定了能够检测到特定系统的特异性程度。如果想要一个特定的电台,或者一台特定的收音机,就需要检测到一个对那个个体系统且仅对该系统特定的|Ri⟩。
上述关于检测信号和物体变化的描述是完全通用的,实际上它描述了任何能够以某种特定方式对其环境的某种特定属性做出响应的物理系统[5]。用物理学的语言来说,特定类型的信号或系统的检测器是量子的(因为它们是物理实现的)参考系(量子参考系,QRFs [49, 50])。例如,对特定频率范围内的光子有响应的视紫红质分子,由于其物理实现,是该频率范围内任何由光子携带的信号的量子参考系。这种分子并不是孤立或被动存在的,而是存在于更大的系统中,它们依赖这些系统来维持生化稳定性,并且在被光子激发时会对这些系统产生作用。用自由能量原理(FEP)的语言来说,量子参考系是系统生成模型的组成部分,它们指定了其环境中存在的信号或物体的类型、它们能够产生的变化类型、可以针对它们采取的行动类型,以及这些行动的预期后果[15, 16]。实现一个量子参考系赋予了系统观察和行动的能力;因此,用其实现的量子参考系来描述一个系统是一种功能性的,而不是结构性的描述。此外,任何这样的描述都是一个假设性的模型;系统的量子参考系是如何实现的,甚至它实现了哪些量子参考系,都无法通过有限的观察来确定[51];关于这一点的综述,可以参考[52],其中使用了更现代的语言。
随着生物体的发育,我们可以预期它能够检测到的内容以及它对其获取的信息的处理方式会发生变化。因此,我们可以预期它实现的量子参考系也会发生变化。这些变化可能是渐进的,例如一个孩子增加她的母语词汇量,也可能是激进的,例如变态过程为昆虫构建了一个全新的身体,带有新的传感器和效应器。这些变化自然引发了关于经历这些变化的系统的同一性,以及这种同一性本身是否随时间发生变化的问题。
2.3 什么是持续性?
现在我们可以探讨说一个物体S,或者它的内部自相互作用HS,随时间持续存在意味着什么。弗里斯顿(Friston)[14]以“我们首先问,某物如何能够从其他一切中被区分出来”来引入这个话题。我们在这里也采用这种策略,先从相对于某个特定观察者的角度来考虑持续性,然后展示为什么持续性只能以这种观察者相关的方式定义。
上述例子突出了将某物从其他一切中区分开来所需的东西:一个足够具体的量子参考系(QRF)。例如,脊椎动物的视觉系统通过它们相对于静止(或更缓慢移动的)背景的运动来区分“物体”(没有进一步的描述)[53]。这种运动,或视觉轨迹,检测过程对观察的间断非常敏感,并且只有在特定类型的遮挡之后,以及仅在几秒的时间范围内,才会推断物体的持续性。在哺乳动物中,这一过程主要由背侧视觉通路实现,依赖于内颞叶区域实现的空间和时间坐标[54];这些网络可以一起被视为哺乳动物的短期运动量子参考系。观察之间的更长时间间隔需要对物体的属性和历史进行额外的推断,这不仅涉及腹侧视觉通路和海马体,还涉及更前额的区域。在这些情况下,推断的是一个假设性的过程:一个保持物体同一性的因果链[55]。
因此,多个空间、时间和情境的参考点是必需的,例如重新识别一个多年未见的老朋友;因此,在这些情况下,大脑的大部分区域都在作为一个物体识别量子参考系发挥作用。
持续性因此是观察到的区别的组合——来自量子参考系的“检测器点击”——以及一个假设过程。正如上文提到的,这个过程是观察之间的发生的事情。我们不能在没有将它们通过时间延伸的那些过程的情况下谈论持续性的物体,我们也不能在没有通过“快照”打断它们并产生某种特定观察结果的观察的情况下,谈论过程,除非是作为纯粹的抽象。我们尤其不能在没有某种体验时间的方式——一些区分“现在”和“那时”的参考点——的情况下谈论时间。因此,我们不能在不谈论记忆的情况下谈论持续性。正如[30]所指出的,我们不能在不谈论粗粒化、解释以及理解事物的驱动力的情况下谈论记忆[56]。换句话说,自由能量原理(FEP)已经将我们从物理学带回心理学:通过制定持续性的标准,它已经隐含地定义了理解事物的含义。
爱因斯坦曾经著名地问过,当没有人看它的时候,月亮是否还在那里[57],这是一个量子理论已经回答过的问题,就像贝克莱(Berkeley)回答了休谟(Hume)提出的类似问题一样,通过质疑“没有人”是什么意思。让我们回到图1,并问一下S是否能够判断E是否随时间持续存在。这当然也是S是否能够判断它自己是否随时间持续存在,或者等价地说,S是否能够判断边界B是否随时间保持其完整性的问题。由于S与E的分离是一个相互条件独立性的问题,或者用量子理论的术语来说,是纠缠缺失的问题,我们可以将这个问题表述为S是否能够判断它自己是否与E条件独立,或者用量子术语来说,S是否与E纠缠。
这个问题的答案是明确的“不”[52]。没有任何系统能够确定它是否与环境纠缠。换句话说,没有任何系统能够确定它是否有一个有效的边界。原因是简单的,并且直接从霍尔顿-普里查德原理(HP)得出,或者用自由能量原理的术语来说,来自马尔可夫毯的定义[58]:系统通过其边界与环境相互作用,不能“超出其边界”更直接地测量或操纵其环境。特别是,它们不能测量其边界的纠缠熵,因此它们不能确定它们是否可以从其环境中分离出来,因此是否与环境条件独立。这与边界的定义无关,直接导致的后果是,一个系统既不能确定也不能指定“它的边界在哪里”,甚至不能测量其边界的大小(即希尔伯特空间的维度)(再次参见[52]以获取正式证明)。这为“扩展心智假说”[59]——通常被认为涉及认知辅助工具,类似于工具使用诱导的扩展身体图式[60]——提供了相当有力的支持:没有任何系统能够证明任何感知到的物体在其边界之外,因此没有任何系统能够证明任何感知到的物体不是其心智的一部分。在培养细胞与非生物材料相互作用的实验中——即与“混合机器人”(hybrots)相互作用——展示了类似于人类甚至进化生物之外的身体图式扩展的效果,表明“扩展心智”可能是无处不在的[61]。我们也可以从一个完全外部的、抽象的角度来理解这个结果。两个系统是否纠缠——它们的联合状态空间是否分解——不是一个观察者独立的事实,而是取决于它们的联合状态空间如何被描述[62, 63]。因此,不存在观察者独立的边界。
2.4 持续性涉及风险并需要权衡
像自由能量原理(FEP)这样的数学模型在无法进行决定性实验,但有强有力的间接证据和直觉的情况下,作为思考工具的价值最为明显。FEP将主体描述为最小化变分自由能量(VFE),这实际上是一种预测误差的度量。它们通过主动推理做到这一点,主动推理是学习环境规律和对环境采取行动(包括四处移动和进行实验等)的结合,以获取热力学资源和新信息。对于那些不生活在不切实际的理想环境中的系统来说,后一种活动是必不可少的[64],其动机——无论被称为知识饥渴、信息趋性还是好奇心——是一种基本的驱动力[65]。无论是为了食物还是知识,觅食都涉及风险;实际上,[14]展示了风险和(预测的)信息收益只是描述同一统计量的两种方式。因此,主动推理本质上是充满风险的,参与其中的系统可能会遭受不可逆的损害或毁灭,即边界崩溃[66]。
如上所述,作为一个实体持续存在,就是通过维持一组内部状态来保持与环境的统计可分离性,这些内部状态因果上“远离边界”,因此可用于在自身控制下实现计算。这样的内部状态有多少取决于边界的大小——实际上取决于自身的表面积与体积比。而边界的大小又通过霍尔顿-普里查德原理(HP)取决于系统与环境相互作用的强度。因此,持续存在的系统必须保持较小的边界,以避免被环境穿透或烧毁。然而,边界大小也决定了可以从环境中获取的信息量和热力学资源量[67, 68]。这两者都是必需的,当边界大小固定时,它们会相互权衡。因此,所有主动推理主体都面临着与边界大小相关联的权衡,或者等价地说,与它们与环境的总相互作用强度相关联的权衡[41]。对于任何主动推理主体来说,不同的环境暴露选择以及在觅食、学习和探索之间的不同权衡,可以预期会带来不同的生活方式,从而预先适应不同的生态位。
3 什么在进化?什么在发育?
3.1 生命作为一种边界扩张的过程
新达尔文主义的观点认为只有基因在进化,而生物学的其他方面只是随之而行[69, 70, 71, 72],这一观点受到了广泛的批评,并在一定程度上被那些承认多尺度进化的理论方法所取代[73, 74, 75, 76]。即使在一个细胞中,细胞质、细胞骨架和细胞膜编码的可遗传信息也远远多于基因组编码的信息;只关注基因的模型完全忽略了这种信息的遗传[77]。关于生物变异和驱动选择的环境变异都是随机的,因此本质上是热力学过程的观点,也受到了挑战,新的模型将生物视为主动推理主体,它们通过改变环境,进而改变自身和其他生物所面临的自然选择格局[78, 79, 80, 81, 82];关于这一点的哲学讨论,可以参考[83, 84, 85]。
这些以及其他类似的考虑促使我们之前提出,我们用“进化”和“发育”来区分的过程,实际上是单一机制的不同表现形式,它们仅在空间和时间尺度上有所不同[86]。这种观点反过来又表明,我们所知的生命——现存生物的最后共同祖先(LUCA)的谱系,可以被视为一个单一的、时间上延伸的、形态发生过程[87]。换句话说,我们目前观察到的生命具有一个空间上延伸的、多细胞的身体,所有这些细胞与LUCA的亲缘关系,与传统多细胞生物体中的细胞(不考虑共生细菌和其他生物)与受精卵的关系相同。随着我们认识到所有现存的多细胞生物都是全生物体(holobionts)[88, 89, 90],确实可以清楚地看到,传统多细胞生物是由LUCA的多条谱系组成的复合体。
采用图1的符号表示法,我们可以非常简洁地表示生命的发展过程:如图3a所示,生命起初是一个拥有极少数自由度的小系统,因此在U的总状态空间中只占很小的一部分。大多数自由度,以及因此大部分状态空间,构成了生命所互动的非生物环境。然而,随着生命的发展,其作为一个系统的身份——一组自由度——发生了变化。随着“背景”时间t的增加,曾经是非生物环境一部分的自由度,例如可用的水、碳、氮和其他分子,变成了生命的一部分,生命利用它们合成新的大分子。这一过程使生命成为一个更大的系统,既拥有更大的状态空间份额,也拥有更大的边界。更大的状态空间使得更复杂的信息处理成为可能,而更大的边界则提供了更多的热力学资源、更有用的信息以及更多的行动可能性。从这个角度来看,生命形态发生过程可以被描述为一个复杂计算过程的细化,这一过程由时间(t)依赖的自相互作用HLife实现,代价是其非生物环境。生命作为一个系统的扩张现象,是总体自相互作用HU在推动总体状态|Ui在其非常大的状态空间中移动时实现的。
这种将生命视为状态空间和边界扩张过程的观点完全是拓扑学的,并且忽略了产生我们观察到的谱系分支模式(如图3b所示的系统发育多样性)的细胞分裂的几何过程。这种分支过程使得生命与其环境之间的边界在几何上变得复杂,生命的不同组成部分从非生物环境的不同部分获取热力学资源和信息,并对其采取行动,同时也相互作用。将生命表示为一个抽象的系统S,我们可以通过将S视为部署了一组量子参考系来用计算术语描述这种几何复杂性,这些量子参考系访问边界B的状态空间HB的互不相交的“切片”,如图3c所示;详细内容见[91]。我们在所有尺度上都观察到这种边界的分割,从使趋化作用成为可能的膜受体和效应器的不对称分布,到变形虫细胞的独立移动、探索性的伪足,再到神经元、高等植物和动物附肢的分支模式。实际上,我们在[91]中表明,这种“类神经形态”的分支模式会在任何具有空间自由度边界的主动推理主体中被诱导产生。从自由能量原理(FEP)的角度来看,它们通过将计算与边界的互动均匀分布在边界表面,从而提高了预测能力和行动的有效性。
3.2 生命作为一种多尺度能力架构
马图拉纳(Maturana)和瓦雷拉(Varela)[8]、波兰尼(Polanyi)[92]、罗森(Rosen)[93]、诺布尔(Noble)[94]以及许多其他人都指出,生物系统具有双向流动的约束条件及其补充物——使能条件。例如,有机化学既约束又使能大分子生物化学,而大分子生物化学在酶结构和活性所施加的约束内,极大地扩展了有机化学的多样性以及反应可能性空间。动物的身体同样使能并约束动物能够构建的环境,而这些环境既使能又约束其建造者以及其他占据重叠生态位的生物的行为。向上和向下的约束和使能条件的流动,以及无论更高层次还是更低层次均不存在局部决定论,可以通过将任何尺度上的生命系统描述为“具身材料”来表达,这些材料既对更大和更小尺度的系统的行为产生作用,又受到其影响,但同时保持自身的自主性。在每个尺度上都包含具身材料的多尺度系统实现了多尺度能力架构(MCAs),即结构和功能组织,在其中,每个尺度上的组成部分都有能力在没有来自其他尺度的明确指令的情况下,在指导下开展自己的事务[27, 61, 95]。MCAs的组成部分具有自主性的观点——即使不受其因果相关过去中所有事件的局部决定论的约束——基于物理学的一个基本定理,该定理表明,这种自主性是与特殊相对论和量子理论一致所必需的[96]。
从计算架构的角度来看,一个多尺度能力架构(MCA)是一个主动推理主体的层级结构,每个主体都针对其自身的环境符合自由能量原理(FEP)。然而,计算是一个过程。从图1的符号表示来看,一个多尺度能力架构(MCA)是实现该MCA的系统S的内部相互作用HS的分解。特别是,我们可以写出:
3.3 生命作为一种多尺度记忆
机器学习彻底改变了人工智能,因为在一个大型示例集上训练一个人工神经网络,实际上构建了一个关于这些示例共同点的隐含统计模型。像ChatGPT或Midjourney这样的生成系统的行为所展示的那样,将这样的网络“反向运行”可以生成这些共同点的新实例。触发生成新实例所需要的只是一个来自环境的输入,某种特定类型的“提示”。
4 自我模型
人类所体验到的“自我”是一种由默认模式网络(default-mode network)的组成部分实时构建且按需生成的模型,这一观点在认知神经科学领域已经成为主流观点[112, 113, 114, 115, 116]。许多活动是“非自我意识地”完成的——特别是那些凭借专业知识进行的活动,只能是非自我意识地完成——这表明自我模型是在需要明确的元认知监控的不确定性情境中被调用的[117, 118, 119]。在某些冥想实践中,关闭自我体验模型是一个目标,而对这些实践的神经认知研究表明,默认模式网络的去激活参与了这种体验[120, 121, 122]。
从主动推理(active-inference)的角度来看,人类所体验的自我模型是用于预测行动后果的整体生成模型(generative model)的一个组成部分,尤其是在社会情境中的行动。该模型的功能失调,特别是对特定环境输入或先验信念的精确性或相对重要性分配的功能失调,会以可预测的方式导致情境功能失调的行为[123, 124, 125]。这表明可以将“自我模型”的概念推广到任何整体生成模型的元认知组成部分,这些组成部分调节精确性分配,从而有效地将注意力和其他认知资源(包括记忆)分配到行动情境的某些方面,而牺牲其他方面[126]。可以预期,在任何经历具有不同特征时间尺度的选择性压力的系统中,都会存在这样的元认知组成部分[81]。
系统赋予高精确性的属性可以被视为系统所关心的属性[127, 128]。将这些关注的事项(可能包括系统自身的过去和未来自我)相对于系统在时空中的位置进行定位,生成了系统的“认知光锥”(cognitive light cone, CLC),这是对其关注范围在时空中的最大范围的一种表征[127]。至关重要的是,CLC并不是描绘传感器或效应器的最大作用范围,而是代理能够将其作为目标追求的状态的最大范围。由于CLC中的内容能够影响系统的元认知对注意力的控制,我们可以将CLC视为一种可以应用于任何系统的体验自我模型的推广形式,特别是可以应用于任何生物体。
将自我模型重新概念化为认知光锥(CLC)强调了其作为一种资源分配工具的功能角色。CLC特别地为事件记忆提供了一个背景,并且是规划的焦点。CLC的空间和时间范围都严重依赖于记忆和计算处理资源,即取决于系统内部交互的自由度以及其边界的大小。例如,单细胞生物和小型多细胞生物(如图5 中的蜱)的CLC可能仅限于其生理边界的直接邻近区域以及其内部计数的一个或几个时间步长。相比之下,人类的CLC可以利用想象作为资源,将其积极目标扩展到星际空间,并且在时间上可以远远超出个体的寿命范围,既包括过去也包括未来。至少对于人类来说,CLC的范围可以根据个体的当前状态、资源和抱负而扩大或缩小。例如,婴儿可能有一个狭窄的锥体,专注于即时生存;儿童可能关心朋友或期待“长大后想成为什么样的人”;而成年个体可能有一个更宽广的锥体,涵盖对世界状态和他人未来福祉的关心。细胞集体(例如人类细胞)显然可以拥有比单个细胞更大的CLC,它们将解剖学状态作为目标形态,在调节发育和再生过程中积极努力实现这些目标[78, 129]。一些社会性生物的集体(例如蚂蚁)似乎拥有比其个体成员更大的CLC[130]。人类集体是否拥有比个体人类更大的CLC仍然是一个未解决的问题。
与由默认模式网络实现的体验自我模型一样,CLC的操作大小可以根据任务或情境进行扩展或收缩。需要对即时时空环境保持坚定不移的注意力的活动——例如攀岩或竞速驾驶——与重新审视历史或进行长期规划是不兼容的。此外,CLC的更远空间和时间范围相对于更近的组成部分来说,可以被预期为是粗粒化的。这种粗粒化反映了CLC是一个必须从特定时间和特定情境下可用信息实时计算出来的构建物,就像人类体验自我模型一样。因此,CLC在两个方向上的时间深度严重依赖于系统通过想象或投射时间来追踪自身身份的能力,即其“心理时间旅行”能力[131]。在任何现实的、资源有限的环境中,它还依赖于系统忘记过去不必要的细节的能力,并且只明确那些被认为最相关计划元素的能力。因此,它依赖于系统对框架问题(Frame Problem)[132]的启发式解决方案,即决定在行动之后什么保持不变的问题[133]。
人类体验自我模型的一个关键特征是对自我及其思想、行为、身体等的归属感[134]。归属感的失败表现为各种类型的解离,这可能是病理性的,也可能是治疗性的,具体取决于所涉及的机制[135]。被体验为“属于我的”构成了体验自我,因此像精神分裂症中的“思维插入”现象(某些体验被归类为“不是我的”)会引发痛苦[136]。然而,人类也容易受到“虚假记忆”的影响,这些记忆被认为是“属于我的”[137]。体验的归属感的产生似乎是更广泛的人类“来源”或“现实”监控功能的一个组成部分,这一功能关键涉及进化上较新的前额叶皮层区域[138],因此可能甚至在灵长类动物中也不广泛共享。可以推测,对于那些缺乏来源监控能力的系统来说,记忆被体验为匿名的。在这方面,它们与非体验性记忆(例如编码在基因组中的记忆)相当,从某种重要意义上说,这些记忆是匿名的。
这些考虑显然引发了关于生命整体,甚至是大量多个体谱系是否具有自我模型、认知光锥(CLCs)或归属感的问题。如果一个社会群体可以拥有一个CLC,那么同种生物的谱系大概率也可以拥有一个CLC。在细胞层面也存在的利他主义或集体性问题解决的例子[139]表明,集体CLC可能在多种生物和多个尺度上都存在。
5 程序性与陈述性
德鲁·麦克德莫特(Drew McDermott)[140]曾著名地敦促人工智能研究者避免“沉溺于‘程序性-陈述性’争议”,这是一场关于记忆数据结构的争议,在标准冯·诺依曼计算机架构的背景下,它仅仅关乎于你偏好的虚拟机描述[98, 99]。程序性-陈述性二分法仅仅是虚拟实现记忆中过程与对象的二分法。通过更新模型参数编码的记忆(如人工神经网络中的记忆)是程序性的;而以离散的“如果-那么”规则编码的记忆(如专家系统中的记忆)是陈述性的。如果S是一个量子系统,那么由HS在S的计算“本体”上编码的记忆是程序性的,而由HSE在S的边界上编码的记忆是陈述性的。然而,从图1、公式(1)和图4中我们知道,这只是一种解释选择。当我们放大到联合系统的尺度时,本体与边界的区别消失了。当我们深入到S的组成部分的尺度时,这种区别并没有消失,而是变得碎片化了。所有这些描述都只是对同一动态的不同表示方式。它们能够提供不同的理解,但并没有描述不同的现象。从根本上来说,它们只是在不同尺度上对单一现象的不同表示。它们仅仅是规定了不同的虚拟机,正如麦克德莫特所指出的。
正如我们在整个讨论中所强调的,物理交互就是交互——在物理意义上,不存在被动的观察。此外,正是行动的机会使得某些被观察到的差异“产生影响”[141],从而赋予其意义[142]。对环境的任何行动都可能创造一种信息素记忆;这种行动的结果是否作为记忆存在,取决于系统在后续观察中重新识别它的能力。这种重新识别的能力依赖于系统的QRF(量子参考框架),特别是其通过模型细化(即学习)来更新QRF的能力,以正确预测其后续可观察到的行动后果。我们人类往往将书写信息素记忆和细化模型之间的这种耦合视为理所当然,直到这种耦合失效,我们才会忘记把车钥匙或地址簿放在哪里。这种失败揭示了程序性和陈述性记忆是相互依赖的:没有对方,一方就毫无用处。我们可以在任何尺度上观察到这一点;例如,生态位构建如果没有记忆能力,无法识别相关的环境修改,那么它就是无用的。
统计模型(如ChatGPT)[143]的语言使用所表现出的明显的“空洞性”为这一点提供了一个例证。大型语言模型(LLMs)可以说出单词的含义,如果与图像识别器和生成器结合,还可以提供视觉说明。然而,它们缺乏操作能力,这使得它们对语义关系的知识与我们感知和用语言描述的世界脱节。至少在目前,像ChatGPT这样的LLMs只对其用户产生作用,除了上下文窗口中的交互记录外,它们不会更新个别用户的模型以反映过去对它们所说的内容,并预测它们在未来互动中的反应。换句话说,这些系统在重新识别它们自己在其世界上书写的信息素记忆方面能力极差。因此,它们看起来像是非常智能的系统,但却患有严重的顺行性失忆症;这使得它们的语言使用显得诡异,也增加了人们对它们使用语言时似乎并不理解语言的感觉。
第二个更微妙的例证是任何代理与其记忆之间的关系,无论这些记忆是编码在其环境中还是由其自身身体编码的。现在普遍认为,人类记忆,特别是情景记忆,每次被访问时都会被重建[144, 145];关于这一过程的形式化模型见[146]。如果我们把编码的印迹(engram)视为感兴趣的系统S,那么每当它与环境E(即体验记忆的其他部分的代理)互动时,它的状态就会被修改。从这个角度来看,读取和重写记忆是一种互动,因此是一种信息交换——一种印迹与将其作为过去某个事实或事件的表征而使用的代理之间的对话。
正如自我模型或CLC(认知光锥)的概念一样,我们可以在个体生物体之外的尺度上考察信息素记忆与模型细化之间的这种相互依赖——以及陈述性记忆与程序性记忆之间的相互依赖。从微生物席到大学的具有认知分工的联合学习系统,是相互依赖的认知生态位网络,所有参与者都既进行信息素记忆记录(局部生态位构建),也进行模型细化。
“人不是拥有观念,观念拥有着人。”
——卡尔·荣格
6 结论
我们在这里讨论了过程哲学和传统本体论如何将现象对象化,而这些现象只能相对于一个假定的边界来定义,该边界必须被假定为在某个感兴趣的时间段内保持稳定(或缓慢变化)。基础物理学和自由能原理(FEP)提供了相对简单且发展良好的形式化构造,使我们能够将对象(从给定观察者的角度,由其环境在其边界上的编码)和过程(可观察对象内部或之间的信息流)视为互补的,同时只做出最小的、通用的假设。这种方法拒绝了传统的对象-过程二分法,认为它是无益的,甚至是有误导性的。通过将所有对象重新定义为过程(反之亦然),它使我们能够用多尺度约束网络、冗余生成以及错误检测和纠正来描述进化/发育/生态过程。它们因此产生了一种形式上明确且无尺度限制的生物学。
这些观点在理论之外还有许多其他含义,特别是在可以从对具有主体性的材料进行工程设计的更好理解中受益的领域:再生医学和合成形态学[148, 149, 150, 151]。尽管分子生物学取得了巨大进展,但我们认为,对分子状态进行微观管理的方法将在单基因疾病之外达到自然极限。诱导大规模创伤性损伤和先天缺陷修复、重新编程癌症以及创建具有期望形态和功能的合成生物机器所需的复杂形态变化,不能仅通过自下而上的方式实现。确定需要改变哪些遗传信息(以及如何改变)以驱动期望的器官级结果,面临着难以解决的逆问题[78, 152]。前进的道路必须包括利用细胞、组织和分子网络解决问题的能力的自上而下的方法:通过重写其稳态目标状态、修改其先验知识,并识别控制其在各种问题空间中导航的刺激的效价,将复杂性推给系统本身[129]。
我们最近认为,来自神经科学和认知科学的实验室和概念工具远远超出了传统“行为”中神经对运动的控制。训练和沟通——改变记忆从而改变行为的方法——正在被用于控制生理、转录和解剖空间中的结果[153, 154]。事实上,试图通过将形态发生建模为细胞的集体智能来影响形态发生框架,已经导致了许多新的发现(综述于[26, 150])。例如,通过将癌变表型视为认知光锥(CLC)缩小的结果(一种“软件缺陷”,不一定需要任何基因病变作为原因)[155],发现了有前景的癌症治疗方法。这种病理性地缩小自我与世界边界的尺度,将大型细胞群体宏伟的器官维护目标记忆降级为单细胞生物古老的、微小的生理和代谢目标。它们随后将身体的其余部分视为仅仅是外部环境[127, 128]。从生物医学的角度来看,有趣的是,通过缝隙连接在生物电上重新连接——从而在电上重新对齐——细胞,尽管它们强烈表达强大的人类癌基因,却能够在体内消除癌症表型[156, 157, 158, 159]。调节缝隙连接的连通性调节细胞作为生化不同单元的行为程度,从而调节它们具有不同的生化实现的记忆和目标的程度。通过这种高度可调节的电突触耦合的生物电网络涵盖了大多数细胞类型,并且可以存储更大、更复杂的状态,作为在比单细胞的生理和代谢目标状态更大的尺度上导航多样化问题空间(例如组织的解剖空间)的目标导向过程的设定点[153]。
从更基础(进化)的角度来看,可以将直接的生理耦合(通过缝隙连接)视为一种利用记忆的匿名化以及“记忆所有者”大小的流动性,将自我从单细胞扩展到整个生物体的方法。例如,细胞A中事件的分子后果(即记忆印迹)可以通过缝隙连接直接传播到细胞B。细胞B无法区分这一记忆痕迹实际上是它的“虚假记忆”,而尽管这对细胞B来说是一个虚假记忆,但对于新形成的AB生物体来说,它是一个真实记忆,因为这种记忆共享过程所诱导的认知“黑客攻击”产生了一个具有共享记忆的更大系统——一种心灵融合,其中很难保持部分的独特身份,或者在博弈论意义上作弊或背叛。多个细胞能够共享相同记忆(即世界模型和先验知识)的能力,使得集体能够共同致力于巨大的目标,例如在蝾螈肢体截肢后的重建。共享匿名记忆是将较小的自我组合成具有更大智能的更大网络、进入新的问题空间的关键机制之一。
记忆本身没有元数据表明它们属于谁这一事实至关重要——这就是为什么细胞B一旦与细胞A直接耦合就无法保持自身身份的原因——因为它阻止了记忆的接收者将新记忆视为外来记忆而拒绝它们。因此,记忆作为一种自主的、随意的认知浪人(Ronin)的特性对于它们作为部分解决心灵哲学中的组合问题以及从简单代谢稳态循环中进化出解剖可塑性和稳健性的胶水的功能至关重要[27, 160]。这产生了一个令人愉悦的、尽管是非传统的“怪圈”[161]:记忆是由主体(并存在于现有主体的认知介质中)解释的模式,但它们本身也是主体,为它们周围的更大的认知系统贡献出自创生性和稳健性,作为一种生态位构建。因果影响似乎在尺度和实体性的层级结构中动态地双向流动:向下和向上。
认真对待认知科学中的深层概念在变革性生物医学和生物工程中的潜在用途,要求我们开发新的框架,以更好地理解自我、边界、记忆及其在尺度和物质实现中的动态关系。我们必须超越“真实对象”(例如细胞、组织)和“模式”(例如它们内部的记忆和信号)的限制性二分法,并研究允许每一种事物根据视角成为两种事物的对称性和不变性,并且能够适应同一统一框架。这些将是开发实用工具以指导在治疗环境中自我向上和向下扩展以及功能记忆在组织中的移动和转化所必需的[162, 163]。更好地理解记忆重新定义新自我和修改现有自我的能力,可能在(跨)个人心理学以及理解社会系统和其他我们构建现实的方式中具有重要意义。
原文链接:https://chrisfieldsresearch.com/thoughts-thinkers-PLR-final.pdf