来源:CreateAMind
介绍一篇关于生命构建的论文
Polynomial Life: the Structure of Adaptive Systems
Toby St. Clere Smithe Topos Institute toby@topos.institute
关键词:
精确地形式化概念;
是什么赋予了物理系统生命;贝叶斯、 信念;生成模型;控制系统;自生长,具身AI;边界;感觉;行动;推理;
不确定性
形态学
论文介绍部分的自动翻译
我们扩展了先前关于控制论系统的组成结构的工作,以便解释这种系统的体现。他们所有的互动都是通过他们身体的边界进行的:感觉冲击着他们的表面,而行动则对应着他们形态的变化。我们使用多项式函子来形式化这种形态透视。系统的“内部宇宙”被证明构成了多项式上统计博弈的索引范畴; 它们的动态形成了行为的索引类别。我们将主动推理理论描述为这些范畴之间的指数函子,解决了我们早期工作中的许多未解决的问题,并指出自由能原理的形式化是这些理论的伴随。我们通过生物学的基本例子来说明我们的框架,包括体内平衡、形态发生和自生组织,并提出空间导航和证明过程之间的形式联系。
1 介绍在提交给 2020 年ACT的呈件中[10]中,我们介绍了走向分类网络运动理论的一些初步步骤,其动机是关注是什么赋予了物理系统生命。我们解释说,感知和行动都可以被描述为贝叶斯推理的过程:一方面,在观察证据的基础上调整对世界的信念;另一方面,调整世界本身,以便更好地匹配信仰。在每种情况下,系统必须实例化许多结构:对世界状态的“先验”信念的选择;一种基于这种信念产生感知数据预测的机制,称为“随机通道”;和(典型地近似)该通道的贝叶斯反演,通过该反演根据感官观察来更新那些信念。
先验与随机渠道的配对对应于非正式文献中所说的生成模型,通常假设这些模型是分层的 :即随机渠道因素是某种复合的;人们想象每一个因素都对应于某个细节层次上的预测,例如从高级抽象向下级联到单个光感受器。在我们之前的提交中,我们使用双向“透镜”模式正式确定了这种合成结构1 —因为预测和反演是相反方向的—并且使用一种新的统计博弈类别来表征许多近似推理过程,其最佳响应对应于最优推理。然后,控制论系统被定义为这种游戏的“动态实现”。
这种形式主义留下了一些需要改进的地方:我们对动态实现的概念定义不清,而“行动”的概念过于抽象。在这次提交中,我们解决了这些问题,极大地简化了我们的演示。我们解释了执行近似推理的各种方法,对应于我们早期的动力学实现的非正式概念,在适当类别的统计博弈和动力系统之间形成函数近似推理理论。然后,为了形式化一个令人满意的行为概念,我们注意到任何活动的系统都有一个边界定义
它的形态,以及它通过改变这个边界的形状起作用;为了作用于另一个系统,它将这个边界的一部分耦合到另一个系统,从而改变复合形状。
为了形式化系统的形状及其相互作用,我们采用多项式函子:每个多项式将编码系统的“表型”(可能的形状或配置),以及每个配置中可能的感觉。为了赋予这样的系统生命,我们构造了由多项式索引的统计对策和动态行为的范畴。一个积极的推理原则是这些类别之间的索引函子。这个框架提供了许多可能性:我们可以在员工模型的基础上为公司构建一个生成模型;我们给出了生命基本过程的组成描述,如体内平衡和形态发生,并指出对自生的解释;我们勾画了生命系统内化其环境结构的过程,并据此导航,注意到这种在抽象空间中的导航恰好对应于证明的过程。
这里介绍的工作是进行中的工作,由于空间和时间的限制,不可能详细说明我们想要的一切。我们在附录中给出了主要小说结果的证明,并概述了其余的。尽管有这些限制,我们相信我们的结果在一定程度上回答了在我们之前提交的文章末尾勾画出的关于优雅和互动的开放问题。我们把这项工作看作是向体验控制论迈出的一步。
我们感谢拓扑研究所成员激发讨论,感谢基础问题研究所和拓扑研究所提供财政支持。
3 接口内的系统;世界中的世界在本节中,我们开发了将统计博弈的形式主义扩展到具体系统所需的结构。
3.1 体现与互动的多项式我们宇宙中的每个系统都位于某个界面或边界。它通过这个边界接收来自周围环境的信号,并且可以通过改变它的形状(以及我们将在后面看到的它的位置)来行动。当一个系统改变它的形状时,一组可能的内在信号可能会相应地改变:考虑一只刺猬把自己卷成一个球,从而保护它柔软的下腹部免受伤害(除其他外
内在信号)。一个系统也可以通过与其他系统耦合来改变它的形状,比如当我们拿起粉笔来解决一个问题时。形状可以是抽象的:当我们进入在线视频会议或在虚拟现实中移动时,我们会改变我们的“形状”。
我们利用多项式函子正式描述了所有这些相互作用,借鉴了[13].
备注 3.5。在关于主动推理和自由能原理的文献中,对“马尔可夫毯”的概念有很多争论,这是一个非正式的概念,用来表示自适应系统的边界。我们相信多项式代数足以精确地形式化这个概念, 并且澄清了文献中的许多混淆。
5 多项式寿命与具身认知最后,我们概述了一些经典的生物过程是如何被建模为多项式上的主动推理过程的。关键的洞见是,通过固定“主动”自由能量游戏的先验来编码关于外部状态的高精度(低方差)信念,我们可以诱导系统更喜欢行动(来具体化这些信念)而不是感知(即更新信念以匹配感知)。这样做,你可以在系统中诱导意志或目标导向。这些例子的一个关键特征是,它们展示了“具身”认知,在这种认知中,系统的形式和相互作用成为其认知机制的一部分。
备注 5.1。当然,必须注意不要选择精度过高的先验(如狄拉克 δ 分布),因为这将导致系统放弃任何信念更新,从而使其行为独立于“实际”外部状态。
例 5.2。假设系统的传感器包括一个关键参数,如环境温度或血液酸碱度。假设通过调整其配置,系统可以四处移动以采样该参数。假设“先验”编码了一个以该参数的可接受范围为中心的高精度分布。那么很容易表明,通过最小化自由能,系统将试图配置自己,以保持在可接受的参数范围内。我们可以认为这是一个简单的稳态模型。
例 5.3。我们可以将前面的例子扩展到一个具有多个(多项式)组件的系统,每个组件都配备了一个“稳态游戏”,以便对形态发生进行建模。假设感官中的环境参数是某个信号分子的局部浓度,并且假设形成复合系统的多项式态射编码了每个系统邻域中信号分子浓度的模式,这是它们相互配置的结果。假设在每个系统的先验中编码的目标状态对应于相对于其周围系统以特定方式定位的系统,如信号集中所表示的。然后,自由能最小化诱导系统自我排列,以获得目标模式。
备注 5.4。前面的例子开始指向自动生成的组成理论:在这里,人们可能期望目标状态编码命题“保持我的形态”,这是自我参照的。在先验中编码这个命题的最优雅的方式不是立即
很清楚,尽管有许多可能性(例如避免一些代表解体的不良配置)。我们希望这个问题的满意答案与“贝叶斯力学”有关(6).
备注 5.5。非正式地表明,给定一个有限时间范围的马尔可夫决策问题,主动推理可以恢复传统上通过逆向归纳法得到的贝尔曼最优策略 4].目前作者正在进行的工作旨在正式确定这种关系的结构。特别是,结果依赖于在给定策略和目标的情况下,将损失函数的预期直接编码到先验中,这给我们的印象是,大量的信息被推入非结构化的数字分布中。
例 5.6。这些例子不必局限于简单的生物学案例。例如,我们可以非常普遍地对空间导航建模 :我们可以使用参数化的统计游戏来编码关于“外部空间”结构的不确定性(例如:哪些点或社区与哪些点或社区相连,以及通过哪些路径)。通过在某个位置设置高精度先验,系统将尝试到达该位置,学习沿途的空间结构;降低先验的精度导致系统更喜欢“单纯的探索”。可以使用自然多项式束结构将传感数据附加到每个位置。此外,“外部空间”不一定是简单的拓扑空间:它可能是更结构化的东西。例如,类别和站点本身可以多项式建模。人们可以认为“采取行动”精确地类似于“遵循态射”:因此,在拓扑理论的背景下,人们可以认为“外部空间”的结构是类型理论的背景,而世界中的位置是相应拓扑中的对象。然后可以在先验中编码一个目标命题,自由能最小化会导致系统探索“空间”(学习其结构),并寻找一条通往目标的路径。但这样的道路恰恰是一个证明!越来越多的证据表明,空间导航和抽象导航背后的神经机制是相同的[1】,这似乎提供了一个数学上的理由。
ppt video:
https://www.cl.cam.ac.uk/events/act2021/
paper:
https://www.cl.cam.ac.uk/events/act2021/papers/ACT_2021_paper_28.pdf
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”