PNAS前沿:迈向作为多层学习的进化理论

be17de7a9d97270022a55b2f98b88bb7.png

来源:集智俱乐部

作者:郭瑞东

编辑:邓一雪

导语

进化、学习与物理系统的重整化有何相似之处?PNAS的论文“构建将进化视作多层学习的理论”一文,经由统一的理论框架,分析进化过程中的环境预测误差,及学习过程中的信息流,推出了更一般的分子生物学中心法则。

研究领域:中心法则,生物进化

ed4dd421d4ddcea59f61a1bdc030303f.png

论文题目:

Toward a theory of evolution as multilevel learning

论文地址:

https://www.pnas.org/content/119/6/e2120037119

1. 进化理论面对的挑战

按照NASA的定义,生物是能够进行达尔文式进化的、有自我维持能力的化学系统。但该定义中的进化过程本身预设了复杂性的存在,遗传物质(DNA或RNA)的稳定复制本身就需要合适的环境(修复酶)。追根究底,为何会出现适合进化过程产生的环境?什么是进化所必需的条件呢?回答不应该是进化过程本身,否则就会陷入先有鸡还是先有蛋的争议。

进化理论的第二个问题是:进化无法解释为何生命会诞生,为何生物体中的层级化组织会产生?进化关注群体层面的突变频率改变,但对生物个体进化过程中偶然出现的决定性转变(major transitions in evolution),例如多细胞生物、社会性合作种群的出现,却不能给出合适的解释。

传统的进化理论将进化看成是一个最优化过程,但对于多细胞生物来说,进化的过程不仅仅是最优化,还涉及不同层级上的权衡。具体地展示,首先是细胞的复制次数和速率有其上限,否则就会危害生物体整体的生存(比如癌细胞),其次是生物体和其寄生生物之间的军备竞赛。这些需要生物体在不同层级之间进行权衡,而对该权衡的回答,是促成复杂又多样的万千生物的关键因素。

要应对上述挑战,需要将进化过程放在一个更一般的框架下,从而指出生命的诞生只是非遍历(nonergodicity)过程中的特殊现象。就像只有将人类看成哺乳动物的一种特例,才能破除人的特殊性,从而更好地理解人类。新框架下,神经网络的学习、物理系统的重整化和生物进化,都是更一般过程的一种特例。

2. 使进化可能的7条原则

正如欧式几何从几条公理出发,生物进化在满足以下7个条件的宇宙,将不仅是可行的,还可能是必然出现的。满足了这些条件后,宇宙间必然会诞生观察者,复杂性也必然会涌现。观察者的出现不必涉及意识,单细胞生物体也会预测环境并做出反应,因此任何生物体都应该看成观察者。将观察视作进化的先决条件,以下的7条原则可以看成使观察可能的先决条件。

1. 损失函数: 存在一个随时间变化的损失函数,该损失函数在进化过程中会最小化。

2. 层级化组织:演化系统包括在不同时间尺度上发生变化(具有不同特征频率)的多个动力学变量。

3. 频率间隙:代表进化动力学的变量,在不同的组织层次之间,存在足够宽的频率间隙,使其分开。

4. 可重整化。在对演化系统的整个组织进行描述时,通过对变化较慢(较低频率)变量的描述,可对变化较快(较高频率)变量进行统计描述。

5. 可扩展性。不断发展的系统有能力整合可用于维持系统的其他变量,并有能力排除可能破坏系统稳定性的变量。

6. 复制。在不断演化的系统中,相应的信息处理单元(IPUs)的复制和消除可以在组织的各个层级上进行。

7. 信息流。在不断发展的系统中,变化较慢的级别在学习过程,可以从变化较快的层级吸收信息,并将信息传递给变化较快的级别,以预测环境和系统本身的状态。

从整个宇宙的尺度来看,在众多可能的宇宙中,稳定性就可以看成是一个损失函数,经由试错,宇宙试图最优化这一函数,由此宇宙中的某一部分的演化,都可以看成宇宙演化的一个特例。而产生类似复杂生物体,则需要满足之后的几条原则。正因为存在快速变化和缓慢变化的两类变量,才需要出现层级化的组织结构。而可重整化的描述,使系统可以通过粗粒化表达,用少量变量来描述复杂的系统动力学,这使得生物体可以利用不完整的观察,做出对生存有益的预测。而如果描述系统动力学的变量,以相同的频率运行,生物体进行宏观预测时,必需同时了解其微观状态,在这样的宇宙中,只有学会了量子力学的生物体,才能进化出对生物有利的特征。

后三条是复杂生物出现的必须条件,当环境的变化速度,比生物体学习新信息的速度更快时,进化将变得不可能,第五点实际上指生物所处的环境是相对稳定的。第六条与频率间隙相对,正是由于不同层级的信息频率不同,因此不同层级需要有相对独立复制的信息处理单元。而不同层级间的信息交换,则是重整化得以进行的物质基础。

3. 用进化的7条原则,

解释进化中的关键事件

通过上述的7条原则,可以将进化过程中的里程碑事件的出现给予解释,并将进化过程和学习过程联系起来。例如细胞是生物体最基本的信息处理单元(IPU),其区分了自身和外界环境,并通过层级化的组织,构建了生物复杂性。从前四条原则,可以预测IPU一定会出现。将变化相对较慢的生物体,和变化较快的环境区分开,能够促成利用环境中的有用资源,并通过刺激和反应生成信息流。

在自旋玻璃物理中,非遍历且具有长历史的系统,会出现frustration(停滞)的状态。在生物体中,相互冲突的驱动会使生物呈现多样性和复杂性。这一现象的出现,其物理基础在于层级化的组织,而频率间隔的存在,使得生物体可以找到多个在适应函数上位于相同值的不同状态,而非遍历的演化动力学,是复杂系统的一个核心特征。在神经网络中,同样存在最优化停滞的鞍点。

为了克服进化中的停滞状态,可以引入随机性,但随机波动并不能保证生物体找到最优值,也不能确保其停留在最优值上。其结果就是众多不完美的设计,这在生物进化中经常出现。在进化理论中,该现象被称为适应度景观是粗糙的,而在机器学习中,该现象被称为存在多个局部最优。生物体引入随机性的方式,包括基因漂变,而在机器学习中,则是随机梯度下降。

由于重整化的存在,使得生物的信息处理过程中,不存在特定的最优层。这意味着生物体在不同层级间的控制,是在该层进行的。细胞的活动由基因决定,细胞形成的组织的动力学,由细胞间的互作决定,而最高层的生态系统的行为,由多个种群之间的食物链决定。这意味着存在多个管控层级。

重整化和信息间隔,使得生物体需要将信息存储和信息处理分离,即表型(连续的细胞形态)和基因型(稳定的离散信息)是相互分离的(DNA到RNA再到蛋白质的中心法则),即使对于以RNA为信息载体的原始生物,也是如此。在计算机中,冯诺依曼架构中,存储和计算单元的分离,也是基因型和表现型分离的一种体现。

层级化的信息处理以及重整化,使得生物体在进化过程中,会产生搭便车的寄生体。清除寄生信息的成本,由于不同层级的信息频率存在间隔,而变得过于高昂,这使得即使那些对生物体存活没有帮助的寄生编码也能存活。但长久来看,这些寄生的信息,可以为进化提供随机性,还可能促成有利的共生关系,线粒体、叶绿体的出现,都是这一共生关系的典范。

信息单元的复制以及可扩展性,预示着单个信息处理单元的寿命必须是有限的,低层级的信息处理单元,通过复制产生能够更好的从环境中获取负熵的单元后,就会自然走向死亡,从而以低层级的牺牲,促成高层级进一步优化损失函数。这解释了生物体细胞层面的预设死亡(programed death),也解释了为何会出现年老的大象为了象群自杀。

4. 生物体的中心法则背后的信息流

通过将进化,看成是学习过程,可以使用数学模型对生物体中非对称的信息流进行分析。如下图所示:其中环境的信息以及生物的基因型(个体存活的时间范围内)都是无法被训练的,浅绿色代表环境中,对损失函数不产生影响的因素,能够改变的只有中间的表型以及表型和环境之间的连接。

9a19198c0ab91bd84de21acdfd820982.png

将进化过程看成是神经网络的训练过程的示意图

通过该框架,可以解释进化为何促成了复杂性的涌现。相比自组织临界(SOC),该框架能够整合生物和物理领域的众多现象,并符合达尔文式的进化过程。其中快速变化的信息处理动力学(直接和表型作用的蛋白质)和变化缓慢系统动力学(基因型的改变)是相互独立的。生物体通过基因中存储的信息对环境进行快速的预测和干预(产生蛋白质),但反向的信息传递,却不是发生在微观层面,而是宏观上的突变和选择,这一信息传递的不确定性,作者称其为广义的分子生物学中心法则。

用不严谨的类比来描述,缓慢变化的基因型,决定了进化这场游戏的规则,玩家在每场游戏中根据规则游戏,但如果游戏的规则对玩家不利,玩家会尝试改变游戏的规则。但相比没有游戏规则的玩家,在短时间内,按照规则游戏的收益更大,因此玩家在短期内不会破坏游戏规则。

总结全文:通过将进化看成是学习过程,可以从最基础的7条观察开始,对进化过程中的现象给与解释,并在生物和非生物之间,构建起一个统一的解释框架,从解释生命的起源。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

baf19c6b1507905eb0461a11cca38c94.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482475.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【前瞻】Nature:2022年7大“颠覆性”技术

来 源:中国科学报 作 者:文乐乐 近日,《自然》对“可能在未来一年对科学产生影响”的7项技术进行了综述。这7项技术分别是完整版基因组、蛋白质结构解析、量子模拟、精准基因组调控、靶向基因疗法、空间多组学、基于CRISPR的诊断。完整版基因…

重磅!Nature子刊发布稳定学习观点论文:建立因果推理和机器学习的共识基础...

来源:AI科技评论整理:AI科技评论2月23日,清华大学计算机系崔鹏副教授与斯坦福大学Susan Athey(美国科学院院士,因果领域国际权威)合作,在全球顶级期刊Nature Machine Intelligence(影…

卸载mysql

先停止所有mysql有关进程。 打开控制台:依次输入以下命令 sudo rm /usr/local/mysqlsudo rm -rf /usr/local/mysql*sudo rm -rf /Library/StartupItems/MySQLCOMsudo rm -rf /Library/PreferencePanes/My*vim /etc/hostconfig and removed the line MYSQLCOM-YES-rm -rf ~/Libr…

​数据集拥有自己的世界观?不,其实还是人的世界观

来源: AI科技评论编译:Antonio编辑:陈彩娴伴随深度学习的不断日常化,数据集中的偏见(bias)和公正性(fairness)已经成为一个热门研究方向。偏见在AI领域是一个很棘手的话题&#xff1…

图灵奖获得者Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」

来源:机器学习研究组订阅LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测,对应的解决方案是一种叫做分层 JEPA(联合嵌入预测架构)的架构。该架构可以通过堆叠的方式进行更抽象、…

可重构人工智能设备展现出智能化前景

PURDUE UNIVERSITY来源:IEEE电气电子工程师一项新的研究发现,一种适应性强的新设备可以转换成人工智能硬件所需的所有关键电子元件,在机器人和自治系统中有潜在的应用。以大脑为灵感或“神经形态”的计算机硬件旨在模仿人脑从经验中自适应学习…

gin+vue的前后端分离开源项目

该项目是ginvue的前后端分离项目,使用gorm访问MySQL,其中vue前端是使用vue-element-admin框架简单实现的; go后台使用jwt,对API接口进行权限控制。此外,Web页面在token过期后的半个小时内,用户再次操作会自…

day37-数据库分组查询

1. 单表查询 2. 多表查询 ## 单表查询 前期表准备 create table emp( id int not null unique auto_increment, name varchar(20) not null, sex enum(male,female) not null default male, #大部分是男的 age int(3) unsigned not null default 28, hire_date date not null, …

指挥控制智能化现状与发展

来源:人机与认知实验室0 引言人工智能(AI)技术现已进入一个新的高速增长期,是公认最有可能改变未来世界的颠覆性技术。从“深蓝”战胜卡斯帕罗夫,到机器学习技术在语音识别、图像识别和自然语言处理等诸多…

IEEE 2022年网络、计算机和通信国际学术研讨会(ISNCC2022)

2022年网络、计算机和通信国际学术研讨会(International Symposium on Networks, Computers andCommunications,2022)主办:电气与电子工程师学会(IEEE)、IEEE 通信学会(IEEE Communications Society&#x…

【重要征稿】IEEE 2022年网络、计算机和通信国际学术研讨会(ISNCC2022)

2022年网络、计算机和通信国际学术研讨会(International Symposium on Networks, Computers andCommunications,2022)主办:电气与电子工程师学会(IEEE)、IEEE 通信学会(IEEE Communications Society&#x…

C++ 类设计核查表

参考:https://www.jianshu.com/p/01601515ca31 《大规模C程序设计》 函数接口: 1.运算符或非运算符函数? 2.自由或成员运算符? 3.虚函数或非虚函数? 4.纯虚成员函数或非纯虚成员函数? 5.静态或非静态成员函…

CICC《城市大脑建设规范》标准建设启动会在京召开

来源:中国指挥与控制学会 2022年2月27日下午,中国指挥与控制学会(以下简称:CICC)在京召开了《城市大脑建设规范》团体标准启动会。启动会邀请到了中国电信、中国电科、中国电子、联想、科大讯飞、世纪互联、北京市标准…

day38-数据库应用软件

# mysql select distinct 字段1,字段2,。。。 from 表名 where 分组之前的过滤条件 group by 分组条件 having 分组之后过滤条件 order by 排序字段1 asc,排序字段2 desc limit 5,5as语法中给某个查询结果起别名的时候需要把查询语句中…

世界被一种神秘的数学力量彻底改变了

来源:《微积分的力量》编辑:nhyilin01科学或许是唯一的神上世纪60年代,小说家赫尔曼沃克(Herman Wouk)正在为他计划中的巨著《战争风云》做调研,他去加州理工学院采访了参与过原子弹研发的物理学家&#xf…

程序异常退出后,托盘残留图标清理方法(C#)

程序猿对于宕机再熟悉不过了,如果一个程序异常退出,那我们只能在Windows日志中找到它的踪迹;如果它是一个托盘程序,异常退出后,它会停留在托盘中久久不能离去,直到我们的鼠标从它身上划过;如果一…

汪劲:生命系统中的非平衡物理学

来源:集智俱乐部作者:汪劲编译:袁郭玲编辑:邓一雪导语非平衡物理学将在生物应用中发挥重要作用,如酶动力学、新陈代谢、基因调控,细胞的结构、功能和动力学,生理学、癌症、分化和发育&#xff0…

虚拟现实和元宇宙的最大短板在哪里?

出品:科技智谷编辑:王晓东虚拟现实和元宇宙面临的最大问题不是技术问题而是功能问题。在所有关于Metaverse以及虚拟现实或VR将给我们的生活带来什么的讨论中,有一个很大的功能问题被忽略了。正如几大巨头宣传的那样,Metaverse是一…

解密通往元宇宙的三大入口,VR先上AR紧跟,但脑机接口才是未来

来源: 智东西编辑:智东西内参VR、AR和脑机接口,谁是人类通往元宇宙的合适入口?VR/AR/脑机接口是集合了微显示、传感器、芯片和算法等多项技术在内的下一代人机交互平台。回顾整个人机交互发展历程,我们看到人机交互的指令输入形式…

python enumerate用法总结(转)

原文链接:https://blog.csdn.net/churximi/article/details/51648388 enumerate()说明 enumerate()是python的内置函数enumerate在字典上是枚举、列举的意思对于一个可迭代的(iterable)/可遍历的对象(如列表、字符串)&…