图. 智源研究院《人工智能的认知神经基础白皮书》(2021年)
来源:智源研究院
智源研究院发布 2021 年度《人工智能的认知神经基础白皮书》,兼具专业性与科普性,是人工智能学者探寻“AI+脑科学”交叉学科研发创新的导览之作:
《白皮书》由智源“人工智能的认知神经基础方向”首席科学家刘嘉教授牵头,联合方向智源学者和博士后科研人员共同编著,盘点了神经科学、认知科学、智能技术等相关领域的重要进展,同时还囊括了脑机接口、新型脑成像等学科热点。
相较去年,2021年度《白皮书》对于计算机科学、人工智能、深度学习、强化学习等研究背景的从业者更加友好:解释了强化学习、多模态学习、通用人工智能等热门人工智能课题背后的认知神经研究动机。
推荐语
黄铁军,智源研究院院长,北京大学教授
「与去年不同的是,除了从认知科学和神经科学两大领域系统梳理重要进展及对人工智能的启示外,今年还集中介绍了类脑视觉、脑机接口和交叉学科技术这三个方向的热点和趋势。」
刘嘉,智源首席科学家,清华大学教授
「生物智能很强大,但已是完成时;而机器智能是现在进行时,虽然还很弱小。正所谓“已有的事,后必再有;已行的事,后必再行。阳光之下并无新事”。基于脑科学与认知科学的人工智能,正是要借助脑科学与认知科学来逆向工程生物智能以洞悉自然演化的机制,从而指明机器智能的进化道路,最终以触达智能的未来时。」
余山,智源研究员,中科院自动化所研究员
「希望通过它(白皮书)向大家梳理脑科学、认知科学和类脑智能方向上最值得关注的动态和进展,并分享我们对于这些方向未来发展趋势的思考。」
章节速览
上下滚动查看更多
“AIx脑科学”前沿阵地
智源学者打造面向未来
通用智能研究专业指南
大脑作为通用智能的唯一样本,为人工智能的发展提供了重要参照。
智源研究院“人工智能的认知神经基础”重大研究方向是我国在该交叉领域创新发展“前沿阵地”,该方向智源学者均是具有国际影响力的中青年学术带头人,包括清华大学刘嘉教授、宋森研究员,北京大学陈良怡教授、方方教授、吴思教授,中科院自动化所余山研究员等。
图. 智源研究院“人工智能的认知神经基础”重大方向智源学者团队
随着近年来人工智能技术的快速发展,计算机算力和大数据可及性快速提升,以深度人工神经网络为核心的人工智能系统在物体识别、自然语言处理等领域取得了令人瞩目的成绩,在围棋、星际争霸等竞技游戏中一骑绝尘,甚至在蛋白质结构解析、提出和解决数学难题等方面展现出超越人类专家的潜力。但目前的人工智能与通用智能之间,还存在巨大的能力鸿沟。
人工智能研究亟待来自脑科学领域的启发:通过对生物脑如何实现智能的研究,提出可借鉴的原理、模型、算法和系统实现方案,从而促进类脑智能发展,推动人工智能向人类水平、甚至超越人类水平逼近——
一年一期的智源《人工智能的认知神经基础白皮书》即为实现这一目标的重要尝试:
为人工智能相关学科、系统神经科学、认知神经科学、计算神经科学、脑机接口以及神经科学新技术等领域的研究人员、学生和相关从业者介绍最前沿的科研动态,提供高屋建瓴的思路启发。
三层面经典阐析脑智能原理
一览脑机接口等学科热点
上世纪 70 年代末期,计算神经科学的先驱,英国科学家David Marr 指出,我们可以从三个层面理解脑的工作原理:
计算层面 (Level of Computation) :脑在做什么计算,为什么要进行计算。
表征/算法层面 (Level of Representation/Algorithm):如何表征脑在计算过程中的信息,选择怎样的算法来实现计算目标。
物理实现层面 (Level of Implementation):脑选择什么样的“硬件”实现形式来执行这些计算。
图. David Marr——理解智能的三个层次
受此启发,此次《白皮书》基于上述三个层面分别介绍了在认知科学、神经科学领域的经典理论、具有独立智能功能的基本神经回路,以及基于生物视觉信息处理机制的类脑视觉新范式和智能视觉芯片硬件基础。
此外,围绕脑科学与人工智能交叉领域的前沿技术进展,白皮书还介绍了脑机接口技术、高精度高信息量数据获取方法、智能化数据处理手段等类脑计算及其交叉领域的最新进展和趋势洞察。
█ 计算层面
在计算层面,我们在《白皮书》第一章重点介绍了具身认知(Embodied Cognition)理论和全局工作空间(Global Workspace Theory, GWT)理论。
与当前主流人工智能主要基于被动观察与识别,往往不具有具体物理形态的范式不同,具身认知认为,认知过程无法脱离身体而进行,推广开来,整个环境和个体的行为同样是认知的重要组成部分。个体通过感知外部环境,进行决策,生成相应动作与环境交互,以此改变环境,这个过程周而复始,促成了智能的形成和发展。
全局工作空间理论则是由美国心理学家Bernard Baars在上世纪80年代作为一种意识模型而提出的认知架构,后来发展为“全局神经元工作空间”(Global Neuronal Workspace, GNW)。GNW如同一个分布式路由器,同各个脑区的众多神经元存在关联,从而可以放大、维持信息,并提供给各个处理模块使用,从而实现全局的信息共享和处理。
图. GWT 认知架构的功能框架草图
█ 表征/算法层面
在表征/算法层面,我们在第二章中聚焦于脑中认知地图的表征以及神经流形这两个重要的研究领域。
位于脑中海马体及其邻近脑区中存在表征空间特征的位置细胞(Place cell)和网格细胞(Grid cell),近年来的研究揭示这一系统可能不仅涉及空间记忆与导航,而且可能参与了物理空间认知以外的信息处理,比如图片空间、嗅觉空间,甚至关系空间的表征,提示脑中可能用一套通用的机制在处理一系列表面上截然不同,但是具有深刻共性的信息维度。
神经流形 (Neural manifold) 则是利用动力学的理论和观点来理解众多神经元构成的群体如何开展高效计算的有力工具。通过流形向量场这一精确的数学语言对神经电生理信号进行分析已经开始回答很多有关神经群体编码的关键问题。
图. a-c,网格细胞流形表征的概念模型;d-g,网格细胞的规则放电形态随空间形态变化而变化;h-k,流形在大脑内存在的神经科学证据
█ 物理实现层面
在物理实现层面,我们在第三章中基于认知神经科学原理提出类脑视觉的新范式,并重点介绍了受生物视网膜启发的动态视觉传感器(Dynamical vision sensor,简称DVS)和脉冲摄像头(Spiking camera)。
与传统的视觉传感器不同,这两类模拟视网膜的感知设备能够将图像信息转化为脉冲事件流进行表征,具备高动态范围、高时间分辨率、低能量消耗以及高像素带宽等特性。
相应的,我们也系统地梳理了适宜于处理脉冲事件流信号,并可以开展运动目标快速探测、有效跟踪和精确识别的类脑视觉计算模型和算法。
图. DVS 示意图以及其脉冲信息处理面临的挑战
█ 智能技术前沿进展
在上述三个方面的内容之外,我们还在第四章和第五章针对脑科学与类脑智能研究中近年来涌现的新技术,特别是脑机接口技术、新型脑成像、连接组学与数据处理方法等进行了梳理和介绍。
脑机接口通过对于脑活动信息的检测和调控,在脑与外部世界间建立直接的信息通讯接口。这一技术的发展,有望对于人与环境、人与人的交互方式带来根本变化,从而引起社会、经济、教育、军事、医疗等众多领域的颠覆性变革。
新型脑成像、连接组学与数据处理方法,展现了以往观察不到的神经活动细节,解析了神经网络中各部分的相互作用机制,从而促进人们进一步理解神经系统的设计原则。
结语
编写白皮书的过程是智源认知神经基础方向一年一度盘点神经科学、认知科学、智能技术等相关领域重要进展的过程,也是智源科研团队成员不断思考什么是智能,以及如何发展类脑智能的过程。
希望这些努力能让对于这些领域的进展感兴趣,也对回答这些问题感兴趣的读者有所收获。
助力中国“脑-智研究”的交叉融合,推动类脑通用智能发展,期待我们尽一份心力。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”