Science:人工智能的发展离不开神经科学,先天结构或是下一个方向

640?wx_fmt=jpeg

来源:Science

编译:机器之心


摘要:人工智能从神经科学领域吸收了大量养分,并由此催生了深度学习和强化学习等智能处理方法。以色列魏茨曼科学研究学院计算机科学系教授 Shimon Ullman 相信神经科学还能为人工智能发展提供进一步的助力,比如先天结构的采用也许能为人工智能带来高效且灵活的学习能力。Ullman 教授这篇观点文章发表在最新一期 Science 杂志上,机器之心进行了编译介绍。

 

数学家阿兰·图灵 1950 年的开创性论文引领了人类对人工智能(AI)的探索,他在这篇论文中提出了一个问题:「机器能否思考?」,那时候唯一已知的能够进行复杂计算的系统是生物神经系统。因此,毫不奇怪那时候这个新兴的 AI 领域的科学家都将大脑回路作为引导。


其中一条道路是通过类脑回路执行智能计算,这个方向的早期尝试近来已经创造出了巨大的成功,并可被描述成一种用于建模皮层回路的高度还原论(reductionist)的方法。


其当前的基本形式被称为「深度网络」架构,这种脑启发模型是通过类神经元件组成的连续层构成的;这些元件按照生物学中类似作用的组件而被称为「突触」,它们通过可调节的权重相连。


深度网络和相关方法在 AI 系统中的应用已经带来了变革。研究证明它们在 AI 研究的核心领域优于之前已知的方法,包括计算机视觉、语音识别和生成、玩复杂的游戏。它们也已经取得了广泛的实际应用,涉及很多领域,包括计算机视觉、语音和文本翻译,其它还有很多领域也存在大规模的努力。


我将在这里讨论大脑回路中的其它方面将可能如何引导网络模型的发展,从而让我们了解认知和通用人工智能的更多方面。


差  异


深度网络的核心问题是学习(learning),这是对突触的调整,从而得到针对其输入模式的期望输出。这样的调整是基于训练样本集自动执行的,而训练样本集中包含输入模式以及配套的期望输出。然后,学习过程通过调整权重得到训练输入模式的期望输出。成功的学习会让网络超越记忆训练样本的情况,而且使其能够泛化,为学习过程中从没见过的新输入模式提供正确的输出。

 

研究者将深度网络模型与实际得到的生理学、功能性磁共振成像和行为数据进行了比较,结果表明大脑与这类新模型之间存在一些有趣的相似性,但同时也存在一些不相似的地方(见图)。对比灵长类动物的视觉系统,生理学响应与模型响应在神经元响应过程的早期阶段比后期阶段更为近似,这说明深度网络模型也许能更好地体现早期的处理过程,而不是后期的更涉及认知的过程。


640?wx_fmt=jpeg

大脑回路与学习,来自 C. BICKEL/SCIENCE


除了深度网络,AI 模型近来还融合了类脑计算的另一个重要方面:强化学习(RL),其中使用了大脑中的奖励信号来修改行为。


这种形式的学习中涉及的大脑机制已经得到了广泛的研究,而且其计算模型也已经在 AI 领域得到了使用,尤其是在机器人应用中。强化学习可用于在世界中运作的智能体(人、动物或机器人)中,通过接收的奖励信号作为回报。强化学习的目标是学习一个最优「策略」,这是从状态到动作的一个映射,以便最大化随时间获得的一个整体度量的奖励。


在近期的一些 AI 算法中,强化学习方法已经与深度网络方法结合到了一起,并且在游戏领域的应用尤其突出,涵盖的范围包括流行的视频游戏到高度复杂的游戏,比如国际象棋、围棋和将棋。深度网络与强化学习的结合在玩游戏方面取得了惊人的成果,包括令人信服地击败了世界顶级的围棋棋手、在大约 4 小时的训练之后达到了国际象棋世界冠军的水平;这些都是仅从游戏规则开始,通过内部自我对抗进行学习而达成的。

 

从使用神经科学引导 AI 发展的角度看,因为相比于皮层回路,这些网络的形式是经过高度简化的,所以这样的成功很让人惊讶。一些其它的脑启发方面(比如跨神经元组归一化或使用空间注意)也已经被整合进了深度网络模型中。但一般而言,我们所知的有关神经元的几乎一切(它们的结构、类型、互连性等等)都被排除在了深度网络模型的当前形式之外。


我们目前仍不清楚生物回路的哪些方面在计算上是关键的,并且也可用于基于网络的 AI 系统,但结构中的差异很显著。比如,生物神经元在它们的形态学、生理学和神经化学方面都非常复杂和多样。


典型的受到激励的锥体神经元的输入分布在复杂的、高度分支的底和顶树突树上。抑制型皮层神经元具有多种不同的形态,它们很可能执行着不同的功能。典型的深度网络模型都没有包含这种异质性和其它复杂性,而是使用了有限种类的高度简化的同质的人工神经元。在网络中单元之间的连接性上面,大脑中皮层回路也比当前的深度网络模型更复杂,并且在同一层的神经元之间具有丰富的横向连接,其中既有局部连接,也有长程连接,而且还有从皮层区域的高层区域到低层区域的从上到下的连接,而且可能会组织在典型的局部「规范回路(canonical circuits)」中。

 

基于深度网络的学习方法主要在与现实世界的感知数据(比如视觉和语音)相关的问题上取得了显著的成功,近来研究者已经将越来越多努力投入到了自然界中更涉及认知的问题上。比如在视觉领域,网络模型最早是为处理目标分类和分割等感知问题而开发的。类似的方法经过某些扩展后现在已经被用在了图像描述(任务目标是生成一张图像的简短语言描述)和视觉问答(任务目标是为以自然语言提出的有关图像内容的查询提供恰当的答案)等更高层面的问题上。其它还有一些非视觉任务,比如评价幽默程度、检测讽刺、获取直观的物理知识或社会理解的一些方面。研究者们也为一些高难度的真实世界应用开发出了类似的方法,包括在线翻译、灵活的个人助理、医疗诊断、先进机器人学、自动驾驶。

 

有了这些重大的研究努力以及投入到未来 AI 应用中的大量资金,需要解决的重要问题是:当前的方法能在何种程度上生成「真实」和类似人类的理解,或者是否还需要其它的(也许非常不同的)方向来处理认知和通用人工智能(AGI)的众多不同方面。我们还不知道这个问题的答案,但不管是科学上还是商业上,这都非常重要。


先天结构


如果事实证明当前深度网络模型在产生类人认知能力方面的成功是有限的,那么我们很自然又会向神经科学寻求指引。


当前 AI 模型忽视的大脑回路的那些方面是否会是 AGI 的关键?大脑的哪些方面可能是尤其重要的?


目前我们还没有显而易见的答案,因为我们对皮层回路的理解仍然还很有限,但我会简要讨论一下大脑和深度网络模型看起来根本上不同的一个一般性方面,而且这个方面很可能在我们追寻类人 AGI 之路上发挥重要的功用。


这一差异的核心是一个老生常谈的问题,关乎认知中经验主义(empiricism)与先天主义(nativism)之间的平衡,即先天的认知结构与通用的学习机制之间的相对重要程度。


当前的 AI 建模方法严重倾向于经验主义一方,会使用大型的训练数据集。相对而言,生物系统往往仅需少量训练就能完成复杂的行为任务,它们基于特定的预先存在的网络结构,而且该结构在学习之前就已被编码在了回路之中。


比如,针对复杂的导航任务,包括昆虫、鱼类和鸟类在内的不同动物物种都能部分地依靠一套先天固有的特定用途的复杂精细的机制外加精妙的计算能力来完成。


对于人类,婴儿会在生命的最初几个月开始发展出复杂的感知和认知技能,且仅需很少或无需明确的训练。比如,他们能够自发地识别出人手等复杂的目标、跟随其他人的注视方向、通过视觉分辨动画角色是在帮助其他角色还是妨碍其他角色,还能完成其它很多不同的任务,能表现出他们对物理交互和社会交互的初级理解。


大量发展中的研究都表明这种快速的无监督学习之所以是可能的,原因是人类的认知系统通过进化而配备了先天的基础结构,这些结构能够促进对意义概念和认知技能的习得。

 

与已有的深度网络模型相比,人类认知学习和理解的优越性可能很大程度上源自人类认知系统具备的丰富且复杂很多的先天结构。近来对婴儿期视觉学习的建模研究已经表明学习与先天机制的结合是有用的,其中有意义的复杂概念既非先天固有,也不是靠自己学习得到。


从这个居中的角度看,先天的那部分不是已经发展好的概念,而是更简单的「原型概念」,这能提供内部的教学信号,引导学习系统,从而仅需少量或无需明确的训练就能逐渐习得和组织复杂概念。


比如,研究已经表明一种特定的图像运动模式可以为人手识别提供可靠的内部教学信号。对人手以及它们在操作物体中的参与情况的检测可以引导学习系统学习检测注视方向,而检测注视目标又在学习推理人的目标中发挥着重要作用。这样的先天结构可以通过在局部皮层区域中布置特定的初始连接,再将输入和误差信号提供给特定的目标来实现。

 

人工网络模型也可以采用有用的预设结构来使其学习和理解更接近人类。发现有用的预设结构这一难题的解决方法可以是理解和模仿相关的大脑机制,或开发从头开始的计算学习方法来发现支持智能体、人类或人工智能的结构,使其能以高效且灵活的方式学习理解自己的环境。


这一方向上已有一些尝试,但一般而言,「学习先天结构」这一计算问题不同于当前的学习过程,而且我们的了解还很少。长期来看,将经验主义方法与计算方法结合起来处理这一问题很可能对神经科学和 AGI 都有利,并最终可能会成为可应用于这两个领域的智能处理理论的一部分。 


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492651.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu20.04 及深度学习环境anaconda、cuda、cudnn、pytorch、paddle2.3安装记录

学习目标: Ubuntu20.04下装好torch、paddle深度学习环境。 选择的版本环境是 :最新的nvidia驱动、cuda 11.1 、cudnn v8.1.1,下面会说为啥这么选。 学习内容: 1. Ubuntu20.04仓库换源 本节参考Ubuntu 20.04 Linux更换源教程 2…

NSIS脚本语言安装与编译

NSIS是什么 当项目中需要把安装包发给客户时,不能直接发送release文件,需要把release文件压缩打包,这时就可以用到NSIS工具,NSIS工具可以进行包装,使用时需要下载: 编译环境:nullsoft scriptab…

AI 的寒冬将来临

来源:云头条深度学习处于所谓的AI革命的前沿至今已有好几年;许多人过去认为,深度学习是神奇的“银弹”,会把我们带到技术奇点(general AI)的奇妙世界。许多公司在2014年、2015年和2016年纷纷下豪赌&#xf…

Libcurl安装与HelloWorld

Windows系统下源代码下载编译、安装方式如下: https://blog.csdn.net/fxbjye/article/details/89152849 编译后得到库文件,把这两个文件复制到项目文件中, 修改项目文件的属性, 修改附加依赖项: 输入代码&#xff1…

信息论之父是如何将世界数字化的?

来源:CSDN编译:弯月机械鼠闯迷宫在 20 世纪 50 年代早期的一段视频中,贝尔实验室的科学家克劳德香农(Claude Shannon)展示了他的一项新发明:一只名为 Theseus 的机械鼠(看起来需要上发条&#x…

奇点、技术失控与技术启示录

来源:资本实验室回顾过去,我们可以看到历史上各个时期涌现出的众多超越时代的新公司、新产品、新思维和新模式。尽管绝大多数创新产品最终都失败了,但先行者们致力于要解决所在时代各种问题和困难的精神,却影响着下一代的技术进步…

Gartner预测2019年十大「数据和分析技术」趋势:增强型分析成为重要卖点

来源:机器之能摘要:处于数据和分析位置的领导人必须审视这些趋势对业务带来的潜在影响,并相应调整业务模式和运营,否则就有可能失去竞争优势。增强型数据分析,增强型数据管理,持续型智能,可解释…

万字长文带你看尽深度学习中的各种卷积网络

来源:AI科技评论摘要:深度学习中的各种卷积网络大家知多少?深度学习中的各种卷积网络大家知多少?对于那些听说过却又对它们没有特别清晰的认识的小伙伴们,这篇文章非常值得一读。Kunlun Bai 是一位人工智能、机器学习、…

Nexus搭建Maven服务器

参考:http://blog.csdn.net/ichsonx/article/details/14642897 1、 为什么使用Nexus 如果没有私服,我们所需的所有构件都需要通过maven的中央仓库和第三方的Maven仓库下载到本地,而一个团队中的所有人都重复的从maven仓库下载构件无疑加大了仓…

通信测试:5G 时代的“卖水人”

来源:中泰证券摘要:“金矿”变成了5G,卖水人的故事已拉开帷幕。前言十八世纪末期,在美国的西进运动中,人们在萨克拉门托河里发现了金砂,工人、农民、海员和传教士,前仆后继前来淘金,…

2019数字化趋势:未来5年政府、零售数字化程度将达80%

来源:阿里云摘要:2月20日,阿里云研究中心发布《2019数字化趋势报告》。报告指出,当前数字化的应用领域正从互联网行业向政府、金融、零售、农业、工业、交通、物流、医疗健康等行业深入。其中,政府、零售业等将成为受云…

量子计算何时具有真正的商业价值?

来源:IEEE电气电子工程师学会我们对新技术的迷恋似乎总是遵循着同样的轨迹:我们时而着迷,时而崇拜,时而失望,时而沮丧,最终得到的满足比我们最初想象的要少。1954年,德州仪器公司宣称其新型晶体…

[转帖]FPGA--Vivado

来源:http://home.eeworld.com.cn/my/space-uid-639749-blogid-267593.html 一般的,在Verilog中最常用的编码方式有二进制编码(Binary)、格雷码(Gray-code)编码、独热码(One-hot)编码。二进制码和格雷码是压缩状态编码。 若使用格雷编码,则相…

国内5G工程建设面临的6大挑战

来源:5G产业圈摘要:2019年被很多人认为是5G建设元年,但是,5G建设要面临的这些难题,你清楚几个?1、网络云化带来的规划和运维挑战5G网络全面云化,在带来功能灵活性的同时,也带来很多技…

QT中的滚动条QScrollArea

QT里的滚动条操作&#xff0c; 我理解的QScrollArea对象的使用为&#xff0c;把某个widget绑定到该QScrollArea对象&#xff0c;scrol->setWidget(widget); 绑定的widget对象的长宽超过边界时&#xff0c;会有滚动条的效果。 #include <QtGui/QApplication> #include…

iis5.1/6.0/7.0+ 配置url重写 无扩展名伪静态

最近在搞url重写 遇到iis 无扩展名及html映射问题 供后人查看 因为考虑功能比较多(URLRewriter组件有些功能满足不了要求)所以就用了HttpModule方法重写 iis5.1中 添加应用程序映射 .* (注意 这种方法只有5.1中可以)到 C:\WINDOWS\Microsoft.NET\Framework\v2.0.50727\aspnet_i…

无人驾驶重塑竞争生态圈

来源&#xff1a;智车科技摘要&#xff1a;中国有可能成为L4技术以及相关应用的世界领导者&#xff1b;在2030年&#xff0c;中国极有可能成为世界最大的无人驾驶市场&#xff1b;无人驾驶L4生态会是“共生”的&#xff0c;价值链将趋向扁平化&#xff1b;传统汽车领城的公司需…

5G的3大应用场景落地开花,中国或将引领全球5G产业发展

来源&#xff1a;易观智库摘要&#xff1a;2019年2月11日&#xff0c;易观发布了《中国5G应用市场数字化专题2018》的专题分析。5G是指“第五代移动通信计划”&#xff0c;不同于以往通信计划的更迭主要在于提升数据传输速率&#xff0c;5G的网络特点强调数据传输速率的提升、降…

一个简单的parser

所有的内容基于《两周自制脚本语言》。 原文中使用Java编写。鉴于本人不怎么会写Java&#xff08;书里面有好奇怪的语法&#xff0c;不懂&#xff08;逃&#xff09;&#xff09;&#xff0c;便用C#写了一个简单的parser。 代码输入格式&#xff1a; 1: i23*3/(4-2)2: i1; if(i…

向机器理解人类行为迈出一小步

一名被试人员正在键盘上打字来源&#xff1a;《中国科学报》摘要&#xff1a;近日&#xff0c;《中国科学报》采访了CCF优秀博士学位论文奖获奖者、清华大学博士易鑫及其导师史元春教授&#xff0c;深入报道了他们对人机自然交互研究的最新进展。随着信息技术的发展&#xff0c…