生物智能与AI——关乎创造、关乎理解(下)

无监督学习,迁移学习和工程设计

AI系统与人类学习之间的另一个主要差异在于AI系统所需的大量标记数据才可以达到人类级别的性能。例如,最近的语音识别系统在11940小时的语音训练后才能对齐转录。如果我们每天大声地听到另一个人类阅读文本两个小时,那么我们需要16年才能获取到这个数据集。AlphaGozero练习了490万场才击败人类围棋大师。如果一个人每天玩围棋30年,那么他每天必须玩450场比赛才能达到AlphaGozero的练习量。此外,最近关于视觉问答的数据集包含了0.25M图像,0.76M问题和10M答案。如果我们每天收到关于图像的100个问题的答案,我们需要274年的时间来吸收这种规模的数据集。很明显人类接受的标记训练数据量要少得多,但他们可以识别语音,玩围棋并很好地回答有关图像的问题。 

其中,人工智能和生物智能之间差距的几个关键在于人类从未标记数据中学习的能力(无监督学习),以及在解决先前任务时获得的强大先验知识,并将这些知识转移到新任务中(迁移学习)。最后,人类社会建立了教育系统,精心挑选一些学习任务进行教学,以促进知识获取。为了在人工系统中有效地实例化这些概念,我们需要更深入地理解和数学形式化人类和其他动物如何进行无监督学习及知识如何在任务之间转移,这需要计算机科学家、心理学家和教育工作者的参与。因为这对于在标记数据稀缺的领域中训练AI是至关重要。

建立理解,规划和主动因果学习的世界模型

当前AI在商业环境中的成功很多是通过监督方法实现的,其中AI系统被动地接收输入,被告知正确的输出,并且它调整其参数以匹配每个输入-输出组合。相比之下,婴儿就像活跃的科学家一样探索他们的环境。例如:利用魔术,婴儿会看到两个“魔法”物体:物体A,它似乎穿过墙壁,而物体B,它在掉落时不会掉落。给婴儿A,B,婴儿将尝试将物体A穿过墙壁,然后放下物体B以查看它是否会掉落。这项非凡的实验表明,婴儿就像科学家一样,积极地探索他们的世界。

因此,与当前大多数的商业AI系统不同,婴儿具有学习和利用世界模型的卓越能力。我们需要在神经科学和人工智能方面进一步研究从经验中学习世界模型,使用这些世界模型进行规划(即,根据当前行动想象不同的未来),并使用这些未来的计划来做出决策。这种基于模型的规划和决策可能是当前无模型强化学习系统的有力支持,该系统简单地将世界状态映射到值或预期的未来奖励。人工智能中的这项工作可以与神经科学的工作携手并进,揭示动物的神经活动如何与想象的和未来相关。像好奇心这样的基本驱动可以形式化为强化学习系统,以此来促进学习和探索。更一般地,深入理解多个系统和促进动物和人类学习的内在生物驱动可能对加速人工系统的学习非常有益。

在后摩尔定律时代实现节能计算

生物系统和AI系统之间的另一个数量级差异在于它们的能量消耗。人脑仅消耗20瓦的功率,而超级计算机则以兆瓦的功率运行。造成这种差异的一个关键原因可能是过度依赖数字计算本身,虽然数字革命推动了现代信息技术的兴起,但现在我们对实现人工智能的追求被认为是次优遗留技术。原因是数字计算需要在计算的中间阶段以极高的可靠性翻转每一位。然而,热力学定律则为每个快速可靠的位翻转确定了相当大的能量成本。

相比之下,生物的细胞内的分子以及脑内神经元的计算看起来令人惊讶地嘈杂和不精确。然而,生物计算的每个中间步骤都足够可靠,以使最终答案足够好。此外,大脑智能地向上或向下调节能量成本根据所需的通信速度。例如,考虑大脑中通过目标神经元的单位的成本。它开始于囊泡的随机释放,其以1毫米/秒的速度扩散到源神经元和目标神经元之间的空间,仅燃烧2.3毫微微焦耳(fj)。速度刚刚好,因为神经元连接之间的空间只有20纳米。该化学信号被转换为无源电信号,其以1米/秒的速度流过神经元细胞体,燃烧23fj横穿约10微米。最后,它到达轴突终端并转换为长轴,沿着轴突每秒行进100米,燃烧6000 fJ行进1厘米。因此,在从化学信号传递到被动电信号时,大脑动态地将通信速度上调1000倍,以跨越增加1000倍的距离,从而导致能量消耗增加10倍。

因此,只有在需要更高速度且仅需要更高可靠性时,大脑才会消耗更多能量。相比之下,数字计算机在刚性同步时钟上运行,并且在每个时钟周期,许多晶体管必须可靠地翻转状态。总之,生物计算的明显混乱不一定是不可避免的混乱,而是可能反映出高能效设计的理想原则。为了在我们的AI硬件中实现这样的效率,遵循生物计算的这些原则可能是必要的。

用于AI的神经科学和神经科学的AI:一种良性的科学螺旋

最近神经科学和AI之间相互作用促进了深度和递归神经网络模型的发展。在许多情况下,当训练深度或递归网络来解决任务时,其内部表现看起来与训练为解决相同任务的动物中测量的内部神经活动模式非常相似。因此,我们通常会在不同的任务中获得不同大脑区域操作的高度复杂但令人惊讶的真实模型,从而提出了一个基本问题:我们如何理解这些模型正在做什么以及它们如何工作?更确切地说,学习网络连接和神经动态如何产生高性能?AI目前在理解它的神经模型正在做什么时面临同样的问题,虽然一些工程师认为没有必要了解神经网络是如何工作的。然而,对于当前网络的成功和失败如何因其连通性和动态性而产生的更深入的科学理解将导致网络的优化。然而,科学与技术之间的相互作用历史上几乎没有更深入的科学认识,也不会导致更好的技术。但是,在AI的某些应用中,特别是在医学诊断或法律中,可解释的AI是必不可少的。例如,如果医生和法官无法理解为什么这些系统做出了他们做出的决定,他们就不会在他们的案件中使用人工智能系统的建议。

因此,神经科学需要共享理解网络性能和决策如何作为网络连接和动态的新兴属性。因此,理论神经科学,应用物理学和数学的思想和理论的发展可以帮助分析AI系统。此外,AI系统的行为可能会改变神经科学中实验设计的本质,将实验工作集中在AI中难以理解的网络功能方面。总体而言,神经科学,人工智能和许多其他理论学科之间的紧密联系可以获得很多灵感,这可能会为生物和人工系统中的智能的出现带来统一的规律。

寻求管理生物和人工智能的普遍规律

在人工智能系统设计中,一种经常被引用的无视生物学的争论常涉及到飞机与鸟类的比较。然而,仔细观察这个想法会发现更多的细微差别。飞行的一般问题涉及解决两个基本问题:(1)为了前进而产生推力,(2)升力的大小使我们不会脱离天空。鸟类和飞机用不同方法解决了推力问题:鸟儿拍翅膀和飞机使用喷气发动机。但是,它们以完全相同的方式解决升力问题,通过使用弯曲的翼形,在低于和低于上方的气压下产生更高的气压。因此,滑翔的鸟类和飞机的运作非常相似。

实际上,我们知道空气动力学的一般物理定律:不同形状通过空气时,都可以用计算的方法来预测产生的力,如升力和推力。而且,任何解决飞行问题的方法,无论是生物还是人工,都必须遵守空气动力学定律。

更一般地说,在我们对物理世界的研究中,我们习惯于存在管理其行为的原则或规律。例如,正如空气动力学控制飞行物体的运动一样,广义相对论控制着空间和时间的曲率,量子力学控制着纳米世界的演化。我们认为,可能存在普世原则或法律来管理智能行为如何从大型互连神经元网络的合作活动中产生。这些法律可以连接和统一神经科学、心理学、认知科学和人工智能的相关学科,他们的阐述也需要帮助分析和计算领域,如物理,数学和统计学。事实上,这篇文章的作者使用了动力系统理论、统计力学、黎曼几何、随机矩阵理论和自由概率理论等技术,获得了对生物和人工网络运作的概念性见解。然而,为了阐明管理非线性分布式网络中出现智能的一般规律和设计原则,还需要进一步的工作,包括开发新概念,分析方法和工程能力。最终,就像鸟类,飞机和空气动力学的故事一样,创造智能机器的问题可能存在多种解决方案,其中一些组件在生物解决方案和人工解决方案之间共享,而其他组件则可能不同。通过寻求一般的智力法则,发现适用于生物和人工系统的新兴智能的潜在法则,以及建立受神经科学和心理学启发的新型AI,需要许多研究人员共同努力:计算机科学家追求更好的AI系统,神经科学家,心理学家和认知科学家探索大脑和思想的属性,数学家,物理学家,统计学家和其他理论家寻求形式化我们的综合知识并发现一般的法律和原则。

 


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/520248.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何利用tcpdump抓包?

文章目录一、基本使用1. 安装tcpdump2. 使用方法二、案例实战2.1. 企业案例背景2.2. 抓包实战三、网卡接口获取3.1. centos7.x使用3.2. centos6.x使用一、基本使用 1. 安装tcpdump yum install tcpdump -y2. 使用方法 tcpdump -i 网卡接口 协议 -n 注:协议可以接…

Gartner 发布2019年超融合魔力象限:新增深信服一员!

近日,国际权威研究分析机构Gartner公布了2019全球《超融合基础设施魔力象限》报告。 报告显示国内仅有三家云计算厂商进入2019超融合基础设施魔力象限,分别是深信服、华为、华云数据。其中深信服超融合(sangfor aCloud)凭借技术优…

深度学习目标检测系列:一文弄懂YOLO算法|附Python源码

在之前的文章中,介绍了计算机视觉领域中目标检测的相关方法——RCNN系列算法原理,以及Faster RCNN的实现。这些算法面临的一个问题,不是端到端的模型,几个构件拼凑在一起组成整个检测系统,操作起来比较复杂&#xff0c…

Keepalived时主备负载均衡器都有VIP的问题:VRRP协议问题

文章目录一、企业案例背景二、异常现象三、分析结论解决思路3.1. 分析结论3.2. 解决思路四、SElinux 处理4.1. 查看SElinux的状态:4.2. 关闭SElinux五、Firewalld防火墙配置5.1. 开启vrrp 协议5.2. 重新启动防火墙5.3. 查看启动日志5.4. 虚拟ip验证5.5. 停止master节…

数据不足,如何进行迁移学习?

现在,人工智能的发展处于跳跃式阶段,我们也对AI在大型数据集的应用进展感到吃惊。更重要的是,那些我们没有跟踪的数十亿张照片或餐厅的评论并没有被遗漏掉:迁移学习技术让收集数据变得更加“容易”。另外,得益于PyTorc…

MongoDB+阿里云 最新数据库独家上线!

近日,开源数据库厂商MongoDB与阿里云在北京达成战略合作,作为合作的第一步,最新版MongoDB 4.2数据库产品正式上线阿里云平台。 目前阿里云成为全球唯一可提供最新版MongoDB服务的云厂商,双方合作打通了企业在云上使用最新版开源数…

一天超2000次,阿里如何打响音视频超时空战役?

在阿里,音视频会议已经成为跨地区沟通、开会以及招聘的首选方式。据悉,目前阿里巴巴的办公网络与音视频会议已经覆盖全球33个国家和地区,其中,音视频会议在过去3个月平均每天召开超过2000余场。在使用如此频繁、覆盖面如此之广的音…

java pppoe_PPPoE拨号流程

PPP会话的建立,需要两端的设备都发送LCP数据包来配置和测试数据通信链路。用户主机与接入集中器根据在发现阶段所协商的PPP会话连接参数进行PPP会话。一旦PPPoE会话开始,PPP数据就可以以任何其他的PPP封装形式发送。所有的以太网帧都是单播的。PPPoE会话…

Flutter路由管理代码这么长长长长长,阿里工程师怎么高效解决?(实用)

背景: 在flutter的业务开发过程中,flutter侧会逐渐丰富自己的路由管理。一个轻量的路由管理本质上是页面标识(或页面路径)与页面实例的映射。本文基于dart注解提供了一个轻量路由管理方案。 不论是在native与flutter的混合工程&…

用PyTorch创建一个图像分类器?So easy!(Part 1)

经过了几个月的学习和实践,我完成了优达学城网站上《Python Programming with Python Nanodegree》课程的学习,该课程的终极项目就是使用Pytorch为102种不同类型的花创建一个图像分类器。 在完成这个项目的过程中,我和其他学员一样&#xff…

阿里上市,四大洲8个国家的十位代表敲锣;全球首款支持5G双卡双待的芯片发布;撕裂者3990X:桌面史上第一次64核128线程……...

关注并标星星CSDN云计算速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!每周两次,打卡即read更快、更全了解泛云圈精彩newsgo go govivo X30新细节曝光:搭载潜望式超远摄支…

支付宝客户端架构分析:自动化日志收集及分析

小蚂蚁说: 《支付宝客户端架构解析》系列将从支付宝客户端的架构设计方案入手,细分拆解客户端在“容器化框架设计”、“网络优化”、“性能启动优化”、“自动化日志收集”、“RPC 组件设计”、“移动应用监控、诊断、定位”等具体实现,带领…

在Kubernetes上运行区块链服务(BaaS)

本文是在2018年11月15日由Linux基金会CNCF主办的KubeCon & CloudNativeCon China 2018大会的“Running Blockchain as a Service (BaaS) on Kubernetes”演讲内容基础上整理而成,从技术上介绍了阿里云如何将基于区块链Hyperledger Fabric的BaaS和容器集群技术Ku…

RabbitMQ 镜像集群之同步策略_专栏讲解

文章目录一、 基础知识汲取1.1. 镜像集群简述1.2. 策略参数说明1.3. 策略案例二、HA mode 同步方式2.1. 参数说明2.2. 案例2.3. 命令终端形式2.4. MQ管控台设置2.5. 队列同步2.5. 优缺点三、Ha async mode 同步方式(推荐使用)3.1. 参数说明3.2. 案例3.3.…

bug要改一天?

大家应该都听过下面的一个段子~女生:亲爱的,我来亲戚了男生:多喝热水......女生:我好像要感冒了,亲爱的~男生:多喝热水......女生:我现在好难受哦,快撑不下去了男生:多喝…

新手也能看懂,消息队列其实很简单

本文内容思维导图: 消息队列其实很简单 “RabbitMQ?”“Kafka?”“RocketMQ?”...在日常学习与开发过程中,我们常常听到消息队列这个关键词。我也在我的多篇文章中提到了这个概念。可能你是熟练使用消息队列的老手&am…

如何去设计前端框架能力?星巴克消息开放项目从0到1,从点到面的思考

本文由淘宝前端工程师罗嗣分享,主要讲述了作者在星巴克消息开放项目中的总结和思考,希望对大家有帮助,让业务分享更加有价值。 从满足星巴克项目需求单点出发,发散到从点到面的思考。从而总结了自己思考的基本流程(方法…

如何在springboot中使用PageHelper分页插件

文章目录1. pom依赖2. yml3. 实体类4. mapper映射文件4. mapper接口5. service接口6. 实现类7. controller8. 浏览器验证使用思路: 1.引入myabtis和pagehelper依赖 2.yml中配置mybatis扫描和实体类 3. 这2行代码 pageNum:当前第几页 pageNum:…

6.6折票仅剩3天 | BDTC 2019全日程公布,哪些是你感兴趣的话题?

2019年12月5-7日,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN、中科天玑数据科技股份有限公司协办的中国大数据技术大会(BDTC 2019)将于北京长城饭店隆重举行。届时,超过百位顶尖技术专家将齐聚于…

java线程条件变量_使用条件变量(多线程笔记)

条件变量属性:使用条件变量可以以原子方式阻塞线程,知道某个特定条件为真为止。条件变量始终与互斥锁一起使用。使用条件变量,线程可以以原子方式阻塞,知道满足某个条件为止。对掉件的测试时在互斥锁的保护下进行的。如果条件为假…