IEEE Fellow李世鹏 :人工智能与机器人前沿研究之思考

8f8258523aa6127c9254e07ca3dff3c4.png

来源:AI科技评论

作者:维克多

编辑:青暮

2021年12月9日,由粤港澳大湾区人工智能与机器人联合会、雷峰网合办的第六届全球人工智能与机器人大会(GAIR 2021)在深圳正式启幕,140余位产学领袖、30位Fellow聚首,从AI技术、产品、行业、人文、组织等维度切入,以理性分析与感性洞察为轴,共同攀登人工智能与数字化的浪潮之巅。

大会次日,思尔实验室主任、前深圳市人工智能与机器人研究院执行院长、国际欧亚科学院院士、IEEE Fellow李世鹏在GAIR大会上做了《人工智能与机器人前沿研究之思考》的演讲。

699ba294ce0b4e39b43596d4972b90bf.png

李世鹏博士,IEEE Fellow,国际欧亚科学院院士。历任深圳市人工智能与机器人研究院首席科学家和执行院长、科大讯飞集团副总裁及讯飞研究院联席院长、微软亚洲研究院创始成员与副院长。李院士在多媒体、IoT及AI等领域颇具影响力。他拥有203项美国专利并发表了330多篇被引用了的论文(H指数:82)。被Guide2Research列为世界顶尖1000名计算机科学家之一。培养出四位MIT TR35创新奖的获得者。是(科技部)新一代人工智能产业技术创新战略联盟发起人之一及联合秘书长。

在演讲中,李世鹏介绍并展望了人工智能与机器人前沿研究方向,他指出:未来机器学习突破深度学习的数据瓶颈或许可以借助认知科学的方法得到突破,学习范式可从依靠“大数据”转变成依靠“大规则”;人机协作也要进化为人机“谐”作,只有将耦合、交互、增强、互补等目标纳入研究方向,才能实现人机的无缝连接。

以下是演讲全文,AI科技评论做了不改变原意的整理:

44ac703b0175c9eadd7253c04fb76b98.png

今天的演讲题目是《人工智能与机器人前沿研究之思考》,分为三个部分,先谈人工智能机器人研究全景,然后聚焦研究方向,包括机器学习、运动智能、人机谐作、群体协作;最后进行总结。

f1c028bb33fa40643837239400698b65.png

人工智能相关研究的关键元素有三个:人、机器人/物联网以及AI。之所以将机器人和物联网归为一类,是因为这两者是物理世界和虚拟世界的接口。如果三个元素两两之间发生联系就会形成一个新的学科,例如机器人和AI相结合会产生智能体,AI和人类相结合会产生人机耦合以及增强智能,而机器人和人类相融合会形成增强机体。随着人工智能与机器人领域的发展,研究对象不再局限在单个智能体,而是越来越多地对多个智能体的协作进行研究,例如人类社会群体如何更好地相融合?如何设计出能够精妙协作的机器群体?

d8551e9197fc13d6c4cd18b58da5e052.png

总体而言,我认为重要的基本研究方向是:机器学习、运动智能、人机谐作、群体协作。

1

聚焦方向之机器学习

机器学习的发展离不开深度学习加持,它给行业带来许多研究成果,并赋能了语音识别、人脸识别、物体识别、自动驾驶等方面,推动人工智能产业高速发展。

e3822f0131c30de23faaa9a418cd0d84.png

虽然成果颇丰,但成也萧何败也萧何。深度学习依赖于大数据,其瓶颈也在于大数据。例如国内的智能语音技术尽管处于行业领先,但仍依赖技术积累和数据积累。现在想要让深度学习发挥巨大威力,仍然需要大量数据的加持,如果想让深度学习从一个领域扩展到另一个领域,也少不了数据支撑。

如何突破?研究者已经探索了多条路径,其中一个解决方案是:扩展深度学习框架。例如优化深度学习算法、知识图谱+深度学习、专家系统+深度学习等等。另一条路径是因果推理,其目标是借助人类举一反三的能力,期望超越数据之间的相关性,进而探索数据之间的因果性,从而得到数据之间的逻辑推理。

第三条路径是类脑计算,从生物学角度,探索人脑认知元素和机制,以仿真方法再现人类大脑。

个人认为认知科学是突破深度学习框架的着力点。理由是人类认知过程有两点需要我们去进一步借鉴:生而知之、学而知之。

生而知之是指部分认知能力与生俱来,新生儿的脑神经有很多先天的连接。它给我们的启示是:现在的大多深度学习算法,大部分都是从零开始训练,而没有充分或者高效利用先验知识或者已有模型。如何利用“现有知识”是深度学习的下一个热门方向。

学而知之是指大部分认知能力是后天学习到的,尤其是早期学习。通过学习脑神经建立了更多的连接。孩子很多能力,包括感知、应对、语言、读写和理解,甚至分析问题和解决问题的思路和能力在很小时候已经基本定型;以后基本都是知识的积累。这意味着脑神经元很早的时候就连接定型成一个元模型,剩下的是只是利用这个元模型去解决具体领域的问题。这个与当前的大规模预训练模型有着惊人的相似之处。

学而知之的另一层次是:人类学习过程依靠多源的、多传感的、多模态的、多角度的数据,例如视觉、听觉、嗅觉、触觉和语境等联合信息,而今天的深度学习依靠大都是一段语音、一张照片,因此,未来AI模型的输入数据可能不仅是单一的数据,而是多个信号源的融合。如何模仿人类学习的过程,这是认知科学对深度学习的另一个启示。

再者,人类学习过程是一个从样本示例到原理归纳的过程,而不是仅停留在样本示例层面;目前深度学习却都是停留在样本层面。那么,未来是否能够构造类人的机器学习框架,无论输入什么样的数据,只要逻辑相通,都会收敛到一致的模型?

突破深度学习的数据瓶颈,可以尝试构建规则的众包系统,让人类教机器学习过程,其目的不是输入数据,而是让机器学习规则。由于我们试图从日常的活动中学习规则,这种规则普通人都可以标注示教,这就打破了以前专家系统地需要“专家”的局限。这种从“大数据”过渡到“大规则”模型构建方式显然也更符合人类的认知。

2

聚焦方向之运动智能

a37b46686c390b429f9aef27015dab81.gif

众所周知,在机器人领域,波士顿动力公司的产品最“像人”,如上动图,机器人跳舞丝毫看不出生硬的感觉。但受计算资源、能量、运动控制的限制,它只能运行几十分钟。其实,波士顿动力机器人的运行方式是基于电机驱动,存在很多缺点,例如刚性运动、自重比较大、反应速度和灵活性的矛盾以及耗能大。

对比人类和其他动物的运行方式,肌肉、骨骼、传感和神经的结合可以在低能耗情况下,实现灵活运行。这给研究者的启示是,机器人的运行系统应该像人一样满足:高效、灵活、精确、鲁棒、刚柔并济、轻量、自适应等指标。当前的运动智能可能在某一个维度表现优秀,但综合考量仍然有很多缺点。

754dd5eb3bf9792926d584af12ec3da9.png

因此,运动智能的一个重要研究方向是:仿生。仿照动物的运动智能,例如运动控制采用逼近反馈式,运动过程视变化随时灵活调整。

73f961b0fb3dbd1aa7d195f2666a1b98.png

如果说机器人是靠“内力”驱动,而医疗微纳米机器人是“外力”研究方向的代表。例如依靠磁力,小机器人精确地将药物从一个管道运送到另一个管道。

3

聚焦方向之人机谐作

在人机谐作层面,区别于协作,“谐作”代表人机协作中的耦合、交互、增强、互补、协作、和谐等意思。人机谐作的目标是:不需要告诉机器人类的意图,机器就能领会,从而达到人机的无缝连接。

在达成人机谐作的过程中,重点研究人机自然交互、感知及增强。具体可能包括:生物特征检测和识别、人机接口、脑机接口、语音识别、动作识别、表情识别、语言理解、意图理解、体态感知、无隙增强,以及在扩展现实与远程现实的延伸等等。

人机增强智能方面,今天的机器学习框架大都是基于大数据的深度学习框架,肯定会遇到机器智能处理不了的情景。这对于某些高风险领域,例如自动驾驶、金融等来说是致命的。

针对这一问题,当前的解决方案是“人类接管”。这会涉及三个核心问题:

  • 核心问题1:机器智能如何感知自己处理不了一些情况,而主动要求人来接管?

  • 核心问题2:什么时候人类可以完全放手给机器自主完成任务?

  • 核心问题3:什么样的人机交互设计能充分发挥人和机器各自的长处,同时又无需非必要地麻烦对方?

三个核心问题如果无法解决,会导致一些困境。例如,以自动驾驶为例,目前安全员并不是开了“自动”功能就一劳永逸,仍然需要时时监测路况与路线,一刻都不能分神。这其实增加了安全员的负担,因为在没有自动驾驶的时候,人类对自己的驾驶环境会有一定的预测,而机器驾驶的情况人类无法预测。

人机增强机体也属于人机谐作的一个领域,能够帮助人类增强物理机体能力,完成一些人类自身体力完不成的事情。但机器可能过于复杂,需要人类培训后才能操作。人机增强机体的未来目标是实现人与机器和谐共处,操控起来如同人类的自己的器官一样自然。其中,涉及的核心研究课题包括:机器感知人的意图、人的姿态、理解人的自然语言命令、肢体语言等等,从而让机器以最适合人类接受、恰到好处的平滑方式帮助人解决问题。

4e2daf5ed59ad990e191ef6c6cfa5158.png

4

聚焦方向之群体协作

目前单智能体已经可以完成许多任务,但如何发挥每个智能体集合起来的威力?这涉及群体协作的研究方向。在仓储场景下,存在许多抓取分类的机器人,如果能够有效调度,那么必将大大提高工作效率。

当前主流的调度方式是中心化的控制方式,但面对成千上万的规模的智能体,则需要非中心化的控制,允许智能体之间存在自主行为,在相互协作的同时,还能“做自己的事”。即单独的有智能可独立行动的智能体,通过协作而达到的更高效的群体/系统智能和行为。

6aba2fc78118aafe4102a00b25d57fcf.png

智能体群体协作目前涉及的规则包括,群体行为模型和激励机制、群体智能协同决策。这一方面,蚂蚁是我们的学习对象。另外,在自动驾驶方面,越来越多自主驾驶机器人出现,它们之间如何做到协同感知和协同控制也是当今热门话题。

5979f3fb722e85a691156bec10fa2928.png

上述四个方面属于基础性的研究,任何一个领域出现了突破,那将对其领域以及下游应用而言都是革命性的突破,也将带来工业数智化原创技术的创新,会让我们在竞争中占领优势地位!

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

230b5dc233d22aea6ead39337d75e92b.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482821.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2.3.2. 进程互斥的软件实现方法

2.3.2. 进程互斥的软件实现方法 文章目录2.3.2. 进程互斥的软件实现方法1.知识总览2.单标志法3.双标志先检查法4.双标志后检查法5. perterson算法6. 知识回顾1.知识总览 2.单标志法 3.双标志先检查法 4.双标志后检查法 5. perterson算法 6. 知识回顾

哲学的终极解释:48张图了解48种主义

来源:今日头条编辑:nhyilin哲学家建立了事物的基本概念,我们在讨论中遵循它,有时误用它,有时颠覆它。以下48个基本概念常常出现在公共讨论里,伦敦设计师Genis Carreras用最简单的线条、形状和色块对它们进行…

2.1.5编码与调制(1)

文章目录2.1.5编码与调制(1)1.基带信号与宽带信号2. 编码与调制2.1.5编码与调制(1) 1.基带信号与宽带信号 2. 编码与调制

改名Meta俩月,脸书放弃虚拟现实操作系统:负责人跳槽谷歌

来源:机器学习研究组订阅元宇宙,到头来还得是安卓系统?这些年来,facebook 在增强现实和虚拟现实领域投入了大量资金。扎克伯格甚至已经把公司名称改成了 Meta,认为元宇宙将是公司未来的主营业务,不过理想很…

2.2物理层传输介质

2.2物理层传输介质 文章目录2.2物理层传输介质1. 传输介质和分类2.导向性传输介质--1.双绞线3.导向性传输介质--2.同轴电缆4.非导向性传输介质思维导图1. 传输介质和分类 2.导向性传输介质–1.双绞线 3.导向性传输介质–2.同轴电缆 4.非导向性传输介质 思维导图

C#拼装JSON数组简易方法

下面是我们想要拼接出来的JSON字符串,返回给前台 1 {"success":"true","msg":"","data":[{"macName":"正面预拼装机","state":1.0},{"macName":"正面拼板压力架&q…

IEEE年终AI大盘点:网友教会GPT-3骂人、DeepMind再造机器人

来源:新智元【导读】2021年即将过去,IEEE Spectrum盘点了今年的十大AI新闻。在过去的一年里,AI模型训练成本起飞、GPT-3从网友那儿学会了「阴阳怪气」,此外,研究人员还总结了AI绕不过去的七大弱点。2021 年&#xff0c…

2. 3物理层设备

2. 3物理层设备 文章目录2. 3物理层设备中继器2.集线器(多口中继器)中继器 2.集线器(多口中继器)

谁是深度学习框架一哥?2022 年,PyTorch 和 TensorFlow 再争霸

来源:机器学习研究组订阅用PyTorch还是TensorFlow,对于大部分深度学习从业者来说真是一个头疼的问题。最近Reddit上有个帖子从三个方面对比了两个框架,结果竟然是平手?你用PyTorch还是用TensorFlow?对于不同人群可能有…

深度学习不可信?大脑建模先驱有话说

来源:ScienceAI编辑:萝卜皮在过去的 20 年里,深度学习通过一系列有用的商业应用主导了人工智能的研究和应用。但在耀眼的背后是一些根深蒂固的问题,威胁着技术的提升。例如,典型的深度学习程序无法在一项以上的任务上表…

python模块补充

collections模块 collections模块namedtupe方法。又称具名元组。 from collections import namedtuple point namedtuple(空间坐标, x y z) # x y z可以写成列表形式,元组等可迭代对象 res point(3, 4, 5) print(res) # 空间坐标(x3, y4, z5) print(poin…

《力学》课时二质点运动学(二)

视频链接 1.角位移/角速度/角加速度

ListObject 多条件去重

上一篇将到根据某一条件去重List<Object> 对象链表。本文章根据多条件去重List<Object>去重 1 private List<StaingMD0010> getSecondProductWork(List<StaingMD0010> list) {2 for (int i 0; i < list.size(); i) {3 for (int j 0; …

More than Moore的探索

来源&#xff1a;内容由半导体行业观察&#xff08;ID&#xff1a;icbank&#xff09;编译&#xff1a;porsche众所周知&#xff0c;现代电子学于1947年12月16日在新泽西州 Murray Hill的贝尔实验室诞生&#xff0c;在那里物理学家Walter Brattain 首次成功使用一种临时制作的半…

用scikit-learn学习主成分分析(PCA)

在主成分分析&#xff08;PCA&#xff09;原理总结中&#xff0c;我们对主成分分析(以下简称PCA)的原理做了总结&#xff0c;下面我们就总结下如何使用scikit-learn工具来进行PCA降维。 一、scikit-learn PCA类介绍 在scikit-learn中&#xff0c;与PCA相关的类都在sklearn.deco…

开始即结束,Meta元宇宙OS要黄?

来源&#xff1a;七月在线实验室出师未捷身先死&#xff0c;Meta元宇宙操作系统要凉凉了&#xff1f;团队解散&#xff0c;负责人跳槽&#xff01;副总裁亲自发推「辟谣」&#xff0c;但……Facebook进军元宇宙决心&#xff0c;如今要泡汤了&#xff1f;发布元宇宙产品不过瘾&a…

3.1_ 1_ 内存的基础知识

3.1_ 1_ 内存的基础知识 文章目录1.知识总览2.什么是内存&#xff0c;有什么作用进程的运行原理-指令逻辑地址vs物理地址从写程序到程序运行装入模块装入内存装入的三种方式--绝对装入装入的三种方式一静态重定位装入的三种方式- -动态重定位进程运行的基本原理链接的三种方式知…