来源:西电人工智能学院
摘要:2018年11月25日-26日举办的“新一代人工智能前沿与挑战”中青年论坛暨第二十一届学术周在西安电子科技大学圆满落幕,研讨会上包括长江学者、IEEE Fellow、领域顶尖中青年学者、新锐企业领导者等在内的国内外权威专家学者带来了他们在人工智能领域最前沿的研究成果,29场学术报告和1场圆桌会议围绕“新一代人工智能最前沿与挑战”问题展开,内容精彩纷呈,碰撞思想,为现场1000余参会者献上一场“新一代人工智能”最高端、最前沿的思想盛宴。
石光明:混合智能之问题探讨
西安电子科技大学副校长石光明教授
石光明教授的报告主要围绕三个方面展开:“为什么是人机混合系统”、“人机混合系统中的问题”和“人机混合难点”。他首先使用弱小目标识别、水下听音辨物、海量图中判物和外骨骼协调性这四个应用场景需求的例子来说明什么是人机混合系统。石光明教授接着谈到国内外的研究现状并提出当前机器智能面临的挑战性问题:不确定性、脆弱性和开放性。进而提出将人的作用或认知模型引入到机器智能系统中,来提升人工智能系统的性能,使人工智能成为人类智能的自然延伸和拓展,通过人机协同更加高效地解决复杂问题,这就是将人类智能和机器智能相结合的人机混合智能。
石光明教授在报告中阐述脑机混合使得强脑和强机分工合作、优势互补,可长时间应对复杂海况下目标准确识别,是降低目标判别失误率的最佳途径。他指出:“人机混合智能等于深度学习(机)加高效脑电信号处理(人)”。最后,石光明教授以《今日头条》高达750亿美元的估值为例,指出“简单的事情里面蕴含着很多商机,而商机最大的推手就是人工智能手段。把人工智能和实际生活结合在一起,就能对技术的发展、社会的发展作出很大的贡献!”
董彬:Bridging Deep Neural Networks and Differential Equations for Image Restoration and Beyond
北京大学董彬教授
任务董彬教授主要围绕深度神经网络和微分方程的相关性探索以及在图像复原等方面的应用展开。报告主要从以下两方面展开:深度学习存在的挑战以及深度神经网络和微分方程之间的桥梁。
董彬教授首先快速回顾了图像处理过去三十年的发展历程,认为越来越多的数据和更先进的处理器是引发这几十年最大变化的根本原因。但对于深度学习来讲依然存在很多挑战:怎么样从有限的弱监督标记数据中学习;如何从不同类型的数据中学习;算法的理论指导和透明度,在得到模型后要求不仅能够作推断,更重要的是将数据中的内在规律提取出来。
董教授的报告详细阐述了探索数学模型和机器学习关联性的历程:并非开始就从严谨的数学定理出发强行对机器学习进行解释,而是找到框架性的结构和与之相关的数学联系,之后再挖掘更深层次的关联,从而得到机器学习的架构和应用数学的联系。最后总结道:虽然深度学习对图像领域研究和应用的大部分问题产生了巨大的推力作用,但机器学习的基础依然十分重要,需要更多地明晰其内在含义,把深度学习和领域知识相结合以更好地完成复杂。
徐丰:电磁散射建模与SAR图像解译
复旦大学徐丰教授
随着科技发展带来多源SAR技术演变,SAR数据呈现高分辨、多极化等特性,徐丰教授报告详细介绍了关于SAR图像的解译的研究工作。
徐丰教授首先概述了SAR图像解译和传统计算机视觉的特性差异和共同目的,谈到目前计算机视觉最热领域——深度学习当前的发展和瓶颈,介绍了课题组在此启发下所做的一系列SAR图像解译初步应用的研究工作:极化SAR分类、极化SAR重构、相干斑滤波、SAR目标识别和SAR目标重构等。但由于与传统光学图像相比,SAR图像在成像特性和散射机理上存在较大差异,仅依靠深度学习等人工智能的方法对其智能解译存在瓶颈,需要深入挖掘SAR图像中蕴含的丰富散射机理信息。徐丰教授提出以散射机制为单位,研究从散射域到成像域的联合建模和认知特性,如对复杂目标的部件建模耦合,在产生部件的基础上重构目标模式实现检测。最后概述SAR图像解译融合电磁物理和计算机视觉的框架关系并展望适应微波电磁信息的新型类脑认知智能——微波视觉的前景。
侯彪:遥感脑
西安电子科技大学智能感知与图像理解教育部重点实验室副主任侯彪教授
侯彪教授结合西安电子科技大学智能感知与图像理解教育部重点实验室遥感团队二十年来的杰出成果对遥感脑的研究进展进行了阐述。他首先给出了关于遥感脑的定义:“遥感脑是把人的认知,其中包括了视觉的认知和脑的认知,结合在一起实现对遥感图像的解译和模式识别,从而实现目标成像和解译的一体化的技术。”结合“谷歌给出了中国32座城市变化发展”的时事,侯彪教授举例说明了遥感技术在海洋监测、山体变化、城市发展、灾害评估以及军事等领域的重要应用。侯彪教授将其遥感团队二十年来取得的重要成果分为SAR图像解译与识别以及光学遥感图像智能解译两大方面,在SAR图像解译与识别的研究工作中,他介绍了团队在SAR“目标成像”、SAR图像建模、SAR图像融合、SAR目标检测与识别、SAR地物检测与分类、SAR图像配准与变化检测、视频SAR运动目标检测、识别与跟踪、类脑SAR系统及原理样机、稀疏认知下的SAR影像变化检测系统、嵌入式SAR影像处理并行系统等方面取得的进展;在光学遥感图像智能解译的研究工作中,他分享了团队关于高分辨数据模拟域压缩感知AIC系统、基于语义分析的遥感图像目标检测、基于深度学习的遥感图像道路提取、卫星遥感视频解译、遥感语义标注、高光谱图像目标探测与识别、遥感影像深度学习FPGA系统等课题的研究与探索。最后,侯彪教授认为遥感领域未来的研究方向在于如何合理运用多视角、多模态、多功能和宽视场的数据,利用多源遥感协同认知提高系统的发现概率和实现目标的精确识别。
谢欢:星载激光测高数据处理方法及应用
同济大学测绘与地理信息学院副院长谢欢教授
谢欢教授逻辑清晰、论述生动、层层递进地与大家分享了星载激光测高数据处理方法及其测绘应用,并且提出了该研究领域与当下人工智能领域相互借鉴融合的设想。谢欢教授首先向大家介绍了国内外星载激光测高的研究进展以及国内外测绘卫星的不同应用和测绘精度,指出了星载激光测高技术的发展从深空探测到对地观测的趋势,就我国来说,虽然在星载激光测高技术上起步晚于国外发达国家,但是在近十几年中,无论是深空探测还是对地观测都已经取得了显著的进步和发展。之后,谢欢教授向大家介绍了激光测高数据的处理方法,着重涉及了如何克服大气、潮汐以及引力等的影响,提高测量数据质量的方法。谢欢教授课题组在星载激光测高的测绘应用中做了大量研究,包括利用融合ICESat和ZY3影像对上海和南极进行卫星测图、南极冰下湖探测和变化分析、南极接地线提取、南北极物质平衡分析等。最后,谢欢教授指出未来应将星载激光测高领域的研究和人工智能方法相结合:“随着硬件技术的发展,新型卫星激光测高系统光束发散角越来越小,可以提供更精确的空间定位能力和更高的高程精度。而进一步提高测量精度的突破口其实是在星载激光信号的数据处理方面,我们也对此做了许多工作,也引发了一些思考:激光是一个一维信号,而多个激光谱形成的三维数据是一个三维信号。一维信号和三维信号在人工智能领域都有非常出色的应用,比如声波的检测、机器视觉的识别方法等。而怎样把人工智能的方法用在星载激光测高的数据处理领域,我认为有很多可以值得研究的问题。”
王爽:弱监督学习的极化SAR地物分类
国家“万人计划”青年拔尖人才王爽教授
王爽教授分享了弱监督学习在极化SAR图像分类中的应用。她认为“弱监督学习是在深度学习的技术发展之后,反过来对经典机器学习方法的一些思考。”并且指出深度学习可以认为是一种强监督学习,因其对数据量的要求远远超过传统的机器学习方法及个人可以标注产生的样本量。极化SAR图像分类问题中数据标注样本往往不够,王爽教授阐述了其课题组针对这个问题做的三项工作。
第一个工作是基于协同训练的极化SAR地物分类,该工作利用极化SAR图像天然的多视角特性,构建了两组充分而独立的视角,其中的视角其实指的是基于不同特征的分类器。该方法通过两个分类器的相互交互的方式实现扩大训练样本的目的。第一个分类器提取极化SAR的相干矩阵,第二个分类器采用五种目标分解方法(Pauli, Cloude, Freeman, Krogager, Huynen)合成一个24维特征。
第二个工作利用Tri-training放宽Co-training对多视角的约束,王爽教授指出在Co-training中是根据特征的差异性实现了分类器的多视角特性,而Tri-training则利用了数据的差异性,从而保证了分类器的差异性。在该工作中,分类器提取了33维的极化SAR特征,并利用邻域最小生成树简化了对整幅图像的搜索过程,该方法大大降低了对于样本的需求率。
第三个工作针对极化SAR图像的像素点与周围像素可能不属于同一类的问题,提出了一种宽度卷积神经网络的模型,将空间信息进行加权,这样做的好处是既可以考虑像素的空间邻域信息,又能降低不同类的像素点对中心像素点的特征影响。
最后,王爽教授对报告做出了总结:“遥感领域也在进入大数据时代,但相对于计算机视觉,遥感还是属于小样本问题,所以我们应该更多关注模型泛化能力问题、多模态学习问题,任务驱动的因果推理与学习等问题。”
张兴义:Multi-objective Evolutionary Algorithms for Data Mining
安徽大学计算机科学与技术学院生物智能与知识发现研究所所长张兴义教授
兴义教授在报告中详尽介绍了进化计算在数据挖掘领域的应用的工作。他首先阐述了进化算法以及多目标优化的概念,对于为什么采用进化算法解决多目标优化问题,张兴义教授认为:“进化算法是基于种群的,理论上可以得到全局最优解。其次,多目标优化问题的目标是获得一组trade-off解,而进化算法由于种群的存在,正好可以同时生成多个trade-off解。并且进化算法与传统优化算法相比而言,它解决的问题可以不可微,也可以是离散的,在优化问题的适用性上具有很大的优势。“以淘宝商品推荐和智能打印机技术为例,张兴义教授介绍了面向任务的优化问题,他将面向任务的淘宝商品推荐问题转化为多目标优化问题,并针对这类问题对进化算法进行了改进,限定种群的初始解是稀疏的,取得了很好的效果。针对大规模优化算法中计算代价的问题,即多目标适应度函数的计算代价与数据库大小成正比,他引入了多个代理模型,提高了优化效率。张兴义教授还介绍了其课题组在重叠社区检测中的部分工作,他指出在解决重叠社区检测问题中,最大的挑战是编码问题,他提出将整个网络中的点分为两类,第一类为可能的重叠点,第二类为不可能的重叠点,采用演化算法将两类点分别进行演化。在演化过程中,部分可能的重叠点变成了不可能的重叠点,最终留下来的即为最终的重叠点。针对大规模网络优化问题中重叠社区检测的问题,张兴义教授提出了一种网络压缩策略:根据网络的局部拓扑结构,挑出其中连接特别紧密的网络,将其认为是一个节点,从而大大降低了优化问题的维度。
陈欢欢:大数据知识工程
中国科学技术大学陈欢欢教授
知识工程的发展经历了从符号逻辑语义网络、基于传统专家系统的中小型知识库、群体智能的大规模知识库,到当前基于大数据的超大规模知识图谱、知识服务时代。
陈欢欢教授研究的大数据知识工程其旨在建立大数据知识工程的基础理论,形成利用海量、多源、低质、无序的碎片化知识构建新型知识服务平台的方法学体系,突破新时期知识工程瓶颈,满足医疗、教育、商业等各领域的巨大需求。报告概述了知识工程所面临的挑战是如何提高数据驱动方法的可解释行、实现数据和知识的有效融合和自动完成数据到知识的量质转换,解决了“碎片化知识发现、表示与演化规律”、“碎片化知识拓扑融合机理”、“个性化知识导航的交互模型”三个科学问题。陈欢欢教授团队以碎片化知识的表示、质量、适配问题为切入点, 根据人工智能的发展和应用对大数据知识工程的启示,提出“表示演化-多源拓扑融合-知识导航”三阶段的解决思路,通过规则和深度学习方式的互补,根据知识构建规则,并对构建关系进行深度学习,再基于规则的方式进行知识学习,不断扩充获取知识,实现多源海量数据到知识“量-质-序”的转化。针对知识融合中时序碎片化知识数据分布复杂、表示困难、可区分性差等问题,提出解决时序碎片化知识的可区分表示模型与基于模型空间零散化知识融合的多目标优化算法。最后概述了大数据知识工程在慢性病上的应用:从病情治疗指南以及文献中抽取知识,进行知识融合与匹配,包括基于知识导航和关联、碎片化知识整合,进行症状分类。
彭艳:基于认知的海洋智能无人艇
上海大学无人艇工程研究院院长彭艳教授
面对复杂海洋环境下多维化、碎片化知识带来的信息不完整、不确定性,基于脑记忆认知过程的无人艇智能化、高效集群化、跨域协同性自主感知与决策方案成为无人艇技术设备未来的发展趋势。
彭艳教授在本次报告主要讲述了航海脑研究计划包含的四个部分:知识组织,即基于脑记忆认知过程的无人艇自主感知与决策框架。基于脑认知结构,建立无人自主感知与决策框架中的各记忆单元模块,实现认知结构模拟;根据长时记忆、短期情景记忆与工作记忆的交互关系,利用选择性注意机制,实现对多维、碎片信息的高效处理,利用激活扩散机制,实现不确定、不完整信息的知识补全;知识表达和补全技术。提出基于知识图谱的目标实体和场景知识表达;基于文本数据、基于图像数据的海洋场景领域知识抽取。如利用生成对抗网络扩充复杂海洋场景下目标实体样本;基于深度学习和知识图谱交叉感知的海洋目标实体抽取;构建长时记忆中目标识别与意图判断模型方法知识库。提出基于脑认知过程的无人艇离线学习:根据实体和场景知识库、各种模型库、方法库构建长时记忆单元,形成无人艇智能核心基础;基于脑认知过程的无人艇在线学习与实时评价机制,对长时记忆库模型和方法进行修正;基于认知过程的无人艇自主感知与决策技术。调用长时记忆中的知识库,基于记忆认知过程和知识图谱推理实现自主决策。报告最后彭艳教授讲到其中的长时记忆单元的构建等研究不仅可以应用在海洋领域,还可以应用在金融领域、在线学习平台等中,都具有十分旷阔的前景。
杨阳:跨媒体智能分析与应用
电子科技大学杨阳教授
跨媒体理解通过对语言、视觉和听觉的语义贯通,是实现智能分析、内容检索、高维索引的基础。
杨阳教授针对跨媒体理解的最新科研成果进行了详细的介绍,其中包括三个方面:针对网络上层出不穷的多媒体数据,现有监督哈希方法受限于监督信息的稀缺与准确性,提出面向监督知识迁移的零样本哈希(zero-shot hashing)方法,通过有限已知类训练样本学习的哈希函数,将未知类图像压缩成二进制码,并在目标函数中通过语义嵌入空间构建独立标签之间的语义关系。针对语义演化问题,通过对嵌入空间的旋转,匹配嵌入语义与低层的视觉特征空间,从而减轻语义鸿沟的影响;提出基于对抗学习与长短时记忆的视频描述方法,其中生成模块利用长短时记忆网络,判别模块提出针对视频描述的以句子和视频特征为输入的新方法。该方法利用“生成器”根据视频的视觉内容生成文本句子,“判别器”控制生成句子的准确性。通过判别器对生成器的对抗和控制机理,促使生成器的准确性;针对现有POI预测方法偏向于推荐受欢迎景点,而忽略具有潜在价值的不受欢迎的景区。提出分层多线索融合方法。该方法设计了一个有效的层次结构,通过整合来自多个社交源的各类媒体信息(如图像和文本)进行POI全面描述,同时对每个单独的POI注入语义知识和多线索表示能力。
最后杨阳教授指出目前文本、图像、语言等数据形式紧密混合一体,跨媒体智能分析在机器人、无人机、安防、交通、教育、互联网等领域有着重大的研究价值。
王琦:从视觉到遥感:基于深度注意力模型的相关探究及其应用
西北工业大学王琦教授
王琦教授报告首先深入浅出地介绍了深度学习中注意力机制的原理及关键计算机制,以及注意力模型在图像领域的研究现状,最后对近期工作做了详细介绍。
视觉注意力是人类视觉特有的大脑信号处理机制。人类视觉快速扫描全局图像,获得其中重点关注的目标区域,即注意力焦点,并对该区域投入更多注意力资源,获取关注目标的更多细节信息,并抑制其它无用信息,其核心目标是从众多信息中选择出对当前任务更关键的信息。基于注意力模型机制,王琦教授提出了基于注意力序列建模的交通标志检测,通过卷积、解卷积多层次特征提取方式进行细节特征学习,以实现微小目标的检测识别:通过空间序列上下文建模获取上下文信息,实现复杂环境下的交通标志检测,并提出垂直空间序列注意力建模。此外,王琦教授进一步将注意力机制引入到高光谱图像分类中,实现从多尺度卷积滤波器中动态提取特征。方法中构建AI-NET网络,通过注意力Inception模块之间的动态选择自适应学习网络结构,利用不同空间尺度的卷积滤波器和动态CNN架构,在有限的训练样本下学习表示特征。其中,在网络自适应学习部分,分别提出自激活注意力模型以及类别信息方向连接注意力模型,强化特征表达能力。王琦教授指出视觉注意力机制极大提升了视觉信息处理的高效性与准确性,是深度学习在图像领域的重要研究方向。
高新波:混合增强智能中大数据与小数据分析
西安电子科技大学副校长高新波教授
当今技术背景下的智能技术发展,往往需要基于一定的学习过程,因此用于提供学习的数据是人工智能技术发展的沃土。高新波教授生动风趣,深入浅出的从数据的基本概念与特点出发,探讨了大数据的优势不足与小数据的必要性,并指出“在数据的江湖里,既有波澜壮阔的大数据,也有细流涟漪的小数据,二者相辅相成,才能相映生辉。” 高新波教授告诫在场的青年学子“不管是大数据还是小数据,我们应该敞开思想,研究实际问题,精准定位碰到的数据业务问题,以应用为导向,而非以技术为导向,清醒的认识技术和应用之间的关系。”
数据的最大价值,在于形成信息,变成知识,乃至升华为智慧,在多媒体技术迅速发展的今天,大数据以及与大数据相关的算法和计算平台共同催生了人工智能。高新波教授结合人类智慧发展历程剖析了人工智能的技术出现,哲学思考和科学解释。并给出弱人工智能到混合增强人工智能,再到强人工智能的发展走向。目前人工智能大发展离不开对人力资源消耗巨大的海量数据的标注与模型参数调整,并没有真正解放人的工作。他指出“人工智能的初心是机器把人从复杂的体力和脑力劳动中解脱出来,因此人工智能绝不能只强调人工,而不考虑智能。机器是为人服务的,人工智能必须体现人的意图,让智能更好的为人类服务,避免人工智能的异化,要让人工智能可用,好用,可控。”结合团队工作中的实际经验,高新波教授报告中指出人机混合智能在人工智能技术发展中的重要作用。他指出“人机混合智能的初衷不是把人又变成机器的奴隶,而是为了发挥人的智慧。当下,弱人工智能已经取得巨大成功,强人工智能创新空间广阔,令人期待又疑惑,人机混合智能方兴未艾,是可以驾驭的正确选择,充满着机遇和挑战。”
唐金辉:基于社交媒体数据清洗的图像语义理解
南京理工大学计算机科学与工程学院副院长唐金辉教授
唐金辉教授在报告中主要介绍了团队在人工智能在视觉内容的分析与理解问题与社交媒体挖掘与应用研究工作中所遇到的问题以及解决思路,提供宝贵经验。
在视觉内容的分析与理解问题中,唐金辉教授从生物视觉角度借鉴特征信息反馈与整合,针对传统特征学习算法那对数据分布描述不足,原始视觉特征存在噪声、冗余等问题,分别提出-任务双驱动的视觉特征学习,基于块对角结构的视觉特征学习,无监督特征选择等具体技术改善视觉特征提取能力,提高图像理解与分类精度。
在社交媒体挖掘与应用中,媒体数据量巨大而有标记的可用训练数据却严重不足,针对这样的实际问题,唐金辉教授指出社交媒体和用户能为模型的学习提供行之有效的上下文信息,甚至标签信息。结合社交媒体标签图像稀疏重建、图像语义分类任务,图像质量改善问题,唐金辉教授团队分别提出基于稀疏图的半监督学习框架,深度迁移网络以及社交锚体图正则化的张量重构等方法,有效解决模型在人工标记数据不足的情况下模型的训练与学习问题。
除此之外,唐金辉教授还介绍了团队在多媒体索引与搜索、视频动作分析与识别、图像与视频去模糊与增强、人脸识别与分析,视觉和学习加速算法等诸多领域的研究与进展,并给在座学子提供了很多宝贵意见。
王楠楠:Recent Progress on Heterogeneous Facial Image Synthesis and Recognition
西安电子科技大学王楠楠副教授
随着图像采集设备的普及,获得目标图像的代价越来越小,由此而造成所采集到的图像质量参差不齐。而且在一些极端条件和特殊场合难以获得高清晰度,高可辨识度的图像,使得传统模式识别系统难以奏效。王楠楠副教授报告中介绍到“通过引入人类智慧,利用画家经验,可以根据低质量的图像或图像序列,来生成素描画像,基于机器学习方法可以学习画像与图像之间的复杂映射关系,从而由画像合成出可用来进行模式识别的图像信息,进而取得良好的识别结果,我们可以称之为异质图像识别。”
针对卷积网络以及生成对抗网络在进行素描图的合成与识别任务中图像发生形变,细节丢失、图像模糊等问题,王楠楠副教授基于以往概率图模型工作基础,参照画家画像时先勾勒轮廓再描绘细节的过程,提出生成对抗网络与概率图模型相结合的从粗到细的人脸素描图合成方法,进一步地,他将传统的马尔可夫随机场模型与卷积网路深度结合提出马尔可夫随机神经场地异质图像合成模型。在介绍异质图像人脸识别地工作中,他指出既然不同的异质图像合成方法各有优点,各个方法之间可以实现一定的信息互补,所以提出利用多个不同的合成方法得到的合成图像共同提取特征,实现非对称联合学习的异质图像的识别。
王楠楠教授将自己的研究工作与实际的具体应用紧密联系起来,许多工作已经在公安、娱乐等方面得以实际应用,充分体现人工智能在国民经济产业发展与公共服务监督与实施等方面的赋能作用和广阔前景。
Panel--下一代人工智能前沿与挑战问题
会后,屈嵘教授和张向荣教授主持召开了针对“下一代人工智能前沿与挑战问题”的座谈会,参与座谈的有唐金辉教授,董彬教授,李辰教授,张道强教授,刘连庆教授,侯彪教授,陈欢欢教授,彭艳教授,王琦教授,王爽教授,梁雪峰教授,王晗丁教授。
圆桌对话
会议围绕下一代人工智能最前沿与最挑战问题展开,唐金辉教授在会议上发言并指出目前在计算机视觉领域中,图像分类问题似乎已经得到解决,更多的研究者将工作重心放在进一步图像语义描述生成的工作上。但是,虽然在现有的ImageNet数据集下算法分类的精度已经超过人类,但是在实际应用中依旧存在很大的差距,作为青年学者不应该避重就轻,要实现图像广泛的理性的解析与推理仍然有很长的路要走。
在谈到人工智能前沿技术发展方向时,屈嵘教授谈道在人工智能发展初期人们主要关注自顶向下的知识系统,例如知识图谱,而目前人们则是关注自底向上的基于数据挖掘和机器学习算法,在未来两者的交叉与结合会带来新的机遇和挑战。
彭艳教授强调了知识图谱在具体应用中的重要作用并指出如何有效构建和使用知识图谱,如何能够建立有效的评价体系以及如何能够生产落地等在过去和未来的一段时间仍然是需要解决的问题。
陈欢欢教授进一步指出,知识图谱的表达能力并不是完美无缺的,设计和提出新型的知识表示方法仍然是一个非常值得思考的问题。在谈到知识图谱的应用与挑战时,陈欢欢教授列举了以下问题:如何将常识嵌入到知识模型中去、在知识图谱的构建过程中,如何能够结合具体的应用,控制知识描述的“力度”、本体构建在知识图谱中至关重要,如何结合具体的面向对象和具体的应用和由于种种原因,如何解决中文的知识图构建的巨大差距。最后,陈欢欢教授也指出,在未来基于知识图谱的逻辑推理和递进关系的研究是一个值得期待的研究方向。
在谈到深度学习的发展与挑战时,董彬教授指出,虽然深度学习技术在实际应用中取得了广泛的好评,但是深度学习本身的数学理论基础却非常薄弱,我们缺乏对其进行分析的有效的数学手段。从技术层面上讲,如何能够在诸如图结构等关系数据或者不规则数据上使用深度学习方法仍然是一个开放问题。此外,目前更多学者利用深度学习去学习“correlation”,而没有考虑去学习“principle”,如何能够学习到事物或者目标的规律本质可能,这个本质可以更好的施加到类似的任务中也是一个非常值得研究的问题。
随后,李辰教授从自然语言处理的角度强调了在知识图谱或者语义网络构造过程中本体的构建的重要性,并指出在人工智能发展过程中领域知识同样时非常重要的,人工智能技术从“看到,知道”到需要结合领域知识的“理解”的发展仍然有很长的路要走。
在谈到数据的处理与预处理等问题时,王爽教授提到,虽然有些方法在已有规模的数据集上测试时能够产生优异的性能,但是当我们将它用在真实场景中却发现其存在着各种各样的问题。
在数据标注数据的处理与预处理等问题时,张道强教授指出,在医学影像处理领域,医学图像的采集与标注仍然需要专业的医生实施,同时标注及其耗费人力。除此之外,医学影像数据采集设备的型号差异,质量评价要求不严格等因素也造成了可用的高质量数据不足,进一步加剧了算法和模型的构造需求。因此,人工智能技术的发展,不仅仅是致力于人工智能算法研究的科学工作者的工作,更应该是各行各业从业人员都要有所参与,协同反馈迭代发展的工作。
刘连庆教授指出,目前大部分的人工智能都是基于数据的智能,模型的输入是数据,输出是数据,智能产生于数据与数据之间,而在机器人领域输入是一组动作输出也是一组动作,在动作与动作之间的产生智能,这样的思路更加符合人类进化,动作的智能相比数据的智能更加复杂更具挑战性。同时刘连庆教授也指出,人工智能的载体也是非常重要的,我们目前所实施的人工智能都是基于芯片的硅基智能,而在自然界中拥有智能行为的物种都是碳基的智能,是碳基智能还是硅基智能更有利于人工智能的发展也是一个未来一个重要的研究问题。
梁雪峰教授从认知心理学的角度,现阶段人工智能的发展和人类的心理认知还有很大的差别,机器绝大多数都是在做具象的认知,比如说“是”和“不是”,而人类主要的认知是抽象的模糊的。在未来,人工智能的发展方向应该要符合人类的心理认知,才能够更加精准的为服务于人类。因此结合社交网络大数据,认知心理学与人工智能的结合与发展具有广阔的应用场景。
焦李成:深度学习与进化优化:挑战与公开问题
中国人工智能学会副理事长、IEEE Fellow焦李成教授
焦李成教授在报告中介绍了深度学习与进化优化之间存在的挑战与公开问题,从人工智能与机器学习和深度学习之间的联系、深度学习的前沿与挑战、进化优化的前沿与挑战、深度学习与进化优化的研究思考四个方面进行了详细阐述。
在人工智能与机器学习和深度学习之间的联系方面,焦李成教授首先介绍了大数据的认知背景和人工智能研究的基本范畴,并指出人工智能本身的问题一直客观存在,只是在不同阶段、不同领域有着不同的表现,从本质上来说人工智能是人的智能的一部分,并利用人的智能来做事。人工智能可以分为类推、贝叶斯和进化三个学派,并且三者可以分别对应一个人的心智、脑的结构和行为。随后,焦李成教授又介绍了人工智能、机器学习和深度学习三者之间的区别与联系,并指出机器学习可以分为有监督学习、无监督学习和强化学习三类方法,而且机器学习当前存在泛化能力、速度与精度以及可解释性三个方面的挑战。在深度学习的前沿与挑战方面,焦李成教授介绍了神经网络与深度学习的发展脉络:浅层模型到深层模型的改变、单层感知器到多层感知器和径向基神经网络的改变、浅层学习到深层学习的改变,并指出这些改变不仅仅是形式的改变,更重要的是理念的改变,浅层学习注重精确其次是效率,深层学习注重效率其次是精确。焦李成教授还指出当前深度学习的三个关键词:数据、模型、算力,在深度学习时代,目前为止没有比深度学习更好的方法,但是深度学习目前也面临着大量数据、网络过拟合、超参数优化、高性能硬件、缺乏可解释性以及多任务性欠缺等诸多挑战。
在进化优化的前沿与挑战方面,焦李成教授指出了进化优化的五个关键问题:缺乏实验的可重复性、缺乏理论证明、缺乏实际应用、没有最优的通用参数、缺乏用户友好性。在报告最后,焦李成教授提到了深度学习与进化优化相结合的研究方向,强调了全局优化与局部优化学习结合的必要性,并指出深度学习和进化计算要“相识相知,要共同发展,现在的智能一定是人工智能(AI)+计算智能(CI)+生物智能(BI)的形式”。
马坚伟:深度学习在勘探地球物理的应用
哈尔滨工业大学人工智能研究院副院长马坚伟教授
地球物理勘探是根据物理现象对地质体或地质构造做出解释推断的方法,简而言之就是给地球做“B超”,该技术主要应用于油气勘探、地质勘探、考古探测等方面。针对物理勘探中有效反射信号微弱以及观测手段受限等缺点,马坚伟教授将深度学习方法应用到勘探地球物理上来,有效提高了勘探成像的速度以及准确性。
报告中,马坚伟教授首先介绍了深度神经网络在勘探成像去噪领域的应用。在地球物理勘探方面,由于有效反射信号微弱导致图像信噪比较低。针对该问题,马坚伟教授提出在小样本学习中用已知的滤波器(如:小波滤波器)代替卷积层,以有效减少网络参数、简化网络,从而降低了勘探时无关杂波对成像的影响,通过插值测试,小波CNN网络降低随机噪声的性能明显优于传统方法,并且能更好地保留微弱的有效信号,同时,该网络还能有效去除线性噪声以及无用的多次反射噪声。
针对地球物理中的核心问题——反演问题,马坚伟教授介绍了深度学习在反演成像方面的应用。在反演成像中,全波形反演(FWI)是目前为止精确性最好的方法,它可以描述为一个基于勘探全波场模拟的数据拟合过程,其使用了勘探过程中的全波形信息,但是由于计算量过大仍未被有效应用于实际勘探中。马坚伟教授提出,借助深度学习模型在大量勘探数据上离线训练一个模型,再用该模型对实时勘探数据进行预测,可以做到反演成像实时化。针对勘探过程中存在噪声干扰、振幅干扰以及低频数据缺少等问题,深度学习反演突破了传统反演方法的瓶颈,可以不依赖于初始猜测,有效抗噪声和振幅畸变的干扰,更重要的是,在勘探采集数据缺少低频时该方法也能得到准确的成像结果。
张道强:脑影像智能分析与脑疾病早期诊断
南京航空航天大学计算机科学与技术学院副院长张道强教授
近年来,“脑科学计划”这一课题引起了相关领域研究人员以及公众的广泛关注,脑影像技术是研究脑科学的重要工具之一。张道强教授在报告中首先介绍了脑影像的概念和阿兹海默症的基本知识,并且对脑影像分析的一些基本方法进行了梳理。在此基础上,张道强教授进一步讲解了他们团队利用机器学习技术,进一步推动脑影像以及脑网络智能分析发展所展开的相关工作。
张道强教授介绍,在脑影像智能分析中通常利用机器学习的方法进行分类任务,即分辨出正常的和患有脑疾病的影像,在分类任务之后,利用回归方法判断患者患病的严重程度。在该过程中,为了提高预测的准确性,张道强教授建议尽量采用小样本数据。针对“由于脑影像数据所具有的高维度特性,不能对数据进行快速有效的分析”这一问题,张道强教授提出引入迁移学习来对该问题进行弥补。另外,张道强教授还指出,脑影像数据具有多模态的特性,如果出现模态缺失或者只有单模态时,可以取不同的模板进行人为生成。最后,张道强教授特别提到,如果只是简单地把不同医院的数据汇总起来进行训练,效果不一定比只用一家医院的数据的好,因此,他建议对数据进行预处理,将其变换到一个比较集中的区域,再借助基因数据和脑影像数据进行拓延分析,找到易感基因并划分出与阿兹海默症相关的脑区。
刘连庆:类生命机器人---生命系统和机电系统深度融合的感知、驱动和智能
中国科学院沈阳自动化研究所机器人学国家重点实验室副主任刘连庆教授
刘连庆教授在报告中分享了他对类生命机器人的理解与研究成果。“机器人现在更多的是一个机器,那么我们怎么样才有人的特征呢?” 刘连庆教授认为,机械是“硬的”、“干的”、“死的”,而人是“软的”、“湿的”、“活的”,类生命机器人是通过生命系统与机电系统在细胞和分子尺度上的融合,实现感知、思维、能量转换和驱动的新一代机器人系统。“机器人的三要素是感知,驱动,还有智能”刘连庆教授从这三点阐述了生命系统对机器人研究所带来的超级优越性。
在类生命感知方面,刘连庆教授提出以响尾蛇感受红外的机理和机电系统融合起来做出新一代机器人传感器的想法。为此,他与合作者研究出响尾蛇感受红外的机理是离子通道,“有了想法还要有工具。” 刘连庆教授提出微球透镜与超分辨增强的纳米操作机器人系统协同设计并展示了离子通道蛋白传染的实时观测与实时反馈下的纳米操作,得到生理环境纳米尺度“能操作”和“能观测”的工具。
在类生命驱动方面,刘连庆教授重点讲述了建模控制与组装制造两个方面。传统的理想弹性体和无源模型不能描述细胞的机械特性,因此刘连庆教授建立了一个有源粘弹性细胞模型,用于细胞运动收缩特性测量。为了“将细胞成束的组装在一起”,刘连庆教授提出了光电镊操控技术,基于光电镊的柔性操控利用光诱导进行生物的模块化制造,按需制定生物模块的动态组装。在类生命智能方面,刘连庆教授认为动作在智能发育中扮演重要角色:计算机领域的智能是硅基的,是数字信号,数据到数据的智能;大脑里面是碳基的,是数模混合信号,是动作到动作的智能。刘连庆教授及其团队正在把硅基的计算和碳基的认知能力结合起来,打印三维神经脑;用神经细胞把感知和驱动连接起来,实现动作闭环的跨介质类生命智能。
李恒超:基于张量理论的高光谱图像降维方法
西南交通大学李恒超教授
高光谱图像通过成像光谱仪能够同时采集数百个几乎连续的光谱波段,具有光谱分辨率高、空谱合一的特点,高光谱遥感已广泛应用于精准农业、矿产勘探和国防军事等领域。
在本报告中,李恒超教授主要探讨了高光谱遥感技术的背景及高光谱图像降维技术的国内外研究现状,概述了张量理论的基础知识。李恒超教授指出:“由于高光谱图像是典型的三维数据,张量表达能够很好地保持高光谱图像的结构”。在此基础上,李恒超教授介绍了两种基于张量理论的高光谱图像降维技术:基于区域协方差描述子的改进张量局部保持投影算法和张量低秩判别嵌入模型。基于区域协方差描述子的改进张量局部保持投影算法主要将传统的局部保持投影算法进行了张量扩展,旨在从局部几何结构中估计得到一系列的变化矩阵,从而将高维数据映射到低维空间中。该方法主要由近邻图构建,权重计算和投影学习三步组成。张量低秩判别嵌入模型主要将低秩嵌入进行推广,将其与判别分析模型相结合,对其进行张量化,从而进一步保持高光谱图像的结构性。最后采用迭代交替优化算法对上述模型进行求解。报告最后,李恒超教授展示了上述方法在高光谱图像上应用的结果,在高光谱图像降维方面均取得了满意的效果。
唐珂:可扩放的演化搜索
南方科技大学唐珂教授
在智能算法领域已存在许多成功的计算模型,但是如何选择合适的算法并对其进行合适的调整,往往成为将智能算法应用于实际问题甚至进一步产业化所难以逾越的鸿沟。为解决上述问题,唐珂教授在报告中介绍了可扩放的演化搜索方法与案例。
在报告中,唐珂教授主要介绍了如何使得在演化优化算法在保持解的精度的情况下,提高算法的运算速度,其中主要的三个影响因子有:决策变量的数目、数据量的大小以及处理器的实际运行能力,并在机动车规划、影响最大化、子集选择和深度神经网络压缩四个案例中分析了演化优化算法的性能,从理论和实验两方面深入分析了可扩放的演化搜索的可靠性,并在保持问题求解时间不变的基础上,获得更好的求解性能。唐珂教授指出:“随着多目标优化问题中变量数目的不断增加,目前已有的技术来进行大尺度单目标优化的演化求解,但是多目标的大尺度演化优化研究较少。如何平衡收敛性与多样性是众多问题中的重要挑战和难点”。为了解决大尺度多目标优化问题,唐珂教授介绍了一种基于演化算法的可扩放算子。该方法综合考虑了多样性机制,利用具有外部文件的解产生方法搜索Pareto前沿中不同的子区域。该方法在变量数目为8192的案例上进行了分析与测试,均取得了很好的性能。
吴金建:需求导向的视觉信息度量及采集
西安电子科技大学吴金建副教授
目前,全球数据两年翻一番,图像视频数据已占90%。可见,视觉大数据在现代信息中占据主导地位。然而,传统的信息处理技术不考虑目的需求,只进行单向传输,无需求反馈,无法统筹考虑、全局优化整个信息采集、传播和处理过程,面对大数据洪流已显得越来越无能为力。
为此,吴金建副教授在报告中指出:“从用户认知需求出发,以主观感知视觉信息过程为指导,研究认知目的下对视觉信息量的需求”。该任务的主要挑战有:需求的定性描述及定量刻画;视觉内容分析及其信息量度量。针对上述问题,报告首先介绍了大脑感知视觉信息的过程,从基于大脑自能量理论的视觉内容感知模型出发,针对同一场景中不同类型噪声的污染,借助眼动仪分析信息量衰减时主观感知的变化,从而完成对视觉信息需求的描述与刻画;针对不同的视觉信息量需求,吴金建副教授深入地分析了绝对无损、感知无损、认知无损概念。并针对上述概念,引出了恰可识别差阈值和客观图像质量评价,并详细介绍了基于质量评价的认知无损度量方法。最终,针对传统成像及处理系统复杂、功耗高、智能低等瓶颈问题,借助视觉信息量定量反馈来优化系统,提出了需求导向的信息供给策略。进一步模仿视网膜成像特性,研制新一代事件驱动的仿生成像相机,从信息采集端开始优化,有效降低视觉数据量并满足认知需求。
詹志辉:分布式演化计算及其应用
华南理工大学詹志辉教授
在“新一代人工智能”重大项目中,群体智能和演化计算是“新一代人工智能”的重要内容。在演化计算中,模型的并行加速是其中的重要研究方向。
詹志辉教授指出在复杂环境中演化计算问题主要涉及三方面:如何增强全局搜索能力;如何加速收敛速度;如何缩短运行时间。传统演化计算方法解的结果缺少多样性,在大尺度问题上较难获得全局最优解。并且传统的局部搜索或启发式搜索方法只能对单个个体进行搜索,从而使得收敛速度较慢。此外,传统的演化优化算法采用序列计算框架,所有的个体被逐一进行处理,从而导致算法运算时间较长。针对上述问题,詹志辉教授介绍了分布式演化计算如何克服上述三方面的困难。分布式演化计算包含多个种群,从而使得解的多样性增加,并且多种群间的协作能够提高算法的收敛速度。此外,分布式演化计算能够很好地利用并行计算框架进行加速从而减少运行时间。在此基础上,詹志辉教授介绍了两个命名为Cloudde和MPMO 的分布式进化算法实例,并介绍了结合大数据环境对分布式进化算法进行的应用扩展。Cloudde模型主要采用差分进化算法,基于群体差异的启发式随机搜索,将其进行分布式加速运算。MPMO模型主要解决了多目标的优化求解问题。该模型将多个目标进行分布式处理,采用多个种群对多个模型进行处理,并将其运用在云平台的工作调度。
屈嵘:智能搜索算法在优化问题的应用
英国诺丁汉大学屈嵘教授
屈嵘教授的报告从组合优化问题的实际应用与超启发式算法的若干理论分析两个角度作出了讲解。在解决实际问题时通常从问题数学建模出发,希望使用传统数学规划方法给出问题的下界,但往往面临问题复杂度过高和计算时间代价无法接受等困难,因而转向启发式搜索方法进行优化求解以期待在有限计算下获得更优的结果。她从护士排班,港口运输车队任务调度,机场飞机起飞顺序规划等实际问题入手,细致讨论了优化目标选取、约束处理、优化算法选择等关键细节。
在超启发式算法上,屈嵘教授指出在启发方法空间建模搜索相对于原始问题解空间搜索在搜索空间维度降低和解搜索多样性中具有独特优势,其方法的有效性可通过系统对比随机搜索结果得到验证。然而单纯在启发方法空间的搜索不能保障解空间内最优解的可达性,对此她建议回到原始问题解空间继续使用贪心方式进行搜索,这样可进一步提高搜索的有效性。在理论分析方面,她指出由于方法搜索空间的一维特性便于比较解的相似性,可以进行适应度地貌分析,并根据分析发现解空间的局部最优与全局最优具有正相关特性,这可以为以后的算法设计打下理论基础。在最后,屈嵘教授提到了算法设计当中对人类经验依赖的问题,希望能在未来研究出优化算法设计自动化方式,以期待模型化的算法设计,并引入机器学习方法指导优化算法设计。
高亮:基于代理模型的智能优化算法
华中科技大学科学技术发展院和先进技术与装备研究院副院长高亮教授
高亮教授带来了在代理模型优化算法方面的研究成果,他将机器学习与优化算法相结合解决涉及仿真分析的昂贵优化算法并以汽车设计为例进行说明,通过有限次采样建立对真实目标的模型逼近,只在求取足够优秀的解时才做昂贵仿真,以省去大量计算代价高的真实指标评测。高亮教授结合传统粒子群优化的框架和代理模型,回顾了代理模型辅助的粒子群优化(SA-PSO)相关算法的基本思想。融合代理模型的一种策略作用于全局最优个体,对于当前种群建立全局代理模型找到当前模型下的最优解后回到原函数下进行昂贵分析并基于与全局当前最优解的对比作出取代与否的决策。另一种策略作用于个体最优历史,如果通过位置更新公式得到的位置无法在代理模型上取得更优结果则不进行昂贵的真实评价。
高亮教授介绍,其团队在最近的工作中将多个模型集成起来辅助粒子群优化算法,算法中创新的使用了三个策略:第一个策略修改了使用代理模型的粒子群优化算法(OPUS)当中的个体生成所用的惯性系数,由常数变为随机值以增加种群多样性;第二个策略使用了置信下界准则方法来平衡全局和局部搜索;第三个策略融合多个代理模型,在最后阶段加速搜索的收敛。高亮教授还就该系列方法对其他算法框架的兼容性作出了验证研究,证实其普适性。最后,高亮教授指出代理是将学习融入优化算法的良好切入点,它可以多种方式来引导粒子群算法的优化,提高算法的搜索效率,这是一个在工程优化问题中富有前景的研究方向。
王进军:基于行人重识别技术的视频客流分析应用与商业化
西安交通大学王进军教授
王进军教授结合最近逐渐走进公众视野的“新零售”概念阐述了基于行人重识别技术的视频客流分析的商业应用实例。为提升消费者体验,未来实体商场的数字化发展离不开基于计算机视觉的人工智能技术,类比电子商务网站的用户行为收集和个性化推荐,客户在商场内不同店家的行走路线也值得被记录和分析,客流统计作为最为直观的统计数据受到店家经营者和商场管理者期待。对比现有传感器或独立摄像头方法在关键出入口统计客流的若干弊端,联合所有摄像头融入行人重识别技术才能更好关联顾客在不同公共摄像头下行走轨迹,实现计数统计。
行人重识别面临着诸多挑战,如终端摄像头的拍摄角度和被摄物体背景不同、行人的姿态变化较大、被关注物存在遮挡、同一视角下存在相似度高的干扰物使得关联两个场景中的同一行人存在困难等等。学界在解决这些挑战中应用了不同方法最终超越了人的检测精度:使用生成对抗网络(GAN)抵消不同摄像头采集图像的固有差异;使用GAN根据输入图像生成期望的姿态提高训练出的网络的鲁棒性;使用不同粒度网络方法来描述行人并重点突出有重要特征的地方;使用数据增强方法在多个特征层之间强调前景的一致性以达到忽略背景与遮挡的目的,提高对核心物体的关注。王进军教授从人脸识别得到广泛应用这件事实中受到启发,行人重识别技术作为人工智能的一个体现也将有美好的前景。王进军教授最后结合一个真实客户案例展示了商场管理数据采集及其统计可视化的应用,在现场得到了良好的反馈。
杜博:智能化学习理论及其应用研究
武汉大学计算机学院副院长杜博教授
杜博教授首先为大家带来了利用辅助信息设计新型分类器的理论研究。模仿人类教学中常用的额外讲解,意图在训练阶段对训练样本提供如描述,区域标注等的特权信息来辅助训练,提升模型性能,然而这些信息中可能存在的噪声使得训练得到网络的性能降低。为此杜博教授的团队提出了一种鲁棒性的SVM plus模型,模型同时考虑了样本数据和特权信息的噪声对模型学习的影响,估计有可能使模型分类错误的最小噪声,在得到最小噪声后将其下界最大化以达到提高模型对噪声鲁棒性的目的,在结合手写数字分类数据集、人脸分类数据集以及运动传感器采集的人的行为姿态分类数据集上取得了相对现有方法更高的分类精度。
在智能化学习方法在医学诊断方面,杜教授做了前列腺癌核磁共振数据诊断辅助的研究工作。使用考虑注意力模型的卷积神经网络着重解决了医学影像中前列腺部位分割边缘模糊、内部噪声大、目标区域小等难点问题。为避免训练样本过少带来的数据过拟合问题,抛弃了递进式网络连接而改用残差式连接方法,并在相关竞赛中取得了世界领先的结果。
杜博教授还介绍了他的团队利用深度网络融合多源遥感信息方面的工作。考虑到训练样本的稀疏性,他在计算误差过程中提出了一种“蒙版”策略保障了误差反向传播的正确性。整体网络设计中使用了三个子网络融合了高分辨影响、归一化数字地表模型以及高光谱数据并联网络数据后进行softmax分类。在观察到使用网络分类直接得到的结果分类精度有限后,选择继续使用形态学方法后处理提高结果准确性。最后杜博教授还带来了基于深层原形分析的支撑端元自动提取算法,以应对同一种地物光谱变化,提高了目标探测精度。
刘静:进化计算与应急资源调度
西安电子科技大学刘静教授
刘静教授的报告主要围绕三个方面展开:进化计算、应急资源调度建模以及基于进化计算的应急资源调度算法。对于进化计算的理解,刘静教授指出:“进化算法是借鉴自然界的优化学习能力以解决实际问题的优化学习方法,它具有鲜明的生物背景,适用于任何类别的目标函数”。刘静教授介绍,在灾害发生后的应急管理工作中,应急资源调度是应急救援中的重要环节,但由于资源种类繁多与情形动态变化不定,因此需要设计合理且高效的应急资源调度模型:“应急资源调度中包含了各种各样的影响因素,比如供应点与受灾点可以有一对一、一对多、多对一和多对多的对应关系,单个供应点可以存储一种或多种资源,单个受灾点可能需要一种或多种资源,对于已确定的供应点与受灾点间的路径,也可以选择单条或多条路径等。尽管影响因素多种多样,我们在资源调度过程中设计的原则是保证资源供应点到不同资源需求点的时间总和最小,通过设计合理的时间目标函数就可以为应急资源调度建立切实可用的模型”。
随后,刘静教授对基于进化计算的应急资源调度算法作出了分析:“参加应急调度的任务序列即为初始化的个体,可以设计交叉变异算子来处理这些任务序列,同时我们需要对受灾点的实际需求量与供给点的实际存储量作修正处理来保证调度算法能够应用于实际问题中”。最后,刘静教授对应急资源调度问题作出了总结:“设计合理的问题模型是解决应急资源调度的关键,但由于实际中影响因素众多,因此我们设计模型时应考虑实际情况并关注问题的重要方面。在设计应急资源调度算法时,我们应设计问题明确的个体表示方式,并在此基础上设计反映问题特点的进化算子以更好的解决应急资源调度问题”。
沈超:深度学习系统及其应用的安全初探
西安交通大学网络空间安全学院副院长沈超教授
深度学习是人工智能领域最火热的技术,沈超教授介绍在深度学习过程中以下几方面会出现相应的安全问题:
1. 输入传感器端:数据污染,信息掩盖;
2. 数据预处理:恶意信息注入;
3. 深度学习网络模型:数据投毒,对抗样本,隐私模型,数据隐私;
4. 应用:代码安全。
沈超教授指出,在传统的软件分析方法上引入深度学习手段能够减少软件分析占用的人力资源,提高软件自动化能力;通过对大量的电脑日志数据的学习,可以实现对潜在攻击的防御;通过数据挖掘的方法,结合海量的用户数据,可以帮助安全从业人员分析用户的安全行为特征,为安全机制的设计和改进提供辅助支持。在当前的社交媒体中,充斥着大量由机器人生成的广告甚至虚假信息,通过深度学习的方法,可以对机器人进行检测,过滤垃圾信息。
关于深度学习在目前存在安全问题的应用方面,沈超教授给出了许多具体的实例:使用生成对抗网络,对音视频进行伪造,带来一系列的电信诈骗问题;利用深度学习破解验证码,对计算机系统造成威胁;自动聊天机器人被训练成不友好的种族主义者;自动驾驶机器人无法有效检测到行人而出现的行人安全问题;利用超声波对智能家居下达静默指令;深度学习的数据预处理过程中重要信息被替换;在推荐系统中投毒,注入虚假关联数据污染训练数据,使得反馈结果被人为控制;攻击者通过获取机器学习系统的置信度,根据用户的身份信息可以尝试重构用户的训练数据;攻击者通过调用机器学习系统API,发送轮训数据并返回信息,可以逐步推测出一个参数相近甚至完全相同的机器学习模型,或者实现对训练超参数的窃取。同时,沈超教授提出了他的工作设想,例如在数据处理过程中的去噪,避免错误信息对后面过程的影响,异常输入检测,输入信息是否正常的检测等。
最后,沈超教授指出人工智能是安全领域的催化剂,能够助力安全领域做得更好;而安全领域能够为人工智能提供更多的支持与保障,让人工智能发展得越来越好。
刘钦:人工智能技术在作战指挥中的应用与思考
中国电子科技集团公司第二十研究所人工智能实验室高工刘钦博士
刘钦老师主要针对人工智能技术在作战指挥中的应用作了报告。刘钦老师首先指出人工智能技术必将成为未来战争的核心技术,我国已于2017年明确了人工智能是引领未来的战略性技术,其已经上升至国家战略高度。在目前复杂战场环境下,如何提升作战指挥决策系统的性能成为了一项十分重要的战略目标,为此,引入人工智能先进技术构建作战指挥决策系统体系已经成为必不可少的重要环节。刘钦老师介绍,作战指挥决策系统中包含众多人工智能技术,类似智能识别中包含BP神经网络、贝叶斯网络等模型,目标分配中伴随着深度神经网络和增强学习的部分,研究人工智能技术对于作战指挥中的应用十分必要。现代化战争的多种影响因素决定了人工智能技术在其中的不可或缺性,战场状况的非线性、复杂环境的不确定性、态势信息的实时性统统将解决方案指向了人工智能技术,另外,不可避免的信息损失和挖掘战场中大量的数据信息也离不开人工智能技术提供的帮助。
美国国防部前副部长指出“利用人工智能等技术,可以压缩指挥员在观察、判断、决策、行动(ODDA)循环中的时间,实现多域联合作战指挥与控制的目标,以取得未来战争的制胜权”。针对于人工智能在作战中的应用领域,刘钦老师介绍人工智能技术可以应用于决策控制流程、智能识别、威胁判断、智能分配、分布式架构等方面。目前,人工智能技术已验证于红蓝对抗博弈平台系统,同时作用于经典的无人机蜂群战术与分布式杀伤战术等作战场景。但在缺少样本数据、难以有效评判或缺乏方向指导等特殊情况下,人工智能技术的应用还有待研究。
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”