人工智能顶刊TPAMI2019最新《多模态机器学习综述》

人工智能顶刊TPAMI2019最新《多模态机器学习综述》

news/2025/4/26 19:03:22/文章来源:https://blog.csdn.net/cf2SudS8x8F0v/article/details/86581343

640?wx_fmt=png

来源：专知

摘要：”当研究问题或数据集包括多个这样的模态时，其特征在于多模态。

【导读】人工智能领域最顶级国际期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEE TPAMI,影响因子为 9.455)，2019年1月最新一期发表了关于多模态机器学习综述论文。我们周围的世界涉及多种形式 - 我们看到物体，听到声音，感觉质地，闻到异味等等。一般而言，模态指的是事物发生或经历的方式。大多数人将形态与感觉方式联系起来，这些感觉方式代表了我们主要的交流和感觉渠道，例如视觉或触觉。因此，当研究问题或数据集包括多个这样的模态时，其特征在于多模态。本文主要关注但不仅仅关注三种形式：自然语言既可以是书面的，也可以是口头的; 视觉信号，通常用图像或视频表示; 和声音信号，编码声音和口头信息，如韵律和声音表达。

640?wx_fmt=png

我们对世界的体验是多模式的 - 我们看到物体，听到声音，感觉质地，闻到异味和味道。情态是指某种事物发生或经历的方式，并且当研究问题包括多种这样的形式时，研究问题被描述为多模式。为了使人工智能在理解我们周围的世界方面取得进展，它需要能够将这种多模态信号一起解释。多模式机器学习旨在构建可以处理和关联来自多种模态的信息的模型。这是一个充满活力的多学科领域，具有越来越重要的意义和非凡的潜力。本文不是关注特定的多模态应用，而是研究多模态机器学习本身的最新进展。我们超越了典型的早期和晚期融合分类，并确定了多模式机器学习所面临的更广泛的挑战，即：表示，翻译，对齐，融合和共同学习。这种新的分类法将使研究人员能够更好地了解该领域的状况，并确定未来研究的方向。

论文地址：

http://www.zhuanzhi.ai/paper/2236c08ef0cd1bc87cae0f14cfbb9915

https://ieeexplore.ieee.org/document/8269806

640?wx_fmt=png

模态特征表示

多模态的表示方法有两类：

联合表示将不同模态的特征映射到同一个空间，代表方法有神经网络的方法、图模型方法与序列模型方法。
协调方法特征仍在原空间，但是通过相似度或者结构特征协调。

640?wx_fmt=png

多模态特征翻译

多模态特征翻译分为基于样本的和生成式的：

基于样本的方法从特征字典中找出最佳翻译。基于样本的方法分为基于检索式的和合并的方法。
生成式的方法则是通过样本，训练一个翻译模型，并使用翻译模型完成对特征的转换。生成式的方法有基于语法的、encoder-decoder模型和连续模型。

640?wx_fmt=png

多模态特征对齐

多模态特征对齐是找到同一个实例的不同之间模态特征之间的关系。

显式对齐方法包括监督模型和无监督模型。无监督模型如CCA和DTW（Dynamic time warping）等。
隐式对齐的方法包括图模型和神经网络

640?wx_fmt=png

多模态特征融合

多模态特征融合是指将从不同模态的特征集成在一起，共同完成一个任务，如分类。

无模型融合的方法被分为早期模型（基于特征）、晚期模型（基于决策）和混合模型
有模型融合的方法有核方法、图模型方法、神经网络模型方法等。

640?wx_fmt=png

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能，互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）云脑研究计划，构建互联网（城市）云脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/492868.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Python数据类型--字典

Python数据类型--字典

Python中的字典存储数据时不保持元素的顺序通过任意键值查找集合中值信息的过程叫做映射，Python中通过字典实现映射。字典是一个键值对的集合。 – 该集合以键为索引，同一个键信息对应一个值。 >>> passwd {"China": "BigC…

阅读更多...

编程基本功训练：流程图画法及练习

编程基本功训练：流程图画法及练习

对于“程序设计”的工作，很多刚開始学习的人的理解就是“写代码”。相同，新手们苦恼的问题是，他们仅仅会“写代码”。当接到一个新的任务，不少人总是在第一时间就爬到键盘上去敲代码。敲着敲着，就把自己绕糊涂了。头晕…

阅读更多...

python简单练习 -统计文本词频并用柱状图显示

python简单练习 -统计文本词频并用柱状图显示

函数功能：统计文本中单词频率，并用柱状图显示前10个最高的单词这里统计的是函数所在文件本身 import turtlecount 10 data [] words [] # y yScale 6 # X xScale 30def drawLine(t, x1, y1, x2, y2):t.penup()t.goto(x1, y1)t.pendown()t.goto(x…

阅读更多...

今日《科学》封面：纳米级清晰度看大脑是怎样一种体验？

今日《科学》封面：纳米级清晰度看大脑是怎样一种体验？

来源：药明康德微信团队摘要：在最新出版的《科学》杂志上，由麻省理工学院（MIT）和霍华德休斯医学研究所（HHMI）的科学家们领衔的一支团队，成功对果蝇的完整大脑进行了成像，清…

阅读更多...

java的System.getProperty()方法能够获取的值

java的System.getProperty()方法能够获取的值

java.version Java 执行时环境版本号 java.vendor Java 执行时环境供应商 java.vendor.url Java 供应商的 URL java.home Java 安装文件夹 java.vm.specification.version Java 虚拟机规范版本号 java.vm.specification.vendor Java 虚拟机规范供应商 java.vm.spec…

阅读更多...

Python中class的简单介绍

Python中class的简单介绍

类的定义 class classname[(父类名)]: – 成员函数及成员变量_ init _ 构造函数：初始化对象_ del_ 析构函数：销毁对象定义类的成员函数时，必须默认一个变量代表类定义的对象本身，这个变量的名称可自行定义，下面的程序…

阅读更多...

中国演绎太空生命传奇

中国演绎太空生命传奇

来源：人民日报海外版摘要：人类不仅在努力增加对地球家园的认识，而且推进航天科技发展，进入浩渺的太空，探索宇宙的奥秘。在太空中绽放的花朵嫦娥四号搭载的微型生物圈载荷手绘图搭载探空火箭进入太空的两只小狗“小豹”…

阅读更多...

FL2440移植linux内核常用命令（command）

FL2440移植linux内核常用命令（command）

Host Ubuntu系统:sudo ifconfig eth0 192.168.1.2打补丁(补丁和内核在同一目录下/home/chris/temp)：cd /home/chris/temp/linux-3.0patch -p1 < ../linux-3.0-s3c2440.patch开发板u-boot:setenv bootargs root/dev/nfs rw nfsroot192.168.1.2:/home/chris/nfs_wo…

阅读更多...

C++预处理指令#define,#if,#endif等

C++预处理指令#define,#if,#endif等

转载自：“https://www.cnblogs.com/xiehongfeng100/p/4594849.html”，原文写的更加详细，还有代码解释，建议看原文。本文主要记录了C/C预处理指令，常见的预处理指令如下： #空指令，无任何效果 …

阅读更多...

李伯虎院士：新一代人工智能引领下的智造制造初步实践

李伯虎院士：新一代人工智能引领下的智造制造初步实践

来源：电能革命由中国智能制造百人会主办的“2018智造百强榜高峰会暨2019中国智能制造百人会年会上”于2019年1月11日在北京科技会堂举行。中国工程院院士/国家制造强国战略咨询委员会委员李伯虎做“新一代人工智能引领下的智造制造初步实践”的演讲。以下为演讲的速…

阅读更多...

js中的escape的用法汇总

js中的escape的用法汇总

js对文字进行编码涉及3个函数：escape,encodeURI,encodeURIComponent，相应3个解码函数：unescape,decodeURI,decodeURIComponent 1、传递参数时需要使用encodeURIComponent，这样组合的url才不会被#等特殊字符截断。 …

阅读更多...

Python中Turtle绘图函数-绘制时钟程序

Python中Turtle绘图函数-绘制时钟程序

Turtle常用的一些函数， 参考博客：http://blog.csdn.net/zengxiantao1994/article/details/76588580 时钟代码设计我们可以通过main函数查看整个时钟代码的设计设计指针（Init()）并显示指针：设计指针的方向(turtle.m…

阅读更多...

5G的未来投资机会在哪里？

5G的未来投资机会在哪里？

来源：网易智能日前，为了更好地以资本助推5G产业发展，中国移动投资公司与中国移动研究院联合发布了《洞见5G，投资未来——中国5G产业发展与投资报告》，分析了5G对生产和生活带来的变革，研判5G产业建设的投资…

阅读更多...

C语言查找算法

C语言查找算法

/** 查找(数组) 1> 顺序查找 ： 就是遍历数组每一个元素同该元素比较，但是问题是效率比较低 2> 折半查找 ： 条件是数组必须是有顺序的 */ #include <stdio.h> #define n 2 int main() { // 折半查找 /* 思路：将该元素同…

阅读更多...

python在windows系统中安装pandas,numpy

python在windows系统中安装pandas,numpy

进入python的安装目录的sripts文件夹下， 在该文件夹下进入命令行，在命令行输入pip install pandas 等待成功安装转载自：https://www.cnblogs.com/xuqiulin/p/6623154.html

阅读更多...

华为5G首席科学家童文 | 5G：万物连接平台智能世界基石

华为5G首席科学家童文 | 5G：万物连接平台智能世界基石

华为5G首席科学家、华为Fellow童文博士来源：华为2019年是5G产业进入全面商用的关键一年，全球5G网络的部署已经启动。2018年6月，5G独立组网标准冻结，5G完成了第一阶段全功能eMBB标准化工作；12月6日, 中国三大运营商获得…

阅读更多...

js处理日期的一些整理(js获取给定日期前一天的日期)

js处理日期的一些整理(js获取给定日期前一天的日期)

var date new Date();alert(date);//获取当前时间 alert(date.getFullYear());//获取当前年分 alert(date.getMonth());//获取月份（获取当前月份要加1） alert(date.getDate());//获取当前日期的几号 alert(date.getDay());//获取当前是星期几 alert(dat…

阅读更多...

windows下配置tensorflow

windows下配置tensorflow

我使用的是python3.6版，目前该版本可以使用tensorflow， 安装tensorflow，参考博客 ：https://www.cnblogs.com/nosqlcoco/p/6923861.html 在pycharm下配置tensorflow，参考博客：https://www.cnblogs.com/yingc…

阅读更多...

深度解密：软银孙正义如何成为美国硅谷最有权势之人

深度解密：软银孙正义如何成为美国硅谷最有权势之人

来源：腾讯科技摘要：据外媒报道，伊隆马斯克、杰夫贝索斯亦或是马克扎克伯格(，都不如日本亿万富翁孙正义那样，对AI驱动的未来有着最大胆的愿景。在孙正义看来，未来机器将控制着我们的生活方式。为了实现这个愿…

阅读更多...

【笔记】Windows Phone 8开发笔记之API

【笔记】Windows Phone 8开发笔记之API

Windows Phone 8 API一览 Windows Phone 7平台不支持Native语言的开发，这困扰了许多游戏和底层应用的开发者。Windows Phone 8 SDK的推出，改善了这个情况。下图就是Windows Phone 8 的API构成。 1. .NET API for Windows Phone Windows Phone 8支持的托管…

阅读更多...

最新文章