本文是对浙江大学和加州大学圣巴巴拉分校合作完成的,被CVPR 2020收录的论文《Unsupervised Reinforcement Learning of Transferable Meta-Skills for Embodied Navigation》进行解读,相关工作已经开源。
论文:https://arxiv.org/abs/1911.07450
论文简介:
视觉导航任务要求智能体能够智能地导航到指定的目标。当前基于深度强化学习的方法往往需要大量的训练数据,而构建丰富的3D仿真环境以及提供任务相关标注是十分昂贵的。本文关注于在低资源的设定下完成视觉导航任务。本文通过提出无监督强化学习方法来获得具有迁移能力的子策略,使得模型能够快速迁移到视觉导航任务。在AI2-THOR环境中,我们的方法实现了最佳的性能,进一步的实验分析证明我们的方法学习到了一些具备迁移能力的元技能,从而帮助模型实现更好的泛化。
作者简介:
李俊成,浙江大学2019级博士,研究方向为Embodied Agent和vison-and-language understanding。两篇相关工作分别发表于ACM MM2019和CVPR2020。
CVPR 2020 系列报道
相关报道:
CVPR 2020接收论文公布:录用1470篇,接收率“二连降”,仅22% !
论文集:
01. 17篇入选CVPR 2020,腾讯优图 9 篇精选论文详解
02. 22篇入选,百度 15 篇 CVPR 2020 精选论文详解
论文解读:
01. [微软] 古有照妖镜,今有换脸识别机,微软 CVPR 2020力作,让伪造人脸无处遁形02. [港大] PolarMask:将实例分割统一到FCN,有望在工业界大规模应用03. [牛津大学] RandLA-Net:大场景三维点云语义分割新框架(已开源)04. [北大&华为] CIFAR-10上做NAS,仅需单卡半天!华为提出基于进化算法和权值共享CARS模型05. [南京大学] 化繁为简,弱监督目标定位领域的新SOTA - 伪监督目标定位方法06. [UC 伯克利] 挑战 11 种 GAN的图像真伪,DeepFake鉴别一点都不难07. [哈斯特帕大学] 学习一个宫崎骏画风的图像风格转换GAN08. [人大&阿德莱德大学] 看图说话之随心所欲:细粒度可控的图像描述自动生成09.[北京大学]PQ-NET:序列化的三维形状生成网络10. 视觉-语言导航新篇章:真实场景下的远程物体定位导航任务11. 室内设计师失业?针对语言描述的自动三维场景设计算法12. 深度视觉推理2.0:组合式目标指代理解