2021 年不可错过的 40 篇 AI 论文,你都读过吗?

a2d3d2b970bbb2b6d721b3d3b3236174.png

来源:机器之心

编辑:蛋酱

虽然世界仍在从新冠疫情的破坏中复苏,人们无法向从前那样时常线下相聚、共同探讨交流关于学术领域的最新问题,但AI研究也没有停下跃进的步伐。

转眼就是2021年底了,一年就这么就过去了,时光好像被偷走一样。细细数来,你今年读了多少论文?

一名加拿大博主Louis Bouchard以发布时间为顺序,整理出了近40篇2021年不可错过的优秀论文。整体来看,合集中的论文偏重计算机视觉方向。

在这个15分钟左右的视频中,你可以快速浏览这些论文:

以下是每篇论文的详细信息:


1、DALL·E: Zero-Shot Text-to-Image Generation from OpenAI

0d01d78c472956bb35a04cab831b23f1.png

论文链接:https://arxiv.org/pdf/2102.12092.pdf

代码地址:https://github.com/openai/DALL-E

视频解读:https://youtu.be/DJToDLBPovg

2、VOGUE: Try-On by StyleGAN Interpolation Optimization

7f5ad20ed4867ce3840f590956e5f346.png

论文链接:https://vogue-try-on.github.io/static_files/resources/VOGUE-virtual-try-on.pdf

视频解读:https://youtu.be/i4MnLJGZbaM

3、Taming Transformers for High-Resolution Image Synthesis


953777cc40426c84e8057d0a3c5f3d91.png

论文链接:https://compvis.github.io/taming-transformers/

代码地址:https://github.com/CompVis/taming-transformers

视频解读:https://youtu.be/JfUTd8fjtX8

4、Thinking Fast And Slow in AI

3f8729565f2b1a18295560a89af61a80.png

论文链接:https://arxiv.org/abs/2010.06002

视频解读:https://youtu.be/3nvAaVSQxs4

5、Automatic detection and quantification of floating marine macro-litter in aerial images

6ed3ec45b33db044bec1b6be48326ad8.png

论文链接:https://doi.org/10.1016/j.envpol.2021.116490
代码地址:https://github.com/amonleong/MARLIT
视频解读:https://youtu.be/2dTSsdW0WYI

6、ShaRF: Shape-conditioned Radiance Fields from a Single View

7bd5814d609e89a42f22bfcb99dff644.png

论文链接:https://arxiv.org/abs/2102.08860
代码地址:http://www.krematas.com/sharf/index.html
视频解读:https://youtu.be/gHkkrNMlGNg

7、Generative Adversarial Transformers

34d4b4fcc228fbad27491d4101840609.png

论文链接:https://arxiv.org/pdf/2103.01209.pdf
代码地址:https://github.com/dorarad/gansformer
视频解读:https://youtu.be/HO-_t0UArd4

8、We Asked Artificial Intelligence to Create Dating Profiles. Would You Swipe Right?

论文链接:https://studyonline.unsw.edu.au/blog/ai-generated-dating-profile
代码地址:https://colab.research.google.com/drive/1VLG8e7YSEwypxU-noRNhsv5dW4NfTGce#forceEdit=true&sandboxMode=true&scrollTo=aeXshJM-Cuaf
视频解读:https://youtu.be/IoRH5u13P-4

9、Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 

2bbfe953fbdf654ae77d3e944e9bb496.png

论文链接:https://arxiv.org/abs/2103.14030v2
代码地址:https://github.com/microsoft/Swin-Transformer
视频解读:https://youtu.be/QcCJJOLCeJQ

10、IMAGE GANS MEET DIFFERENTIABLE RENDERING FOR INVERSE GRAPHICS AND INTERPRETABLE 3D NEURAL RENDERING

5f036956e4330ef9910951fc83ee2d2a.png

论文链接:https://arxiv.org/pdf/2010.09125.pdf
视频解读:https://youtu.be/dvjwRBZ3Hnw

11、Deep nets: What have they ever done for vision?

9afb0d07a77c28977589588943fd8f22.png

论文链接:https://arxiv.org/abs/1805.04025
视频解读:https://youtu.be/GhPDNzAVNDk

12、Infinite Nature: Perpetual View Generation of Natural Scenes from a Single Image


1d2025670d1592437a60241009f316e5.png

论文链接:https://arxiv.org/pdf/2012.09855.pdf
代码地址:https://github.com/google-research/google-research/tree/master/infinite_nature
视频解读:https://youtu.be/NIOt1HLV_Mo
在线试用:https://colab.research.google.com/github/google-research/google-research/blob/master/infinite_nature/infinite_nature_demo.ipynb#scrollTo=sCuRX1liUEVM

13、Portable, Self-Contained Neuroprosthetic Hand with Deep Learning-Based Finger Control

381e9fe127f233f2c435d1d226ac9512.png

论文链接:https://arxiv.org/abs/2103.13452
视频解读:https://youtu.be/wNBrCRzlbVw

14、Total Relighting: Learning to Relight Portraits for Background Replacement

bc083ed7e66b25727a70a6f3bd645aa2.png

论文链接:https://augmentedperception.github.io/total_relighting/total_relighting_paper.pdf
视频解读:https://youtu.be/rVP2tcF_yRI

15、LASR: Learning Articulated Shape Reconstruction from a Monocular Video 

c234ad44a6fdedc7bfbef7b3626ddb10.png

论文链接:https://openaccess.thecvf.com/content/CVPR2021/papers/Yang_LASR_Learning_Articulated_Shape_Reconstruction_From_a_Monocular_Video_CVPR_2021_paper.pdf
代码地址:https://github.com/google/lasr
视频解读:https://youtu.be/lac7wqjS-8E

16、Enhancing Photorealism Enhancement

7a83bee83d862816782dc7a89c2423ea.png

论文链接:http://vladlen.info/papers/EPE.pdf
代码地址:https://github.com/isl-org/PhotorealismEnhancement
视频解读:https://youtu.be/3rYosbwXm1w

17、DefakeHop: A Light-Weight High-Performance Deepfake Detector

fd3e80bfa99f9b21ed2ea0c89c02673f.png

论文链接:https://arxiv.org/abs/2103.06929
视频解读:https://youtu.be/YMir8sRWRos

18、High-Resolution Photorealistic Image Translation in Real-Time: A Laplacian Pyramid Translation Network

57290a7d8dc5947d99d910ee7198da4c.png

论文链接:https://arxiv.org/pdf/2105.09188.pdf
代码地址:https://github.com/csjliang/LPTN
视频解读:https://youtu.be/X7WzlAyUGPo

19、Barbershop: GAN-based Image Compositing using Segmentation Masks

2269e5a881be9e6a1fc46137d94e5ec1.png

论文链接:https://arxiv.org/pdf/2106.01505.pdf
代码地址:https://github.com/ZPdesu/Barbershop
视频解读:https://youtu.be/HtqYMvBVJD8

20、TextStyleBrush: Transfer of text aesthetics from a single example

b69b457cb6492412ef70b21f294232ec.png

论文链接:https://arxiv.org/abs/2106.08385
代码地址:https://github.com/facebookresearch/IMGUR5K-Handwriting-Dataset?fbclid=IwAR0pRAxhf8Vg-5H3fA0BEaRrMeD21HfoCJ-so8V0qmWK7Ub21dvy_jqgiVo
视频解读:https://youtu.be/hhAri5fl-XI

21、Animating Pictures with Eulerian Motion Fields

7c8292c43347a20cd47cae975bd02e14.png

论文链接:https://arxiv.org/abs/2011.15128
代码地址:https://eulerian.cs.washington.edu/
视频解读:https://youtu.be/KgTa2r7d0I0

22、CVPR 2021 Best Paper Award: GIRAFFE - Controllable Image Generation

70a7ed7901838e1a72847fd432aa8ba8.png

论文链接:http://www.cvlibs.net/publications/Niemeyer2021CVPR.pdf
代码地址:https://github.com/autonomousvision/giraffe
视频解读:https://youtu.be/JIJkURAkCxM

23、GitHub Copilot & Codex: Evaluating Large Language Models Trained on Code

2fc2dba57b58846ced85b5895550f6df.png

论文链接:https://arxiv.org/pdf/2107.03374.pdf
代码地址:https://copilot.github.com/
视频解读:https://youtu.be/az3oVVkTFB8

24、Apple: Recognizing People in Photos Through Private On-Device Machine Learning

bbff1f5113bb1ba264cbe728d89b37e8.png

论文链接:https://machinelearning.apple.com/research/recognizing-people-photos
视频解读:https://youtu.be/LIV-M-gFRFA

25、Image Synthesis and Editing with Stochastic Differential Equations

90a741c9d78110411012da09f77cae12.png

论文链接:https://arxiv.org/pdf/2108.01073.pdf
代码地址:https://github.com/ermongroup/SDEdit
视频解读:https://youtu.be/xoEkSWJSm1k
https://colab.research.google.com/drive/1KkLS53PndXKQpPlS1iK-k1nRQYmlb4aO?usp=sharing

26、Sketch Your Own GAN

504bef8ced8ea50a4edca9f5eed8cd8b.png

论文链接:https://arxiv.org/abs/2108.02774
代码地址:https://github.com/PeterWang512/GANSketching
视频解读:https://youtu.be/vz_wEQkTLk0

27、Tesla's Autopilot Explained

在今年8月的特斯拉AI日上,特斯拉AI总监Andrej Karpathy和其他人展示了特斯拉是如何通过八个摄像头采集图像,打造了基于视觉的自动驾驶系统。

55a408d720a5b4e863428ed13cf7dbfb.png

视频解读:https://youtu.be/DTHqgDqkIRw

28、Styleclip: Text-driven manipulation of StyleGAN imagery

a58171605ad325d7e6befa0fe16a9078.png

论文链接:https://arxiv.org/abs/2103.17249
代码地址:https://github.com/orpatashnik/StyleCLIP
视频解读:https://youtu.be/RAXrwPskNso
https://colab.research.google.com/github/orpatashnik/StyleCLIP/blob/main/notebooks/StyleCLIP_global.ipynb

29、TimeLens: Event-based Video Frame Interpolation

1ff0d3a6576586b7e2eb095dff2d2482.png

论文链接:http://rpg.ifi.uzh.ch/docs/CVPR21_Gehrig.pdf
代码地址:https://github.com/uzh-rpg/rpg_timelens
视频解读:https://youtu.be/HWA0yVXYRlk

30、Diverse Generation from a Single Video Made Possible

104112a58a0a1af1c6cec392a8ce5f27.png

论文链接:https://arxiv.org/abs/2109.08591
代码地址:https://nivha.github.io/vgpnn/
视频解读:https://youtu.be/Uy8yKPEi1dg

31、Skillful Precipitation Nowcasting using Deep Generative Models of Radar

ceb3c878aac0a1dbf8be501a9fe99231.png

论文链接:https://www.nature.com/articles/s41586-021-03854-z
代码地址:https://github.com/deepmind/deepmind-research/tree/master/nowcasting
视频解读:https://youtu.be/dlSIq64psEY

32、The Cocktail Fork Problem: Three-Stem Audio Separation for Real-World Soundtracks

b185c3e781b85747525a73e39a3b8abb.png

论文链接:https://arxiv.org/pdf/2110.09958.pdf
代码地址:https://cocktail-fork.github.io/
视频解读:https://youtu.be/Rpxufqt5r6I

33、ADOP: Approximate Differentiable One-Pixel Point Rendering

fa9be4e8dcf1f0de09da71a4a1b1172c.png

论文链接:https://arxiv.org/pdf/2110.06635.pdf
代码地址:https://github.com/darglein/ADOP
视频解读:https://youtu.be/Jfph7Vld_Nw

34、(Style)CLIPDraw: Coupling Content and Style in Text-to-Drawing Synthesis    


9712335faebb329379df055b7161937f.png

CLIPDraw论文链接:https://arxiv.org/abs/2106.14843
在线试用:https://colab.research.google.com/github/kvfrans/clipdraw/blob/main/clipdraw.ipynb

c4aaa812e9d4ac414cd51119a43d551e.png

StyleCLIPDraw论文链接:https://arxiv.org/abs/2111.03133
在线试用:https://colab.research.google.com/github/pschaldenbrand/StyleCLIPDraw/blob/master/Style_ClipDraw.ipynb

视频解读:https://youtu.be/5xzcIzHm8Wo

35、SwinIR: Image restoration using swin transformer

c4a57dcd6b77f7699e2347a934ab3ff2.png

论文链接:https://arxiv.org/abs/2108.10257
代码地址:https://github.com/JingyunLiang/SwinIR
视频解读:https://youtu.be/GFm3RfrtDoU
https://replicate.ai/jingyunliang/swinir

36、EditGAN: High-Precision Semantic Image Editing

0974917a6e59ea1af9cd6868c20caa5d.png

论文链接:https://arxiv.org/abs/2111.03186
代码地址:https://nv-tlabs.github.io/editGAN/
视频解读:https://youtu.be/bus4OGyMQec

37、CityNeRF: Building NeRF at City Scale

cd8e715321fb5e5d86af572d2144d348.png

论文链接:https://arxiv.org/pdf/2112.05504.pdf
代码地址:https://city-super.github.io/citynerf/
视频解读:https://youtu.be/swfx0bJMIlY

38、ClipCap: CLIP Prefix for Image Captioning

69b3e6028fcc590788899785cf441247.png

论文链接:https://arxiv.org/abs/2111.09734
代码地址:https://github.com/rmokady/CLIP_prefix_caption
视频解读:https://youtu.be/VQDrmuccWDo
在线试用:https://colab.research.google.com/drive/1tuoAC5F4sC7qid56Z0ap-stR3rwdk0ZV?usp=sharing


当然,博主在整理的过程中也不能保证完美。经网友提醒,这里可以手动添加一项突破性研究:「AlphaFold」。

fd39dbd3c76237b40697eba5bddaeec0.png

去年,谷歌旗下人工智能技术公司 DeepMind 宣布深度学习算法「Alphafold」破解了出现五十年之久的蛋白质分子折叠问题。2021年7月,AlphaFold 的论文正式发表在《Nature》杂志上。

c8ee6da30201cda05611a6ef584c44d1.png

论文链接:https://www.nature.com/articles/s41586-021-03819-2

这项研究被评为Nature年度技术突破,Alphafold 的缔造者之一 John Jumper 也被评为《Nature》2021 年度十大科学人物。DeepMind也已经将他们的预测结果免费开放给公众。

对于你来说,2021年最令人印象深刻的论文又是哪篇呢?

原文链接:https://www.louisbouchard.ai/2021-ai-papers-review/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

8b0f4623625edb4ee45c1f7a2dca4838.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482840.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

spring-security-学习笔记-03-spring-security快速上手

spring-security-学习笔记-03-spring-security快速上手 文章目录spring-security-学习笔记-03-spring-security快速上手3-spring-security快速上手3.1 Spring Security介绍3.2 创建工程3.2.1 创建maven工程3.2.2 spring容器配置3.2.3 Servlet Context配置3.2.4 加载 Spring容器…

所有的科学知识都是不确定的

理查德菲利普费曼(Richard Phillips Feynman),1918年5月11日—1988年2月15日,美国著名理论物理学家,1965年,因在量子电动力学方面的成就而获得诺贝尔物理学奖。来源:科学技术哲学一、不存在决定…

2.1.1物理层基本概念

2.1.1物理层基本概念 文章目录2.1.1物理层基本概念

神经网络为大脑如何运作提供新见解

来源:ScienceAI编辑:萝卜皮单细胞空间转录组学(sc-ST)有望阐明复杂组织的结构方面。此类分析需要通过将 sc-ST 数据集中的细胞类型与单细胞 RNA-seq 数据集集成来对它们进行建模。然而,这种整合并非微不足道&#xff0…

2.1.2数据通信基础知识

文章目录2.1.2数据通信基础知识0 思维导图1. 典型的数据通信模型2 数据通信相关术语3 三种通信方式4 两种数据传输方式2.1.2数据通信基础知识 0 思维导图 1. 典型的数据通信模型 2 数据通信相关术语 3 三种通信方式 4 两种数据传输方式

一文读懂MEMS技术4大主要分类及应用领域

来源:传感器专家网MEMS传感器是在微电子技术基础上发展起来的多学科交叉的前沿研究领域。经过四十多年的发展,已成为世界瞩目的重大科技领域之一。它涉及电子、机械、材料、物理学、化学、生物学、医学等多种学科与技术,具有广阔的应用前景。…

2.1.3码元、波特、速率、带宽

2.1.3码元、波特、速率、带宽 文章目录2.1.3码元、波特、速率、带宽0 思维导图1.码元2. 速率,波特,带宽练习题0 思维导图 1.码元 2. 速率,波特,带宽 练习题

模拟电路人工智能神经网络的前景

ISTOCKPHOTO来源:IEEE电气电子工程师未来驱动人工智能的一些最佳电路可能是模拟电路,而不是数字电路,世界各地的研究团队正在越来越多地开发支持此类模拟人工智能的新设备。在驱动AI当前爆炸的深层神经网络中,最基本的计算是乘法累…

CSS-盒子模型

CSS盒子模型 盒子模型解释 元素在页面中显示成一个方块,类似一个盒子,CSS盒子模型就是使用实现中盒子来做比喻,帮助我们设置元素对应的样式。盒子模型示意图如下: 把元素叫做盒子,设置对应的样式分别为: 盒…

2.1.4 ★(考察计算能力)奈氏准则和香农定理

2.1.4 奈氏准则和香农定理 文章目录2.1.4 奈氏准则和香农定理0.思维导图1. 失真2. 失真的一种现象--码间串扰3.奈氏准则(奈奎斯特定理)4. 奈氏准则(奈奎斯特定理)-练5. 香农定理6. 香农定理-例题7. “nice”和“香浓”对比0.思维导图 1. 失真 2. 失真的一种现象–码间串扰 3.奈…

未来哲学的六个问题域

来源:中科院哲学所作者:约翰R塞尔(John R. Searle)译者:GTY约翰塞尔生于1932年,当代著名哲学家,现为美国加州大学伯克利分校Slusser哲学教授,在语言哲学、心灵哲学和社会哲学领域贡献…

2.2_ 4_ FCFS、SJF、 HRRN调度算法

文章目录知识总览先来先服务短作业优先高响应比优先知识回顾和重要考点知识总览 先来先服务 短作业优先 高响应比优先 知识回顾和重要考点

当AI学会高数:解题、出题、评分样样都行

来源:AI科技评论“高等数学里程碑式的研究”,114页论文让AI文理双修,也许不久后机器出的高数试卷就会走进高校课堂,这下可以说“高数题不是人出的了”。人工智能虽然给我们带来了诸多便利,但也不免受到了各种质疑。在互…

2.3_ 1_ 进程同步、进程互斥

2.3_ 1_ 进程同步、进程互斥 文章目录2.3_ 1_ 进程同步、进程互斥1.知识概览2.什么是进程同步?2.什么是进程互斥3.知识回顾1.知识概览 2.什么是进程同步? 2.什么是进程互斥 3.知识回顾

IEEE Fellow李世鹏 :人工智能与机器人前沿研究之思考

来源:AI科技评论作者:维克多编辑:青暮2021年12月9日,由粤港澳大湾区人工智能与机器人联合会、雷峰网合办的第六届全球人工智能与机器人大会(GAIR 2021)在深圳正式启幕,140余位产学领袖、30位Fel…

2.3.2. 进程互斥的软件实现方法

2.3.2. 进程互斥的软件实现方法 文章目录2.3.2. 进程互斥的软件实现方法1.知识总览2.单标志法3.双标志先检查法4.双标志后检查法5. perterson算法6. 知识回顾1.知识总览 2.单标志法 3.双标志先检查法 4.双标志后检查法 5. perterson算法 6. 知识回顾

哲学的终极解释:48张图了解48种主义

来源:今日头条编辑:nhyilin哲学家建立了事物的基本概念,我们在讨论中遵循它,有时误用它,有时颠覆它。以下48个基本概念常常出现在公共讨论里,伦敦设计师Genis Carreras用最简单的线条、形状和色块对它们进行…

2.1.5编码与调制(1)

文章目录2.1.5编码与调制(1)1.基带信号与宽带信号2. 编码与调制2.1.5编码与调制(1) 1.基带信号与宽带信号 2. 编码与调制

改名Meta俩月,脸书放弃虚拟现实操作系统:负责人跳槽谷歌

来源:机器学习研究组订阅元宇宙,到头来还得是安卓系统?这些年来,facebook 在增强现实和虚拟现实领域投入了大量资金。扎克伯格甚至已经把公司名称改成了 Meta,认为元宇宙将是公司未来的主营业务,不过理想很…

2.2物理层传输介质

2.2物理层传输介质 文章目录2.2物理层传输介质1. 传输介质和分类2.导向性传输介质--1.双绞线3.导向性传输介质--2.同轴电缆4.非导向性传输介质思维导图1. 传输介质和分类 2.导向性传输介质–1.双绞线 3.导向性传输介质–2.同轴电缆 4.非导向性传输介质 思维导图