深度学习论文精读

深度学习论文精读

所有论文

包括已经精读完成和之后将要精读的论文,10年内深度学习里有影响力文章(必读文章),或者近期比较有意思的文章。

感谢沐神!

总论文数 67,阅读完成数 32

计算机视觉 - CNN

已阅读年份名字简介博文链接
2012AlexNet深度学习热潮的奠基作
2014VGG使用 3x3 卷积构造更深的网络
2014GoogleNet使用并行架构构造更深的网络
2015ResNet构建深层网络都要有的残差连接。
2017MobileNet适合终端设备的小CNN
2019EfficientNet通过架构搜索得到的CNN
2021Non-deep networks让不深的网络也能在ImageNet刷到SOTA

计算机视觉 - Transformer

已阅读年份名字简介博文链接
2020ViTTransformer杀入CV界
2021Swin Transformer多层次的Vision Transformer
2021MLP-Mixer使用MLP替换self-attention
2021MAEBERT的CV版

生成模型

已阅读年份名字简介博文链接
2014GAN生成模型的开创工作
2015DCGAN使用CNN的GAN
2016pix2pix
2016SRGAN图片超分辨率
2017WGAN训练更加容易
2017CycleGAN
2018StyleGAN
2019StyleGAN2
2020DDPMDiffusion Models
2021Improved DDPM改进的 DDPM
2021Guided Diffusion Models号称超越 GAN
2021StyleGAN3
2022DALL.E 2CLIP + Diffusion models,文本生成图像新高度

计算机视觉 - Object Detection

已阅读年份名字简介博文链接
2014R-CNNTwo-stage
2015Fast R-CNN
2015Faster R-CNN
2016SSDSingle stage
2016YOLO
2017Mask R-CNN
2017YOLOv2
2018YOLOv3
2019CenterNetAnchor free
2020DETRTransformer

计算机视觉 - 对比学习

已阅读年份名字简介博文链接
2018InstDisc提出实例判别和memory bank做对比学习
2018CPC对比预测编码,图像语音文本强化学习全都能做
2019InvaSpread一个编码器的端到端对比学习
2019CMC多视角下的对比学习
2019MoCov1无监督训练效果也很好
2020SimCLRv1简单的对比学习 (数据增强 + MLP head + 大batch训练久)
2020MoCov2MoCov1 + improvements from SimCLRv1
2020SimCLRv2大的自监督预训练模型很适合做半监督学习
2020BYOL不需要负样本的对比学习
2020SWaV聚类对比学习
2020SimSiam化繁为简的孪生表征学习
2021MoCov3如何更稳定的自监督训练ViT
2021DINOtransformer加自监督在视觉也很香

计算机视觉 - 视频理解

已阅读年份名字简介博文链接
2014DeepVideo提出sports1M数据集,用深度学习做视频理解
2014Two-stream引入光流做时序建模,神经网络首次超越手工特征
2014C3D比较深的3D-CNN做视频理解
2015Beyond-short-snippets尝试使用LSTM
2016Convolutional fusion做early fusion来加强时空间建模
2016TSN超级有效的视频分段建模,bag of tricks in video
2017I3D提出Kinetics数据集,膨胀2D网络到3D,开启3D-CNN时代
2017R2+1D拆分3D卷积核,使3D网络容易优化
2017Non-local引入自注意力做视觉问题
2018SlowFast快慢两支提升效率
2021TimeSformer视频中第一个引入transformer,开启video transformer时代

多模态学习

已阅读年份名字简介博文链接
2021CLIP图片和文本之间的对比学习
2021ViLT第一个摆脱了目标检测的视觉文本模型
2021ViLDCLIP蒸馏帮助开集目标检测
2021GLIP联合目标检测和文本定位
2021CLIP4Clip拿CLIP直接做视频文本retrieval
2021ActionCLIP用多模态对比学习有监督的做视频动作分类
2021PointCLIP3D变2D,巧妙利用CLIP做点云
2022LSeg有监督的开集分割
2022GroupViT只用图像文本对也能无监督做分割
2022CLIPassoCLIP跨界生成简笔画
2022DepthCLIP用文本跨界估计深度

自然语言处理 - Transformer

已阅读年份名字简介博文链接
2017Transformer继MLP、CNN、RNN后的第四大类架构
2018GPT使用 Transformer 解码器来做预训练
2018BERTTransformer一统NLP的开始
2019GPT-2更大的 GPT 模型,朝着zero-shot learning迈了一大步
2020GPT-3100倍更大的 GPT-2,few-shot learning效果显著

系统

已阅读年份名字简介博文链接
2014参数服务器支持千亿参数的传统机器学习模型
2018GPipe流水线(Pipeline)并行
2019Megatron-LM张量(Tensor)并行
2019Zero参数分片
2022Pathways将Jax拓展到上千TPU核上

图神经网络

已阅读年份名字简介博文链接
2021图神经网络介绍GNN的可视化介绍

优化算法

已阅读年份名字简介博文链接
2014Adam深度学习里最常用的优化算法之一
2016为什么超大的模型泛化性不错
2017为什么Momentum有效Distill的可视化介绍

新领域应用

已阅读年份名字简介博文链接
2016AlphaGo强化学习出圈
2020AlphaFold赢得比赛的的蛋白质3D结构预测
2021AlphaFold 2原子级别精度的蛋白质3D结构预测
2021Codex使用注释生成代码
2021指导数学直觉分析不同数学物体之前的联系来帮助发现新定理
2022AlphaCode媲美一般程序员的编程解题水平

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/48536.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

前端笔试全攻略:30道经典面试题详解

引言 前端开发是一个充满挑战与机遇的领域,随着Web技术的不断发展,前端工程师需要掌握的知识体系也在不断扩展。无论是刚入门的新手还是资深开发者,在求职过程中都会面临各种技术笔试。本文将为你提供30道常见的前端笔试题及其详尽解答&…

FLINKCDC连接oracle导致归档日志暴增

前言 前段时间再用flinkcdc连接oracle的时候,oracle的归档日志疯狂的飙升,我经常去到归档目录下查看占用的内存情况。。 情况 在使用flinkcdc连接oracle的时候,发现归档日志飙升,查看了很多文档,该配置了都配置了, …

使用el-table实现自动滚动

文章目录 概要技术实现完整代码 概要 在前端开发大屏的时候,我们会用到表格数据展示,有时候为了使用户体验更加好,会增加表格自动滚动。下边我将以示例代码,用element UI的el-table来讲一下。 技术实现 1 .增加dom监听&#xf…

Linux搭建Kubernetes集群(单Master)【附图文】

文章目录 一、集群环境配置要求二、主机准备三、初始环境准备1.关闭防火墙2.关闭 selinux3.关闭swap4.加载 br_netfilter 模块5.允许iptables转发流量6.设置时间同步 四、安装Docker五、安装kubeadm, kubectl, kubelet六、在Master节点部署集群七、将 node 节点加入集群八、部署…

(一)Readme 了解kurator

Kurator 是一个开源的分布式云原生平台,旨在帮助用户构建自己的分布式云原生基础设施,并出金企业进行数字化转型。 概览 云原生软件栈:kurator结合了多种流行的云原生软件栈(Kubernetes、Istio、Prometheus等)&#…

学习笔记14:CNAME 记录值、TTL (Time to Live)、Redis 的 Pool 对象池、钩子函数、依赖注入

CNAME 记录值 CNAME 记录是一种DNS记录类型,它将一个域名映射到另一个域名。这通常用于将一个子域名指向另一个域名,或者将一个域名指向一个不同的顶级域。 用途:用于域名别名,负载均衡,或者在更换域名时保持服务的连…

CSS(四)——CSS Text(文本)

CSS Text(文本&#xff09; 文本颜色 颜色属性被用来设置文字的颜色。 颜色是通过CSS最经常的指定&#xff1a; 十六进制值 - 如: &#xff03;FF0000 一个RGB值 - 如: RGB(255,0,0) 颜色的名称 - 如: red 一个网页的背景颜色是指在主体内的选择&#xff0c;即<body…

【C#】Func、Action和Predicate

使用情景 根据不同参数值&#xff0c;执行不同方法&#xff0c;执行完方法后&#xff0c;执行相同的操作 函数 Func Func 委托表示有返回值的方法。它最多可以接受 16 个输入参数&#xff0c;并且必须返回一个值。在 Func 委托中&#xff0c;最后一个类型参数始终是返回类型…

【C语言】英寸英尺转换米

运行的结果为 我们百度一下 恒明显我们的答案错了,那这个是为什么呢? 问题就出现在计算的地方,c语言规定两个整数计算,那么小数的部分会被丢弃. 如果计算的两个数中有一个数为小数,那么会将两个数都变为小数在进行计算,结果也会是小数. 那么我们现在就有解决办法了. 方法一…

gbase8s自动同步数据及加入集群的脚本

cat remote.sh #!/bin/bash #此脚本永远在主节点上执行&#xff0c;需要同步的节点永远是备节点 #主节点pri开头&#xff0c;备节点hac开头 #开始执行脚本之前一定要关闭hac节点&#xff0c;并且系统空间要大于备份数据文件的大小 #执行之前请手动改好ip和主备节点的实例名及g…

开源浪潮下的航行:趋势洞察与个人航迹

引言 在全球经济与科技浪潮的推动下&#xff0c;开源软件项目如同一股不可阻挡的洪流&#xff0c;正以前所未有的速度席卷整个技术生态。它不仅促进了技术的快速迭代与创新&#xff0c;更搭建起了一个跨越国界、行业与组织的协作平台。本文旨在探讨当前开源项目的发展趋势&…

SSH不用每次都输入密码的方法

首先&#xff0c;打开自己电脑上的终端cmd 输入&#xff1a; ssh-keygen -t rsa 一直回车。 然后我的服务器因为某些原因不能直接复制到远程终端 所以我手动复制&#xff0c;先打开要复制的公钥。这个地址就看你的程序默认给你创建的文件在哪里了。 cat .ssh/id_rsa.pub 这个--…

【时时三省】unity test 测试框架 下载

目录 1&#xff0c;unity test 测试框架介绍 2&#xff0c;源码下载 3&#xff0c;目录架构 4&#xff0c;git for window 下载安装方法&#xff1a; 1&#xff0c;unity test 测试框架介绍 Unity是一个用于C语言的轻量级单元测试框架。它由Throw The Switch团队开发&#…

Umi-OCR:功能强大且易于使用的本地照片识别软件

Umi-OCR是一款开源且免费的离线OCR&#xff08;光学字符识别&#xff09;软件&#xff0c;可让您轻松从照片中提取文本。它支持多种语言&#xff0c;并具有许多其他功能使其成为照片识别任务的绝佳选择。 Umi-OCR的优势 离线操作&#xff1a; Umi-OCR无需互联网连接即可工作&…

【算法】分割回文串

难度&#xff1a;中等 题目&#xff1a; 给你一个字符串 s&#xff0c;请你将 s 分割成一些子串&#xff0c;使每个子串都是 回文串。返回 s 所有可能的分割方案。 示例 1&#xff1a; 输入&#xff1a;s “aab” 输出&#xff1a;[[“a”,“a”,“b”],[“aa”,“b”]] 示…

PyMySQL库的使用方法

过程和步骤&#xff1a; 安装 PyMySQL 首先&#xff0c;需要使用 pip 安装 PyMySQL 库&#xff1a; pip install pymysql连接数据库 使用 PyMySQL.connect() 方法可以建立到 MySQL 数据库的连接&#xff1a; import pymysql# 配置数据库连接参数 config {host: localhost…

鸿蒙开发仓颉语言【在工程中使用Hyperion TCP框架】

3. 在工程中使用Hyperion TCP框架 3.1 导入Hyperion TCP框架的静态库 在工程的module.json中引入Hyperion TCP框架的静态库&#xff1a; "package_requires": {"package_option": {"hyperion_hyperion.buffer": "${path_to_hyperion_proj…

启发式缓存和本地存储缓存

启发式缓存详解 当服务器响应中没有包含 Expires、Cache-Control: max-age 或 Cache-Control:s-maxage 时,浏览器会采用一个启发式的算法来确定缓存的时间。 1. 启发式缓存的计算方法 通常,启发式缓存会根据响应头中的 Date 和 Last-Modified 之间的时间差来计算缓存时间。 …

【算法】01背包

算法-01背包 前置知识 DP 思路 01背包一般分为两种&#xff0c;不妨叫做价值01背包和判断01背包。 价值01背包 01背包问题是这样的一类问题&#xff1a;给定一个背包的容量 m m m 和 n n n 个物品&#xff0c;每个物品有重量 w w w 和价值 v v v&#xff0c;求不超过背…

Linux命令更新-文本处理grep

简介 grep命令是Linux系统中用于查找文本文件内容的实用工具。它可以根据指定的模式在文件中搜索文本&#xff0c;并显示匹配的行。grep命令功能强大&#xff0c;易于使用&#xff0c;是运维人员必备的工具之一。 命令格式 grep命令的基本格式如下&#xff1a; grep [选项] …