CV计算机视觉每日开源代码Paper with code速览-2023.10.31

精华置顶

墙裂推荐!小白如何1个月系统学习CV核心知识:链接

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【基础网络架构】(NeurIPS2023)Fast Trainable Projection for Robust Fine-Tuning

  • 论文地址:https://arxiv.org//pdf/2310.19182

  • 开源代码:GitHub - GT-RIPL/FTP: This repo hosts the code for the Fast Trainable Projection (FTP) project.

2.【基础网络架构:Transformer】TransXNet: Learning Both Global and Local Dynamics with a Dual Dynamic Token Mixer for Visual Recognition

  • 论文地址:https://arxiv.org//pdf/2310.19380

  • 开源代码(即将开源):GitHub - LMMMEng/TransXNet

3.【图像分类】(NeurIPS2023)Analyzing Vision Transformers for Image Classification in Class Embedding Space

  • 论文地址:https://arxiv.org//pdf/2310.18969

  • 开源代码:GitHub - martinagvilas/vit-cls_emb: Accompanying code for "Analyzing Vision Tranformers in Class Embedding Space" (NeurIPS '23)

4.【目标检测】RGB-X Object Detection via Scene-Specific Fusion Modules

  • 论文地址:https://arxiv.org//pdf/2310.19372

  • 开源代码:GitHub - dsriaditya999/RGBXFusion

5.【目标检测】A High-Resolution Dataset for Instance Detection with Multi-View Instance Capture

  • 论文地址:https://arxiv.org//pdf/2310.19257

  • 开源代码:GitHub - insdet/instance-detection

6.【目标检测】PrObeD: Proactive Object Detection Wrapper

  • 论文地址:https://arxiv.org//pdf/2310.18788

  • 开源代码(即将开源):GitHub - vishal3477/Proactive-Object-Detection

7.【异常检测】Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection

  • 论文地址:https://arxiv.org//pdf/2310.19070

  • 开源代码(即将开源):GitHub - tzjtatata/Myriad: Open-sourced codes, IAD vision-language datasets and pre-trained checkpoints for Myriad.

8.【异常检测】AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly Detection

  • 论文地址:https://arxiv.org//pdf/2310.18961

  • 开源代码(即将开源):GitHub - zqhang/AnomalyCLIP

9.【语义分割】(NeurIPS2023)Revisiting Evaluation Metrics for Semantic Segmentation: Optimization and Evaluation of Fine-grained Intersection over Union

  • 论文地址:https://arxiv.org//pdf/2310.19252

  • 开源代码:GitHub - zifuwanggg/JDTLosses: Optimization with JDTLoss and Evaluation with Fine-grained mIoUs for Semantic Segmentation

10.【语义分割】(NeurIPS2023)Switching Temporary Teachers for Semi-Supervised Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.18640

  • 开源代码(即将开源):GitHub - naver-ai/dual-teacher: Official code for the NeurIPS 2023 paper "Switching Temporary Teachers for Semi-Supervised Semantic Segmentation"

11.【Open-Vocabulary Segmentation】(NeurIPS2023)Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.19001

  • 开源代码(即将开源):GitHub - Ferenas/PGSeg: This is the official code of "Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic Segmentation, Neurips23"

12.【视频语义分割】(NeurIPS2023)Mask Propagation for Efficient Video Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.18954

  • 开源代码(即将开源):GitHub - ziplab/MPVSS

13.【超分辨率重建】(NeurIPS2023)Efficient Test-Time Adaptation for Super-Resolution with Second-Order Degradation and Reconstruction

  • 论文地址:https://arxiv.org//pdf/2310.19011

  • 开源代码(即将开源):GitHub - DengZeshuai/SRTTA

14.【超分辨率重建】EDiffSR: An Efficient Diffusion Probabilistic Model for Remote Sensing Image Super-Resolution

  • 论文地址:https://arxiv.org//pdf/2310.19288

  • 开源代码(即将开源):GitHub - XY-boy/EDiffSR: EDiffSR: An Efficient Diffusion Probabilistic Model for Remote Sensing Image Super-Resolution

15.【领域泛化】(NeurIPS2023)SimMMDG: A Simple and Effective Framework for Multi-modal Domain Generalization

  • 论文地址:https://arxiv.org//pdf/2310.19795

  • 开源代码(即将开源):GitHub - donghao51/SimMMDG: [NeurIPS 2023] SimMMDG: A Simple and Effective Framework for Multi-modal Domain Generalization

16.【领域泛化】(WACV2024)Domain Generalisation via Risk Distribution Matching

  • 论文地址:https://arxiv.org//pdf/2310.18598

  • 开源代码:GitHub - nktoan/risk-distribution-matching: Here is the codebase for our accepted paper in the Research Track of WACV'24 on 'Domain Generalization via Risk Distribution Matching'.

17.【多模态】Harvest Video Foundation Models via Efficient Post-Pretraining

  • 论文地址:https://arxiv.org//pdf/2310.19554

  • 开源代码:GitHub - OpenGVLab/InternVideo: InternVideo: General Video Foundation Models via Generative and Discriminative Learning (https://arxiv.org/abs/2212.03191)

18.【多模态】IterInv: Iterative Inversion for Pixel-Level T2I Models

  • 论文地址:https://arxiv.org//pdf/2310.19540

  • 开源代码(即将开源):GitHub - Tchuanm/IterInv: The official implement of "IterInv: Iterative Inversion for Pixel-Level T2I Models".

19.【多模态】Generating Context-Aware Natural Answers for Questions in 3D Scenes

  • 论文地址:https://arxiv.org//pdf/2310.19516

  • 开源代码(即将开源):GitHub - MunzerDw/Gen3DQA: My guided research project on 3D visual question answering at the lab of Prof. Dr. Niessner at Technical University of Munich.

20.【多模态】Text-to-3D with Classifier Score Distillation

  • 论文地址:https://arxiv.org//pdf/2310.19415

  • 工程主页:Classifier Score Distillation

  • 代码即将开源

21.【多模态】Dynamic Task and Weight Prioritization Curriculum Learning for Multimodal Imagery

  • 论文地址:https://arxiv.org//pdf/2310.19109

  • 开源代码:GitHub - fualsan/DATWEP: Source code for the Dynamic Task and Weight Prioritization Curriculum Learning for Multimodal Imagery

22.【多模态】TESTA: Temporal-Spatial Token Aggregation for Long-form Video-Language Understanding

  • 论文地址:https://arxiv.org//pdf/2310.19060

  • 开源代码:GitHub - RenShuhuai-Andy/TESTA: [EMNLP 2023] TESTA: Temporal-Spatial Token Aggregation for Long-form Video-Language Understanding

23.【多模态】Customizing 360-Degree Panoramas through Text-to-Image Diffusion Models

  • 论文地址:https://arxiv.org//pdf/2310.18840

  • 开源代码:GitHub - littlewhitesea/StitchDiffusion: This is the official implementation of "Customizing 360-Degree Panoramas through Text-to-Image Diffusion Models" (WACV2024)

24.【多模态】ROME: Evaluating Pre-trained Vision-Language Models on Reasoning beyond Visual Common Sense

  • 论文地址:https://arxiv.org//pdf/2310.19301

  • 开源代码(即将开源):GitHub - K-Square-00/ROME

25.【多模态】Apollo: Zero-shot MultiModal Reasoning with Multiple Experts

  • 论文地址:https://arxiv.org//pdf/2310.18369

  • 开源代码:GitHub - danielabd/Apollo-Cap: Style Controllable Zero-Shot Image-to-Text Generation

26.【自监督学习】Local-Global Self-Supervised Visual Representation Learning

  • 论文地址:https://arxiv.org//pdf/2310.18651

  • 开源代码:GitHub - alijavidani/Local_Global_Representation_Learning

27.【自监督学习】(NeurIPS2023)InstanT: Semi-supervised Learning with Instance-dependent Thresholds

  • 论文地址:https://arxiv.org//pdf/2310.18910

  • 开源代码(即将开源):tmllab/2023_NeurIPS_InstanT · GitHub

28.【单目3D目标检测】ODM3D: Alleviating Foreground Sparsity for Enhanced Semi-Supervised Monocular 3D Object Detection

  • 论文地址:https://arxiv.org//pdf/2310.18620

  • 开源代码(即将开源):https://github.com/arcaninez/odm3d

29.【自动驾驶:协同感知】Dynamic V2X Autonomous Perception from Road-to-Vehicle Vision

  • 论文地址:https://arxiv.org//pdf/2310.19113

  • 开源代码(即将开源):tjy1423317192/AP2VP · GitHub

30.【自动驾驶:深度估计】(NeurIPS2023)Dynamo-Depth: Fixing Unsupervised Depth Estimation for Dynamical Scenes

  • 论文地址:https://arxiv.org//pdf/2310.18887

  • 工程主页:Dynamo-Depth: Fixing Unsupervised Depth Estimation for Dynamical Scenes

  • 开源代码(即将开源):GitHub - YihongSun/Dynamo-Depth: [NeurIPS 2023] Fixing Unsupervised Depth Estimation for Dynamical Scenes

31.【图像编辑】(EMNLP2023)Learning to Follow Object-Centric Image Editing Instructions Faithfully

  • 论文地址:https://arxiv.org//pdf/2310.19145

  • 开源代码:GitHub - tuhinjubcse/FaithfulEdits_EMNLP2023: Code and Data for EMNLP 2023 paper "Learning to Follow Object-Centric Image Editing Instructions Faithfully"

32.【视频生成】VideoCrafter1: Open Diffusion Models for High-Quality Video Generation

  • 论文地址:https://arxiv.org//pdf/2310.19512

  • 工程主页:VideoCrafter1

  • 开源代码:GitHub - AILab-CVC/VideoCrafter: VideoCrafter1: Open Diffusion Models for High-Quality Video Generation

33.【知识蒸馏】One-for-All: Bridge the Gap Between Heterogeneous Architectures in Knowledge Distillation

  • 论文地址:https://arxiv.org//pdf/2310.19444

  • 开源代码:GitHub - Hao840/OFAKD

34.【Continual Learning】(NeurIPS2023)NPCL: Neural Processes for Uncertainty-Aware Continual Learning

  • 论文地址:https://arxiv.org//pdf/2310.19272

  • 开源代码(即将开源):GitHub - srvCodes/NPCL

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

使用目标之间的先验关系提升目标检测器性能

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/127418.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

EVM6678L 开发教程: IBL-TFTP 引导 elf 文件

目录 EVM6678L 开发教程: IBL-TFTP 引导 elf 文件安装 Tftpd64测试工程测试说明 EVM6678L 开发教程: IBL-TFTP 引导 elf 文件 参考: "C:\ti\mcsdk_2_01_02_06\tools\boot_loader\examples\i2c\tftp\docs\README.txt" 此教程介绍如何在 EVM6678L 开发板上实现 IBL-…

uni-starter 使用常见问题

1. Invalid uni-id config file 没有找到uni-id文件导致 需要在uniCloud-aliyun/cloudfunctions/common/uni-config-center/uni-id/下新建 config.json 如果没有uni-id 就新建一个。 注意:config.json是一个标准json文件,不支持注释 uni-starter 按照…

树形结构数据展示及返回上一级

11月1日&#xff0c;又是搬砖的一天&#xff0c;让我们红尘作伴&#xff0c;活的潇潇洒洒。。。。。。 html <template><view class"content"><view><input class"sreachTool" v-model"toolValue"/><van-icon name…

进口跨境电商商城源码(海关179接口+海关报关+三单对碰)

海关179接口 现如今&#xff0c;跨境电商正在飞速发展&#xff0c;进口商品成为人们消费的热点。然而&#xff0c;进口商品的报关手续繁琐&#xff0c;而海关179接口的出现解决了这个问题。海关179接口是指与海关电子数据交换的商业接口&#xff0c;可以实现与海关进行数据对接…

Centos7上安装 Node.js

文章目录 一、前言二、步骤三、涉及nodejs&#xff0c;centos还是少用吧 一、前言 centos7安装nodejs如果直接安装较高版本会包错误&#xff0c;无法运行npm node: /lib64/libm.so.6: version GLIBC_2.27‘ not found (required by node)二、步骤 网上说的下载升级编译器的方…

PyTorch入门学习(十一):神经网络-线性层及其他层介绍

一、简介 神经网络是由多个层组成的&#xff0c;每一层都包含了一组权重和一个激活函数。每层的作用是将输入数据进行变换&#xff0c;从而最终生成输出。线性层是神经网络中的基本层之一&#xff0c;它执行的操作是线性变换&#xff0c;通常表示为&#xff1a; y Wx b其中…

PM2 vs Kubernetes:在部署 Node.js 服务时使用哪个?

Node.js 已成为 Web 开发中的热门技术之一&#xff0c;但如果我们想成功地将 Node.js 应用程序交付给用户&#xff0c;我们需要考虑部署和管理这些应用程序。两个常见的选项是 PM2 和 Kubernetes。PM2 是一个用于运行和管理 Node.js 应用程序的进程管理器&#xff0c;它能够创建…

【生物信息学】单细胞RNA测序数据分析:计算亲和力矩阵(基于距离、皮尔逊相关系数)及绘制热图(Heatmap)

文章目录 一、实验介绍二、实验环境1. 配置虚拟环境2. 库版本介绍 三、实验内容0. 导入必要的库1. 读取数据集2. 质量控制&#xff08;可选&#xff09;3. 基于距离的亲和力矩阵4. 绘制基因表达的Heatmap5. 基于皮尔逊相关系数的亲和力矩阵6. 代码整合 一、实验介绍 计算亲和力…

一键全自动剪辑,喝杯咖啡的时间,几百个视频就剪好了,效率大大提高,可以让我有更多的时间去研究剪辑的思路

一键全自动剪辑&#xff1a;提升效率&#xff0c;释放创造力 在当今的快节奏数字时代&#xff0c;视频剪辑已经成为各行各业不可或缺的一部分。从社交媒体到电子商务&#xff0c;从教育到娱乐&#xff0c;视频剪辑的应用越来越广泛。然而&#xff0c;剪辑工作往往需要大量的时…

【Mybatis源码】注册器 - TypeAliasRegistry

Mybatis中使用TypeAliasRegistry注册器用于管理类型与别名,Mybatis中许多功能的实现都需要从TypeAliasRegistry注册器中找到别名对应的类型,本篇我们介绍一下TypeAliasRegistry注册器的原理与使用 一、构造方法 TypeAliasRegistry注册器类提供了一个无参数的构造方法用于创…

【自然语言处理】【长文本处理】RMT:能处理长度超过一百万token的Transformer

相关博客 【自然语言处理】【长文本处理】RMT&#xff1a;能处理长度超过一百万token的Transformer 【自然语言处理】【大模型】MPT模型结构源码解析(单机版) 【自然语言处理】【大模型】ChatGLM-6B模型结构代码解析(单机版) 【自然语言处理】【大模型】BLOOM模型结构源码解析(…

【STL】:list用法详解

朋友们、伙计们&#xff0c;我们又见面了&#xff0c;本期来给大家解读一下有关list的使用&#xff0c;如果看完之后对你有一定的启发&#xff0c;那么请留下你的三连&#xff0c;祝大家心想事成&#xff01; C 语 言 专 栏&#xff1a;C语言&#xff1a;从入门到精通 数据结构…

教您如何去除照片上的水印!

许多网友都在寻找方法去除照片上的水印&#xff0c;水印通常用于保护版权或标识来源&#xff0c;但有时候我们可能需要使用带有水印的照片&#xff0c;却又不希望水印影响观感&#xff0c;今天我将向大家介绍两种有效的方法&#xff0c;帮助解决“如何去除照片上的水印”这一难…

metaRTC集成flutter ui demo编译指南

概要 Flutter是由Google开发的开源UI工具包&#xff0c;用于构建跨平台应用程序&#xff0c;支持linux/windows/mac/android/ios等操作系统。 metaRTC新增flutter demo&#xff0c;支持linux/windows/mac/android/ios操作系统&#xff0c;此demo在ubuntu桌面环境下测试成功。…

【嵌入式项目应用】__UART自定义通信协议代码实现方法

目录 前言 一、什么是通信协议 二、简单通信协议的问题 三、通信协议的常见内容 1. 帧头 2. 设备地址/类型 3. 命令/指令 4. 命令类型/功能码 5. 数据长度 6. 数据 7.帧尾 8.校验码 四、通信协议代码实现 1. 消息数据发送 a. 通过串口直接发送每一个字节 b. 通过…

图像处理:图片二值化学习,以及代码中如何实现

目录 1、了解下图片二值化的含义 2、进行图像二值化处理的方法 3、如何选择合适的阈值进行二值化 4、实现图片二值化&#xff08;代码&#xff09; &#xff08;1&#xff09;是使用C和OpenCV库实现&#xff1a; &#xff08;2&#xff09;纯C代码实现&#xff0c;不要借…

<windows>win11输入法无法设置UI,变为了win10样子,解决方法

1 问题 升级win11版本后&#xff0c;输入法可能会变为旧版&#xff0c;如下图。如何恢复WIN11新版样子&#xff1f; 2 解决 点击开始–>设置–>搜索”语言“–>选择中文简体右侧语言选项。 下拉到最后选择微软拼音右侧三点&#xff0c;选择键盘选项–>选择常规…

Unity从入门到主程学习路线(内含学习资料)干货超全

写在最前 很多小伙伴想进阶Unity主程&#xff0c;进阶Unity架构师&#xff0c;不知道要学哪些知识&#xff0c;今天给大家分享一下比较完整的知识体系&#xff0c;Unity学习路线&#xff0c;介绍一些有干货的博主与教程,给大家做参考。 不管你是已经工作了&#xff0c;还是正…

Ubuntu:使用apache2部署Vue开发的网站

作者:CSDN @ _乐多_ 本文记录了Vue项目打包到部署到ubuntu系统的全部步骤。 文章目录 一、代码打包二、安装 Apache2三、开启/关闭apache23.1 开启3.2 关闭四、部署Vue应用到Apache24.1 首次部署4.2 更新部署五、全部操作截图一、代码打包 首先,确保您已经在本地开发环境中…

【C语言初阶】之函数

【C语言初阶】之函数 1. 函数是什么2. C语言中的函数2.1 库函数2.2.1 利用文档学习库函数 2.2 自定义函数 3. 函数参数3.1 实际参数(实参)3.2 形式参数(形参) 4. 函数调用4.1 传值调用4.2 传址调用4.3 练习 5. 函数的嵌套调用和链式访问5.1 嵌套调用5.2 链式访问 6. 函数的声明…