CV计算机视觉每日开源代码Paper with code速览-2023.10.31

精华置顶

墙裂推荐!小白如何1个月系统学习CV核心知识:链接

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【基础网络架构】(NeurIPS2023)Fast Trainable Projection for Robust Fine-Tuning

  • 论文地址:https://arxiv.org//pdf/2310.19182

  • 开源代码:GitHub - GT-RIPL/FTP: This repo hosts the code for the Fast Trainable Projection (FTP) project.

2.【基础网络架构:Transformer】TransXNet: Learning Both Global and Local Dynamics with a Dual Dynamic Token Mixer for Visual Recognition

  • 论文地址:https://arxiv.org//pdf/2310.19380

  • 开源代码(即将开源):GitHub - LMMMEng/TransXNet

3.【图像分类】(NeurIPS2023)Analyzing Vision Transformers for Image Classification in Class Embedding Space

  • 论文地址:https://arxiv.org//pdf/2310.18969

  • 开源代码:GitHub - martinagvilas/vit-cls_emb: Accompanying code for "Analyzing Vision Tranformers in Class Embedding Space" (NeurIPS '23)

4.【目标检测】RGB-X Object Detection via Scene-Specific Fusion Modules

  • 论文地址:https://arxiv.org//pdf/2310.19372

  • 开源代码:GitHub - dsriaditya999/RGBXFusion

5.【目标检测】A High-Resolution Dataset for Instance Detection with Multi-View Instance Capture

  • 论文地址:https://arxiv.org//pdf/2310.19257

  • 开源代码:GitHub - insdet/instance-detection

6.【目标检测】PrObeD: Proactive Object Detection Wrapper

  • 论文地址:https://arxiv.org//pdf/2310.18788

  • 开源代码(即将开源):GitHub - vishal3477/Proactive-Object-Detection

7.【异常检测】Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection

  • 论文地址:https://arxiv.org//pdf/2310.19070

  • 开源代码(即将开源):GitHub - tzjtatata/Myriad: Open-sourced codes, IAD vision-language datasets and pre-trained checkpoints for Myriad.

8.【异常检测】AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly Detection

  • 论文地址:https://arxiv.org//pdf/2310.18961

  • 开源代码(即将开源):GitHub - zqhang/AnomalyCLIP

9.【语义分割】(NeurIPS2023)Revisiting Evaluation Metrics for Semantic Segmentation: Optimization and Evaluation of Fine-grained Intersection over Union

  • 论文地址:https://arxiv.org//pdf/2310.19252

  • 开源代码:GitHub - zifuwanggg/JDTLosses: Optimization with JDTLoss and Evaluation with Fine-grained mIoUs for Semantic Segmentation

10.【语义分割】(NeurIPS2023)Switching Temporary Teachers for Semi-Supervised Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.18640

  • 开源代码(即将开源):GitHub - naver-ai/dual-teacher: Official code for the NeurIPS 2023 paper "Switching Temporary Teachers for Semi-Supervised Semantic Segmentation"

11.【Open-Vocabulary Segmentation】(NeurIPS2023)Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.19001

  • 开源代码(即将开源):GitHub - Ferenas/PGSeg: This is the official code of "Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic Segmentation, Neurips23"

12.【视频语义分割】(NeurIPS2023)Mask Propagation for Efficient Video Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.18954

  • 开源代码(即将开源):GitHub - ziplab/MPVSS

13.【超分辨率重建】(NeurIPS2023)Efficient Test-Time Adaptation for Super-Resolution with Second-Order Degradation and Reconstruction

  • 论文地址:https://arxiv.org//pdf/2310.19011

  • 开源代码(即将开源):GitHub - DengZeshuai/SRTTA

14.【超分辨率重建】EDiffSR: An Efficient Diffusion Probabilistic Model for Remote Sensing Image Super-Resolution

  • 论文地址:https://arxiv.org//pdf/2310.19288

  • 开源代码(即将开源):GitHub - XY-boy/EDiffSR: EDiffSR: An Efficient Diffusion Probabilistic Model for Remote Sensing Image Super-Resolution

15.【领域泛化】(NeurIPS2023)SimMMDG: A Simple and Effective Framework for Multi-modal Domain Generalization

  • 论文地址:https://arxiv.org//pdf/2310.19795

  • 开源代码(即将开源):GitHub - donghao51/SimMMDG: [NeurIPS 2023] SimMMDG: A Simple and Effective Framework for Multi-modal Domain Generalization

16.【领域泛化】(WACV2024)Domain Generalisation via Risk Distribution Matching

  • 论文地址:https://arxiv.org//pdf/2310.18598

  • 开源代码:GitHub - nktoan/risk-distribution-matching: Here is the codebase for our accepted paper in the Research Track of WACV'24 on 'Domain Generalization via Risk Distribution Matching'.

17.【多模态】Harvest Video Foundation Models via Efficient Post-Pretraining

  • 论文地址:https://arxiv.org//pdf/2310.19554

  • 开源代码:GitHub - OpenGVLab/InternVideo: InternVideo: General Video Foundation Models via Generative and Discriminative Learning (https://arxiv.org/abs/2212.03191)

18.【多模态】IterInv: Iterative Inversion for Pixel-Level T2I Models

  • 论文地址:https://arxiv.org//pdf/2310.19540

  • 开源代码(即将开源):GitHub - Tchuanm/IterInv: The official implement of "IterInv: Iterative Inversion for Pixel-Level T2I Models".

19.【多模态】Generating Context-Aware Natural Answers for Questions in 3D Scenes

  • 论文地址:https://arxiv.org//pdf/2310.19516

  • 开源代码(即将开源):GitHub - MunzerDw/Gen3DQA: My guided research project on 3D visual question answering at the lab of Prof. Dr. Niessner at Technical University of Munich.

20.【多模态】Text-to-3D with Classifier Score Distillation

  • 论文地址:https://arxiv.org//pdf/2310.19415

  • 工程主页:Classifier Score Distillation

  • 代码即将开源

21.【多模态】Dynamic Task and Weight Prioritization Curriculum Learning for Multimodal Imagery

  • 论文地址:https://arxiv.org//pdf/2310.19109

  • 开源代码:GitHub - fualsan/DATWEP: Source code for the Dynamic Task and Weight Prioritization Curriculum Learning for Multimodal Imagery

22.【多模态】TESTA: Temporal-Spatial Token Aggregation for Long-form Video-Language Understanding

  • 论文地址:https://arxiv.org//pdf/2310.19060

  • 开源代码:GitHub - RenShuhuai-Andy/TESTA: [EMNLP 2023] TESTA: Temporal-Spatial Token Aggregation for Long-form Video-Language Understanding

23.【多模态】Customizing 360-Degree Panoramas through Text-to-Image Diffusion Models

  • 论文地址:https://arxiv.org//pdf/2310.18840

  • 开源代码:GitHub - littlewhitesea/StitchDiffusion: This is the official implementation of "Customizing 360-Degree Panoramas through Text-to-Image Diffusion Models" (WACV2024)

24.【多模态】ROME: Evaluating Pre-trained Vision-Language Models on Reasoning beyond Visual Common Sense

  • 论文地址:https://arxiv.org//pdf/2310.19301

  • 开源代码(即将开源):GitHub - K-Square-00/ROME

25.【多模态】Apollo: Zero-shot MultiModal Reasoning with Multiple Experts

  • 论文地址:https://arxiv.org//pdf/2310.18369

  • 开源代码:GitHub - danielabd/Apollo-Cap: Style Controllable Zero-Shot Image-to-Text Generation

26.【自监督学习】Local-Global Self-Supervised Visual Representation Learning

  • 论文地址:https://arxiv.org//pdf/2310.18651

  • 开源代码:GitHub - alijavidani/Local_Global_Representation_Learning

27.【自监督学习】(NeurIPS2023)InstanT: Semi-supervised Learning with Instance-dependent Thresholds

  • 论文地址:https://arxiv.org//pdf/2310.18910

  • 开源代码(即将开源):tmllab/2023_NeurIPS_InstanT · GitHub

28.【单目3D目标检测】ODM3D: Alleviating Foreground Sparsity for Enhanced Semi-Supervised Monocular 3D Object Detection

  • 论文地址:https://arxiv.org//pdf/2310.18620

  • 开源代码(即将开源):https://github.com/arcaninez/odm3d

29.【自动驾驶:协同感知】Dynamic V2X Autonomous Perception from Road-to-Vehicle Vision

  • 论文地址:https://arxiv.org//pdf/2310.19113

  • 开源代码(即将开源):tjy1423317192/AP2VP · GitHub

30.【自动驾驶:深度估计】(NeurIPS2023)Dynamo-Depth: Fixing Unsupervised Depth Estimation for Dynamical Scenes

  • 论文地址:https://arxiv.org//pdf/2310.18887

  • 工程主页:Dynamo-Depth: Fixing Unsupervised Depth Estimation for Dynamical Scenes

  • 开源代码(即将开源):GitHub - YihongSun/Dynamo-Depth: [NeurIPS 2023] Fixing Unsupervised Depth Estimation for Dynamical Scenes

31.【图像编辑】(EMNLP2023)Learning to Follow Object-Centric Image Editing Instructions Faithfully

  • 论文地址:https://arxiv.org//pdf/2310.19145

  • 开源代码:GitHub - tuhinjubcse/FaithfulEdits_EMNLP2023: Code and Data for EMNLP 2023 paper "Learning to Follow Object-Centric Image Editing Instructions Faithfully"

32.【视频生成】VideoCrafter1: Open Diffusion Models for High-Quality Video Generation

  • 论文地址:https://arxiv.org//pdf/2310.19512

  • 工程主页:VideoCrafter1

  • 开源代码:GitHub - AILab-CVC/VideoCrafter: VideoCrafter1: Open Diffusion Models for High-Quality Video Generation

33.【知识蒸馏】One-for-All: Bridge the Gap Between Heterogeneous Architectures in Knowledge Distillation

  • 论文地址:https://arxiv.org//pdf/2310.19444

  • 开源代码:GitHub - Hao840/OFAKD

34.【Continual Learning】(NeurIPS2023)NPCL: Neural Processes for Uncertainty-Aware Continual Learning

  • 论文地址:https://arxiv.org//pdf/2310.19272

  • 开源代码(即将开源):GitHub - srvCodes/NPCL

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

使用目标之间的先验关系提升目标检测器性能

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/127418.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

EVM6678L 开发教程: IBL-TFTP 引导 elf 文件

目录 EVM6678L 开发教程: IBL-TFTP 引导 elf 文件安装 Tftpd64测试工程测试说明 EVM6678L 开发教程: IBL-TFTP 引导 elf 文件 参考: "C:\ti\mcsdk_2_01_02_06\tools\boot_loader\examples\i2c\tftp\docs\README.txt" 此教程介绍如何在 EVM6678L 开发板上实现 IBL-…

uni-starter 使用常见问题

1. Invalid uni-id config file 没有找到uni-id文件导致 需要在uniCloud-aliyun/cloudfunctions/common/uni-config-center/uni-id/下新建 config.json 如果没有uni-id 就新建一个。 注意:config.json是一个标准json文件,不支持注释 uni-starter 按照…

树形结构数据展示及返回上一级

11月1日&#xff0c;又是搬砖的一天&#xff0c;让我们红尘作伴&#xff0c;活的潇潇洒洒。。。。。。 html <template><view class"content"><view><input class"sreachTool" v-model"toolValue"/><van-icon name…

进口跨境电商商城源码(海关179接口+海关报关+三单对碰)

海关179接口 现如今&#xff0c;跨境电商正在飞速发展&#xff0c;进口商品成为人们消费的热点。然而&#xff0c;进口商品的报关手续繁琐&#xff0c;而海关179接口的出现解决了这个问题。海关179接口是指与海关电子数据交换的商业接口&#xff0c;可以实现与海关进行数据对接…

【生物信息学】单细胞RNA测序数据分析:计算亲和力矩阵(基于距离、皮尔逊相关系数)及绘制热图(Heatmap)

文章目录 一、实验介绍二、实验环境1. 配置虚拟环境2. 库版本介绍 三、实验内容0. 导入必要的库1. 读取数据集2. 质量控制&#xff08;可选&#xff09;3. 基于距离的亲和力矩阵4. 绘制基因表达的Heatmap5. 基于皮尔逊相关系数的亲和力矩阵6. 代码整合 一、实验介绍 计算亲和力…

【自然语言处理】【长文本处理】RMT:能处理长度超过一百万token的Transformer

相关博客 【自然语言处理】【长文本处理】RMT&#xff1a;能处理长度超过一百万token的Transformer 【自然语言处理】【大模型】MPT模型结构源码解析(单机版) 【自然语言处理】【大模型】ChatGLM-6B模型结构代码解析(单机版) 【自然语言处理】【大模型】BLOOM模型结构源码解析(…

【STL】:list用法详解

朋友们、伙计们&#xff0c;我们又见面了&#xff0c;本期来给大家解读一下有关list的使用&#xff0c;如果看完之后对你有一定的启发&#xff0c;那么请留下你的三连&#xff0c;祝大家心想事成&#xff01; C 语 言 专 栏&#xff1a;C语言&#xff1a;从入门到精通 数据结构…

教您如何去除照片上的水印!

许多网友都在寻找方法去除照片上的水印&#xff0c;水印通常用于保护版权或标识来源&#xff0c;但有时候我们可能需要使用带有水印的照片&#xff0c;却又不希望水印影响观感&#xff0c;今天我将向大家介绍两种有效的方法&#xff0c;帮助解决“如何去除照片上的水印”这一难…

metaRTC集成flutter ui demo编译指南

概要 Flutter是由Google开发的开源UI工具包&#xff0c;用于构建跨平台应用程序&#xff0c;支持linux/windows/mac/android/ios等操作系统。 metaRTC新增flutter demo&#xff0c;支持linux/windows/mac/android/ios操作系统&#xff0c;此demo在ubuntu桌面环境下测试成功。…

【嵌入式项目应用】__UART自定义通信协议代码实现方法

目录 前言 一、什么是通信协议 二、简单通信协议的问题 三、通信协议的常见内容 1. 帧头 2. 设备地址/类型 3. 命令/指令 4. 命令类型/功能码 5. 数据长度 6. 数据 7.帧尾 8.校验码 四、通信协议代码实现 1. 消息数据发送 a. 通过串口直接发送每一个字节 b. 通过…

<windows>win11输入法无法设置UI,变为了win10样子,解决方法

1 问题 升级win11版本后&#xff0c;输入法可能会变为旧版&#xff0c;如下图。如何恢复WIN11新版样子&#xff1f; 2 解决 点击开始–>设置–>搜索”语言“–>选择中文简体右侧语言选项。 下拉到最后选择微软拼音右侧三点&#xff0c;选择键盘选项–>选择常规…

【C语言初阶】之函数

【C语言初阶】之函数 1. 函数是什么2. C语言中的函数2.1 库函数2.2.1 利用文档学习库函数 2.2 自定义函数 3. 函数参数3.1 实际参数(实参)3.2 形式参数(形参) 4. 函数调用4.1 传值调用4.2 传址调用4.3 练习 5. 函数的嵌套调用和链式访问5.1 嵌套调用5.2 链式访问 6. 函数的声明…

微服务架构之路1,服务如何拆分?使用微服务的注意事项?

目录 一、前言二、单体服务的弊端三、微服务化四、服务如何拆分&#xff1f;五、使用微服务的注意事项1、服务如何定义2、服务如何发布和订阅3、服务如何监控4、服务如何治理5、故障如何定位 大家好&#xff0c;我是哪吒。 一、前言 微服务已经是Java开发的必备技能&#xff…

Python画图之动态爱心

Python画出动态爱心&#xff08;有趣小游戏&#xff09; 一、效果图二、Python代码 一、效果图 二、Python代码 import random from math import sin, cos, pi, log from tkinter import *CANVAS_WIDTH 640 # 画布的宽 CANVAS_HEIGHT 480 # 画布的高 CANVAS_CENTER_X CANV…

线段树 区间赋值 + 区间加减 + 求区间最值

线段树好题&#xff1a;P1253 扶苏的问题 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 区间赋值 区间加减 求区间最大。 对于区间赋值和区间加减来说&#xff0c;需要两个懒标记&#xff0c;一个表示赋值cover&#xff0c;一个表示加减add。 区间赋值的优先级大于区间加…

大麦协议开发

1. 用户抢购请求处理&#xff1a; - 后端实现&#xff1a;在后端&#xff0c;您可以创建一个用于处理用户抢购请求的接口。当用户发起抢购请求时&#xff0c;后端会根据一定的算法和逻辑来处理请求。例如&#xff0c;可以使用分布式锁来保证只有一个用户能够成功抢购。示例后端…

VS2017制作安装包如何将整个文件夹添加进依赖项中

找到安装项目右键view-文件系统 找到Application Folder 右键Add-Folder 如Python38 选中创建的 Python38 在右侧的空白处粘贴要复制的文件即可。文件多&#xff0c;等待时间较长

玩转硬件之Micro:bit的玩法(三)——计步器

随着技术的发展&#xff0c;现在智能手机和智能手表已经走进千家万户&#xff0c;所以大家对于计步器可能不陌生&#xff0c;计步器是一种用于计算行走步数的装置。它通常是一个小型电子设备&#xff0c;可以佩戴在身体上&#xff0c;如腕带、腰带或口袋中。计步器通过感应人体…

树结构及其算法-二叉查找树

目录 树结构及其算法-二叉查找树 C代码 树结构及其算法-二叉查找树 二叉树在建立的过程中是根据“左子树 < 树根 < 右子树”的原则建立的&#xff0c;因此只需从树根出发比较键值即可&#xff0c;如果比树根大就往右&#xff0c;否则往左而下&#xff0c;直到相等就找…

浅谈安科瑞无线测温产品在南非某变电站的应用

摘要&#xff1a;随着电力工业的发展&#xff0c;对设备的安全性、可靠性要求越来越高。在这种条件下&#xff0c;高压设备的无线测温系统应运而生。这种技术是将内置电池或电流感应和无线发射模块的测温传感器安装于各测温点&#xff0c;由于其体积小&#xff0c;且无需任何接…