CV计算机视觉每日开源代码Paper with code速览-2023.11.21

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【基础网络架构:Transformer】Multi-entity Video Transformers for Fine-Grained Video Representation Learning

  • 论文地址:https://arxiv.org//pdf/2311.10873

  • 开源代码:GitHub - facebookresearch/video_rep_learning: SSL Video Representation Learning project

2.【异常检测】NNG-Mix: Improving Semi-supervised Anomaly Detection with Pseudo-anomaly Generation

  • 论文地址:https://arxiv.org//pdf/2311.11961

  • 开源代码(即将开源):GitHub - donghao51/NNG-Mix: Improving Semi-supervised Anomaly Detection with Pseudo-anomaly Generation

3.【语义分割】Generalized Category Discovery in Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2311.11525

  • 开源代码(即将开源):GitHub - JethroPeng/GCDSS: The official code implementation of Generalized Category Discovery in Semantic Segmentation

4.【3D目标检测】Sparse4D v3: Advancing End-to-End 3D Detection and Tracking

  • 论文地址:https://arxiv.org//pdf/2311.11722

  • 开源代码:GitHub - linxuewu/Sparse4D: Sparse4D v1 & v2

5.【点云】Point Cloud Self-supervised Learning via 3D to Multi-view Masked Autoencoder

  • 论文地址:https://arxiv.org//pdf/2311.10887

  • 开源代码(即将开源):GitHub - Zhimin-C/Multiview-MAE

6.【点云3D目标检测】Domain Generalization of 3D Object Detection by Density-Resampling

  • 论文地址:https://arxiv.org//pdf/2311.10845

  • 代码即将开源

7.【医学图像分割】SA-Med2D-20M Dataset: Segment Anything in 2D Medical Imaging with 20 Million masks

  • 论文地址:https://arxiv.org//pdf/2311.11969

  • 开源代码:GitHub - OpenGVLab/SAM-Med2D: Official implementation of SAM-Med2D

8.【多模态】VLM-Eval: A General Evaluation on Video Large Language Models

  • 论文地址:https://arxiv.org//pdf/2311.11865

  • 代码即将开源

9.【多模态】LION : Empowering Multimodal Large Language Model with Dual-Level Visual Knowledge

  • 论文地址:https://arxiv.org//pdf/2311.11860

  • 开源代码(即将开源):GitHub - rshaojimmy/JiuTian: JiuTian, a Multimodal Large Language Model from HITSZ

10.【多模态】CORE-MM: Complex Open-Ended Reasoning Evaluation For Multi-Modal Large Language Models

  • 论文地址:https://arxiv.org//pdf/2311.11567

  • 工程主页:CORE-MM: Complex Open-ended Reasoning Evaluation for Multi-modal LargeLanguage Models

  • 开源代码(即将开源):GitHub - core-mm/core-mm

11.【多模态】GPT-4V(ision) for Robotics: Multimodal Task Planning from Human Demonstration

  • 论文地址:https://arxiv.org//pdf/2311.12015

  • 工程主页:https://microsoft.github.io/GPT4Vision-Robot-Manipulation-Prompts/

  • 代码即将开源

12.【数字人】Semantic-Preserved Point-based Human Avatar

  • 论文地址:https://arxiv.org//pdf/2311.11614

  • 开源代码(即将开源):GitHub - l1346792580123/spa

13.【自动驾驶】A Language Agent for Autonomous Driving

  • 论文地址:https://arxiv.org//pdf/2311.10813

  • 开源代码:GitHub - USC-GVL/Agent-Driver: A Language Agent for Autonomous Driving

14.【Diffusion】Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model

  • 论文地址:https://arxiv.org//pdf/2311.11638

  • 开源代码(即将开源):GitHub - ChunmingHe/Reti-Diff

15.【人体姿态估计】Multiple View Geometry Transformers for 3D Human Pose Estimation

  • 论文地址:https://arxiv.org//pdf/2311.10983

  • 开源代码(即将开源):GitHub - XunshanMan/MVGFormer

16.【人群计数】Evaluating Supervision Levels Trade-Offs for Infrared-Based People Counting

  • 论文地址:https://arxiv.org//pdf/2311.11974

  • 开源代码(即将开源):tortueTortue/IRPeopleCounting · GitHub

17.【图像修复】Deep Equilibrium Diffusion Restoration with Parallel Sampling

  • 论文地址:https://arxiv.org//pdf/2311.11600

  • 开源代码(即将开源):GitHub - caojiezhang/DeqIR: PyTorch implementation of "Deep Equilibrium Diffusion Restoration with Parallel Sampling"

18.【NeRF】Entangled View-Epipolar Information Aggregation for Generalizable Neural Radiance Fields

  • 论文地址:https://arxiv.org//pdf/2311.11845

  • 开源代码(即将开源):GitHub - tatakai1/EVENeRF

19.【三维重建】LiDAR-HMR: 3D Human Mesh Recovery from LiDAR

  • 论文地址:https://arxiv.org//pdf/2311.11971

  • 开源代码(即将开源):GitHub - soullessrobot/LiDAR-HMR: Code and data for LiDAR-HMR: 3D Human Mesh Recovery from LiDAR

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.11.20

CV计算机视觉每日开源代码Paper with code速览-2023.11.17

CV计算机视觉每日开源代码Paper with code速览-2023.11.16

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/171775.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt 串口编程-从入门到实战

1. Qt 串口通信流程解析 1.1 串行通信和并行通信对比 并行通信适合距离较短的通信,且信号容易受干扰,成本高串口通讯-设备(蓝牙, wifi, gprs, gps) 1.2 Qt 串口通信具体流程 1. 创建 QSerial…

Java基于springboot+vue开发服装商城小程序

演示视频: 小程序 https://www.bilibili.com/video/BV1rM411o7m4/?share_sourcecopy_web&vd_source11344bb73ef9b33550b8202d07ae139b 管理员 https://www.bilibili.com/video/BV1fc411D7V3/?share_sourcecopy_web&vd_source11344bb73ef9b33550b8202d07ae…

计算机中vcomp140.dll丢失的解决方法,一键修复vcomp140.dll缺失问题

vcomp140.dll是Visual C 2015 Redistributable的一个组件,它是运行一些基于Visual Studio开发的软件所必需的。当你在运行某些程序时,可能会遇到“找不到vcomp140.dll”的错误提示,这通常是由于系统缺少这个组件导致的。本文将介绍vcomp140.d…

服务运营 |精选:病人向何处去?医院调度的几种建模方法(上)

推文作者: Shutian Li 编者按: 住院流程(Inpatient Flow)是一种通过协调和优化医院内部流程,以提高患者入院至出院期间的效率和质量的方法。住院流程通常通过医院内部信息系统和协同工作流程进行管理,以确…

ArcGIS中基于人口数据计算人口密度的方法

文章目录 一、密度分析原理二、点密度分析三、线密度分析四、核密度分析一、密度分析原理 密度分析是指根据输入的要素数据集计算整个区域的数据聚集状况,从而产生一个联系的密度表面。通过密度计算,将每个采样点的值散步到整个研究区域,并获得输出栅格中每个像元的密度值。…

C语言——深入理解指针(2)

目录 1. 数组名 2. 指针访问数组 3. 一维数组的传参(本质) 4. 冒泡排序 5. 二级指针 6. 指针数组(指针的数组) 7. 指针数组模拟二维数组 1. 数组名 在之前的代码中我们使用指针访问过数组的内容。 int arr[10] {1,2,3,4…

针对c语言的scanf读取字符和字符串解析

在scanf函数中,格式字符串里的空格字符有特定的作用。 当你在格式字符串里放置一个空格时,scanf会尝试匹配并消耗输入中的一个或多个空白字符(包括空格、制表符或换行符)。换句话说,它会跳过任何空白字符,…

jQuery_09 事件的绑定与使用(on)

jQuery使用on绑定事件 jQuery可以给dom对象添加事件 在程序执行期间动态的处理事件 1. $("选择器").事件名称(事件处理函数) $("选择器") : 选择0或者多个dom对象 给他们添加事件 事件名称:就是js中事件名称去掉on的部分 比如单击…

js逆向-JS加密破解

一、常见五种js加密手段 (一)加密位置: 1.Request Payload 加密 2.Request Headers 加密 3.Request URL params 参数加密 4.Response Data 数据加密 5.JS代码混淆加密 (二)加密算法 base64 编码 哈希算法&…

抖音视频怎么提取动图?手机视频转gif方法

抖音是人们休闲娱乐消遣时光必备的短视频软件,当我们想要把好玩有趣的抖音短视频转换成gif动画时,要怎么操作呢?通过使用gif动图制作(https://www.gif.cn/)网站-GIF中文网,手机自带浏览器,上传视…

Leetcode—45.跳跃游戏II【中等】

2023每日刷题&#xff08;四十&#xff09; Leetcode—45.跳跃游戏II 贪心法思想 实现代码 #define MAX(a, b) (a > b ? (a) : (b))int jump(int* nums, int numsSize) {int start 0;int end 1;int ans 0;int maxStride 0;while(end < numsSize) {maxStride 0;fo…

向量机SVM原理理解和实战

目录 概念场景导入 点到超平面的距离公式 最大间隔的优化模型 硬间隔、软间隔和非线性 SVM 用 SVM 如何解决多分类问题 1. 一对多法 2. 一对一法 SVM主要原理和特点 原理 优点 缺点 支持向量机模型分类 SVM实战如何进行乳腺癌检测 数据集 字段含义 代码实现 参…

所有网站文本复制方法(知网、百度文库等)

实现文字复制自由 在肝学校结课论文是发现要用的论文文字都无法复制&#xff0c;所以想到了以前学到的一个方法&#xff0c;开始忘了&#xff0c;突然想起来&#xff0c;现在记录一下。 拿我现在肝的课程结课论文为例&#xff1a; 方法一 在谷歌浏览器的网址前面有一个列表一…

ES8生产实践——日志清洗过滤(vector方案)

前言 什么是vector 以下描述摘自官方文档&#xff1a;https://vector.dev/docs/about/what-is-vector/ Vector 是一个高性能的可观测性数据管道&#xff0c;可帮助企业控制其可观测性数据。收集、转换和路由所有日志、度量指标和跟踪数据&#xff0c;并将其提供给今天需要的任…

CSS新手入门笔记整理:CSS基本选择器

id属性 id属性具有唯一性&#xff0c;也就是说&#xff0c;在一个页面中相同的id只能出现一次。在不同的页面中&#xff0c;可以出现两个id相同的元素。 语法 <div id"text"> ...... </div> class属性 class&#xff0c;顾名思义&#xff0c;就是“类…

LeetCode.283移动零(双指针)

LeetCode.283移动零 1.问题描述2.解题思路3.代码 1.问题描述 给定一个数组 nums&#xff0c;编写一个函数将所有 0 移动到数组的末尾&#xff0c;同时保持非零元素的相对顺序。 请注意 &#xff0c;必须在不复制数组的情况下原地对数组进行操作。 示例 1: 输入: nums [0,1…

(三) Windows 下 Sublime Text 3 配置Python环境和Anaconda代码提示

一&#xff1a;新建一个 Python3.7 编译环境。 1 Tools--Build System--New Build System... 修改前&#xff1a; 修改后&#xff1a; 内容&#xff1a; {"cmd":["C:\\Python\\Python37-32\\python.exe","-u","$file"],"file_r…

开通橱窗还能开抖店吗?怎么开通?一篇详解!

我是电商珠珠 开通商品橱窗之后还能开抖店吗&#xff1f;商品橱窗和抖音小店可以同时开吗&#xff1f; 一部分人最初的时候&#xff0c;都觉得直播带货很火&#xff0c;所以就自己去买粉丝或是发视频积攒粉丝&#xff0c;等粉丝够了发现&#xff0c;好像和当初想的不太一样&a…

关于反射、枚举以及Lambda表达式你了解多少呢?快来看看吧~

目录 1、反射 1.1、定义 1.2、用途 1.3、反射基本信息 1.4、反射相关的类【重点】 1.5、Class类&#xff08;反射机制的起源&#xff09; 1.6、Class类中相关的方法 1.7、获得Class对象的三种方式 1.8、反射的使用 1.9、反射的优点、缺点 2、枚举 2.1、背景及定义 …

ZGC 垃圾回收过程

ZGC&#xff08;Z Garbage Collector&#xff09;是Java平台上的一种垃圾收集器&#xff0c;它是由Oracle开发的&#xff0c;旨在解决大堆的低延迟垃圾收集问题。ZGC是一种并发的分代垃圾收集器&#xff0c;它主要针对具有大内存需求和低停顿时间要求的应用程序 ZGC的核心概念及…