CV计算机视觉每日开源代码Paper with code速览-2023.11.21

CV计算机视觉每日开源代码Paper with code速览-2023.11.21

news/2025/4/27 2:03:36/文章来源:https://blog.csdn.net/zhangkai950121/article/details/134630475

点击@CV计算机视觉，关注更多CV干货

论文已打包，点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【基础网络架构：Transformer】Multi-entity Video Transformers for Fine-Grained Video Representation Learning

论文地址：https://arxiv.org//pdf/2311.10873
开源代码：GitHub - facebookresearch/video_rep_learning: SSL Video Representation Learning project

2.【异常检测】NNG-Mix: Improving Semi-supervised Anomaly Detection with Pseudo-anomaly Generation

论文地址：https://arxiv.org//pdf/2311.11961
开源代码（即将开源）：GitHub - donghao51/NNG-Mix: Improving Semi-supervised Anomaly Detection with Pseudo-anomaly Generation

3.【语义分割】Generalized Category Discovery in Semantic Segmentation

论文地址：https://arxiv.org//pdf/2311.11525
开源代码（即将开源）：GitHub - JethroPeng/GCDSS: The official code implementation of Generalized Category Discovery in Semantic Segmentation

4.【3D目标检测】Sparse4D v3: Advancing End-to-End 3D Detection and Tracking

论文地址：https://arxiv.org//pdf/2311.11722
开源代码：GitHub - linxuewu/Sparse4D: Sparse4D v1 & v2

5.【点云】Point Cloud Self-supervised Learning via 3D to Multi-view Masked Autoencoder

论文地址：https://arxiv.org//pdf/2311.10887
开源代码（即将开源）：GitHub - Zhimin-C/Multiview-MAE

6.【点云3D目标检测】Domain Generalization of 3D Object Detection by Density-Resampling

论文地址：https://arxiv.org//pdf/2311.10845
代码即将开源

7.【医学图像分割】SA-Med2D-20M Dataset: Segment Anything in 2D Medical Imaging with 20 Million masks

论文地址：https://arxiv.org//pdf/2311.11969
开源代码：GitHub - OpenGVLab/SAM-Med2D: Official implementation of SAM-Med2D

8.【多模态】VLM-Eval: A General Evaluation on Video Large Language Models

论文地址：https://arxiv.org//pdf/2311.11865
代码即将开源

9.【多模态】LION : Empowering Multimodal Large Language Model with Dual-Level Visual Knowledge

论文地址：https://arxiv.org//pdf/2311.11860
开源代码（即将开源）：GitHub - rshaojimmy/JiuTian: JiuTian, a Multimodal Large Language Model from HITSZ

10.【多模态】CORE-MM: Complex Open-Ended Reasoning Evaluation For Multi-Modal Large Language Models

论文地址：https://arxiv.org//pdf/2311.11567
工程主页：CORE-MM: Complex Open-ended Reasoning Evaluation for Multi-modal LargeLanguage Models
开源代码（即将开源）：GitHub - core-mm/core-mm

11.【多模态】GPT-4V(ision) for Robotics: Multimodal Task Planning from Human Demonstration

论文地址：https://arxiv.org//pdf/2311.12015
工程主页：https://microsoft.github.io/GPT4Vision-Robot-Manipulation-Prompts/
代码即将开源

12.【数字人】Semantic-Preserved Point-based Human Avatar

论文地址：https://arxiv.org//pdf/2311.11614
开源代码（即将开源）：GitHub - l1346792580123/spa

13.【自动驾驶】A Language Agent for Autonomous Driving

论文地址：https://arxiv.org//pdf/2311.10813
开源代码：GitHub - USC-GVL/Agent-Driver: A Language Agent for Autonomous Driving

14.【Diffusion】Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model

论文地址：https://arxiv.org//pdf/2311.11638
开源代码（即将开源）：GitHub - ChunmingHe/Reti-Diff

15.【人体姿态估计】Multiple View Geometry Transformers for 3D Human Pose Estimation

论文地址：https://arxiv.org//pdf/2311.10983
开源代码（即将开源）：GitHub - XunshanMan/MVGFormer

16.【人群计数】Evaluating Supervision Levels Trade-Offs for Infrared-Based People Counting

论文地址：https://arxiv.org//pdf/2311.11974
开源代码（即将开源）：tortueTortue/IRPeopleCounting · GitHub

17.【图像修复】Deep Equilibrium Diffusion Restoration with Parallel Sampling

论文地址：https://arxiv.org//pdf/2311.11600
开源代码（即将开源）：GitHub - caojiezhang/DeqIR: PyTorch implementation of "Deep Equilibrium Diffusion Restoration with Parallel Sampling"

18.【NeRF】Entangled View-Epipolar Information Aggregation for Generalizable Neural Radiance Fields

论文地址：https://arxiv.org//pdf/2311.11845
开源代码（即将开源）：GitHub - tatakai1/EVENeRF

19.【三维重建】LiDAR-HMR: 3D Human Mesh Recovery from LiDAR

论文地址：https://arxiv.org//pdf/2311.11971
开源代码（即将开源）：GitHub - soullessrobot/LiDAR-HMR: Code and data for LiDAR-HMR: 3D Human Mesh Recovery from LiDAR

论文已打包，下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬，不定期分享技术知识、面试技巧和内推招聘信息。

想进群的同学请添加微信号联系管理员：PingShanHai666。添加好友时请备注：学校/公司+研究方向+昵称。

推荐阅读：

CV计算机视觉每日开源代码Paper with code速览-2023.11.20

CV计算机视觉每日开源代码Paper with code速览-2023.11.17

CV计算机视觉每日开源代码Paper with code速览-2023.11.16

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/171775.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Qt 串口编程-从入门到实战

Qt 串口编程-从入门到实战

1. Qt 串口通信流程解析 1.1 串行通信和并行通信对比并行通信适合距离较短的通信，且信号容易受干扰，成本高串口通讯-设备（蓝牙， wifi， gprs， gps） 1.2 Qt 串口通信具体流程 1. 创建 QSerial…

阅读更多...

Java基于springboot+vue开发服装商城小程序

Java基于springboot+vue开发服装商城小程序

演示视频： 小程序 https://www.bilibili.com/video/BV1rM411o7m4/?share_sourcecopy_web&vd_source11344bb73ef9b33550b8202d07ae139b 管理员 https://www.bilibili.com/video/BV1fc411D7V3/?share_sourcecopy_web&vd_source11344bb73ef9b33550b8202d07ae…

阅读更多...

计算机中vcomp140.dll丢失的解决方法,一键修复vcomp140.dll缺失问题

计算机中vcomp140.dll丢失的解决方法,一键修复vcomp140.dll缺失问题

vcomp140.dll是Visual C 2015 Redistributable的一个组件，它是运行一些基于Visual Studio开发的软件所必需的。当你在运行某些程序时，可能会遇到“找不到vcomp140.dll”的错误提示，这通常是由于系统缺少这个组件导致的。本文将介绍vcomp140.d…

阅读更多...

服务运营｜精选：病人向何处去？医院调度的几种建模方法（上）

服务运营｜精选：病人向何处去？医院调度的几种建模方法（上）

推文作者： Shutian Li 编者按： 住院流程（Inpatient Flow）是一种通过协调和优化医院内部流程，以提高患者入院至出院期间的效率和质量的方法。住院流程通常通过医院内部信息系统和协同工作流程进行管理，以确…

阅读更多...

4. 无向图的各连通分支

4. 无向图的各连通分支

题目求解无向图的各连通分支输入： 第一行为图的节点数n（节点编号0至n-1，0<n<10） 从第二行开始列出图的边，-1表示输入结束输出： 输出每个连通分支的广度优先搜索序列（从连通分支的最…

阅读更多...

WordPress无插件实现css、js加速实现动静态分离

WordPress无插件实现css、js加速实现动静态分离

“Wordpress网站现在普遍较慢”，其实是没有做好优化罢了，像我的网站生成页面的时间才0.06s,而且我这网站还有提速的机会呢，如css、js使用CDN加速，实现动静态分离，我安装过，Memcache和PHP加速脚本就已经让我…

阅读更多...

NextJS开发：Prisma开启SQL日志输出

NextJS开发：Prisma开启SQL日志输出

在 Prisma 中打印执行的 SQL 可以通过在 PrismaClient 实例上设置 log 配置参数来实现。具体步骤如下： 在你的Prisma项目根目录中，找到 prisma/schema.prisma 文件在 datasource 块中，找到你正在使用的数据库配置，并添加 provide…

阅读更多...

ArcGIS中基于人口数据计算人口密度的方法

ArcGIS中基于人口数据计算人口密度的方法

文章目录一、密度分析原理二、点密度分析三、线密度分析四、核密度分析一、密度分析原理密度分析是指根据输入的要素数据集计算整个区域的数据聚集状况，从而产生一个联系的密度表面。通过密度计算，将每个采样点的值散步到整个研究区域，并获得输出栅格中每个像元的密度值。…

阅读更多...

C语言——深入理解指针（2）

C语言——深入理解指针（2）

目录 1. 数组名 2. 指针访问数组 3. 一维数组的传参（本质） 4. 冒泡排序 5. 二级指针 6. 指针数组（指针的数组） 7. 指针数组模拟二维数组 1. 数组名在之前的代码中我们使用指针访问过数组的内容。 int arr[10] {1,2,3,4…

阅读更多...

针对c语言的scanf读取字符和字符串解析

针对c语言的scanf读取字符和字符串解析

在scanf函数中，格式字符串里的空格字符有特定的作用。当你在格式字符串里放置一个空格时，scanf会尝试匹配并消耗输入中的一个或多个空白字符（包括空格、制表符或换行符）。换句话说，它会跳过任何空白字符，…

阅读更多...

Vue2 Vue3 响应式实现原理

Vue2 Vue3 响应式实现原理

Vue2 和 Vue3 的响应式实现原理有所不同。 Vue2 响应式实现原理： Vue2 使用 Object.defineProperty() 方法来实现数据劫持，从而实现数据的响应式更新。具体步骤如下： 首先，在初始化阶段，遍历 data 对象的所有属性&a…

阅读更多...

jQuery_09 事件的绑定与使用(on)

jQuery_09 事件的绑定与使用(on)

jQuery使用on绑定事件 jQuery可以给dom对象添加事件在程序执行期间动态的处理事件 1. $("选择器").事件名称(事件处理函数) $("选择器") ： 选择0或者多个dom对象给他们添加事件事件名称：就是js中事件名称去掉on的部分比如单击…

阅读更多...

js逆向-JS加密破解

js逆向-JS加密破解

一、常见五种js加密手段 （一）加密位置： 1.Request Payload 加密 2.Request Headers 加密 3.Request URL params 参数加密 4.Response Data 数据加密 5.JS代码混淆加密 （二）加密算法 base64 编码哈希算法&…

阅读更多...

【已解决】HBase 2.2.6 集群部署后，从节点未启动 HRegionServer

【已解决】HBase 2.2.6 集群部署后，从节点未启动 HRegionServer

问题发现今天搭建了 HBase 2.2.6 集群环境，启动之后发现，从节点的 HRegionServer 未启动。多次对比参数设置仍然未发现异常。而启动之前的 HBase 2.4.11 则完成正常，我就有点怀疑是不是 HBase 2.2.6 集群搭建有什么特殊的地方？ …

阅读更多...

抖音视频怎么提取动图？手机视频转gif方法

抖音视频怎么提取动图？手机视频转gif方法

抖音是人们休闲娱乐消遣时光必备的短视频软件，当我们想要把好玩有趣的抖音短视频转换成gif动画时，要怎么操作呢？通过使用gif动图制作（https://www.gif.cn/）网站-GIF中文网，手机自带浏览器，上传视…

阅读更多...

找不到android.support.v4.view.ViewPager的解决方案

找不到android.support.v4.view.ViewPager的解决方案

较新版的安卓默认使用androidx的包，摒弃了以前的support包。把用到 android.support.v4.view.ViewPager的地方改成androidx.viewpager.widget.ViewPager即可

阅读更多...

Leetcode—45.跳跃游戏II【中等】

Leetcode—45.跳跃游戏II【中等】

2023每日刷题（四十） Leetcode—45.跳跃游戏II 贪心法思想实现代码 #define MAX(a, b) (a > b ? (a) : (b))int jump(int* nums, int numsSize) {int start 0;int end 1;int ans 0;int maxStride 0;while(end < numsSize) {maxStride 0;fo…

阅读更多...

向量机SVM原理理解和实战

向量机SVM原理理解和实战

目录概念场景导入点到超平面的距离公式最大间隔的优化模型硬间隔、软间隔和非线性 SVM 用 SVM 如何解决多分类问题 1. 一对多法 2. 一对一法 SVM主要原理和特点原理优点缺点支持向量机模型分类 SVM实战如何进行乳腺癌检测数据集字段含义代码实现参…

阅读更多...

所有网站文本复制方法（知网、百度文库等）

所有网站文本复制方法（知网、百度文库等）

实现文字复制自由在肝学校结课论文是发现要用的论文文字都无法复制，所以想到了以前学到的一个方法，开始忘了，突然想起来，现在记录一下。拿我现在肝的课程结课论文为例： 方法一在谷歌浏览器的网址前面有一个列表一…

阅读更多...

ES8生产实践——日志清洗过滤（vector方案）

ES8生产实践——日志清洗过滤（vector方案）

前言什么是vector 以下描述摘自官方文档：https://vector.dev/docs/about/what-is-vector/ Vector 是一个高性能的可观测性数据管道，可帮助企业控制其可观测性数据。收集、转换和路由所有日志、度量指标和跟踪数据，并将其提供给今天需要的任…

阅读更多...

最新文章