CVPR2024|AIGC(图像生成,视频生成等)相关论文汇总(附论文链接/开源代码/解析)【持续更新】

CVPR2024|AIGC相关论文汇总(如果觉得有帮助,欢迎点赞和收藏)

  • Awesome-CVPR2024-AIGC
  • 1.图像生成(Image Generation/Image Synthesis)
      • ECLIPSE: A Resource-Efficient Text-to-Image Prior for Image Generations
      • InstanceDiffusion: Instance-level Control for Image Generation
      • Instruct-Imagen: Image Generation with Multi-modal Instruction
      • MACE: Mass Concept Erasure in Diffusion Models
      • PAIR-Diffusion: Object-Level Image Editing with Structure-and-Appearance Paired Diffusion Models
      • Residual Denoising Diffusion Models
  • 2.图像编辑(Image Editing)
      • PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models
  • 3.视频生成(Video Generation/Image Synthesis)
      • Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners
  • 4.视频编辑(Video Editing)
  • 5.3D生成(3D Generation/3D Synthesis)
      • EscherNet: A Generative Model for Scalable View Synthesis
  • 6.其他多任务(Others)
      • InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks
      • Q-Instruct: Improving Low-level Visual Abilities for Multi-modality Foundation Models
  • 参考
  • 相关整理

Awesome-CVPR2024-AIGC

A Collection of Papers and Codes for CVPR2024 AIGC

整理汇总下今年CVPR AIGC相关的论文和代码,具体如下。

欢迎star,fork和PR~
优先在Github更新:Awesome-CVPR2024-AIGC,欢迎star~
知乎:https://zhuanlan.zhihu.com/p/684325134

参考或转载请注明出处

CVPR2024官网:https://cvpr.thecvf.com/Conferences/2024

CVPR完整论文列表:

开会时间:2024年6月17日-6月21日

论文接收公布时间:

【Contents】

  • 1.图像生成(Image Generation/Image Synthesis)
  • 2.图像编辑(Image Editing)
  • 3.视频生成(Video Generation/Image Synthesis)
  • 4.视频编辑(Video Editing)
  • 5.3D生成(3D Generation/3D Synthesis)
  • 6.其他多任务(Others)

1.图像生成(Image Generation/Image Synthesis)

ECLIPSE: A Resource-Efficient Text-to-Image Prior for Image Generations

  • Paper: https://arxiv.org/abs/2312.04655
  • Code: https://github.com/eclipse-t2i/eclipse-inference

InstanceDiffusion: Instance-level Control for Image Generation

  • Paper: https://arxiv.org/abs/2402.03290
  • Code: https://github.com/frank-xwang/InstanceDiffusion

Instruct-Imagen: Image Generation with Multi-modal Instruction

  • Paper: https://arxiv.org/abs/2401.01952

MACE: Mass Concept Erasure in Diffusion Models

  • Paper:
  • Code: https://github.com/Shilin-LU/MACE

PAIR-Diffusion: Object-Level Image Editing with Structure-and-Appearance Paired Diffusion Models

  • Paper: https://arxiv.org/abs/2303.17546
  • Code: https://github.com/Picsart-AI-Research/PAIR-Diffusion

Residual Denoising Diffusion Models

  • Paper: https://arxiv.org/abs/2308.13712
  • Code: https://github.com/nachifur/RDDM

2.图像编辑(Image Editing)

PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models

  • Paper: https://arxiv.org/abs/2312.13964
  • Code: https://github.com/open-mmlab/PIA

3.视频生成(Video Generation/Image Synthesis)

Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners

  • Paper: https://arxiv.org/abs/2308.13712
  • Code: https://github.com/yzxing87/Seeing-and-Hearing

4.视频编辑(Video Editing)

5.3D生成(3D Generation/3D Synthesis)

EscherNet: A Generative Model for Scalable View Synthesis

  • Paper: https://arxiv.org/abs/2402.03908
  • Code: https://github.com/kxhit/EscherNet

6.其他多任务(Others)

InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks

  • Paper: https://arxiv.org/abs/2312.14238
  • Code: https://github.com/OpenGVLab/InternVL

Q-Instruct: Improving Low-level Visual Abilities for Multi-modality Foundation Models

  • Paper: https://arxiv.org/abs/2311.06783
  • Code: https://github.com/Q-Future/Q-Instruct
    持续更新~

参考

CVPR 2024 论文和开源项目合集(Papers with Code)

相关整理

  • Awesome-AIGC-Research-Groups
  • Awesome-Low-Level-Vision-Research-Groups
  • Awesome-CVPR2024-CVPR2021-CVPR2020-Low-Level-Vision
  • Awesome-ECCV2020-Low-Level-Vision

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/708518.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器人内部传感器阅读梳理及心得-速度传感器-模拟式速度传感器

速度传感器是机器人内部传感器之一,是闭环控制系统中不可缺少的重要组成部分,它用来测量机器人关节的运动速度。可以进行速度测量的传感器很多,如进行位置测量的传感器大多可同时获得速度的信息。但是应用最广泛、能直接得到代表转速的电压且…

fastjson序列化MessageExt对象问题(1.2.78之前版本)

前言 无论是kafka&#xff0c;还是RocketMq&#xff0c;消费者方法参数中的MessageExt对象不能被 fastjson默认的方式序列化。 一、查看代码 Override public ConsumeConcurrentlyStatus consumeMessage(List<MessageExt> msgs,ConsumeConcurrentlyContext context) {t…

江科大stm32学习笔记——【4-1】OLED

一.原理 1.调试方式 串口调试&#xff1a;通过串口通信&#xff0c;将调试信息发送到电脑端&#xff0c;电脑使用串口助手显示调试信息。 显示屏调试&#xff1a;直接将显示屏连接到单片机&#xff0c;将调试信息打印在显示屏上。 Keil调试模式&#xff1a;借助Keil软件的调…

resilience4j 2.0.0版本使用要求最低JDK17(使用踩坑记录)

文章目录 &#x1f50a;博主介绍&#x1f964;本文内容&#x1f4e2;文章总结&#x1f4e5;博主目标 &#x1f50a;博主介绍 &#x1f31f;我是廖志伟&#xff0c;一名Java开发工程师、Java领域优质创作者、CSDN博客专家、51CTO专家博主、阿里云专家博主、清华大学出版社签约作…

六自由度Stewart平台的matlab模拟与仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 4.1运动学原理 4.2 Stewart平台运动学方程 5.完整工程文件 1.课题概述 六自由度Stewart平台的matlab模拟与仿真&#xff0c;模拟六自由度Stewart平台的动态变化情况以及伺服角度。 2.系统仿真结果 3.核…

v-rep--websocket接口

websocket是什么 V-REP 中的 Web Socket 是一种用于在 V-REP 和外部应用程序之间进行通信的协议和技术。Web Socket 基于 TCP 连接&#xff0c;可以提供双向、实时的数据传输&#xff0c;适用于互动性或实时交互性应用。 (比如v-rep在云服务器上运行&#xff0c;通过websocke…

【国产MCU】-CH32V307-定时器同步模式

定时器同步模式 文章目录 定时器同步模式1、定时器同步模式介绍2、驱动API介绍3、定时器同步模式实例1、定时器同步模式介绍 CH32V307的定时器能够输出时钟脉冲(TRGO),也能接收其他定时器的输入(ITRx)。不同的定时器的ITRx的来源(别的定时器的TRGO)是不一样的。 通用定…

RecyclerView适配器的封装

RecyclerView适配器基类的封装 RecyclerView.Adapter封装类 public abstract class AutoRollAdapter<T> extends RecyclerView.Adapter<ViewHolder> {protected List<T> ts new ArrayList<>();public List<T> getData() {return ts; } public…

Covalent Network的长期数据可用性 获得了众多加密 KOL的肯定及支持

随着 Web3 生态系统的动态发展&#xff0c;Covalent Network&#xff08;CQT&#xff09;的关键性正在显现&#xff0c;通过提供分布式、加密安全的数据层&#xff0c;以解决长期数据可用性的问题。Covalent Network&#xff08;CQT&#xff09;不仅仅是一个工具&#xff0c;更…

企业内部文件资料如何进行加密 ——防止泄露?

企业内部文件资料的加密是防止数据泄露的关键措施之一。 www.weaem.com 以下是一些建议&#xff0c;用于在企业内部进行文件资料的加密&#xff0c;以防止数据泄露&#xff1a; 选择适合的加密技术&#xff1a; 透明加密&#xff1a;这种加密方式允许用户在不改变原有操作习惯的…

简单网站模板1(HTML)

想要拥有自己的网站&#xff0c;却不知该如何才能简约好看&#xff0c;接下来分享一种自己搭建的网站模板&#xff0c;希望大家喜欢。 展示图&#xff1a; CODE: <!DOCTYPE html> <html> <head><title>我的网站</title><style>body {fo…

BERT:基于TensorFlow的BERT模型搭建中文问答系统模型

目录 1、导入所需库2、准备数据集3、对问题和答案进行分词4、构建模型5、编译模型6、训练模型7、评估模型8、使用模型进行预测 1、导入所需库 #导入numpy库&#xff0c;用于进行数值计算 import numpy as np#从Keras库中导入Tokenizer类&#xff0c;用于将文本转换为序列 from…

Nginx服务器配置详解

server {listen 80;listen 443 ssl http2;server_name logi.lyz8770.com;index index.html index.htm default.htm default.html;root /www/wwwroot/logi.lyz8770.com/dist/;#SSL-START SSL相关配置#error_page 404/404.html;ssl_certificate /www/server/panel/vhost/cert/…

eltable 合计行添加tooltip

eltable 合计行添加tooltip 问题描述&#xff1a; eltable 合计行单元格内容过长会换行&#xff0c;需求要求合计行数据超长显示 … &#xff0c;鼠标 hover 时显示提示信息。 解决方案&#xff1a;eltable合计行没有对外的修改接口&#xff0c;想法是 自己实现一个tooltip&a…

System Verilog学习笔记(八)——采样和数据驱动

System Verilog学习笔记&#xff08;八&#xff09;——采样和数据驱动 为了避免在RTL仿真行为中发生的信号竞争问题&#xff0c;可以通过非阻塞赋值或者特定信号延迟来解决同步的问题。 默认情况下&#xff0c;时钟对于组合电路的驱动会添加一个无限小时间&#xff08;delta-…

RLWE同态加密编码打包——系数打包

RLWE同态加密的明文域 RLWE的加密方案&#xff0c;如BGV、BFV&#xff0c;加密的对象&#xff0c;实际上是分圆多项式环上的一个整系数多项式。而我们在平时接触到的需要加密的数据&#xff0c;如图像或者工资&#xff0c;通常是一个数。所以&#xff0c;在使用RLWE同态加密时…

JVM对象创建与内存分配机制

JVM对象创建与内存分配机制 JVM对象创建与内存分配机制 JVM对象创建与内存分配机制对象的创建过程内存分配对象栈上分配对象逃逸分析标量替换 对象在Eden区分配大对象直接进入老年代长期存活的对象将进入老年代对象年龄动态判断老年代空间分配担保机制 对象头与指针压缩对象头利…

课时49:表达式_表达式进阶_集合基础

3.3.2 集合基础 学习目标 这一节&#xff0c;我们从 基础知识、简单实践、小结 三个方面来学习。 基础知识 简介 所谓的集合&#xff0c;主要是针对多个条件表达式组合后的结果&#xff0c;尤其是针对于逻辑场景的组合。初中数学的相关逻辑示意图&#xff1a;表现样式 两个…

将四个主页面配置为 tab-bar 的子路由

使用vant组件库 路由 {path: /, name: layout,component: () > import(/views/layout),children: [{path: , // 默认子路由name: home,component: () > import(/views/home)},{path: qa,name: qa,component: () > import(/views/qa)},{path: video,name: video,compo…

对比CentOS与Ubuntu:选择最适合你的Linux发行版

目录 对比CentOS与Ubuntu&#xff1a;选择最适合你的Linux发行版CentOS vs Ubuntu&#xff1a;概述CentOS vs Ubuntu&#xff1a;安装和配置CentOS vs Ubuntu&#xff1a;性能和稳定性示例代码和解决方案CentOS示例&#xff1a;Ubuntu示例&#xff1a; CentOS vs Ubuntu&#x…