DIFT:Emergent Correspondence from Image Diffusion # 论文阅读

URL

https://arxiv.org/pdf/2306.03881
主页:https://diffusionfeatures.github.io/
代码:https://github.com/Tsingularity/dift

TD;DR

23 年 6月 cornell 大学的文章,任务是做图片的特征匹配(关联),特别是局部的特征与其他图片中特征的匹配。文章提出的方法不需要任何额外的 finetune,训练也不需要用到带有标签的数据。最终的精度要明显优于 DINO 和 openclip,同时也不弱于已有的监督方法。

考虑到 diffusion model 的图片编辑能力,自然可以想到其实 diffusion model 是有图片特征匹配的能力的,否则不可能准确的把某一个主体变成另外一个主体。所以作者用 diffusion 探索了一种图像特征匹配的方法。

在这里插入图片描述

Model & Method

在这里插入图片描述

  • 整个过程最重要的是拿到每张图片的 Diffusion feature。具体的做法是对带匹配的图片按照前向过程加噪到时间 t,然后送到 diffusion 里面预测噪声,这个过程会得到想要的 feature。
  • 为了保证稳定性,作者会改变 random seed 的到多次噪声,然后用多次的匹配结果取平均值。

关于加噪到时间 t 具体要加到哪一步,作者表示如果是不同的物体建议加噪到比较大的数值,因为比较大时间 t 的 feature 里更多是语意信息;如果是同一个物体建议加噪到比较小的数值,因为比较小时间 t 的 feature 里面更多是细节信息。

Dataset & Results

如下图,可以看到同一个物体、不同物体,角度变化比较大的情况下,匹配的准确度都很高。
在这里插入图片描述

在这里插入图片描述
更多结果

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
一些失败的 case

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/11536.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【kali工具使用】Tcpdump 抓包查看三次握手过程

Tcpdump 抓包查看三次握手过程 tcpdump 常用参数: -c 指定要抓取的数据包数量 -n 对 IP 地址以数字方式显式,否则显式为主机名 port 指定端口 -I 指定 tcpdump 需要监听的接口。默认会抓取第一个网络接口 tcp 1ClientSYN1seqx 2Server SYN1 seq…

树莓派|超声波传感器

VCC:超声波模块电源脚,接5V电源即可 Trig:超声波发送脚,高电平时发送出40KHZ出超声波 Echo:超声波接收检测脚,当接收到返回的超声波时,输出高电平 GND:超声波模块GND 测距原理&…

2025考研 | 北京师范大学计算机考研考情分析

北京师范大学(Beijing Normal University)简称“北师大”,由中华人民共和国教育部直属,中央直管副部级建制,位列“211工程”、“985工程”,入选国家“双一流”、“珠峰计划”、“2011计划”、“111计划”、…

NCL绘制WRF domain区域并添加气象站点

读取文件 根据官网例子Using gsn_csm_contour_map to plot WRF-ARW data绘制: ; It shows how to use gsn_csm_xxxx scripts to do the plotting. ; ; You can use the map projection settings on the WRF file, or you ; can use your own map projection. See …

路由器、交换机和网卡

大家使用VMware安装镜像之后,是不是都会考虑虚拟机的镜像系统怎么连上网的,它的连接方式是什么,它ip是什么? 路由器、交换机和网卡 1.路由器 一般有几个功能,第一个是网关、第二个是扩展有线网络端口、第三个是WiFi功…

ncs sdk nrf5340 运行DFU

nrf5340 运行DFU 1. dfu介绍 Nordic 的 DFU(Device Firmware Update)是一种用于更新设备固件的技术和协议。Nordic Semiconductor 是一家专门设计和制造无线芯片的公司,他们的产品主要用于物联网(IoT)和无线连接应用…

【数据分析面试】42.用户流失预测模型搭建(资料数据分享)

题目 保持高的客户留存率可以稳定和提到企业的收入。因此,预测和防止客户流失是在业务中常见的一项数据分析任务。这次分享的数据集包括了电信行业、银行、人力资源和电商行业,涵盖了不同业务背景下的流失预测数据。 后台回复暗号(在本文末…

React Native 之 开发环境搭建(一)

1. 安装Node.js: Node.js是React Native开发的基础,因此首先需要安装Node.js。强烈建议始终选择 Node 当前的 LTS (长期维护)版本,一般是偶数版本,不要选择偏实验性质的奇数版本。 如果你希望更方便地管理…

基于SpringBoot+微信小程序的订餐(点餐)配送系统设计与实现+毕业论文(12000字)

系统介绍 本微信小程序在线订餐系统管理员功能可以修改个人中心,用户管理,菜品分类管理,菜品信息管理,订单信息管理,取消订单管理,订单配送管理,菜品评价管理以及系统管理。微信小程序用户可以…

实训一:设计系统主页作业

1.题目 设计系统主页。 2.目的 (1)熟悉Web前端项目开发环境。 (2)掌握如何建立Web前端项目,学会规划项目结构。 (3)掌握动态生成页面内容的方法。 (4)理解如何使用Flash显示图片新闻。 (5)会在应用系统中编写播放动态新闻的程序。 3.内容 建立项目结构,并…

在excel的内置瀑布图模板中,能在数据标签里同时显示数值和百分比吗?

瀑布图是由麦肯锡顾问公司所创的图表类型,因为形似瀑布流水而称之为瀑布图( Waterfall Plot)。这种图表常用于表达数个特定数值之间的数量增减变化关系。 在Excel中,瀑布图是可以通过簇状柱形图来完成创建。从excel2016版起,excel添加了内置…

【AIGC】Mac Intel 本地 LLM 部署经验汇总(CPU Only)

书接上文,在《【AIGC】本地部署 ollama(gguf) 与项目整合》章节的最后,我在 ollama 中部署 qwen1_5-14b-chat-q4_k_m.gguf 预量化模型,在非 Stream 模式下需要 89 秒才完成一轮问答,响应速度实在是太慢,后续需要想办法…

IT行业现状与未来趋势-技术创新日新月异

目录 一、引言 二、IT行业现状 技术创新日新月异 市场需求持续增长 人才竞争激烈 网络安全问题凸显 三、IT行业未来趋势 人工智能将更加普及 区块链技术将改变商业模式 网络安全将成为重要战略 数字化转型将加速推进 四、结语 一、引言 随着科技的飞速发展&#x…

通过 OmniPlan 4 解决项目管理中的实际问题

项目管理是一个复杂的过程,涉及规划、执行、监控和控制等多个方面。OmniPlan 4作为一款专业的项目管理软件,能够帮助项目经理和团队成员解决实际项目管理中遇到的各种问题。以下是通过OmniPlan 4解决一些常见项目管理问题的介绍。 OmniPlan 4 下载 https…

大型医疗挂号微服务“马上好医”医疗项目(4)设计一个医院方接口

如何构建一个医院方接口 一、如何进行数据库建模 数据库建模一般需要使用工具PowerDesign,但是其实在navicat中是有类似的功能的 二、分析医院接口会有什么字段 其实很多的同学在入行的时候会有一个问题,没有设计思维。 表字段的设计方案 状态字段…

怎么把图片大小缩小到1M?教你几招图片你压缩

当我们的图片数量越来越多的时候,占用的内存也就越来越多,时间长了之后,会导致我们空间不足或者设备比较卡顿,为了缓解这个问题,很多人会选择去删除一些不必要的图片文件,其实还有个方法就是利用图片压缩的…

Workfine签章方案使用说明

概述 为支持绝大部分第三方签章平台,Workfine针对性添加了部分动作事件与message支持。用户只需要自己开发中间代理程序,用于Workfine与签章平台的通讯即可完成整套签章方案。 整体业务流程图如下: 设计端添加发送PDF动作事件,生…

宁夏银川最牛起名大师的老师颜廷利:宝与饱,饿跟恶

对于中国优秀传统文化之根-汉语而言, 恶,对应着‘饿’; 宝,对应着‘饱’… 由此可见,无论是‘饿’(与‘恶’同音),还是‘饱’(与‘宝’通音),实际…

SqlServer2016安装

1、下载 下载地址: https://www.microsoft.com/en-us/server-cloud/products/sql-server-2016/ 或者 MSDN, 我告诉你 - 做一个安静的工具站 开发版下载地址:https://myprodscussu1.app.vssubscriptions.visualstudio.com/downloads KB2919442下载地址…

Django 安全性与防御性编程:如何保护 Django Web 应用

title: Django 安全性与防御性编程:如何保护 Django Web 应用 date: 2024/5/13 20:26:58 updated: 2024/5/13 20:26:58 categories: 后端开发 tags: CSRFXSSSQLUploadHTTPOnlyPasswordSession 跨站请求伪造(CSRF) 跨站请求伪造&#xff0…