分享两个虚拟试衣工具,一个在线,一个离线,还有ComfyUI插件

SAM ,对不住了!

ecd8196291af4d71bdb0a18ee23a279b.png

 

我没记错的话,OpenAI CEO,性别男,取向男,配偶男。

这又让我联想到了苹果CEO库克...

所以OpenAI和Apple可以一啪即合。        

钢铁直男老马就和他们都不对付~~

开个玩笑,聊回正题!

我之前分享过一个叫IDM-VTON的虚拟试衣软件,效果挺不错,后来又出了一个叫Kolors的,看起来也是不错。最近使用了一下IDM-VTON的升级版,所以就放在一起发一下。

下面就先介绍一下Kolors,然后给大家一个IDM-VTON的升级包,还有一个ComfyUI的插件,全套了。

45ec6689d4d3485996c9da71d24f2d38.png

 

Kolors Virtual Try-On 是快手可灵发布的一个网页Demo,托管在HuggingFace上面。

只要上传一个模特的照片,上传一件衣服的照片,点一下RUN,几秒钟内就可以实现换装。

487724a2b31b476c8abcbd6cadbab505.png

 

Demo里面内置了一些AI生成的模特素材,可以通过点击预设素材,快速体验。

从实际操作来看,可以换衣服,也可以换套装,但是下半身不是100%能换,比如开头的奥特曼,就只换了一半。这套衣服基本就没成功的...哈哈~

eb1db670a5634f9f9acaf26cdacd195d.pngKolors可以保持服装的整体风格,但是细节上会有一些变化。另外换上衣的时候,会自动给你匹配裤子。7f6e40d5fe3149639e2a5402a206ef36.png  

另外它也可以处理不同比例的模特照片,比如竖屏横屏都可以。

我大致看了一下源代码,这应该并不算完全的开源软件。代码里是通过调用API来生成图片的,HuggingFace上显示运行在CPU上,也印证了这一点。目前只要能打开网页就能使用,用起来挺方便,效果也挺不错。

说完Kolors,再说说IDM-VTON。

这是第一个效果惊艳的虚拟试衣项目,而且是全部开源。

IDM-VTON(Image-Based Virtual Try-On Network)是一种基于深度学习的图像虚拟试衣系统,其运作方式主要依靠对衣物和人体图像进行融合,从而实现虚拟试衣效果。IDM-VTON 采用的是 2D 图像处理技术,专注于将用户上传的正面照与衣物图片合成在一起,给用户一个视觉上的衣物穿戴效果。 

这个项目发布已经有一段时间了,项目刚出的时候,我做过一个软件包。但是当时的版本只能换上衣。最近我回过头去看,发现很早就支持裤子和套装了。

但是,网上搜了一圈,要下载到更新版还是有点麻烦。所以,自己动手丰衣足食。

官方项目应该本身就支持全套换装,但是给出来的代码和网页都只支持换上衣。后来发现有一个叫IDMVTON_CN的项目做的不错,就基于这个项目做了一个软件包。

下面就简单说一下,软件包的实用方法。

首先是下载软件包。这个软件包大概20G左右(猜猜我配置,打包,上传花了多久)。

下载解压打开文件夹,然后找到启动2.exe1783ce975beb4361bbac57055f3a8a5d.png

 

首次启动,会有两个选项。根据你的硬件配置来选择就好了。最低应该能支持到6G显存。启动之后会自动调用浏览器,打开本地网页。然后只要按下面的步骤设置运行即可。cbd11c157c324ae4b34c04dcc8b94c5b.png

 

①选择模特

②选择服装

③点击启动

④⑤是运行结果。

如果替换的服装和原来的服装匹配度比较高的情况下,换装效果一般都相当出色,完全达到了可用的程度。

如果故意把不同性别,不同款式的服装混合在一起替换,就会出现下面的情况。7ec372ddd82b47c9a098494473e47f1e.png

 

身材还不错,这肤色,也很“正确”。当然这个例子也说明了,这个版本可以替换全套。只要在成衣类型里面做一个选择就可以了。目前有三个选项,分别是:upper_body 上身

lower_body  下身

dresses 全身

这么说应该很好理解吧。从实际测试来说,下半身表现不如上半身好。

可能和训练素材有一定的关系。另外这个项目限制了模特图片的比例,可能也和素材有关,我也没有深入研究。

另外还有一点,这个项目可以自己画遮罩。

 23f1695adbeb4efab64806e6fc3b16b7.png

 

只要点击画笔,涂抹想要替换的区域就可以了。

手动遮罩,可以解决自动遮罩不准确的问题。当手动画遮罩之后,记得把自动上蒙版(遮罩)的勾选去掉。

拔出萝卜带出泥,无意中有发现一个ComfyUI的IDM插件(节点),也挺不错。

ComfyUI这种复杂又简洁的设计,确实太迷人了,看到了我就想搞一搞,花了不少时间安装了,三个插件,终于跑起来了。

e732ca3f27bd4a96ab57ee9b9b62e10c.png工作流制作完成之后,用起来就非常丝滑了。S·A·M自动切割实在是太精准了,牛。不过有时候反而成为一个缺点了,比如在换装这个场景,切割完成后,外扩一点的的遮罩会更好一点。

 

为了把这流程跑起来,需要安装三个插件:ComfyUI-IDM-VTON (换装)

ComfyUI Segment Anything (分割)

ComfyUI's ControlNet Auxiliary Preprocessors.(姿态)

限于篇幅,就不具体讲如何安装了。这个工作流,我分享在网盘里,有需要的自取。ComfyUI的基本用法可以参考之前的文章。软件和工作流,可以评论或私信发送idm获取。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/54526.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

编写Python脚本监控域名ssl证书过期时间并在10天内发送邮件

依赖aliyun的邮件推送服务 1、安装依赖包 pip3 install alibabacloud_dm201511232、编写配置文件config.json {"alibaba_cloud": {"access_key_id": "XXXXXXXXXXXXXXXXXXX","access_key_secret": "XXXXXXXXXXXXXXXX",&qu…

GPU 云与 GenAI :DigitalOcean 在 AI 平台与应用方向的技术规划

在 DigitalOcean,我们不仅在观察人工智能革命,而且还在积极参与这场技术革命。 去年,我们进行了一项关键的收购以扩展平台的人工智能能力,扩大了对曾经仅限于大型企业的 AI/ML 开发工具的访问。在2024年7月由 DigitalOcean 主办的…

C++:多态(协变,override,final,纯虚函数抽象类,原理)

目录 编译时多态 函数重载 模板 运行时多态 多态的实现 实现多态的条件 协变 析构函数的重写 override 关键字 final 关键字 重载、重写、隐藏对比 纯虚函数和抽象类 多态的原理 多态是什么? 多态就是有多种形态 多态有两种,分别是编译时…

使用Go语言的互斥锁(Mutex)解决并发问题

解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 在并发编程中,由于存在竞争条件和数据竞争,我们需要将某些代码片段设定为临界区,并使用互斥锁(Mutex)等同步原语来保护这些临界区。本文将详细介绍Go语言标准库中Mutex的使用方法,以及如何利用它来解决实际…

Linux驱动开发 ——架构体系

只读存储器(ROM) 1.作用 这是一种非易失性存储器,用于永久存储数据和程序。与随机存取存储器(RAM)不同,ROM中的数据在断电后不会丢失,通常用于存储固件和系统启动程序。它的内容在制造时或通过…

Java基础面试题——异常

目录 关系图 1. Throwable和Exception之间的关系 2.异常分为哪两大类 3.常见的 RuntimeException 4. 常见的 Error 5.什么是已检查异常和未检查异常?它们的区别是什么? 6.Java 中如何自定义异常? 7.throw 和 throws 的区别是什么&…

ubuntu18.04升级到20.04

要将 Ubuntu 18.04 升级到 Ubuntu 20.04,你可以按照以下步骤进行操作。升级操作会涉及到系统的核心部分,建议在升级之前备份重要数据。 1. 备份数据 在进行系统升级之前,请确保备份重要的数据。可以使用 rsync、tar、或者系统备份工具来创建…

GlusterFS 分布式文件系统

一、GlusterFS 概述 1.1 什么是GlusterFS GlusterFS 是一个开源的分布式文件系统,它可以将多个存储服务器结合在一起,创建一个大的存储池,供客户端使用。它不需要单独的元数据服务器,这样可以提高系统的性能和可靠性。由于没有…

视频转文字工具:开启视频内容深度挖掘的钥匙

图片里到文字要提取出来,现在有很多的工具,但是视频里的文字要提取出来,是不是就不那么好操作呢?并不是的,现在也有不少支持视频转文字的工具,这次我们就来介绍一些可以提高我们视频文字提取效率的工具吧。…

速盾:凡科建站开cdn了吗?

凡科建站是一家专业的建站平台,提供了多种功能和工具来帮助用户快速搭建自己的网站。随着互联网技术的不断发展,网站的访问速度和稳定性成为了越来越重要的考虑因素。为了优化用户体验,提高网站的加载速度,凡科建站已经开启了CDN&…

经典sql题(八)SQL 查询详细指南总结一

SQL 查询详细指南 SQL(Structured Query Language)是一种用于管理和操作关系数据库的标准语言。本文将详细介绍 SQL 中的一些常见操作及其用法,包括 DISTINCT 去重、LIMIT 限制、排序、开窗函数、NULL 值替换、JOIN 与 UNION 等。 1. DISTI…

大话Python|基础语法(上)

一、单行注释 以下代码输出一个Hello World!字符串 在Python代码中,注释会自动被Python解析器忽略 print(Hello World) 二、多行注释 在Python代码中,注释一共有两种形式; 1、单行注释:注释的内容只有一行 2、多行…

计算机网络笔记001

讲义 1.计算机网络的定义  定义: 一批独立自治的计算机系统的互连集合体  说明: 独立自治的计算机系统, 互连的手段是各种各样的, 依据协议进行 工作  2.计算机网络和通信网络  通信网络: 重点研究通…

element plus 按需导入vue

步骤一: 下载element plus 在打开vue项目的编辑器中打开终端,或者在cmd窗口进入到项目目录下 用你的包管理器安装element plus,例如使用npm包管理器: npm install element-plus --save 查看是否安装成功:查看项目文件package…

PostgreSQL(PG)(二十二)

🌻🌻 目录 🌻🌻 一、PostgreSQL 简介1.1、PG 的历史1.2、PG的社区1.2.1 纯社区1.2.2 完善的组织结构1.2.3 开源许可独特性 1.3 、PostgreSQL与MySQL的比较 二、PostgresQL的下载安装2.1、Windows上安装 PostgreSQL2.2、远程 连接 …

RK3568部署DOCKER启动服务器失败解决办法

按照上文的方法部署完DOCKER之后,启动服务异常,查阅网络相关资源,解决方案如下: 修改/源码/kernel/arch/arm64/configs/OK3568-C-linux_defconfig,在最后添加 CONFIG_MEMCGy CONFIG_VETHy CONFIG_BRIDGEy CONFIG_BRID…

php怎么连接使用kafka

PHP 连接并使用 Kafka 需要借助 Kafka 的 PHP 客户端库,比如流行的 php-rdkafka 扩展。它是基于 C 语言的 librdkafka 库的 PHP 绑定,功能稳定且性能高。下面是如何使用 php-rdkafka 来连接和使用 Kafka 的步骤。 1. 安装 php-rdkafka 1.1 安装依赖 首…

GS-SLAM论文阅读笔记--TAMBRIDGE

前言 本文提出了一个自己的分类方法,传统的视觉SLAM通常使用以帧为中心的跟踪方法,但是3DGS作为一种高效的地图表达方法好像更侧重于地图的创建。这两种方法都有各自的优缺点,但是如果能取长补短,互相结合,那么就会是…

6.7泊松噪声

基础概念 在OpenCV联合C中给一张图片添加泊松噪声(Poisson Noise)可以通过生成随机数并在图像的每个像素上加上这些随机数来实现。泊松噪声是一种统计分布服从泊松分布的噪声,通常用于模拟光子计数等场景。 使用泊松噪声的场景 泊松噪声通…

【解决】chrome 谷歌浏览器,鼠标点击任何区域都是 Input 输入框的状态,能看到输入的光标

chrome 谷歌浏览器,鼠标点击任何区域都是 Input 输入框的状态,能看到输入的光标 今天打开电脑的时候,网页中任何文本的地方,只要鼠标点击,就会出现一个输入的光标,无论在哪个站点哪个页面都是如此。 我知道…