AIGC 005-Dreambooth定制化生成,微调文本到图像的扩散模型!

AIGC 005-Dreambooth定制化生成,微调文本到图像的扩散模型!


文章目录

    • 0 论文工作
    • 1 论文方法
    • 2 效果

0 论文工作

DreamBooth 论文 (DreamBooth: Fine-Tuning Text-to-Image Diffusion Models for Subject-Driven Generation) 提出了一种新颖的技术,用于微调文本到图像扩散模型,以生成特定主题的新图像,同时保留主题的关键特征,并将其与各种场景、姿势和视角相结合。
大型文本到图像模型在人工智能的进化中取得了显著的飞跃,能够从给定的文本提示中合成高质量和多样化的图像。然而,这些模型缺乏以下能力模拟受试者在给定的参考集中的外观,并在不同的背景下合成它们的新再现。在这篇论文中提出了一种新的方法来“个性化”的文本到图像扩散模型。作为输入一个主题的几张图像,对预先训练过的文本到图像模型进行微调,以便它学习将一个唯一的标识符绑定到该特定的主题上。一旦子对象嵌入到模型的输出域中,可以使用唯一标识符用于合成不同场景下的新的逼真图像。通过利用嵌入在模型中的语义先验和一个新的特定于自类的先验保存损失,该论文的技术能够在没有出现在参考图像中的不同场景、姿势、视图和照明条件中合成主题。
主要用于给大模型插入一个新的概念。定制化,让模型学习一个特定的概念,并用于其他生成。
论文
Project

1 论文方法

DreamBooth 的核心思想是通过微调预训练的文本到图像扩散模型,将新的主题概念注入到模型中,使其能够理解并生成该主题的独特表示。微调整个模型把新概念“A [V] dog”和对应图像插入到模型中。
在这里插入图片描述

a. 训练数据:
少量主题图像: DreamBooth 只需要 3-5 张特定主题的图像,即可有效地学习主题的概念。
唯一标识符: 为主题指定一个唯一的标识符 (例如 “[主题名称]”),以区分于其他概念。
类别先验: 利用主题的类别信息 (例如 “狗”) 来提供额外的语义引导。
b. 微调过程:
文本提示: 使用 “[唯一标识符] [类别]” 形式的文本提示来微调扩散模型,例如 “[主题狗] 一只狗”。
低分辨率训练: 为了提高效率和泛化性,DreamBooth 首先在低分辨率图像上进行微调。
高分辨率微调: 可选地,可以使用高分辨率图像进行进一步微调,以提高生成图像的细节。
正则化: DreamBooth 使用一种正则化技术来防止过度拟合,并保留原始模型的生成能力。
c. 图像生成:
文本提示引导: 使用包含唯一标识符的文本提示来引导生成过程,例如 “[主题狗] 在沙滩上玩耍”。
多样化生成: DreamBooth 能够生成主题在各种场景、姿势和视角下的新图像。
2. 优势:
个性化生成: DreamBooth 能够生成特定主题的全新图像,同时保留主题的关键特征。
高效性: 只需要少量主题图像即可有效地学习主题概念。
多样性和可控性: 可以生成主题在各种场景、姿势和视角下的图像,并通过文本提示进行引导。
保留原始能力: DreamBooth 能够保留原始模型的生成能力,并生成其他主题的图像。
3. 缺点:
过度拟合风险: 使用少量主题图像进行微调可能导致过度拟合,尤其是在训练数据质量较低的情况下。
类别先验依赖: DreamBooth 的效果依赖于主题的类别信息,对于难以分类的主题可能效果不佳。
计算成本: 微调过程仍然需要一定的计算资源和时间。
4. 应用:
DreamBooth 在个性化图像生成方面具有广泛的应用,例如:
创建个人头像: 可以使用 DreamBooth 生成各种风格的个人头像,用于社交媒体或虚拟世界。
产品设计: 可以使用 DreamBooth 生成特定产品的不同版本,例如不同颜色或材质的鞋子。
艺术创作: 艺术家可以使用 DreamBooth 将自己的风格应用于特定主题,创作独特的艺术作品。

2 效果

定制化,让模型学习一个特定的概念,并用于其他生成。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/16045.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【开源】大学生竞赛管理系统 JAVA+Vue+SpringBoot+MySQL

目录 一、系统介绍 学生管理模块 教师管理模块 竞赛信息模块 竞赛报名模块 二、系统截图 三、核心代码 一、系统介绍 基于Vue.js和SpringBoot的大学生竞赛管理系统,分为管理后台和用户网页端,可以给管理员、学生和教师角色使用,包括学…

mysql实战——xtrabackup全量备份/增量备份及恢复

一、测试前准备 mysql数据库 端口3306数据文件目录 /data/mysql/3306/data 安装目录/usr/lcoal/mysql配置文件/etc/my.cnf 创建数据库 testXtra 创建备份目录 备份目录/data/backup/备份恢复数据文件目录/data/mysql/3307/data备份恢复配置文件/etc/my_3307.cnf 二、开始…

linux查看是否被入侵(一)

1、查看当前系统状态 [rootbastion-IDC ~]#top #一般挖矿等病毒点用CPU比较大 2、查看当前登录用户(w\who) 3、检查系统日志 检查系统错误登陆日志,统计IP重试次数 [rootbastion-IDC ~]# lastb 4、查看近期用户登录情况 [rootkvm01 ~]# last -n 5 #-n 5 表示…

将list对象里的某一个属性取出组成一个新的list

使用Java8将对象里的某一个属性取出组成一个新的list List<Spgg1> listnew ArrayList<>();Spgg1 spgg1new Spgg1();spgg1.setSpdm("测试");spgg1.setGgdm("001");list.add(spgg1);Spgg1 spgg2new Spgg1();spgg2.setSpdm("测试2");sp…

Mysql 找出未提交事务的SQL及死锁

未提交事务&#xff1a; 通过查看information_schema.INNODB_TRX视图,您可以了解当前系统中正在运行的事务情况,从而进行问题排查和性能优化。 SELECT * FROM information_schema.innodb_trx; 通过trx_state为RUNNIG,trx_started判断是否有一直RUNNING的事务。 如果有未提交…

千帆【API接入】自定义组件简明教程

千帆【API接入】自定义组件简明教程 大家好&#xff0c;我是 JavaRoom&#xff0c;今天来给大家做一个自定义API接入来是心啊遣返组件创建案例简明教学。 1.准备工作 1.1 一个不欠费的千帆账号 财务总览地址&#xff1a;https://console.bce.baidu.com/billing/#/account/i…

“现代汽车中国前瞻软件赛杯” 牛客周赛 Round 43

A. 小红平分糖果&#xff08;签到&#xff09; // Problem: 小红平分糖果 // Contest: NowCoder // URL: https://ac.nowcoder.com/acm/contest/82394/A // Memory Limit: 524288 MB // Time Limit: 2000 ms // // Powered by CP Editor (https://cpeditor.org)#include<b…

以前:不会用电脑;现在:不会用AI

购买特价商务机票需要一些策略和灵活性。、 提前规划&#xff1a;商务舱票价通常在出发日期的2-3个月前最便宜。尽早规划您的行程并开始关注票价。 使用比价工具&#xff1a;使用Skyscanner、Kayak等比价网站来比较不同航空公司的商务舱票价。这些网站可以显示多个航空公司的价…

Jeecg | 如何解决 ERR Client sent AUTH, but no password is set 问题

最近在尝试Jeecg低代码开发&#xff0c;但是碰到了超级多的问题&#xff0c;不过总归是成功运行起来了。 下面说说碰到的最后一个配置问题&#xff1a;连接redis失败 Error starting ApplicationContext. To display the conditions report re-run your application with deb…

近期阅读论文

Exploring Hybrid Active-Passive RIS-Aided MEC Systems: From the Mode-Switching Perspective abstract 移动边缘计算&#xff08;MEC&#xff09;被认为是支持延迟敏感和计算密集型服务的有前途的技术。 然而&#xff0c;随机信道衰落特性导致的低卸载率成为制约MEC性能的…

4个宝藏网站,免费即用,办公运营效率利器!

哈喽&#xff0c;各位小伙伴们好&#xff0c;我是给大家带来各类黑科技与前沿资讯的小武。 有很多朋友在日常办公时&#xff0c;需要发送邮件&#xff1b;在新媒体运营、设计及前端开发等工作场合中&#xff0c;都或多或少会遇上图片、视频等文件太大及格式问题需要压缩和转换…

数据结构(三)栈 队列 数组

2024年5月26日一稿(王道P78) 栈 基本概念 基本操作 顺序存储结构 基本操作 共享栈

数智乡村:是不是乡村治理治理的巨大进步呢?

一、什么是数智乡村 数智乡村是指借助信息技术和数据分析等手段&#xff0c;对乡村进行智能化管理和服务的模式。它可以提供更高效、精准、便利的服务&#xff0c;促进乡村经济发展和社会治理改善。因此&#xff0c;数智乡村确实可以被视为乡村治理的巨大进步。 二、数智乡村的…

腾讯发布ELLA:为扩散模型注入LLM能力,提升复杂场景的图像生成,准确率超90%

前言 近年来&#xff0c;基于扩散模型的文本到图像生成技术取得了显著进步&#xff0c;能够生成高质量、逼真的图像。然而&#xff0c;大多数扩散模型仍然使用CLIP作为文本编码器&#xff0c;这限制了它们理解复杂提示的能力&#xff0c;例如包含多个物体、详细属性、复杂关系…

ROS 2边学边练(51)-- 构建自定义(消息类型)RViz显示项

前言 一俩礼拜没有更新了&#xff0c;今天突然发现ROS 2突然有了新版本了&#xff0c;名为Jazzy&#xff0c;这更新速度与Qt有的一比。这么长时间没更新呢&#xff0c;一来工作上来活了&#xff0c;没那么多时间来继续ROS这块&#xff0c;二来&#xff0c;人懈怠了一点&#xf…

Grafana HTML Panel展示post获取后数据

<!DOCTYPE html> <html> <head><title>API 数据表格展示</title><script src"https://code.jquery.com/jquery-3.6.0.min.js"></script> </head> <body><table id"data-table" border"1&qu…

航运复兴?大摩不信!

大摩认为&#xff0c;从供需关系来看红海危机只是推迟了航运业下行周期的到来&#xff0c;一旦干扰消除&#xff0c;行业可能重回周期性低迷。 红海危机加剧运力紧张&#xff0c;航运市场价格飞涨。 大摩在24日的一份报告中指出&#xff0c;受红海危机干扰航运市场运力&#…

Springboot集成GRPC

Springboot集成GRPC 一、springboot版本二、GRPC的pom依赖2.1 服务端2.2 客户端3.构建依赖 三、配置文件服务端客户端 四、 demo4.1 编写proto文件4.2 生成文件4.3 服务端重写方法4.4 客户端调用该方法 五、测试 一、springboot版本 <groupId>org.springframework.boot&l…

pycharm找不到conda可执行文件解决办法

解决办法 1、第一种 按照以下步骤&#xff0c;找到condabin文件下面&#xff0c;conda.bat 文件&#xff0c;把路径给复制下来&#xff0c;粘贴到 Conda 可执行文件&#xff0c;即可。 然后再点击加载环境&#xff0c;我这里是已经汉化了 pycharm &#xff0c;如何汉化&…