diffusers-训练自己的模型

一、搭建dataset

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
基于datasets这个库创建的dataloader,底层代码还待探索

二、修改模型结构(非必要)

尽量可以利用已有的预训练权重去训练模型,但是权重并不一定能够完全是适配,所以还需要自己来视情况做修改,未能加载预训练权重的那一部分参数必须要重新开始训练,不存在finetune一说
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

三、无条件样本生成

先搭建环境
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
train_unconditional.py这个代码待细看
在这里插入图片描述
train_unconditional.py中创建的unet

model = UNet2DModel(sample_size=args.resolution,in_channels=3,out_channels=3,layers_per_block=2,block_out_channels=(128, 128, 256, 256, 512, 512),down_block_types=("DownBlock2D","DownBlock2D","DownBlock2D","DownBlock2D","AttnDownBlock2D","DownBlock2D",),up_block_types=("UpBlock2D","AttnUpBlock2D","UpBlock2D","UpBlock2D","UpBlock2D","UpBlock2D",),
)
# Initialize the scheduler
accepts_prediction_type = "prediction_type" in set(inspect.signature(DDPMScheduler.__init__).parameters.keys())
if accepts_prediction_type:noise_scheduler = DDPMScheduler(num_train_timesteps=args.ddpm_num_steps,beta_schedule=args.ddpm_beta_schedule,prediction_type=args.prediction_type,)
else:noise_scheduler = DDPMScheduler(num_train_timesteps=args.ddpm_num_steps, beta_schedule=args.ddpm_beta_schedule)# Initialize the optimizer
optimizer = torch.optim.AdamW(model.parameters(),lr=args.learning_rate,betas=(args.adam_beta1, args.adam_beta2),weight_decay=args.adam_weight_decay,eps=args.adam_epsilon,
)

默认的优化器和采样器

dataset = load_dataset("imagefolder", data_dir=args.train_data_dir, cache_dir=args.cache_dir, split="train")augmentations = transforms.Compose([transforms.Resize(args.resolution, interpolation=transforms.InterpolationMode.BILINEAR),transforms.CenterCrop(args.resolution) if args.center_crop else transforms.RandomCrop(args.resolution),transforms.RandomHorizontalFlip() if args.random_flip else transforms.Lambda(lambda x: x),transforms.ToTensor(),transforms.Normalize([0.5], [0.5]),]
)

读取数据模块

在这里插入图片描述

accelerate launch train_unconditional.py \--dataset_name="huggan/flowers-102-categories" \--output_dir="ddpm-ema-flowers-64" \--mixed_precision="fp16" \--push_to_hub
# 单卡训accelerate launch --multi_gpu train_unconditional.py \--dataset_name="huggan/flowers-102-categories" \--output_dir="ddpm-ema-flowers-64" \--mixed_precision="fp16" \--push_to_hub
多卡训

在这里插入图片描述

预测代码(小疑问,这个路径咋确定的呢?)

四、

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/235808.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

详解TensorFlow2.0 API:tf.data.Dataset

tf.data.Dataset是TensorFlow中的一个类,用于创建和操作数据集。它提供了一种高效的方式来处理大量数据,支持并行读取、批处理、重复等操作。在使用tf.data.Dataset时,需要注意数据类型的兼容性。如果需要将字符串和数字混合在一起&#xff0…

AttributeError: module ‘_winapi‘ has no attribute ‘SYNCHRONIZE‘解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

【SplaTAM】基于RGB-D类型SplaTAM的定位与重建

SplaTAM ubuntu配置与运行记录 1. 资料收集2. 环境配置与运行注意问题3. 在线运行 近期各种定会涌现出一种新的基于高斯的方法,备受关注,这里我们也来学习下sota效果的slam用于定位和重建。 1. 资料收集 coda link3D Gaussians 2.1 Dynamic 3D Gaussian…

猫罐头评测:五大平价猫罐头排行榜揭晓!

想必铲屎官都知道给猫咪长期吃主食罐头的好处了吧!主食罐头不仅营养丰富,还能让猫咪顺便补充水分。有时候猫咪食欲不佳,一罐主食罐头就能让它们胃口大开呢。 通过本文,我将与大家分享我做宠物医生6年间发现的一些好用的猫罐头&…

安全运营之态势感知与监测

信息安全是一个动态的过程,操作系统、应用软件、中间件,还有硬件,平台的种类越来越多,技术越来越复杂,稍有不慎就会留下安全隐患和管理漏洞,依靠客户自身的IT资源无论从技术的先进性还是方案的严密性上都越…

350. 两个数组的交集 II --力扣 --JAVA

题目 给你两个整数数组 nums1 和 nums2 ,请你以数组形式返回两数组的交集。返回结果中每个元素出现的次数,应与元素在两个数组中都出现的次数一致(如果出现次数不一致,则考虑取较小值)。可以不考虑输出结果的顺序。 解…

超声功率放大器的技术方案是什么

超声功率放大器是一种用于超声波领域的放大器,主要用于将输入的小功率信号放大为高功率的超声波信号。在医学、工业和科学研究等领域,超声功率放大器被广泛应用于超声成像、无损检测、清洗和材料处理等方面。下面将详细介绍超声功率放大器的技术方案和工…

no module named cv2 、numpy 、xxx超全解决方案

常规解决方案可见博客: https://blog.csdn.net/ALiLiLiYa/article/details/126988014 案例 上述仍没有解决,可以参考如下进行: 例如:明明文件夹存在下述文件,仍然报错。那么可能缺少环境变量导致。 No module named …

推荐算法架构7:特征工程

1 概述 特征工程[1](Feature Engineering)是推荐算法的基础,它对收集到的原始数据进行解析和变换,从而提取出模型所需要的信息。通过挖掘丰富和高质量的特征,并对其进行合理的处理,可以提升模型预估准确度…

判断数据是否为整数--函数设计与实现

#定义函数:is_num(s),判断输入的数据是否整数。 #(1)判断是否是数字 def is_num(s):if s.isdigit(): #isdigit()是一个字符串方法,用于检查字符串是否只包含数字字符。如果字符串只包含数字字符,则返回True;否则返回Falsereturn T…

知识付费小程序源码系统:支持视频课程+音频课程+图文课程+完整的代码包 带搭建安装教程

近年来,人们对于知识的需求越来越大,知识付费行业也逐渐崛起。但是,目前市场上有很多知识付费平台存在一些问题,如内容质量参差不齐、用户体验不佳、支付安全问题等。知识付费小程序源码系统的出现很好的解决了这些问题&#xff0…

【Vue中给输入框加入js验证_blur失去焦点进行校验】

【Vue中给输入框加入js验证_blur失去焦点进行校验】 通俗一点就是给输入框加个光标离开当前文本输入框时&#xff0c;然后对当前文本框内容进行校验判断 具体如下&#xff1a; 1.先给文本框加属性 blur“validatePhoneNumber” <el-input v-model“entity.telephone” blur…

人工智能 RL 算法边缘服务器

提出了一种基于人工智能深度强化学习算法的扩展性及智能性较高的智能选择模式。在人工智能深度强化学习 算法的基础上&#xff0c;引入了动作抑制、四重 Q 学习 (QQL) 及归一化 Q-value 等机制&#xff0c;研究并实现了在满足业务延迟要求及公平 性的原则下&#xff0c;物联终端…

如何用docke启动redis?(解决双击docker服务闪退问题)

要使用Docker启动Redis服务&#xff0c;您可以按照以下步骤进行操作&#xff1a; 安装Docker&#xff1a; 如果您还没有安装Docker&#xff0c;请先在您的系统上安装Docker。您可以从Docker官方网站获取安装说明。 https://www.docker.com/get-started/ 2.在Docker Hub上查找R…

2023 英特尔On技术创新大会直播 |我感受到的“芯”魅力

文章目录 每日一句正能量前言AI时代&#xff0c;云与PC结合为用户带来更好体验全新处理器&#xff0c;首次引入针对人工智能加速的NPU大模型时代&#xff0c;软硬结合带来更好训练成果后记 每日一句正能量 成长是一条必走的路路上我们伤痛在所难免。 前言 在2023年的英特尔On技…

DC电源模块在工业自动化中的关键应用案例分析

BOSHIDA DC电源模块在工业自动化中的关键应用案例分析 DC电源模块在工业自动化中有许多关键应用案例&#xff0c;以下是其中的一些&#xff1a; 1. 电机控制系统&#xff1a;在工业自动化中&#xff0c;电机控制是非常常见的应用。DC电源模块用于为电机提供稳定的直流电源&…

听GPT 讲Rust源代码--src/tools(16)

File: rust/src/tools/rust-analyzer/crates/ide-completion/src/completions/use_.rs rust-analyzer是一个基于Rust语言的IntelliSense引擎&#xff0c;用于提供IDE自动补全、代码导航和其他代码编辑功能。在rust-analyzer的源代码中&#xff0c;rust/src/tools/rust-analyzer…

CSS新手入门笔记整理:CSS3背景样式

背景大小&#xff1a;background-size 语法 div{background-size:取值;} div{background-size:100px 100px;} background-size属性取值有两种&#xff1a;一种是长度值&#xff0c;如px、em、百分比等&#xff1b;另一种是使用关键字。 属性值 说明 cover 即“覆盖”&…

Shell脚本应用(二)

一、条件测试操作 Shell环境根据命令执行后的返回状态值〈$?&#xff09;来判断是否执行成功&#xff0c;当返回值为О时表示成功.否则〈非О值)表示失败或异常。使用专门的测试工具---test命令&#xff0c;可以对特定条件进行测试&#xff0e;并根据返回值来判断条件是否成立…

OpenVAS 插件

插件概述OpenVAS 是一款广泛使用的开源漏洞评估工具&#xff0c;可以扫描计算机系统和网络中的漏洞&#xff0c;并生成详细的报告。OpenVAS 插件是 OpenVAS 的核心组成部分&#xff0c;用于识别和评估系统和网络中的漏洞。本文将介绍 OpenVAS 插件的概述、分类和使用方法等。 …