lora体验

lora体验

news/2025/4/27 11:02:47/文章来源:https://blog.csdn.net/qq_19859865/article/details/138695816

项目链接

GitHub - cloneofsimo/lora: Using Low-rank adaptation to quickly fine-tune diffusion models.

现在如果想体验stable diffusion的lora功能，有很多种渠道吧，虽然lora是微软开源，但是cloneofsimo提供了适配stable diffusion的lora流程。

数据准备

我准备了20张葫芦娃的图片用于微调，没有什么特别操作。

微调

微调耗时很短，10分钟？

Code Review

代码基于cli_lora_pti.py 执行，针对输入的关键词，我们生成对应的token id. 其实就是建立embedding的映射了。

这里有点不理解的是，initialize_token_ids, place_token_ids的作用不太理解。。。

接下来，进入

PivotalTuningDatasetCapation

它的作用就是构建数据集。

接下来，还有inpaint的训练选项，这是一个我很感兴趣的功能。我们可以选择是使用inpainting_dataloader还是text2img_dataloader 加载数据

然后，我们设定require_grad为false。

   unet.requires_grad_(False)vae.requires_grad_(False)

接下来，我们可以选择是否进行inversion，如果选择训练inversion，我们会对于text encoder进行训练，

接下来，我们可以选择利用lora进行训练,这里可以选择是否使用extended lora进行训练，

然后，我们可以inspect_lora(什么意思呢？

最后，我们又一次进行tuning，对象为text_encoder和unet。并进行保存！我认为这个代码结构非常的清晰简洁，值得多看！

看什么呢？

有几个问题需要再梳理清楚

1. initialized_token_id和place holder token id是什么关系

2. inpaint 的操作如何进行？

3. inspect lora是什么操作？

4. inversion的细节

5. extended lora是什么操作？

6. unet微调的细节？

7. vae不需要微调吗？

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/835390.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Springboot+Vue项目-基于Java+MySQL的车辆管理系统(附源码+演示视频+LW)

Springboot+Vue项目-基于Java+MySQL的车辆管理系统(附源码+演示视频+LW)

大家好！我是程序猿老A，感谢您阅读本文，欢迎一键三连哦。 💞当前专栏：Java毕业设计精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计 &…

阅读更多...

STM32（六）：定时器PWM呼吸灯（标准库函数）

STM32（六）：定时器PWM呼吸灯（标准库函数）

前言上一篇文章已经介绍了如何用STM32单片机中的TIMER定时器来控制LED灯的交替闪烁，实现了点灯的第五种方式。这篇文章我们来介绍一下如何用STM32单片机中的定时器的PWM波来实现LED的“呼吸”。一、实验原理关于定时器这边就不多加赘述，详细请看上…

阅读更多...

6. path路径绘制：使用path绘制弧线

6. path路径绘制：使用path绘制弧线

在可缩放矢量图形（SVG）中，path 元素是用于绘制各种形状的强大工具，其中包括弧线的绘制。理解弧线绘制的原理对于精确控制图形的形状至关重要。绘制原理当指定了这些参数后，浏览器会根据数学公式计算出弧线的路径。…

阅读更多...

综合能力 | 误差 | 学习笔记

综合能力 | 误差 | 学习笔记

误差指真值与观测值的差值。误差分为系统误差（消除方法：观测方法、仪器校正、修正等）、偶然误差（符合正态分布规律，进行计算纠正）、粗差（一般舍弃）。中误差（均方差或标…

阅读更多...

Gartner发布降低企业软件供应链安全风险指南：全球软件供应链相关法规、指南以及企业需要开展的三个方面工作

Gartner发布降低企业软件供应链安全风险指南：全球软件供应链相关法规、指南以及企业需要开展的三个方面工作

软件供应链攻击呈三位数增长，但很少有企业机构采取措施对这些复杂攻击的风险进行评估。安全和风险管理领导者可参考本文，采用三种实践来检测和预防攻击，保护企业机构的安全。主要发现虽然软件供应链攻击频繁发生，但其安全评估尚…

阅读更多...

linux基础命令第三篇

linux基础命令第三篇

雷迪斯and the乡亲们欢迎你们来到奇幻的编程世界 17.wc命令作用： 统计行数、单词数、字符分数格式： wc 选项文件选项： -l： 统计行数 -w： 统计单词 -c ：统计字符例子： 162&…

阅读更多...

Wallace树乘法器及Verilog实现

Wallace树乘法器及Verilog实现

一、Wallace树乘法器 Wallace树乘法器就是将多个部分积进行分组，每三个一组，最后如果剩下的部分积个数不够三个的不做处理，然后将各组的部分积进行相加得到和以及进位信息，直到最终只剩下两行部分积，相加后得到最终结…

阅读更多...

3月笔记本电脑行业线上市场销售数据分析

3月笔记本电脑行业线上市场销售数据分析

笔记本电脑市场在过去几年中经历了起伏，但总体上呈现出稳定增长的态势。特别是随着远程办公、在线学习等需求的增加，以及消费者对于便携性、高性能等方面的追求，笔记本电脑市场得到了进一步的发展。据鲸参谋数据统计，线上平台&a…

阅读更多...

利用干扰源模型确定多通道音频信号盲源分离

利用干扰源模型确定多通道音频信号盲源分离

在现实世界的应用中，通常需要从多个麦克风采集的混合信号中提取出感兴趣的源信号。源分离技术主要有两种范式：波束形成（beamforming）和基于独立成分分析（ICA）的多通道盲音频源分离（MBASS&#x…

阅读更多...

简单的神经网络

简单的神经网络

一、softmax的基本概念我们之前学过sigmoid、relu、tanh等等激活函数，今天我们来看一下softmax。先简单回顾一些其他激活函数： Sigmoid激活函数：Sigmoid函数（也称为Logistic函数）是一种常见的激活函数&#xff0c…

阅读更多...

四十九坊股权设计，白酒新零售分红制度，新零售策划机构

四十九坊股权设计，白酒新零售分红制度，新零售策划机构

肆拾玖坊商业模式 | 白酒新零售体系 | 新零售系统开发坐标：厦门，我是易创客肖琳深耕社交新零售行业10年，主要提供新零售系统工具及顶层商业模式设计、全案策划运营陪跑等。不花钱开3000多家门店，只靠49个男人用一套方法卖白酒…

阅读更多...

（Java）心得：LeetCode——4.寻找两个正序数组的中位数

（Java）心得：LeetCode——4.寻找两个正序数组的中位数

一、原题给定两个大小分别为 m 和 n 的正序（从小到大）数组 nums1 和 nums2。请你找出并返回这两个正序数组的中位数。算法的时间复杂度应该为 O(log (mn)) 。示例 1： 输入：nums1 [1,3], nums2 [2] 输出：2.0…

阅读更多...

2010年认证杯SPSSPRO杯数学建模D题(第一阶段)服务网点的分布全过程文档及程序

2010年认证杯SPSSPRO杯数学建模D题(第一阶段)服务网点的分布全过程文档及程序

2010年认证杯SPSSPRO杯数学建模 D题服务网点的分布原题再现： 服务网点、通讯基站的设置，都存在如何设置较少的站点，获得较大效益的问题。通讯基站的覆盖范围一般是圆形的，而消防、快餐、快递服务则受到道路情况和到达时间的限…

阅读更多...

[图解]实现领域驱动设计译文暴露的问题01

[图解]实现领域驱动设计译文暴露的问题01

0 00:00:00,430 --> 00:00:03,470 今天呢，我们来说一个主题 1 00:00:03,810 --> 00:00:04,041 2 00:00:04,041 --> 00:00:05,430 我们来谈一谈 3 00:00:05,960 --> 00:00:07,710 实现领域驱动设计 4 00:00:09,120 --> 00:00:11,070 这本书的中译本…

阅读更多...

Android使用Chaquo来运行Python的librosa的相关代码【有详细案例教程】

Android使用Chaquo来运行Python的librosa的相关代码【有详细案例教程】

在某些情况下，我们可能需要在android上运行python的代码，那么常见的解释器有很多，目前比较成熟的就是chaquo，它适配的第三方机器学习的库很多，下面是它的简单使用教程 1.环境的搭建 1.1 在Android studio中新建安卓工…

阅读更多...

社交媒体数据恢复：飞书

社交媒体数据恢复：飞书

飞书数据恢复过程包括以下几个步骤： 确认数据丢失：首先要确认数据是否真的丢失，有时候可能只是被隐藏或者误操作删除了。检查回收站：飞书中删除的文件会默认保存在回收站中，用户可以通过进入回收站找到被删除的文件&…

阅读更多...

springboot整合redis多数据源(附带RedisUtil)

springboot整合redis多数据源(附带RedisUtil)

单数据源RedisUtil(静态) 单数据源RedisUtil,我这里implements ApplicationContextAware在setApplicationContext注入redisTemplate,工具类可以直接类RedisUtil.StringOps.get()使用 package com.vehicle.manager.core.util;import com.alibaba.fastjson.JSON; import lombok.e…

阅读更多...

如何向Linux内核提交开源补丁？

如何向Linux内核提交开源补丁？

2021年，我曾经在openEuler社区上看到一项改进Linux内核工具的需求，因此参与过Linux内核社区的开源贡献。贡献开源社区的流程都可以在内核社区文档中找到，但是，单独学习需要一个较长的过程，新手难以入门，因此…

阅读更多...

【专用】C# ArrayList的用法总结

【专用】C# ArrayList的用法总结

System.Collections.ArrayList类是一个特殊的数组。通过添加和删除元素，就可以动态改变数组的长度。一、优点 1. 支持自动改变大小的功能 2. 可以灵活的插入元素 3. 可以灵活的删除元素 4. 可以灵活访问元素二、局限性跟一般的数组比起来，速度…

阅读更多...

AI 数据观 | TapData Cloud + MongoDB Atlas：大模型与 RAG 技术有机结合，落地实时工单处理智能化解决方案

AI 数据观 | TapData Cloud + MongoDB Atlas：大模型与 RAG 技术有机结合，落地实时工单处理智能化解决方案

本篇为「AI 数据观」系列文章第二弹，在这里，我们将进一步探讨 AI 行业的数据价值。以 RAG 的智能工单应用场景为例，共同探索如何使用 Tapdata Cloud MongoDB Atlas 实现具备实时更新能力的向量数据库，为企业工单处理的智能化和自…

阅读更多...

最新文章