机器学习笔记：李宏毅 stable diffusion

news/2025/4/26 16:24:22/文章来源:https://blog.csdn.net/qq_40206371/article/details/132259609

1 基本框架

①：文字变成向量
②：喂入噪声+文字encoder，产生中间产物
③：decoder 还原图片

2 text encoder

这张图越往右下表示效果越好，可以看到text encoder尺寸越大，对后续生成图片的增益越多

3 评价图片生成好坏的标准

3.1 FID

现有一个训练好的CNN 模型，可以生成真实影像和生成图像的representation
这两组表征的分布越近，效果越好
——>我们sample 一堆图片，然后生成一组同语义的图片，计算他们分布的distance

3.2 CLIP

如果图片和文字是成对的，那么他们的representation越近表示生成的图片效果越好

4 decoder

训练一个auoto encoder
训练完把decoder拿出来用即可

5 噪声加的位置

之前defusion model 中，noise是加在图片上
但现在产生的东西已经不是图片了
- ——>noise 加在中间产物上

大体上和diffusion model 类似，这里就是最后多接一个decoder，将中间产物变成图片

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/40315.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

公园游玩必备！新零售模式如何吸引更多游客

公园游玩必备！新零售模式如何吸引更多游客

随着科技的不断演进，新零售模式正以前所未有的速度改变着我们的购物方式和消费体验。其中，自动售货机作为新零售模式的重要组成部分，以其智能化、便捷性和多样性的特点，正逐渐成为城市中熠熠生辉的一道风景线。从24小时不间断的运…

阅读更多...

LeetCode Top100 Liked 题单（序号34~51）

LeetCode Top100 Liked 题单（序号34~51）

34. Find First and Last Position of Element in Sorted Array 题意：找到非递减序列中目标的开头和结尾我的思路用二分法把每一个数字都找到，最后返回首尾两个数代码 Runtime12 ms Beats 33.23% Memory14 MB Beats 5.16% class Solution {…

阅读更多...

前端练手小项目--自定义时间（html+css+js）

前端练手小项目--自定义时间（html+css+js）

自定义时间写文章的因关于要写这篇文章的原因是记录在工作上遇到的困难需求，是希望能给大家提供一些解决问题的思路接下来我描述这个需求的多样性，难点在哪。勾选勾选框开始时间与结束时间默认显示昨天与今天。取消勾选框开始时间与结束时间清空。…

阅读更多...

如何查看线程在哪个cpu核上

如何查看线程在哪个cpu核上

1、ps -eLF查看PSR值 2、 taskset -pc $pid（进程/线程） 参考链接：https://blog.csdn.net/test1280/article/details/87993669

阅读更多...

Ubuntu修改设置系列--修改ssh端口号的方法(有示例)

Ubuntu修改设置系列--修改ssh端口号的方法(有示例)

原文网址：Ubuntu修改设置系列--修改ssh端口号的方法(有示例)_IT利刃出鞘的博客-CSDN博客简介说明本文介绍Ubuntu修改ssh端口号的方法(有示例)。要达成的目标 ssh添加一个端口：3333，关闭原来的22端口。 1.修改端口修改配置文件/et…

阅读更多...

thingsboard编译安装踩坑记录

thingsboard编译安装踩坑记录

thingsboard编译安装踩坑记录一、编译：二、运行朋友的thingsboard没人维护，要装新的服务器，啥文档也没有，就让参考官网的文档，版本也比较老3.2.2的，拿过来试了试记录下踩坑的地方。一、编译：…

阅读更多...

get与post如何拼接url与数据的灵活处理，循环的重要性。

get与post如何拼接url与数据的灵活处理，循环的重要性。

get与post拼接url地址不同： let postData {method: "post",data: {op: "/api/setting/maintenanceperiod?period"this.authorizationCode,loadingConfig: {},data: {period:this.authorizationCode}}}; if(this.editData.id){let postData …

阅读更多...

Nginx运行Vue项目：基本运行

Nginx运行Vue项目：基本运行

需求在Nginx服务器中，运行Vue项目。说明 Vue项目打包生成的生产文件，是无法直接在浏览器打开的。需要放到Nginx服务器中，才能够访问。本文章只介绍最基本的情况：Nginx中运行一个Vue项目。实际生产环境，一个Ng…

阅读更多...

mysql 批量给数据表和字段添加注释

mysql 批量给数据表和字段添加注释

1、用命令行导出 mysql数据库中的所有表首先查看 mysql 的配置文件 “/etc/my.cnf ”，配置中找到 datadir 目录， 将文件导出到 datadir 目录下我的 datadir 目录是： /var/lib/mysql 连接mysql，执行导出命令 SELECT TABLE_NAM…

阅读更多...

解密 AI 客服；在不同硬件设备上运行大型语言模型的可能性

解密 AI 客服；在不同硬件设备上运行大型语言模型的可能性

🦉 AI新闻 🚀 微软必应首席执行官称必应聊天优于OpenAI的GPT-4，但成本更高摘要：微软必应的首席执行官米哈伊尔・帕拉欣表示，必应聊天表现优于OpenAI的GPT-4，但使用了更高成本的检索增强推理技术。必应聊…

阅读更多...

中科亿海微ROM使用

中科亿海微ROM使用

标题 ROM（Read-Only Memory，只读存储器）是一种在FPGA（Field-Programmable Gate Array，现场可编程门阵列）中常用的存储器类型。与RAM（Random Access Memory，机存取存储器）…

阅读更多...

Nginx安全加固，版本隐藏及HTTP请求头修改方法

Nginx安全加固，版本隐藏及HTTP请求头修改方法

1 隐藏nginx版本号 1.1 引言 nginx作为目前较为流行的http server软件，其相关的安全漏洞也非常多，攻击者可以根据我们的nginx版本来了解到相关的漏洞从而针对性的进行攻击。通过新版本的nginx都会修复一些老版本的已知漏洞，但有时候我们生…

阅读更多...

二刷LeetCode--148. 排序链表(C++版本),必会题，思维题

二刷LeetCode--148. 排序链表(C++版本),必会题，思维题

思路，本题其实考察了两个点：合并链表、链表切分。首先从1开始，将链表切成一段一段，因为需要使用归并，所以下一次的切分长度应该是当前切分长度的二倍，每次切分，我们拿出两段，然后将第…

阅读更多...

虚拟机与Java虚拟机介绍

虚拟机与Java虚拟机介绍

1、虚拟机所谓虚拟机（Virtual Machine），就是一台虚拟的计算机。它是一款软件，用来执行一系列虚拟计算机指令。大体上，虚拟机可以分为系统虚拟机和程序虚拟机。大名鼎鼎的Visual Box，VMware就属于系统虚…

阅读更多...

提示丢失vcomp140.dll怎么办？如何快速修复vcomp140.dll丢失问题

提示丢失vcomp140.dll怎么办？如何快速修复vcomp140.dll丢失问题

最近我遇到了一个程序启动失败的问题，错误提示显示缺少了vcomp140.dll文件。经过一番研究和尝试，我终于成功修复了这个问题。在这里，我将分享一下我的修复方法。目录 vcomp140.dll是什么？ 如何快速修复呢？ vcomp140…

阅读更多...

sCrypt编程马拉松于8月13日在复旦大学成功举办

sCrypt编程马拉松于8月13日在复旦大学成功举办

继6月在英国Exeter大学成功举办了为期一周的区块链编程马拉松后，美国sCrypt公司创始人兼CEO刘晓晖博士带领核心团队成员王一强、郑宏锋、周全，于8月13日在复旦大学再次成功举办了一场全新的sCrypt编程马拉松。本次活动由上海可一澈科技有限公司与复旦大…

阅读更多...

C++笔记之花括号和圆括号初始化区别，列表初始化和初始化列表区别

C++笔记之花括号和圆括号初始化区别，列表初始化和初始化列表区别

C笔记之花括号和圆括号初始化区别，列表初始化和初始化列表区别 code review! 文章目录 C笔记之花括号和圆括号初始化区别，列表初始化和初始化列表区别1.花括号{}进行初始化和圆括号()进行初始化2.列表初始化（list initialization&#xff0…

阅读更多...

Vitis高层次综合学习——FPGA

Vitis高层次综合学习——FPGA

高层次综合什么是高层次综合？就是使用高级语言（如C/C）来编写FPGA算法程序。在高层次综合上并不需要制定微架构决策，如创建状态机、数据路径、寄存器流水线等。这些细节可以留给 HLS 工具，通过提供输入约束&#xff…

阅读更多...

专访阿里云席明贤，视频云如何运用大模型与小模型来破茧升级2.0

专访阿里云席明贤，视频云如何运用大模型与小模型来破茧升级2.0

不久前，LiveVideoStack与阿里云视频云负责人席明贤（花名右贤）展开一场深度的对话，一个是圈内专业的社区媒体，一个是20年的IT老兵，双方有交集、有碰撞、有火花。面对风云变幻的内外环境，阿里云…

阅读更多...

未来数字银行的样子

未来数字银行的样子

对银行长期发展来讲，这意味着将关闭和减少低效率的实体分行，加速向数字化发展。实现成本节省和 IT 预算提效的需求，将为数字柜台和银行代理点创造新的机遇。一个崭新的世界：未来数字银行趋势图现在是银行迎头赶上并为客户提供超…

阅读更多...

最新文章