字节开源Hyper-SD模型,超越SDXL-Lightning,单步生成SOTA级图像

前言

近年来,扩散模型(Diffusion Model,DM)在图像生成领域取得了显著进展,展现出前所未有的图像质量和多样性。然而,扩散模型的训练和推理过程通常需要多个步骤,这限制了其在实际应用中的效率。为了克服这一挑战,字节跳动AI团队推出了全新的扩散模型加速框架——Hyper-SD,并将其开源。Hyper-SD 能够将扩散模型的推理步骤大幅压缩,甚至实现单步生成高质量图像,同时保持甚至超越原模型的生成效果。

  • Huggingface模型下载:https://huggingface.co/ByteDance/Hyper-SD

  • AI快站模型免费加速下载:https://aifasthub.com/models/ByteDance

技术特点

Hyper-SD模型拥有以下关键技术特点,使其在扩散模型加速领域独树一帜:

  • 轨迹分段一致性蒸馏 (TSCD)

Hyper-SD 采用了一种名为轨迹分段一致性蒸馏(TSCD)的技术。该技术将扩散模型的整个训练过程划分为多个阶段,并在每个阶段内对模型进行一致性蒸馏,以确保模型在不同阶段都能保持一致的生成质量。TSCD 的优势在于,它能够有效地减少模型拟合的复杂度,并避免因模型拟合不足或推理过程中累积误差而导致的图像质量下降。

  • 人机协同优化

Hyper-SD 将人机协同优化技术引入到模型加速中。它利用人类的审美偏好和现有的视觉感知模型,对加速后的模型进行进一步的优化,以提升图像的审美质量和结构合理性。这使得 Hyper-SD 能够生成更符合人类审美标准的图像,并在某些情况下甚至超越原模型的性能。

  • 统一LoRA支持全步长推理

Hyper-SD 引入了一种统一的LoRA(低秩自适应)技术,使模型能够在所有推理步骤中都保持一致性,包括单步推理。这意味着用户可以灵活地根据不同的需求选择推理步骤,而无需重新训练模型。

性能表现

Hyper-SD 模型在多个基准测试中都取得了领先的性能:

  • Hyper-SDXL 在单步推理中,CLIP得分比 SDXL-Lightning 高出 +0.68,Aesthetic得分高出 +0.51,超越了现有的扩散模型加速方法。

  • Hyper-SD 能够在 1 到 8 个推理步骤中,为 SDXL 和 SD1.5 都实现最佳的性能。

应用场景

Hyper-SD 的高效性能和出色效果,使其在多个领域具有广泛的应用潜力:

  • 加速图像生成: Hyper-SD 可以加速扩散模型的图像生成过程,大幅缩短生成时间,提高生成效率。

  • 提升图像质量: Hyper-SD 能够生成更高质量的图像,尤其是在单步推理中,其效果甚至超越了原模型。

  • 拓展应用场景: Hyper-SD 的低步长推理能力,使其可以应用于更多资源受限的场景,例如移动设备、嵌入式系统等等。

总结

Hyper-SD 的开源,为扩散模型的加速发展提供了新的方向。该模型能够在保持高图像质量的同时,大幅减少推理步骤,甚至实现单步生成SOTA级图像。Hyper-SD 的发布将推动扩散模型技术的发展,并为图像生成领域带来更多可能性。

模型下载

Huggingface模型下载

https://huggingface.co/ByteDance/Hyper-SD

AI快站模型免费加速下载

https://aifasthub.com/models/ByteDance

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/850426.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

注册小程序

每个小程序都需要在 app.js 中调用 App 方法注册小程序实例,绑定生命周期回调函数、错误监听和页面不存在监听函数等。 详细的参数含义和使用请参考 App 参考文档 。 整个小程序只有一个 App 实例,是全部页面共享的。开发者可以通过 getApp 方法获取到全…

172.二叉树:左叶子之和(力扣)

代码解决 /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode *left;* TreeNode *right;* TreeNode() : val(0), left(nullptr), right(nullptr) {}* TreeNode(int x) : val(x), left(nullptr, right(nullptr) {}* Tree…

代码随想录算法训练营第32天(py)| 贪心 | 122.买卖股票的最佳时机II、55. 跳跃游戏、45.跳跃游戏II

122.买卖股票的最佳时机II 力扣链接 给你一个整数数组 prices ,其中 prices[i] 表示某支股票第 i 天的价格。 在每一天,你可以决定是否购买和/或出售股票。你在任何时候 最多 只能持有 一股 股票。你也可以先购买,然后在 同一天 出售。 返…

python学习 - 在线 百度语音API 播报 测试案例分析

在进行百度语音API的播报测试时,可以遵循以下步骤来确保测试的顺利进行。 1. 注册百度语音账号 访问百度语音开发平台:ai.baidu.com/tech/speech注册成为百度开发者,创建个人或企业账号 2. 创建应用并获取API密钥 在控制台中,…

RandomDate(接口参数化-随机生成日期)

目录 1、入口位置:2、验证函数生成值3、获取 年月日时分秒 的全随机4、时间函数 前言:有时候我们做性能测试或者接口测试时,参数需要传入日期格式,但是又不想每次都是用同一个日期,我们就可以使用Jmeter工具中函数助手…

2024050702-重学 Java 设计模式《实战状态模式》

重学 Java 设计模式:实战状态模式「模拟系统营销活动,状态流程审核发布上线场景」 一、前言 写好代码三个关键点 如果把写代码想象成家里的软装,你肯定会想到家里需要有一个非常不错格局最好是南北通透的,买回来的家具最好是品…

Mysql 中的case-when

什么是 case-when case-when 是一种 sql 语句中的语法结构,结构如下: case 字段名 when 值 then 字段名|值 ... else 字段名|值 end case when 主要用于数据的 行列转换(把一列数据转换为多列) 前置条件: -- 表…

02.体验CSS以及Bootstrap框架

目录 CSS固定格式 1)style标签 2)div标签 3)span标签 CSS属性 一、文字属性 1.规范文字样式的属性 2.规定文字粗细的属性 3.规定文字大小的属性 4.规范文字字体的属性 二、文本属性 1.文本装饰属性 2.文本水平对齐属性 3.文本缩进…

[flutter]一键将YAPI生成的api.json文件转为需要的Dart Model类的脚本

目的: 根据YAPI接口平台生成的api.json接口文件,将接口数据转化为model类,生成对应的接口值类型文件。 发现: api.json文件导出: YAPi是一个接口管理平台,登录账号打开项目后,在点击数据管理…

Vuex3学习笔记

文章目录 1,入门案例辅助函数 2,mutations传参辅助函数 3,actions辅助函数 4,getters辅助函数 5,模块拆分6,访问子模块的state辅助函数 7,访问子模块的getters辅助函数 8,访问子模块…

Python魔法之旅-魔法方法(23)

目录 一、概述 1、定义 2、作用 二、应用场景 1、构造和析构 2、操作符重载 3、字符串和表示 4、容器管理 5、可调用对象 6、上下文管理 7、属性访问和描述符 8、迭代器和生成器 9、数值类型 10、复制和序列化 11、自定义元类行为 12、自定义类行为 13、类型检…

大宋咨询(深圳窗口满意度调查)关于政务服务窗口满意度调研的内容

政务服务窗口作为公政与社会公众之间的桥梁,其服务质量直接关系到公政形象与公众满意度。为了深入了解政务服务窗口的运作状况及公众的实际感受,大宋咨询(深圳窗口满意度调查)受客户委托开展政务服务窗口满意度第三方调研评估。 …

【Python】数据处理:OS目录文件操作

Python的os模块是一个用于与操作系统进行交互的标准库模块。它提供了丰富的功能来处理文件和目录、执行系统命令、获取和设置环境变量等。 工作目录操作 获取当前工作目录 os.getcwd()参数:无返回值:一个字符串,表示当前工作目录的路径。这…

数据库表中创建字段查询出来却为NULL?

起因: 今天新创建了一张表,其中一个字段命名为"word_num"带下划线,我在前端页面怎么也查询不出来word_num的值,后来在后端接口处打印了一下数据库查询出来的数据,发现这个字段一直为NULL,然后我就想到是不是…

什么,一不小心打造了一个基于大模型的操作系统

如果以大模型为Kernel, 形成一个新的操作系统,那么: 1. byzer-llm 是这个大模型操作系统的编程接口,有点类似Linux操作系统的C ABI。 2. byzer-retrieval 也被集成进 byzer- llm 接口里,算是大模型操作系统的文件系统&#xff0c…

Node.js 和 Vue 的区别的基本知识科普

Node.js和Vue.js在多个方面存在显著的区别。以下是这两者的主要区别,按照清晰的分点表示和归纳: Node.js 服务器端环境: Node.js是一个基于Chrome V8引擎的JavaScript运行环境,它使JavaScript能够在服务器端运行。为JavaScript提供服务器端的环境服务,方便地搭建响应速度…

pytorch 自定义学习率更新 Poly

Poly 学习率调整策略需要继承_LRScheduler类,该类包含三个重要属性和两个重要方法 学习率与batch-size的关系 一般来说,batch-size的大小一般与学习率的大小成正比。batch-size越大一般意味着算法收敛方向的置信度越大,也可以选择较大的学…

STM32快速入门(ADC数模转换)

STM32快速入门(ADC数模转换) 前言 ADC数模转换存在的意义就是将一些温度传感器、各自数据传感器产生的模拟信号转换成方便识别和计算的数字信号。 导航 图24 通用定时器框图: 图片截取自STM32 F1XX中文参考手册。还是以框图为中心&#x…

scss是什么安装使⽤的步骤

当谈到SCSS时,我们首先需要了解它是什么。SCSS,也称为Sassy CSS,是Sass(Syntactically Awesome Stylesheets)的一种语法,它是CSS的预处理器,允许你使用变量、嵌套规则、混合(mixin&a…