内含教程丨最高可降低 16 倍成本,ComfyUI Stable Cascade 教程已上线,一键部署!

2024 年 2 月,OpenAI 又一次站在了镁光灯下,Sora 横空出世并引发热烈讨论,「文生视频」的热潮被那段 60 秒的展示视频再度推高,也使得很多人忽视了其图片生成能力。

更加值得一提的是,其实就在 Sora 发布前不久,Stability AI 就已经开源了 AI 绘图工具 Stable Cascade,这个同样强大的工具也在一定程度上被 Sora 「抢走」了热度。

图片

图源:AIGC芝士计划 

据 Stability AI 官方介绍,相比于 Stable Diffusion 1.5,Stable Cascade 可以降低 16 倍成本。在不同模型的性能评估对比中,该模型在即时对齐和美学质量方面的表现优于或相当于其他模型。

作为新一代文生图模型,Stable Cascade 基于 Würstchen 架构而建立,分别由三个阶段组成。

图片

Stable Cascade 模型 

Stage A 是 VAE 模型,Stage B 和 Stage C 是扩散模型。输入提示词后,Stage C 模型会根据文本生成 24*24 的低分辨率潜像,输入到 Stage B 模型中放大,然后输入到 Stage A 模型中再度放大,并转换为像素空间,最后生成图像。

这种分阶段的架构模式使得 Stable Cascade 在生成图像时更加灵活且高效。 一方面,每个阶段使用不同大小的模型,可以让用户根据自己的硬件条件选择合适的模型,降低了硬件要求。另一方面,不同阶段模型能够单独训练或微调,进而让模型更好地适应不同任务和需求。

除了文生图外,Stable Cascade 还能进行图像变化和图像到图像的生成,功能非常强大。目前,ComfyUI** 官方已经支持使用 Stable Cascade,通过搭建工作流,片刻即可生成图片。然而,用户在运行 ComfyUI Stable Cascade 时,往往需要耗费大量的时间进行节点的拖拽和连接,出现连接错误时,非技术人员也很难快速修改调整。

近日,B 站热门 up 主独立研究员-星空发布了「ComfyUI Stable Cascade 工作流在线教程」,教程已上线至超神经官网。该教程帮助大家搭建好环境,还内置了 Stable Cascade 默认文生图工作流,直接帮大家连好节点,简化使用流程,2 秒即可出图。

超神经公共教程地址:

https://hyper.ai/tutorials/30620

B 站 up 主独立研究员-星空的教学视频如下:

ComfyUI 云端整合包 内置Stable Cascade工作流 一键克隆 免去部署 赠送4小时RTX4090时长_哔哩哔哩_bilibili

根据教程,小编已经成功生成了各种风格的好看图片,快来尝试吧!

图片

Demo 运行

  1. 登录 https://hyper.ai/,在「教程」页面,选择「ComfyUI Stable Cascade 工作流在线教程」。

图片

  1. 点击「在线运行此教程」,页面跳转后,点击「克隆」。

图片

图片

  1. 点击右下角「下一步:选择算力」。

图片

  1. 跳转后,选择「NVIDIA GeForce RTX 4090」,点击「下一步:审核」。新用户使用下方邀请链接注册,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费算力时长!

HyperAI超神经专属邀请链接(直接复制到浏览器打开即可注册):

https://openbayes.com/console/signup?r=Ada0322_QZy7

图片

  1. 点击「继续执行」,等待分配资源,首次克隆需等待 2 分钟左右的时间。当状态变为「运行中」后,点击「打开工作空间」。

若超过 5 分钟仍处于「正在分配资源」状态,可尝试停止并重启容器;若重启仍无法解决,请在官网联系平台客服。

图片

图片

  1. 打开工作空间后,在启动页新建一个终端会话,然后在命令行里输入 「./run.sh」。

图片

图片

  1. 稍等片刻,当命令行出现「To see the GUI go to : http://0.0.0.0:8080」后,拷贝右侧 API 地址到浏览器地址栏中,即可访问 ComfyUI 界面。请注意,用户需在实名认证后才能使用 API 地址访问功能。

图片

图片

效果展示

  1. 打开 ComfyUI 界面后,点击「Switch Locale」切换成中文模式,再点击「加载默认」直接加载文生图工作流。

图片

图片

  1. 在 CLIP 文本编码器中输入英文提示词,点击「添加提示词队列」,只需 2s,即可快速生成图片。

图片

图片

  1. 如果想加载图生图、图像变体、多图混合和控制网络的工作流,可以到 ComfyUI Stable Cascade 官方页面下载更多工作流。

其他 Stable Cascade 工作流链接:

https://comfyanonymous.github.io/ComfyUI_examples/stable_cascade/

点击上述链接后,选择页面中的相应图片右键保存,再回到 OpenBayes** 平台的 ComfyUI 界面,将保存的图片拖入其中,即可加载其他工作流啦。

图片

图片

目前,HyperAI超神经官网已上线了数百个精选的机器学习相关教程,并整理成 Jupyter Notebook 的形式。

点击链接即可搜索相关教程及数据集:

https://hyper.ai/tutorials

以上就是小编本次分享的全部内容了,希望这次的内容对您有所帮助。如果大家还想学习其他好玩的教程,欢迎留言或私信告诉我们项目地址,小编将会为你量身打造课程,教你如何玩转 AI。 (ps: 上次小伙伴留言要求的 SUPIR-AI 照片修复项目,已经在安排中啦。)

参考资料:

1.https://zhuanlan.zhihu.com/p/683276860

2.https://m.ithome.com/html/750418.htm

3.https://stability.ai/news/introducing-stable-cascade

4.https://www.aigc.cc/archives/sdsd.html

5.https://zhuanlan.zhihu.com/p/682460863

6.https://www.aihub.cn/tools/image/stablecascade/

7.https://zhuanlan.zhihu.com/p/683832139

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/802412.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3 +Taro 页面实现scroll-view 分页功能

需求 现在分页列表 后端只给你一个分页的数据列表 没有总页数 没有当前的分页 页数 只有这么一个list 、、、 如何去分页 我这使用的是scroll-view 组件 滑动到底部的事件 根据你当前设定的每页的数据数量和后端返回给你的数据列表数量 当某一次分页 两个数量不相等了以后 就…

SpringBoot第一个hello world项目

文章目录 前言一、Spring Boot是什么?二、使用步骤1. 创建项目2.书写测试 总结 前言 提示:这里可以添加本文要记录的大概内容: 例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了…

javaWeb车辆管理系统设计与实现

摘 要 随着经济的日益增长,车辆作为最重要的交通工具,在企事业单位中得以普及,单位的车辆数目已经远远不止简单的几辆,与此同时就产生了车辆资源的合理分配使用问题。 企业车辆管理系统运用现代化的计算机管理手段,不但可以对车辆的使用进行合理的管理,…

多模态检索增强生成的简单介绍

多模态检索增强生成的简单介绍 文章目录 多模态检索增强生成的简单介绍为什么多模态很难?每种模式都有其自身的挑战您如何跨模式管理信息? 多模态检索方法将所有模态嵌入到同一向量空间中将所有模式归结为一种主要模式对于不同的方式有单独的备用 多模式…

Redis的高可用和持久化

目录 一、Redis高可用 二、Redis持久化 2.1 持久化的功能 2.2 Redis提供两种方式进行持久化 三、RDB持久化 3.1 触发条件 3.1.1 手动触发 3.1.2 自动触发 3.1.3 其他自动触发机制 四、AOF持久化 4.1 开启AOF 4.2 执行流程 4.2.1 命令追加 (append) 4.2.2 文件写入…

生产车间图纸无纸化,生产车间图纸无纸化解决方案

生产车间图纸无纸化是指通过采用数字化设备和技术,将传统的纸质图纸转化为电子文档,并在生产过程中实现图纸的电子化、网络化和自动化管理。这一转变旨在提高工作效率、降低成本、提高安全性,并推动生产车间的现代化和智能化。 实现生产车间图…

SpringBoot 定时任务实践、定时任务按指定时间执行

Q1. springboot怎样创建定时任务? 很显然,人人都知道,Scheduled(cron ".....") Q2. 如上所示创建了定时任务却未能执行是为什么? 如果你的cron确定没写错的话 cron表达式是否合法,可参考此处&#xff0c…

Android集成微信支付

官方api:Android接入指南 | 微信开放文档 打开微信开放平台登录账户后点击创建应用 根据提示填写完相应的内容提交审核通过后,需要开通支付权限。 1.接着在你的项目工程build.gradle文件中添加微信支付依赖库 ​api com.tencent.mm.opensdk:wechat-sdk…

python代码使用过程中使用快捷键注释时报错

1.代码 2.代码报错 3.代码注释后的结果 4. 原因

sql注入方式之联合注入

1.1 靶场环境 系统centos7 IP地址192.168.1.24 1.2 联合注入原理 联合查询注入是联合两个表进行注入攻击,使用关键词 union select 对两个表进行联合查询。两个表的字段要数要相同,不然会出现报错。 1.3 找注入点 找注入点,当输入id1 an…

C语言——文件管理

文件:即磁盘上的文件,使用文件可以将数据直接存放在电脑的硬盘上,做到数据持久化。 在程序设计中,按文件的功能划分,将文件分为程序文件与数据文件 程序文件 程序文件包括源文件(.c)&#xff0…

Centos7搭建 Skywalking 单机版

介绍 Skywalking是应用性能监控平台,可用于分布式系统,支持微服务、云原生、Docker、Kubernetes 等多种架构场景。 整体架构如图 Agent :在应用中,收集 Trace、Log、Metrics 等监控数据,使用 RPC、RESTful API、Kafk…

【算法详解】二分查找

1. 二分查找算法介绍 「二分查找算法(Binary Search Algorithm)」:也叫做 「折半查找算法」、「对数查找算法」。是一种在有序数组中查找某一特定元素的搜索算法。 基本算法思想:先确定待查找元素所在的区间范围,在逐步…

骨传导耳机哪个品牌质量比较好?精选六大必看的耳机选购指南

骨传导耳机,是作为近年来深受消费者喜欢的蓝牙耳机产品,目前已经成为了热度最高的骨蓝牙耳机。然而,随着骨传导耳机的热度增高,市场上开始出现一些质量参差不齐、音质不佳的劣质产品,如果使用这些劣质产品的话&#xf…

C语言从入门到实战————文件操作

目录 前言 1. 为什么使用文件? 2. 什么是文件? 2.1 程序文件 2.2 数据文件 2.3 文件名 3. ⼆进制文件和文本文件? 4. 文件的打开和关闭 4.1 流和标准流 4.1.1 流 4.1.2 标准流 4.2 文件指针 4.3 文件的打开和关闭 5. 文…

基于java+springboot+vue实现的旅游管理系统(文末源码+Lw)23-234

摘 要 如今社会上各行各业,都喜欢用自己行业的专属软件工作,互联网发展到这个时候,人们已经发现离不开了互联网。新技术的产生,往往能解决一些老技术的弊端问题。因为传统旅游管理系统信息管理难度大,容错率低&#…

使用yolov8实现自动车牌识别(教程+代码)

该项目利用了一个被标记为“YOLOv8”的目标检测模型,专门针对车牌识别任务进行训练和优化。整个系统通常分为以下几个核心步骤: 数据准备: 收集包含车牌的大量图片,并精确地标记车牌的位置和文本信息。数据集可能包含各种环境下的…

短剧小程序开发:解锁碎片时间的观影新风尚

随着移动互联网的飞速发展,人们对内容的消费方式也在不断升级。短剧作为一种新型的内容形态,正逐渐受到广大用户的青睐。为了满足用户随时随地观看短剧的需求,我们推出了全新的短剧小程序开发服务,为您解锁碎片时间的观影新风尚。…

C/C++中局部变量static用法实例

1. 普通局部变量存储于进程栈空间,使用完毕会立即释放,静态局部变量使用static修饰符定义,即使在声明时未赋初值,编译器也会把它初始化为0,并且静态局部变量存储于进程的全局数据区,即使函数返回&#xff0…

解密项目管理专业术语:十大名词背后的实战技巧

项目管理是一门综合学科,涵盖了一系列方法、技能和工具。今天为大家带来项目管理的十大专业术语,它们分别是项目范围、利益相关者管理、工作分解结构(WBS)、里程碑、风险管理、资源分配、关键路径法(CPM)、…