扩散模型已成为高分辨率图像合成的主流方法,传统的扩散模型虽然在图像合成方面取得了显著进展,但在扩展到更高分辨率时往往面临对象重复和计算成本增加的问题。
旷世科技开源的高分辨率框架 HiDiffusion,由分辨率感知 U-Net (RAU-Net) 和改进的移位窗口多头自注意力 (MSW-MSA) 两大核心组件构成,不仅可以将图像生成的分辨率由常见的的 1024x1024 提高至 4096×4096,而且能将图像生成速度提升 1.5 至 6 倍, 很好的解决了对象重复和高计算负担的问题。
「HiDiffusion 可快速生成高质量 8k 图像 Demo」现已上线至 OpenBayes 平台公共教程板块,不仅支持文生图、图生图,还具备图像修复功能,无需输入任何命令,一键克隆即可启动。
公共教程地址:
https://go.openbayes.com/Sc2u6
操作步骤
01 Demo 运行阶段
1. 登录 OpenBayes.com,在「公共教程」页面,选择「HiDiffusion 可快速生成高质量 8k 图像 Demo」。
2. 页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
3. 点击右下角「下一步:选择算力」。
4. 页面跳转后,选择「NVIDIA GeForce RTX 4090」,点击「下一步:审核」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!
小贝总专属邀请链接(直接复制到浏览器打开):
https://go.openbayes.com/9S6Dr
5. 点击「继续执行」,等待分配资源,首次克隆需等待 2 分钟左右的时间。当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至「HiDiffusion 可快速生成高质量 8k 图像 Demo」的页面。请注意,用户需在实名认证后才能使用 API 地址访问功能。
若超过 10 分钟仍处于「正在分配资源」状态,可尝试停止并重启容器;若重启仍无法解决,请在官网联系平台客服。
02 效果演示阶段
打开 Demo 后,可以看到左上方菜单栏分别为「文本生成图像」,「图像生成图像」以及「修复图像」。
1. 文本生成图像
点击「文本生成图像」,在文本框输入正向提示词 (A dog was playing on the grass. The sun was shining brightly) 与反向提示词 (blurry, ugly, duplicate, poorly drawn face, deformed, mosaic, artifacts, bad limbs) 后,点击 Submit,稍等片刻即可输出图片。
2. 图像生成图像
切换至「图像生成图像」界面。上传一张参考图像,输入正向提示词 (The Joker, high face detail, high detail, muted color, 8k) 与反向提示词 (blurry, ugly, duplicate, poorly drawn, deformed, mosaic) ,可以看到它根据我们的提示词,将男人的照片修改为了 Joker。
3. 修复图像
切换至「修复图像」界面,上传一张需要修复的图像以及一张标明修复区域的图像。输入正向提示词 (A post-apocalyptic survivor in tattered clothing, with a makeshift spear, cautiously navigating through a dense forest overgrown with vines that have reclaimed a crumbling cityscape.) 和反向提示词 (blurry, ugly, duplicate, poorly drawn, deformed, mosaic),可以看到它将我们标记的区域按照提示词进行了修改。
新用户福利
* 注册福利:点击下方邀请链接注册,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费算力时长,永久有效!
小贝总专属邀请链接(直接复制到浏览器打开):
https://go.openbayes.com/9S6Dr