ChatGPT 之后,再玩玩 Stable-Diffusion

29ba3e5e955d247b66d16ea87fcff275.png

前些天体验的 ChatGPT 主要用来进行文本方面的处理,那么图片生成有没有这样的 AI 工具 呢?答案是肯定的。

例如:和菜头公众号的题图和文章中的插图大多都是使用 Stable-Diffusion 的 AI 图形生成工具创作的。顺着 Stable-Diffusion 搜索了下相关资料,发现 AI 创作图片的工具也有不少:

  • Disco Diffusion:是发布于 Google Colab 平台的一款利用人工智能深度学习进行数字艺术创作的工具,它是基于 MIT 许可协议的开源工具,可以在 Google Drive 直接运行,也可以部署到本地运行;

  • Midjourney:是 Disco Diffusion 的原作者 Somnai 的作品,对 Disco Diffusion 进行了改进,平均 1 分钟能出图;

  • DALL-E 2:OpenAI 推出 DALL·E 2, DALL-E 2 实现了更高分辨率和更低延迟;

  • Stable-Diffusion:由 http://stability.ai/ 推出,在 2022 年 8 月 10 号开源了,10 几秒就能出图,算是比较快的了。

本文就以 Stable-Diffusion 为例,谈谈我的使用体验。Stable-Diffusion 作为一个开源工具,使用的方式有多种:

1、基于开源的工具提供了实现,比如官方提供的 https://beta.dreamstudio.ai/dream;,也可以使用 https://huggingface.co/spaces/camenduru/webui

2、本地部署;

3、调用 API 。

官网注册账号

打开 https://beta.dreamstudio.ai/ ,直接选择使用 Google 账号进行注册,你也可以选择自己的方式。

714c3fa17062fc8c8d6eb12798b58b0a.png

相比较 ChatGPT ,dreamstudio 的注册要方便很多,注册成功后登录界面如下:

c0d103181565df0b5f4ae52c955f77c9.png

dreamstudio 是收费的,成功注册后会赠送 100 个 credits ,每次生成图片,会消耗一些 credits,消耗的多少跟设置有关,默认设置会产生 4 张 512 * 512 的图,消耗 0.8 个 credits 。

配置信息如下:

  • Widht:图片宽度;

  • Height:图片高度;

  • Cfg Scale:一个阈值,越高生成的图片越接近你的描述,越低,AI 发挥空间越大,保持默认就好;

  • Steps:生成图片用的步骤数,越大生成越慢;

  • Number of Images:一次生成的图片数量,默认为 4,也可以改为 1,改成 1 后,生成一次只要 0.2 credits。

在上图中最下面的文本框中输入提示文本,点击 Dream 按钮便可生成。

huggingface

直接在浏览器输入:https://huggingface.co/spaces/camenduru/webui 便可使用,可以不用注册登录,缺点就是需要排队,相当于就是多人在同时使用这个服务,如果排队的人较多,生成的时间会比较长。

91426b7d9c1c77319cbae13f07dfa4b6.png

本地化部署

本地化部署对机器的配置要求比较高,内存和显存都不能太低。

在 GitHub 上有一个仓库 https://github.com/AUTOMATIC1111/stable-diffusion-webui 介绍了 stable-diffusion 怎样离线部署使用,提供了 Windows、Liunx、Mac 等多种方式。

如果你使用的是 Mac ,可以参考:https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Installation-on-Apple-Silicon

如果你使用的是 Windows ,觉得安装步骤比较繁琐,还有人做了一键安装和启动的项目放在 Github 上,地址如下:

https://github.com/EmpireMediaScience/A1111-Web-UI-Installer

提示语

AI 生成图片的关键在于提示语,就像使用 ChatGPT ,一个好的问题是关键。提示语不会写的话可以先参考,在下面网站中可以搜索相关的图片,查看提示语:

https://lexica.art/

https://www.krea.ai/

https://laion-aesthetic.datasette.io/laion-aesthetic-6pls/images

先多看看那些精美有创意的图片都是什么样的提示词生成的,看多了,再尝试自己去修改、调整。


相关阅读

尝鲜 ChatGPT

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/279932.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

渗透测试入门DVWA 教程1:环境搭建

首先欢迎新萌入坑。哈哈。你可能抱着好奇心或者疑问。DVWA 是个啥? DVWA是一款渗透测试的演练系统,在圈子里是很出名的。如果你需要入门,并且找不到合适的靶机,那我就推荐你用DVWA。 我们通常将演练系统称为靶机,下面请…

指派问题(匈牙利算法)

问题描述: 在生活中经常遇到这样的问题,某单位需完成n项任务,恰好有n个人可承担这些任务。由于每人的专长不同,各人完成任务不同(或所费时间),效率也不同。于是产生应指派哪个人去完成哪项任务,使完成n项任…

移动硬盘改台式机硬盘_如何在台式机或移动设备上离线使用Google云端硬盘

移动硬盘改台式机硬盘If there’s any drawback to using cloud-based services for all your productivity and organization needs, it’s that if you can’t get an Internet connection, you’re basically out of luck. 如果使用基于云的服务来满足您的所有生产力和组织需…

你可能不知道的容器镜像安全实践

大家好,我是Edison。最近在公司搭建CI流水线,涉及到容器镜像安全的话题,形成了一个笔记,分享与你,也希望我们都能够提高对安全的重视。时代背景近年来应用程序逐步广泛运行在容器内,容器的采用率也是逐年上…

从零基础到拿到网易Java实习offer,谈谈我的学习经验

微信公众号【程序员江湖】作者黄小斜,斜杠青年,某985硕士,阿里研发工程师,于2018 年秋招拿到 BAT 头条、网易、滴滴等 8 个大厂 offer个人擅长领域 :自学编程、技术校园招聘、软件工程考研(关注公众号后回复…

【Win 10 应用开发】UI Composition 札记(二):基本构件

在上一篇中,老周用一个示例,演示了框架视图的创建过程,在本篇中,老周将给大伙伴们说一下 Composition 构建 UI 的一些“零件”。 UI Composition 有一个核心类——对,就是 Compositor 类,它是总生产车间&am…

禁用内置键盘_如何禁用Windows 10的所有内置广告

禁用内置键盘Windows 10 has a lot of built-in advertising. This isn’t just about the free upgrade offer: Even if you purchase a new PC that comes with a Windows 10 license or spend $200 for a copy of Windows 10 Professional, you’ll see ads in your operati…

zbb20180710 maven Failed to read artifact descriptor--maven

Failed to read artifact descriptor--maven2016年09月10日 13:30:46阅读数:13036在开发的过程中,作为新手,经常遇到Maven下载依赖的时候,"Failed to read artifact descriptor for xxx:jar"的错误对于这种非业务相关的问题,耽误时间非常不效率,看到网站很…

震惊!顶着 39.5℃高烧 ,我和这哥俩都聊了些啥?

这是头哥侃码的第271篇原创上周三,我邀请了两位嘉宾进入直播间,即便自己顶着 39.5 度的高烧,还是强打精神与这哥俩聊了俩小时。相信关注我的朋友们都知道,我是头哥侃码的主理人,同时也是上海TGO上海分会董事会成员。赵…

CAS原理分析及ABA问题详解

什么是CAS CAS即Compare And Swap的缩写,翻译成中文就是比较并交换,其作用是让CPU比较内存中某个值是否和预期的值相同,如果相同则将这个值更新为新值,不相同则不做更新,也就是CAS是原子性的操作(读和写两者同时具有原…

在Windows Mobile模拟器(Emulator)建立网络连接

因为想使用Windows Mobile Emulator进行网络通信程序的测试,所以找方法配置Emulator的网络连接。在网上找了一些文章,很多都说需要安装Virtual PC 2007. 例如下面的文章Enable Network Connection Windows Mobile 6 Emulator 如果需要 Virtual PC 2007 可…

api游戏编程鼠标选择拖动_如何选择合适的游戏鼠标

api游戏编程鼠标选择拖动You don’t need a gaming mouse to play PC games—just about any mouse with two buttons and a wheel will play anything you want it to. But that’s no reason to deny yourself the wonderful variety of gaming mouse designs on the market.…

iOS - 上架的APP 生成二维码下载

1.首先打开苹果App Store商店进入到里面,找到需要打开链接地址的应用程序,例如:百度。2. 在App Store商店里面先点击一下应用程序图标,再按一下…分享按钮。 3. 接着选择分享APP,再点击拷贝链接地址,将应用…

Rsa2加密报错java.security.spec.InvalidKeySpecException的解决办法

最近在和支付宝支付做个对接,Java项目中用到了RSA2进行加解密,在加密过程中遇到了错误: java.security.spec.InvalidKeySpecException: java.security.InvalidKeyException: IOException : algid parse error, not a sequence 代码执行到这句…

浅析领域驱动设计

1.概要DDD(Domain-driven design,模型驱动设计)是一种软件设计的指导思想,而非固定的一套公式化开发模板(这样就会导致网络上出现各种基于自己或业务上的理解而产出的DDD落地的实现,会让很想学习的开发者迷…

Delphi实现的透明阴影以及蒙版效果菜单

QQ2010的皮肤控件目前实现了一部分,看到有些软件的菜单,都有阴影,透明等效果,于是开始重新实现菜单控件,QQ2009版的菜单控件,是自己从TComponent继承了完全模拟实现的一个菜单,虽然实现了菜单控…

cortana搜索框_如何在Windows 10任务栏上隐藏Cortana搜索框

cortana搜索框One of the most talked about features in the latest version of Windows 10 was the Cortana personal assistant that is integrated directly into the taskbar. But what if you don’t want to waste all that taskbar space? 最新版本的Windows 10中最受…

Kotlin 基础 - 数据类型

一、Boolean 类型 Boolean 值有两个值,分别为 true 或 false。多数情况下,Kotlin 中的 Boolean 相当于 Java 中的基本类型 boolean,只有在必要的情况下才会装箱成为 Java 中的装箱类型 Boolean。这一切都是交由编译器来完成,我们无…

全框眼镜拆卸镜片方法分享

全框眼镜拆卸镜片方法分享http://www.iqiyi.com/w_19ru97p1n9.html 很多直接用手掰就成(眼镜布) 转载于:https://www.cnblogs.com/OceanF/p/9288411.html

发送http请求

public static String httpGetSend(String url) {String responseMsg "";HttpClient httpClient new HttpClient();GetMethod getMethod new GetMethod(url);// GET请求try {// http超时5秒httpClient.getHttpConnectionManager().getParams().setConnectionTimeo…