用ComfyUI安装可图Kolors大模型做手机壁纸

一、Kolors简介

国内科技公司快手在人工智能领域取得了显著进展,特别推出了「可图 Kolors」这一开源模型,它在图像生成质量上超越了SD3,与Midjourney v6模型相媲美,并支持中文提示词识别与生成中文字符,成为国产AI绘画模型的佼佼者。
在这里插入图片描述

Kolors模型亮点:

  • 基于潜在扩散技术:Kolors在数十亿文本-图像对上训练,擅长生成高质量人像图片。
  • 中文提示词理解:Kolors能准确理解中文提示词,包括复杂对象、颜色和位置关系。
  • 中文字符生成:支持生成多种字体的中文字符,包括黑体、手写、书法等,准确度高。
  • 本土化元素呈现:Kolors对中国元素如长城、故宫等有出色表现,满足本土化需求。
  • 性能评估:在FlagEval模型排行榜中位列第二,仅次于DALL·E 3。

使用Kolors模型:

用户可在Huggingface平台免费体验Kolors的图像生成效果,几秒内即可得到结果。

二、ComfyUI集成Kolors模型:

ComfyUI社区迅速响应,提供了ComfyUI-KwaiKolorsWrapper插件,使Kolors模型在本地得以应用。但需注意,Kolors目前限于学术研究使用,商用需注册。

安装步骤简述:

  1. 通过ComfyUI Manager安装KwaiKolorsWrapper插件。
    一般直接git clone 可能下载比较慢,如果使用代理安装可能会出现下面的错误 。

    在这里插入图片描述

    1. 命令行代理配置:如果您的网络需要通过代理访问互联网,您可以在命令行中设置代理。例如:

      export HTTPS_PROXY=http://proxyserver:port
      export HTTP_PROXY=http://proxyserver:port
      git clone https://github.com/kijai/ComfyUI-KwaiKolorsWrapper.git
      

      替换proxyserver和port为您的代理服务器地址和端口。

    2. 使用SSH方式克隆:如果 HTTPS 方式有问题,您可以尝试使用 SSH 方式来克隆仓库:

      git clone git@github.com:kijai/ComfyUI-KwaiKolorsWrapper.git
      

      这需要您在本地配置 SSH 密钥,并将其添加到 GitHub 账户中。

      我这里就直接使用第2种安装了。

  2. 在 ComfyUI文件夹中地址栏输入cmd打开终端,安装依赖项:

    运行 pip install -r requirements.txt

    或者portable安装

    python_embeded\python.exe -m pip install -r ComfyUI\custom_nodes\ComfyUI-KwaiKolorsWrapper\requirements.txt
    

在这里插入图片描述

安装完成运行run_nvidia_gpu.bat即可

  1. 在ComfyUI-KwaiKolorsWrapper\examples文件夹中,导入 kolors_example 工作流到 ComfyUI 中,这个工作流中的节点都是 Kolors 专属的。

  2. 工作流打开后,如果点击生成,后台会自动下载所需的各种模型文件,但是容易出错,推荐从我的网盘下载modes下载diffusers\Kolors和vae模型文件,分别放到根目录的 ComfyUI\models 文件夹中即可。

  3. 根据显存容量选择合适的模型精度:fp16(13G以上)、8bit(8G以上)或4bit(4G以上)。

模型节点功能:

  • **(Down)load Kolors Model 😗*加载Kolors模型,选择对应精度加载Kwai-Kolors/Kolors大模型。默认fp16精度
  • (Down)load ChatGLM3 Model::加载 ChatGLM3 文本编码器。不同的模型需要选择不同的精度,对应关系为:fp16-fp16;quan8-8bit;quna4-4bit。
  • **Kolors Text Encode:**提示词输入框,如果在提示词后加上丨小符号,可以隔离提示词,同时生成多张图像;
  • **Kolors Sampler:**推荐使用 1024 分辨率,其余保持默认即可;
  • Load VAE::可以使用 sdxl vae。。

快手的Kolors模型不仅在技术上取得了突破,更在本土化和用户体验上展现了其独特价值。随着官方对Kolors的持续优化和新应用的开发,包括 ControlNet、IP-Adapter 和 LCM 等,我们有理由期待它在AI绘画领域的更多创新与应用。

  • Kolors模型

  • ComfyUI Kolors插件

  • ChatGLM3模型库 git克隆下载更快

    git clone https://www.modelscope.cn/AI-ModelScope/ChatGLM3-safetensors.git
    

国内网络从以上魔搭社区下载,速度更快。

也可以从我的百度网盘整合包地址下载:下载链接

三、实际使用

方案

用户要用可图大模型生成手机壁纸,最直接的有两种方案。

1、直接固定尺寸576 * 1024

2、生成1024 * 1024,然后裁剪成576 * 1024

下面是用第二种方案生成手机壁纸的绘图效果:

在这里插入图片描述

可以看出用可图来替代MJ基本是可行的,成本更低。

生成手机壁纸中的问题

1、中文理解在两种尺寸下会有差异
在用kolors做手机壁纸时,客户说效果不好,有些会变形,缺少重要元素。我测试了一下,确实用9:16生成的效果跟1:1的默认生成图片是有区别的,我用中文生成座山雕,1:1生成的是鸟,而9:16默认生的座山雕这个人。我又测试了几个,没有1:1效果好,然后我把1:1的图片加一个缩放从中间裁剪的成9:16,这样可能会更好一些吧。所以上图是生成1:1的图后,从中间裁剪成9:16,虽然有时候会把关键的元素裁掉,但是这个效果相对来说是比较好的。
在这里插入图片描述
2、生成图片效果会有差异
再画两条金鱼看一下。9:16下,鱼不在水里了,抽卡其他图片,也会有所差异,大家可以试一下。
在这里插入图片描述
也用过其他方案处理测试,比如放大后插补等,效果都不太好。暂时先用两台服务器分别使用两种方案绘图,过段时间看看大部分客户绘图的要求是什么样的,再来固定方案。不知道大家有什么更好的方案?

总之,可图大模型是具有高生成质量、支持中文提示词和字符的先进AI绘画模型,长远来看国产AI大模型一定会超越国外,更适合国人使用。希望国产越来越强!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/874090.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Windows图形界面(GUI)-DLG-C/C++ - 日期时间控件(DateTimePicker)

公开视频 -> 链接点击跳转公开课程博客首页 -> e​​​​​​链接点击跳转博客主页 目录 日期时间控件(DateTimePicker) 使用场景 消息处理 示例代码 日期时间控件(DateTimePicker) 使用场景 表单中需要用户输入日期或时间的地方,如旅行预订、预约系统等…

实习手计(3):前端菜鸟碎碎念

也是顺利熬过三周,感觉时间还蛮快的,但是感觉人变懒散了啊啊啊~本周的周报都没写,每天的学习计划也没完成。本来就菜,再这么懒和拖延怎么办!!!这周总的来说活不太多呢(挺好的&#x…

XMl基本操作

引言 使⽤Mybatis的注解⽅式,主要是来完成⼀些简单的增删改查功能. 如果需要实现复杂的SQL功能,建议使⽤XML来配置映射语句,也就是将SQL语句写在XML配置⽂件中. 之前,我们学习了,用注解的方式来实现MyBatis 接下来我们…

四、 简单工厂模式

文章目录 1 基本介绍2 案例2.1 Drink 抽象类2.2 Tea 类2.3 Coffee 类2.4 DrinkFactory 类2.5 Client 类2.6 Client 类运行结果2.7 总结 3 各角色之间的关系3.1 角色3.1.1 Product ( 抽象产品 )3.1.2 ConcreteProduct ( 具体产品 )3.1.3 Factory ( 工厂 )3.1.4 Client ( 客户端 …

Python实现精准判断并区分PDF文件是“图片内容”还是“文字内容”(8)

前言 本文是该专栏的第8篇,后面会持续分享Python办公自动化干货知识,记得关注。 对于pdf文件来说,pdf文件内容有的时候是“文字”,有的时候却是“图片”。pdf文件内容为图片的时候,不能进行复制粘贴;相反,当pdf文件内容为文字的时候,却可以进行复制粘贴。 如果说,有…

[译] Rust项目的基础设施

本篇是对 RustConf 2023中的Infrastructure for Rust这一视频的翻译与整理, 过程中为符合中文惯用表达有适当删改, 版权归原作者所有. 我今天要和大家讨论支持Rust及Rust项目的基础设施。Rust是一门令人惊叹的语言,我非常喜欢它,看到它的普及度和社区的成长令人非常满意。但从项…

es的内部数据存储逻辑,读取逻辑

Elasticsearch的内部数据存储逻辑和读取逻辑是非常复杂的,但是可以概括为以下几点: 索引(Index): 一个索引就是一个文档的容器,它包含了很多文档。 分片(Sharding): 为了处理大量数据&#xf…

CSA笔记4-包/源管理命令以及本地光盘仓库搭建

包/源管理命令 1.rpm是最基础的rmp包的安装命令,需要提前下载相关安装包和依赖包 2.yum/dnf是基于rpm包的自动安装命令,可以自动在仓库中匹配安装软件和依赖包 注意:以上是安装命令,以下是安装源 3.光盘源:是指安装系统时后的…

JAVA零基础学习2(算术逻辑三元运算符、原码反码补码、标准的类如何描写)

JAVA零基础学习2(算术逻辑三元运算符、原码反码补码、标准的类如何描写) 算术运算符算术运算符自增和自减运算符算术运算符的优先级示例代码 逻辑运算符三元运算符示例代码示例1:简单的条件判断示例2:嵌套的三元运算符 原码反码补…

【Elasticsearch7.11】集合字段 数量大小查询

需求: 有个字符串集合字段,需要查询出 集合大小 大于等于2 的数据 1、字段mapping "belong_account": {"type": "text","analyzer": "ik_max_word","search_analyzer": "ik_smart&qu…

ClusterIP、NodePort、LoadBalancer 和 ExternalName

Service 定义 在 Kubernetes 中,由于Pod 是有生命周期的,如果 Pod 重启它的 IP 可能会发生变化以及升级的时候会重建 Pod,我们需要 Service 服务去动态的关联这些 Pod 的 IP 和端口,从而使我们前端用户访问不受后端变更的干扰。 …

MySQL运维实战之ProxySQL(9.10)proxysql监控

作者:俊达 stats数据库 从stats数据库中可以查到proxysql一些内部组件的状态,如内存使用情况、连接池信息、会话信息、SQL执行状态等。 mysql> show tables from stats; --------------------------------------- | tables …

昇思25天学习打卡营第11天 | ResNet50迁移学习

利用ResNet50进行迁移学习的探索与实践 在人工智能的各个领域中,迁移学习已成为一个极其有效的策略,特别是在图像识别任务中。通过使用预训练模型,我们可以利用在大型数据集(如ImageNet)上学到的丰富特征,…

Windows图形界面(GUI)-DLG-C/C++ - 状态栏(StatusBar)

公开视频 -> 链接点击跳转公开课程博客首页 -> e​​​​​​链接点击跳转博客主页 状态栏(StatusBar) #define IDC_STATUSBAR 1111 case WM_INITDIALOG:{// 初始环境INITCOMMONCONTROLSEX initComm { 0 };initComm.dwSize sizeof(INITCOMMONCONTROLSEX);initComm.…

Vue 使用 Element UI 组件库

https://andi.cn/page/621589.html

C嘎嘎类与对象拓展

本篇文章是对浅谈C嘎嘎类与对象的拓展 初始化列表(初始化) 格式:类名(类型 形参1, 类型 形参2) :(冒号) 变量【类中声明的变量】(形参1) , 变量【类中…

基于天地图使用Leaflet.js进行WebGIS开发实战

目录 前言 一、天地图的key 1、创建应用 2、调用限制策略 注: (1)日服务调用超量会暂时拒绝访问,次日自动开启; (2)如果服务调用过程中存在数据爬取或者下载行为,服务调用会被自…

网络编程:UDP数据报套接字编程与TCP流套接字编程

目录 一、网络协议的基本概念 二、UDP数据报套接字编程 1.套接字的创建 2.绑定套接字 3.接收与发送数据 三、TCP流套接字编程 1.套接字的创建与绑定 接受连接 数据的接收与发送 关闭连接 四、UDP与TCP的适用场景 网络编程是现代计算机科学和工程领域中一个极为重要的…

ChatGPT对话:有关花卉数据集

【编者按】编者准备研究基于深度学习的花卉识别,首先需要花卉数据集。 后续,编者不断会记录研究花卉识别过程中的技术知识,敬请围观 1问:推荐一下用于深度学习的花卉数据集 ChatGPT 以下是一些用于深度学习的优秀花卉数据集&am…

【中项】系统集成项目管理工程师-第3章 信息技术服务-3.6服务发展

前言:系统集成项目管理工程师专业,现分享一些教材知识点。觉得文章还不错的喜欢点赞收藏的同时帮忙点点关注。 软考同样是国家人社部和工信部组织的国家级考试,全称为“全国计算机与软件专业技术资格(水平)考试”&…