使用midjourney搞出一套三国人物画像!

当下已进入如火如荼的全民AI时代,最近体验了下midjourney,使用它的以图生图功能生成出来一套三国人物画像,和大家分享下使用心得。

使用midjourney的准备工作

下载工具

使用midjourney生产图片依赖的工具和流程,大致如下:

image.png

  • [1] 下载Discord App
  • [2] 添加Midjourney Bot
  • [3] 发送交互指令
  • [4] 生成图片

image.png

midjourney.commidjourney的官网,可以跟随网站引导提示完成使用体验。较为推荐和常见的使用姿势是在discord.com下载discord app后添加midjourney bot来进行指令交互完成图片生成。

image.png

交互流程

image.png

对于图片的生成主要是通过输入给midjourney一些prompt和参数来完成的。

  • prompt 可以分为文本和图片两种类型,可以同时存在施加干预
  • 参数 常用参数如--ar指定图片比例、--vmidjourney版本等

参考midjourney参数

以图生图

指令

以图生图的指令结构非常简单,如下:

/imagine [url] [prompt] [param]

url:上传到midjourney的图片url
prompt:影响midjourney的提示
param:midjouryney支持的参数配置

出图流程

image.png

  • [1] 上传图片:在本地选择一张图片上传到midjourney,支持jpgpng等通用格式,而bmp等格式需要转换后方可上传
  • [2] 复制图片地址:复制图片地址以备发送交互指令后使用
  • [3] 发送交互指令
/imagine https://s.mj.run/wws8EMAvHdE
she is a woman,in ancient China,2 foot tall doll in pixar::2 
--ar 3:4 --v 5 --q 2 --s 750 
--no braid,barbarians,earrings,glasses,wrinkle,baldness
  • [4] 生成图片:根据出图体感做v1~v4u1~u4prompt调整直到生成最满意的图

初体验

  • 文字生图/以图生图的差别

image.png

在纯文字prompt的场景下,生成出来的图是一个几乎全未知的结果,需要进行大量的prompt调整才可能达到要求,在我进行纯文字prompt测试的case中几乎没有一张能够满足我的出图要求,这既有个人指令熟练度、覆盖度的原因,也有文字prompt相对局限性的问题,当下涌现了很多prompt网站,很多近乎成品的图和对应prompt被分享出来,但是拿着一致的prompt不一定拿到一致的图,存在很大的随机性、不稳定。

但是,以图生图的好处是可以通过一个已经存在的图像,让AI来识别,基于“模板”来进行二创,在我进行以图生图prompt的测试case中拿到满意出图效果。如果你的出发点是通过已有图片做较为稳定性的出图,比如给自己的照片做卡通形象,以图生图是很好的一种实现形式。

  • 模型数据影响

对于出图描述体感上更符合欧美人群,而且亚裔人的描述并不是很符合现实,猜测和训练数据有一定关系,如果prompt不进行细节描述,描述很难符合预期。

最佳实践

总结一句话就是:喜欢的原型图 + 喜欢的风格 = 二创满意的图!

image.png

  • 第一步: 在prompt分享网站找到自己喜欢的midjourney生成好的图片,如lexica.art/ ,大部分是支持关键字检索的,可以检索自己期望的风格、物品等描述。
  • 第二步: 查看它的prompt进行参考,过于简短的prompt没有太大参考价值,主要参考哪些风格系描述,如cartoon(卡通)、painting(绘画)等,这里我想要给我找到的原型图卡通一点的形象,我抽取了prompt为2 foot tall doll in pixar (皮克斯的 2 英尺高娃娃)作为我的出图效果设定。
  • 第三步 对图片细节进行详尽描绘,具体可以参考如下人物特征描述。如果你对于细节要求不高,对出图效果比较佛系,可以简单描述核心特征即可。比如我在二创三国人物时候,会给简单prompt提示,如:
//性别
a man,
//中国古代
in ancient China,
//皮克斯风格,这里配置了权重::2,增强midjourney的感知
2 foot tall doll in pixar::2
//我需要3:4比例的图片
--ar 3:4

如果需要更为详尽的人物特征刻画,可以参考下面这组prompt。值得一提的是,并不是事无巨细越全越好,而是要挑选重点进行描述,以图生图的好处之一是已经有一个成型的图片模板,AI会识别它的特征,而我们二创只需要基于它进行“改版”做适当微调就可以。 image.png

错误陷阱

在使用过程中也遇到很多badcase,这里分享下:

  • 颜色敏感

在一个测试case中发现,midjourney对颜色词汇非常敏感,但是也容易产生混乱,比如:

//带红色的帽子
wearing a red hat,
//穿绿色的衣服
wearing a green clothes,

有时候会只识别到一种颜色,而且会把整个画面变得过于“色彩化”。

  • 配合权重设置

权重设置可以参考上面的参数列表使用,它相当于是prompt的手动调优,让AI“重视”你的选择和倾向。比如,我在使用皮克斯这个风格的时候AI有时会”忽略“我的prompt,因此我会设置它的权重,增强这个prompt的存在感。

//设置权重,增强存在感
2 foot tall doll in pixar::2
  • 画“手”很难

AI对手的描述并不是很好,很多时候可能是“4指怪”、“6指怪”,握住东西,拉开一张弓等等,都是比较难的动作,需要反复调优prompt或者“碰运气”。

  • 女性角色更容易

从我自身测试case来看,女性角色的以图生图刻画更贴近并且更容易接受一些,出图效果更符合预期,男性角色可能由于图画中夹杂了更多的人物外物品如刀、枪、弓等,原型图刻画张力更复杂有关系,偶尔会出现匪夷所思的效果。

效果展示

下面是一些没有做太多微调的粗制版,供大家参考。

原型图皮克斯风格
关羽.jpg关羽.png
0001_张飞_3.png张飞.png
赵云.bmp赵云.png

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/804371.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3移动端H5 瀑布流显示列表

以上效果 是之前发送的改进版 waterList <template><view class"pro-cons" v-if"data.length"><view class"cons-left"><template v-for"(item, index) in data"><template v-if"(index 1) % 2 1…

NLP在搜索召回领域中的应用场景

自然语言处理&#xff08;NLP&#xff09;在搜索召回领域中的应用场景非常广泛&#xff0c;它通过理解和分析人类语言&#xff0c;提高了信息检索的准确性和效率。以下是一些具体的应用场景&#xff1a; 1. 搜索引擎优化 NLP技术可以用于优化搜索引擎的查询处理&#xff0c;通…

【DM8】外部表

外部表是指不存在于数据库中的表。 通过向达梦数据库定义描述外部表的元数据&#xff0c;可以把一个操作系统文件当成一个只读的数据库表&#xff0c;对外部表将像普通定义的表一样访问。 外部表的数据存储在操作系统文件中&#xff0c;建立外部表的时候&#xff0c;不会产生…

下载安装JDK17(windows)

官网地址 Oracle | Cloud Applications and Cloud Platform 点击Products拉倒最下面点击java 点击右下角Download Java 选择JDK17 点击Windows&#xff0c;下载第二个 下载完成点击一下步安装就好了 认真看这段话 ​ JDK 17 binaries are free to use in production and free…

代码整洁之道【2】--函数

关于函数部分的总结 一、函数只做一件事 函数应该只做一件事、做好这件事、只做这件事。 判断函数是否不止做了一件事&#xff0c;还有一个方法&#xff0c;就是看是否能再拆出一个函数&#xff0c;该函数不仅只是单纯地重新 二、函数尽量不要太长 按照作者的理论&#xff…

【算法】双指针算法

个人主页 &#xff1a; zxctscl 如有转载请先通知 题目 1. 283. 移动零1.1 分析1.2 代码 2. 1089. 复写零2.1 分析2.2 代码 3. 202. 快乐数3.1 分析3.2 代码 4. 11. 盛最多水的容器4.1 分析4.2 代码 5. LCR 179. 查找总价格为目标值的两个商品5.1 分析5.2 代码 6. 15. 三数之和…

大语言模型开源数据集

本文目标&#xff1a;汇聚目前大语言模型预训练、微调、RM/RL、评测等全流程所需的常见数据集&#xff0c;方便大家使用&#xff0c;本文持续更新。文章篇幅较长&#xff0c;建议收藏后使用。 一、按语料类型分类 1、维基百科类 No.1 Identifying Machine-Paraphrased Plagia…

企业微信认证后可以修改主体吗?

企业微信变更主体有什么作用&#xff1f;如果原有的公司注销了&#xff0c;或者要更换一家公司主体来运营企业微信&#xff0c;那么就可以进行变更主体&#xff0c;变更主体后才可以保留原来企业微信上的所有用户&#xff0c;否则就只能重新申请重新积累用户了。企业微信变更主…

【资源分享】MAC上最好用的截图软件-Snipaste

::: block-1 “时问桫椤“是一个关注本科生到研究生教育阶段的不严肃的公众号&#xff0c;希望能在大家迷茫、难受、困难之时帮助到大家。用广大研究生的经验总结&#xff0c;让大家能尽早的适应研究生生活&#xff0c;尽快的看透科研本质。祝好&#xff01;&#xff01;&#…

vue通过echarts实现数据可视化

1、安装echarts cnpm install echarts -Sechart官方图表示例大全&#xff1a;https://echarts.apache.org/examples/zh/index.html#chart-type-line 2、代码实现 <template><div><div class"box" ref"zhu"></div><div class&…

注解式 WebSocket - 构建 群聊、单聊 系统

目录 前言 注解式 WebSocket 构建聊天系统 群聊系统&#xff08;基本框架&#xff09; 群聊系统&#xff08;添加昵称&#xff09; 单聊系统 WebSocket 作用域下无法注入 Spring Bean 对象&#xff1f; 考虑离线消息 前言 很久之前&#xff0c;咱们聊过 WebSocket 编程式…

掌握网络抓取技术:利用RobotRules库的Perl下载器一览小红书的世界

引言 在信息时代的浪潮下&#xff0c;人们对于获取和分析海量网络数据的需求与日俱增。网络抓取技术作为满足这一需求的关键工具&#xff0c;正在成为越来越多开发者的首选。而Perl语言&#xff0c;以其卓越的文本处理能力和灵活的特性&#xff0c;脱颖而出&#xff0c;成为了…

Android 属性动画及自定义3D旋转动画

Android 动画框架 其中包括&#xff0c;帧动画、视图动画&#xff08;补间动画&#xff09;、属性动画。 在Android3.0之前&#xff0c;视图动画一家独大&#xff0c;之后属性动画框架被推出。属性动画框架&#xff0c;基本可以实现所有的视图动画效果。 视图动画的效率较高…

【第七篇】使用BurpSuite进行主动、被动扫描和主动、被动爬虫

文章目录 前言主动扫描被动扫描主动爬虫被动爬虫前言 Burp Scanner 既可以用作全自动扫描仪,也可以用作增强手动测试工作流程的强大手段。 扫描网站涉及两个阶段: 抓取内容和功能: Burp Scanner 首先在目标站点周围导航,密切反映真实用户的行为。它对站点的结构和内容以及…

数字社会下的智慧公厕:构筑智慧城市的重要组成部分

智慧城市已经成为现代城市发展的趋势&#xff0c;而其中的数字化转型更是推动未来社会治理体系和治理能力现代化的必然要求。在智慧城市建设中&#xff0c;智慧公厕作为一种新形态的信息化公共厕所&#xff0c;扮演着重要角色。本文智慧公厕源头实力厂家广州中期科技有限公司&a…

【攻防世界】web2(逆向解密)

进入题目环境&#xff0c;查看页面信息&#xff1a; <?php $miwen"a1zLbgQsCESEIqRLwuQAyMwLyq2L5VwBxqGA3RQAyumZ0tmMvSGM2ZwB4tws";function encode($str){$_ostrrev($str);// echo $_o;for($_00;$_0<strlen($_o);$_0){$_csubstr($_o,$_0,1);$__ord($_c)1;…

龙蜥社区「人人都可以参与开源」——体验开源成为“开源人“

龙蜥社区「人人都可以参与开源」体验开源——让更多的人了解开源&#xff01; 龙蜥社区开源概述&#xff1a;龙蜥社区开源的探索过程:龙蜥社区收获总结:AtomGit评测:服务设计上:功能结构上:安全设计上: AtomGit测评总结: 龙蜥社区开源概述&#xff1a; 在追求技术的路上少不了…

铸造大型基础平板的结构应该怎样设计

设计大型基础平板的结构时&#xff0c;需要考虑以下几个方面&#xff1a; 地质条件&#xff1a;首先要了解工程所在地的地质条件&#xff0c;包括土质、地下水位、地震状况等。根据地质条件来选择合适的基础类型&#xff0c;如浅基、深基或地下连续墙等。 荷载分析&#xff1a…

Proxmox VE qm 方式一键创建Windows虚拟机

前言 实现qm 方式一键创建Windows虚拟机&#xff0c;提高效率。 qm 一键创建Windows虚拟机 以下实现在线下载镜像&#xff0c;创建虚拟机&#xff0c;安装系统需要自己手动安装哦&#xff0c;如果想实现全自动安装系统&#xff0c;建议部署自己的内网pxe server 系统参考各参…

【C语言】整数和浮点数在内存中的存储

点这里是个人主页~ 这次的内容是比较底层的奥&#xff0c;对于理解编程很重要~ 整数浮点数在内存中的存储 一、 整数在内存中的存储二、大小端字节序和字节序判断大小端的概念一道简单关于大小端排序的百度面试题 三、简单理解数据类型存储范围例一例二例三例四例五例六 四、 …