AI绘画如何打造高质量数据集?

遇到难题不要怕!厚德提问大佬答!

厚德提问大佬答11

你是否对AI绘画感兴趣却无从下手?是否有很多疑问却苦于没有大佬解答带你飞?从此刻开始这些问题都将迎刃而解!你感兴趣的话题,厚德云替你问,你解决不了的困难,大佬替你来解决!

欢迎各位阅读《厚德提问大佬答》栏目的第11期,这一期我们邀请了一位AI绘画的大佬,他的回答也非常专业!只要你有问题,在文章下方留言,我们会尽可能的邀请相关行业大佬替你解答!

AI绘画大佬 阿屿同学

QQ截图20240607150444.png

这次我们邀请到的是AI绘画大佬 “阿屿同学”大佬的模型在模型平台上拥有着不错的使用量!让我们来看看大佬能给我们带来哪些惊喜吧!

Q&A环节

数据集往往能够决定一张图片的风格、质量以及图片所带有的因素等等,制作一个高质量的数据集也是十分的耗时间,我想知道制作高质量的数据集十分有提高效率的窍门。

阿屿大佬给出了他自己的见解:“获取图片的渠道很多,最简单的就是找到高质量的图库直接进行购买,最省时间也是质量最好的办法,当然了这里也可以提供小窍门,你可以使用来源于Midjourney生成的高质量图像用于AI训练;也可以找找国内各大图库和包图网等创意素材网;但一定要注意版权来源。”

阿屿大佬还说:“如果你需要给你的产品做一个LORA模型,你需要构建一个用于AI训练图像的拍摄计划,主体物在室内白棚场景下的不同角度,正视、侧视、俯视、仰视图;在不同背景下产品的应用图片,在夜晚,在白天,搭配不同的背景数据集可以使模型在出图的时候更具有泛化性且光影随着提示词变幻但仍能保持主体比例统一具有细节。”

new_products_are_on_the_shelves_3.png

如果有一张图片的元素是我所需要的,我又想让这个图片变成另一种画风,AI绘画能够实现这样的操作吗?

阿屿大佬思考了一下回复道:“AI绘画可以实现风格迁移,我在实现风格迁移时我会更多地使用提示词调用大模型里的画风储备,在大模型无法达到目的时,我会选择训练LORA模型来进行稳定的风格出图,最近很火的黏土风转绘大火,在技巧上就是使用了图生图+LORA画风模型的办法。”

new_products_are_on_the_shelves_4.png

大部分模型的作者都会在生成的图片中带入自己的参数,使用作者给的参数能帮助我们生成的图像更接近于作者所生成的图像。大佬是否也会去使用其他作者的参数标准呢?

“我们津津乐道的stable diffusio各种各样的模型都是基于“Stability AI”这家公司开源的大模型进行微调,在开源文档中会提供基本的模型使用方法,比如出图分辨率,合适的VAE以及迭代等,帮助我们进行模型的调用,这一个参数的使用习惯也影响了很多的创作者,在我进行自己的模型训练时也会参考最原始的参数去进行调试,以适应不同创作者的使用习惯,在提示词和参数不变的情况下获得更棒的效果。”阿屿大佬再一次给出了自己的看法。

他说:“当然一些特殊的行业类模型,例如汽车的模型,因为训练时使用的训练集比例特征以及训练参数不同也会影响出图的最优参数,例如 在这个模型里横版图像比竖版图像出图的效果和细节要好很多,在迭代步数>30时候细节会更好,我会针对这一类特殊的模型做文档说明,帮助创作者更好地运用。”

对于一张图片的好与坏的评判标准往往是模糊的,如果站在专业的大佬的视角来看会不会有什么不同呢?大佬对图片好坏的评判标准是什么?

关于这个问题,阿屿大佬笑着回答:“一张图片的好坏还是蛮客观的,但也会有一些基本原则;图像是否忠诚于提示词生成图像有没有意外的噪点,我们俗称鬼图;对于细节的把握,在AI图像当中,人们更多会认为AI出一眼假,画不好手,画不好脸等;其他的更多是个人对于美学的看法不同因地制宜。”

总结

通过这次对阿屿大佬的采访,我们对AI绘画的具体细节又有了进一步的了解与认知,相信这些回答对你们会有一定的帮助!

如果你也对算力感兴趣或是有需求,欢迎搜索我们厚德云官方,又或者你此时有自己解不开的难题,那么可以在文章评论给我们留言,我们也会尽全力去回答帮助你们,我们下期厚德提问再见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/849405.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

鸿蒙开发教程:新手入门必看

一 开发设备要求 Windows环境运行要求: 根据华为官方文档,为了开发基于鸿蒙系统的应用,电脑的配置需求如下: 操作系统:建议至少为Windows 10 64位或Windows 11 64位版本。内存:至少需要8GB以上。硬盘空间…

使用Redis缓存实现短信登录逻辑,手机验证码缓存,用户信息缓存

引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId></dependency> 加配置 spring:redis:host: 127.0.0.1 #redis地址port: 6379 #端口password: 123456 #密码…

毫米波雷达深度学习技术-1.6目标识别1

1.6 目标识别 利用检测和跟踪在距离、多普勒和角度这两个维度中的任意一个进行精确的目标定位后&#xff0c;将检测到的目标分类到所需的类别中。与检测类似&#xff0c;提出了多种框架来同时使用图像和点云进行目标分类。使用图像进行目标分类的最常见方法是从检测到的目标特征…

10款必备软件,每款都是神器,赶快用起来吧!

AI视频生成&#xff1a;小说文案智能分镜智能识别角色和场景批量Ai绘图自动配音添加音乐一键合成视频https://aitools.jurilu.com/最近有很多小伙伴在咨询&#xff0c;我也抓紧时间整理了一些不错的软件和我陆续收到的&#xff0c;希望对大家有所帮助。 1. 全球鼠标——MouseI…

vue2组件封装实战系列之space组件

组件之 GfSpace 多个同类型的内容比如 div/span/button/li 等&#xff0c;实现水平、垂直方向的均匀布局的功能 效果预览 属性 参数类型说明可选值默认值flexBoolean是否 flex 布局true/falsefalsegapNumber内容间距-10directionString内容排列方向row/columnrow 代码实现 这…

机器学习扩展包MLXtend绘制分类模型决策边界

公众号&#xff1a;尤而小屋编辑&#xff1a;Peter作者&#xff1a;Peter 大家好&#xff0c;我是Peter~ 继续更新机器学习扩展包MLxtend的文章。本文介绍如何使用MLxtend来绘制与分类模型相关的决策边界decision_regions。 导入库 导入相关用于数据处理和建模的库&#xff…

技术对比:eMMC、SD NAND与NOR Flash存储特性详解

在电子技术迅猛前进的今天&#xff0c;存储技术成为了整个行业发展的基石。SD NAND、eMMC和NOR Flash&#xff0c;这三种存储技术各自以其独特的架构和特性&#xff0c;满足了多样化的存储需求。让我们来看看它们之间的一些关键对比&#xff1a; 1. 存储单元架构&#xff1a; S…

Perfectly Clear WorkBench v4 解锁版安装教程 (图像修复增强工具)

前言 Perfectly Clear WorkBench 是一款图像修复工具&#xff0c;可以帮助用户对自己的图片素材进行修复&#xff0c;很多的照片因为拍摄问题&#xff0c;或者设备限制&#xff0c;会导致拍摄效果不好&#xff0c;使用这款软件可以进行一定程度的修复&#xff0c;当拍摄时亮度…

Ant Design+react 表单只读

表单禁用&#xff0c;样式不好看&#xff0c;不符合甲方标准&#xff0c;看了一下文档&#xff0c;select、radio等都不支持只读状态。 解决方法&#xff1a; 利用css3的point-events属性&#xff0c;设置为none 在查看弹窗时&#xff0c;传入一个变量&#xff0c;当变量为true…

了解光隔离器和光耦合器:主要区别和应用

光隔离器和光耦合器是现代电子电路中必不可少的组件&#xff0c;提供一项关键功能&#xff1a;电路不同部分之间的电气隔离。虽然它们在许多方面相似且经常互换使用&#xff0c;但两者之间存在明显差异&#xff0c;主要基于它们的工作电压能力。本文深入探讨了这些组件的基础知…

最新23道vue2+vue3面试题带答案汇总

文章目录 MVVM与MVC的区别Vue 2与Vue 3的主要区别Vue 3的优势Vue 2 是如何实现数据绑定的&#xff1f;Vue 2 中的 v-model 是如何工作的&#xff1f;Vue 2 的生命周期钩子有哪些&#xff1f;Vue 3 使用了什么技术来实现响应式系统&#xff1f;Vue 3 中的 Composition API 带来了…

windows系统内查看电脑SN号

cmd命令行模式下&#xff0c;输入代码wmic bios get serialnumber可以查看到当前计算机的SN号码

Python爬取与可视化-豆瓣电影数据

引言 在数据科学的学习过程中&#xff0c;数据获取与数据可视化是两项重要的技能。本文将展示如何通过Python爬取豆瓣电影Top250的电影数据&#xff0c;并将这些数据存储到数据库中&#xff0c;随后进行数据分析和可视化展示。这个项目涵盖了从数据抓取、存储到数据可视化的整个…

记一次Linux下Docker镜像服务器磁盘空间清理

我们开发环境Jenkins构建项目时报服务器磁盘空间不足&#xff0c;导致项目自动化构建部署失败&#xff0c; Docker镜像服务器磁盘空间清理我们做了多次了&#xff0c;之前在清理Docker镜像服务器时走了不少弯路&#xff0c;查了不少Docker镜像服务器空间清理&#xff0c;都大同…

JAVA网络编程,反射及注解知识总结

文章目录 网络编程软件架构三要素IP端口号协议UDP协议发送数据接收数据三种通信方式 TCP协议客户端服务器端三次握手四次挥手 反射获取字节码文件获取构造方法获取成员变量获取成员方法反射的作用 动态代理注解作用格式使用位置注解的原理常见注解元注解自定义注解解析注解 网络…

自然语言处理(NLP)—— 语言检测器

1. 文章概述 1.1 目的 在本篇文章中&#xff0c;我们将构建一个语言检测器&#xff0c;这是一个能够识别文本语言的简单分类器。这是一个能够识别文本是用哪种语言写的程序。想象一下&#xff0c;你给这个程序一段文字&#xff0c;它就能告诉你这是英语、法语还是其他语言。 …

Moonshot AI API使用(1)-获取MOONSHOT_API_KEY

Moonshot AI 开放平台 用户注册&#xff0c;使用微信扫码登录 把这个key复制下来

用你熟悉的语言就能开发智能合约,Vara Network 以 WASM 解锁未来应用创新

Vara Network 自推出以来&#xff0c;凭借其基于 Gear Protocol 的独特架构和强大的开发工具&#xff0c;为开发者提供了一个高效、安全的智能合约构建平台。Vara Network 通过采用先进的 Actor 模型、持久内存概念和 WebAssembly 技术&#xff0c;实现了异步消息处理、并行计算…

OpenFeign --学习笔记

什么是OpenFeign&#xff1f; OpenFeign可以想象成一座连接客户端&#xff08;服务器&#xff09;和服务器之间的桥梁。在微服务架构中&#xff0c;各个服务之间像小岛屿一样分布在网络上&#xff0c;它们需要相互通信才能协同工作。但是&#xff0c;这些岛屿之间并没有现成的…

SVNCloud 与 Navicat和IDEA的连接

文章目录 SVNCloud 配置Navicat访问云端数据库与IDEA Java jdbc 的连接 SVNCloud 配置 访问网址&#xff1a;SVN注册账号&#xff0c;进入mysql区域&#xff1a; 数据库管理->创建数据库&#xff0c;输入数据库名称和密码&#xff0c;注意&#xff0c;这里的数据库名称实际…