被鹅厂最新开源AI绘画工具PhotoMaker圈粉了，多风格头像生成器就靠它了！

被鹅厂最新开源AI绘画工具PhotoMaker圈粉了，多风格头像生成器就靠它了！

news/2025/4/17 18:10:43/文章来源:https://blog.csdn.net/z_ipython/article/details/135895109

要说本周AIGC开源爆火项目，腾讯的PhotoMaker 可以入选其一。而 PhotoMaker 是腾讯Arc于4天前开源上线到GitHub的，更有一众互联网科技领域大V体验推荐，当前Star已经有4.7k了！

相信小编这篇文章发布时star预测可能达到5k+了。而 PhotoMaker 究竟如何刚发布上线就爆火了呢？

根据众多博主的体验描述，给它最直接的定位就是**一款风格百变的头像生成器。**你以为它的功能仅仅如此嘛，当然不是，该模型工具不会根据原始输入图像固有的特征限制它的发挥，还可以改变人物的性别、年龄等，生成不同风格的全新图像。

接下来小编就跟大家一起来看看这款AI绘画工具 PhotoMaker 怎么就被无数人刷屏了！

项目介绍

PhotoMaker 是一款通过 堆叠 ID技术嵌入 定制出逼真的人体照片的开源工具。

一个可以创建任何风格的任何人的照片/绘画/头像的生成器。

能根据描述生成符合描述的人物照片。也能把几个不同人的照片特征混合在一起，创造出一个全新的人物形象。

还能改变照片人物的性别、年龄和生成多种风格的其他照片。快速逼真，效果自然。更加无需训练LoRA即可保持角色一致性。

🌠 主要特点：

PhotoMaker 使用的核心技术是**“堆叠ID嵌入”**。

这意味着它可以将多个身份证明（ID）图像的信息合并成一个统一的数据结构。这种方法不仅能捕捉到单个ID的细微特征，还能整合多个不同ID的特征，创造出新的、个性化的图像。

结合多张照片的特征：PhotoMaker可以取多张照片，这些照片可以是同一个人的，也可以是不同人的。它分析这些照片中的特征，然后将它们结合起来，创造出一个新的、个性化的人物图像。
灵活的文本控制：与其他方法相比，PhotoMaker提供了更灵活的文本控制能力。用户可以通过文本提示来指导图像的生成，这使得创造出的图像不仅逼真，而且能更好地符合用户的具体要求。
高效率和快速生成：相比于需要大量微调的方法（如DreamBooth），PhotoMaker在保持身份信息的同时，提供了更快的生成速度。它能在短时间内（例如10秒）生成定制的人类照片，这对于需要快速生成结果的应用场景非常有利。
高身份保真度：PhotoMaker在生成图像时能更好地保持人物的身份特征。这对于需要精确保留人物特征的场景（如个性化肖像或身份识别）尤其重要。

主要功能：

根据文字描述制作照片：你可以告诉它你想要的人物样子，它就能生成符合描述的人物照片。
混合多个人的特征：它可以把几个不同人的照片特征混合在一起，创造出一个全新的人物形象。
改变年龄或性别：比如，你可以把一张男士的照片转换成女士的样子，或者让照片中的人看起来年轻或年老。
添加艺术风格：它还能给照片加上不同的艺术效果，比如油画风格或卡通风格。
现实化艺术作品/旧照片中的人物：将艺术品或旧照片中的人物带入现代。

部署及使用

本地部署及搭建，小编这里就不展开续写了。

项目要求Python版本3.8及以上、Pytorch版本2.0及以上。然后下载模型、训练模型、启动服务本地演示。

详细部署说明请到项目中查看。

其实官方已经提供了Demo模型！可在线体验，有现实版本和风格化版本，考虑十分周全。

现实版本模型：https://huggingface.co/spaces/TencentARC/PhotoMaker

风格化版本模型：https://huggingface.co/spaces/TencentARC/PhotoMaker-Style

使用步骤：

1️⃣ 上传您想要定制的人的图片。一张图片就可以，但更多的更好。（上传的图片中的人应占据图片的大部分区域）

2️⃣ 输入一个文本提示，确保将您想要定制的类别词与触发词img配对。

例如：man img（男人的图片）或woman img（女人的图片）或girl img（女孩的图片）。

3️⃣ 选择您喜欢的样式模板。

4️⃣ 点击提交按钮开始进行定制。

还有其他作者根据PhotoMaker，提供舒适的用户界面项目：

https://github.com/ZHO-ZHO-ZHO/ComfyUI-PhotoMaker
https://github.com/StartHua/Comfyui-Mine-PhotoMaker
https://github.com/shiimizu/ComfyUI-PhotoMaker

组合使用场景示例

以下示例来源于量子位。

1、可以根据描述生成多种风格个人照片。

比如: 你见过这样的黑寡妇吗？

2、混合不同人物特征，生成全新人物形态。

比如: 奥特曼和乔布斯“生”的孩子，可能长这样？

3、修改年龄、性别以及照片年代。

比如: 小时候的马斯克，你见过吗？

总结

实验结果表明，与其他类似模型相比，PhotoMaker 具备高质量和多样化的生成能力，以及可编辑性、保真性。

此外，这一方法还能实现更多以往难实现的有趣功能。比如改变年龄或性别、将旧照片或艺术作品中的人物还原到现实中以及身份混合等。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/652253.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

js打地鼠

js打地鼠

文章目录 1实现效果2代码实现 1实现效果游戏难度：简单，一般，困难，噩梦（控制setInterval的time参数） 按钮功能：结束（可以通过修改gameScore的值来修改判定结束的分数）&am…

阅读更多...

SpringBoot AOP应用（公共字段填充）

SpringBoot AOP应用（公共字段填充）

背景在很多场景下，我们对需要对一些公共字段进行赋值操作，如果我们每一个公共字段都进行代码赋值那无疑会增加很多重复无用代码，都会导致我们的代码臃肿，所以我们使用AOP切面编程，实现功能增强，来完成公…

阅读更多...

3个精美的wordpress律师网站模板

3个精美的wordpress律师网站模板

暗红色WordPress律师事务所网站模板演示 https://www.zhanyes.com/qiye/23.html 暗橙色WordPress律师网站模板演示 https://www.zhanyes.com/qiye/18.html 红色WordPress律所网站模板演示 https://www.zhanyes.com/qiye/22.html

阅读更多...

2023 IoTDB Summit：Dr. Feinauer《Apache IoTDB在德国工业和关键基础设施中的应用》

2023 IoTDB Summit：Dr. Feinauer《Apache IoTDB在德国工业和关键基础设施中的应用》

12 月 3 日，2023 IoTDB 用户大会在北京成功举行，收获强烈反响。本次峰会汇集了超 20 位大咖嘉宾带来工业互联网行业、技术、应用方向的精彩议题，多位学术泰斗、企业代表、开发者，深度分享了工业物联网时序数据库 IoTDB 的技术创新…

阅读更多...

Biotin-PEG4-TSA，生物素-PEG4-酪胺，用于标记蛋白质、核酸等生物分子

Biotin-PEG4-TSA，生物素-PEG4-酪胺，用于标记蛋白质、核酸等生物分子

您好，欢迎来到新研之家文章关键词：Biotin-PEG4-Tyramide，Biotin-PEG4-TSA，生物素-PEG4-酪胺，Biotin PEG4 Tyramide，Biotin PEG4 TSA 一、基本信息产品简介：Biotin PEG4 Tyramide is compos…

阅读更多...

React 中条件渲染的 N 种方法

React 中条件渲染的 N 种方法

本文作者系360奇舞团前端开发工程师条件渲染在React开发中非常重要的功能，它允许开发人员根据条件控制渲染的内容，在创建动态和交互式用户界面方面发挥着至关重要的作用，本文总结了常用的的条件渲染方法。 1.If-else if-else是一种控制流程…

阅读更多...

mac 10.15.7 Unity 2021.3.14 XCode 12.4 -＞ Unity IOS 自动安装 Cocoapods 失败解决方法

mac 10.15.7 Unity 2021.3.14 XCode 12.4 -＞ Unity IOS 自动安装 Cocoapods 失败解决方法

自己这两天在用Unity开发IOS时，遇到了安装Cocoapods失败的问题，记录一下问题及解决方法，便于自己后续查看，以及有相同遭遇的人查看发生场景：打开 unity，触发自动安装 Cocoapods -> 安装失败&#xff08…

阅读更多...

基于Micropython利用ESP32-C3驱动墨水屏显示图片

基于Micropython利用ESP32-C3驱动墨水屏显示图片

从咸鱼上淘了两块2.9寸的墨水屏价签，可以结合ESP32-C3做个低功耗的时钟温湿度计。 1、所需硬件合宙的ESP32-C3： 电子价签拆出来的2.9寸墨水屏： ——电子价签型号为：Stellar-L，墨水屏型号为：E029A01。电子…

阅读更多...

vue3之echarts3D环柱图

vue3之echarts3D环柱图

vue3之echarts3D环柱图效果： 核心代码： <template><div class"container"><div ref"chartRef" class"charts"></div></div> </template><script lang"ts" setup&g…

阅读更多...

3. SQL 语言

3. SQL 语言

重点： MySQL 的三种安装方式：包安装，二进制安装，源码编译安装。 MySQL 的基本使用 MySQL 多实例 DDLcreate alter drop DML insert update delete DQL select 3）SQL 语言 3.1）关系型数据库的常见…

阅读更多...

探索Pyecharts关系图绘制技巧：炫酷效果与创意呈现【第42篇—python：Pyecharts水球图】

探索Pyecharts关系图绘制技巧：炫酷效果与创意呈现【第42篇—python：Pyecharts水球图】

文章目录 Pyecharts绘制多种炫酷关系网图引言准备工作代码实战1. 基本关系网图2. 自定义节点样式和边样式3. 关系网图的层级结构4. 添加标签和工具提示5. 动态关系网图6. 高级关系网图 - Les Miserables 示例7. 自定义关系网图布局8. 添加背景图9. 3D 关系网图10. 热力关系网图…

阅读更多...

同为科技（TOWE）自动控制循环定时插座

同为科技（TOWE）自动控制循环定时插座

随着科技的发展，智能化家居已成为我们生活的重要组成部分。作为国内领先的智能家居品牌，同为科技（TOWE）推出的自动控制循环定时插座，无疑将科技与生活完美地结合在一起。 1.外观设计同为科技（TOWE&#x…

阅读更多...

java中aes加密解密工具类

java中aes加密解密工具类

java中aes加密解密工具类字符串：{“DATA”:{“SJH”:“17600024168”,“DLZH”:“91510104MA67FPXR5T”,“DLMM”:“jhdz123456”,“DLSF”:“5”,“NSRSBH”:“91510104MA67FPXR5T”},“JRSF”:“23”} 加密后：y4mzmi3jta22aXeIPfEdzu8sgA9uy3OevaIY…

阅读更多...

Tomcat10安装报错Unknown module: java.rmi specified to --add-opens

Tomcat10安装报错Unknown module: java.rmi specified to --add-opens

错误原因需要根据自己的tomcat的版本查看需要根据自己的tomcat找到对应安装的java版本(查看版本网址)https://tomcat.apache.org/whichversion.html 将电脑当中的环境变量JRE_HOME变量删除即可（具体如下图）

阅读更多...

vmware-VCSA6.0部署

vmware-VCSA6.0部署

下载vcsa的iso包，解压后首先安装VMware-ClientIntegrationPlugin-6.0.0-6823256.exe 如果不配置域名配置成ip地址也可以 https://172.16.51.202/

阅读更多...

阶段项目中的添加图片和打乱图片

阶段项目中的添加图片和打乱图片

package Puzzlegame.com.wxj.ui; import javax.swing.*; import java.util.Random; public class GameJframe extends JFrame { //游戏主界面 //创建一个二维数组 //目的：管理数据 //加载图片的时候，会根据二维数组中的数据进行加载 int [][] …

阅读更多...

使用大模型检索增强 Rerank 模型，检索效果提升太明显了！

使用大模型检索增强 Rerank 模型，检索效果提升太明显了！

Rerank 在 RAG（Retrieval-Augmented Generation）过程中扮演了一个非常重要的角色，普通的 RAG 可能会检索到大量的文档，但这些文档可能并不是所有的都跟问题相关，而 Rerank 可以对文档进行重新排序和筛选，让…

阅读更多...

分布式事务解决方案Saga模式

分布式事务解决方案Saga模式

由于这个场景需要深入详细的解释，我将采用分布式事务中的一个常见模式——补偿事务（Saga模式）——来进行解释，并提供一个具体的Java源码示例。请注意，这个示例是为了演示目的，并不代表一个生产级别的解决方…

阅读更多...

Linux ping命令详解

Linux ping命令详解

目录一、简介二、ping命令三、简单示例3.1 ping -c 3 www.baidu.com3.2 ping -c 3 -i 2 www.baidu.com 一、简介 PING （Packet Internet Groper）， 因特网包探索器，用于测试网络连接量的程序。Ping是工作在 TCP/IP 网络体系结构…

阅读更多...

yum指令——Linux的软件包管理器

yum指令——Linux的软件包管理器

. 个人主页：晓风飞专栏：数据结构|Linux|C语言路漫漫其修远兮，吾将上下而求索文章目录什么是软件包yum指令1.yum 是什么？2.Linux系统（Centos）的生态 3.yum的相关操作安装卸载yum的相关操作小结软件源安…

阅读更多...

最新文章