给想玩AIGC的小白:教你从0搭一个图文视频生成网站(附插件源码)

Stable Diffusion的发布是AI图像生成发展过程中的一个里程碑,相当于给大众提供了一个可用的高性能模型,让「AI 文本图片生成」变成普通人也能玩转的技术。最近一些网友将网上的真人图片不断喂给模型,让其自主学习,训练出来的效果已经可以做到以假乱真——你甚至不知道哪些图片是 AI 生成的还是真人拍出来的。你感兴趣吗?今天这篇文章从零开始,手把手教你如何搭建自己的真人 AI 网站。强烈建议收藏(不管是否吃灰)。

👉看目录,点收藏

1. 搭建你自己的 AI 网站

2. 模型下载

3. 汉化插件下载

4. 生成你的真人图片

4.1 生成真人图片

4.2 不同风格图片生成

4.3 动画视频生成

5. 让你生成的图片开口说话

01、搭建你自己的AI网站

本篇我们将单刀直入教各位最快搭建出一个质量不错的 AI 网站,如果各位想了解相关的原理、技术点,可以留言告诉我们。下文会提及的模型、插件和源码,我们也一并提前为各位整理~大家看到文末添加一下,即可领取。

第一步,我们可以直接使用 GitHub 仓库:

stable-diffusion-webui。

图片

首先,在电脑上安装 python 3.10.6,如果已经安装了其他 python 版本,可以利用 conda 安装多一个 3.10 的虚拟环境版本:

conda create -n novelai python==3.10.6

接下来下载该仓库的代码:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

再安装对应的 GPU 版本的 Pytorch,直接进入网站:

pytorch.org/get-started…

图片

进入刚刚创建的虚拟环境”novelai“:

图片

执行刚刚的命令:

./python -m pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

安装成功后,可以测试自己的 pytorch 版本是否可以跑通。

图片

进入刚刚下载的 Github 仓库的代码文件夹,安装第三方依赖:

python -m pip install -r requirements.txt

02、模型下载

有了网站之后,就需要下载对应的 AI 模型进行有效生成。一些网友已经利用网上大量的图片训练好的模型,并分享到网站上。我们举个例子:

civitai.com/

这个大名鼎鼎的网站被人们称为「C 站」,里面有很多你意想不到的模型。

图片

可以在这个网站上找到很多已经训练好的模型。例如找一个生成真人图片的模型:ChilloutMix。从网页上下载对应的模型后,把该模型放到工程目录:models/Stable-diffusion。

图片

图片

03、汉化插件下载

stable-diffusion-webui 这个项目还支持下载第三方插件。例如我们可以下载对应的汉化插件。其下载地址如下:
文末领取!

登陆上面网站后,就可以下载插件的安装包:

图片

然后将文件解压放到 extensions 目录下:

图片

接着,就需要对网页进行重启服务:

图片

在扩展这里,把插件勾上:

图片

在“设置”选项里,找到 zh_CN,最后需要重新启动网页,就可以生效了:

图片

图片

04、生成你的真人图片

启动主程序"launch.py",等待一定的时间出现网页地址就可以了。

图片

打开网址时,有时候可能模型没有更新。因此可以尝试一下多次重启。需要选择刚刚下载的模型:ChilloutMix。

图片

这样就已经完成前期的部署工作了。接下来详细教大家怎么生成自己想要的图片。

4.1 生成真人图片

在c站上,已经有很多大神利用 promt 生成图片了,因此我们就可以对这些进行参考。例如找一个好看的图片,对下面的 Prompt 词语进行复制:

图片

其中 Prompt 词语放在提示词框内,消极 Prompt 词语放在对应的方框内。同时调整对应的参数,最后就可以生成真人图片:

图片


4.2 不同风格图片生成

在 C 站上,还有很多 Lora 模型可以进行下载。这是一种可以帮助你调整画风的小模型。主要是放到 Prompt 中进行使用。例如我们可以在网站上下载原神的 Lora 模型:

图片

‍下载完成后,把模型放到 models/Lora 路径下:

图片

按照图片下的步骤,选中模型后,会看到具体的 Prompt 在方框内了:

图片

把步骤 4.1 中的 Prompt 词语加入到这里,就可以生成一个原神风格的图片:

图片


4.3 动画视频生成

首先需要安装插件 “deforum” 这个插件能够根据多个生成的图片构造成视频动画。

在当前 stable-diffusion 目录下,执行下面命令,就会发现 extensions 多了新的插件:

git clone https://github.com/deforum-art/deforum-for-automatic1111-webui extensions/deforum

图片

同时重启新的网页,会发现多了 deforum 这个选项:

图片

可以先执行简单的生成,在提示词上,已经默认填写了语句:

{  "0": "tiny cute swamp bunny, highly detailed, intricate, ultra hd, sharp photo, crepuscular rays, in focus, by tomasz alen kopera",  "30": "anthropomorphic clean cat, surrounded by fractals, epic angle and pose, symmetrical, 3d, depth of field, ruan jia and fenghua zhong",  "60": "a beautiful coconut --neg photo, realistic",  "90": "a beautiful durian, trending on Artstation"  
}

Prompt 词语模板解释如下:

//Abstracted Example  
{  "0": "Prompt A --neg NegPompt"  "12": "Prompt B"   
}

其中“0”和“12”提示在插值中解析的关键帧。Prompt A 和 B 是肯定提示,NegPrompt 是否定提示。当然,也可以直接用上面 C 站下载下来的模型,生成真人动画。

05、让你生成的图片开口说话

从上面我们已经得到了生成的图片。那么就可以利用这张图片,创建自己的 AI 说话视频。登陆这个网址:

studio.d-id.com/

图片

选择刚刚生成的图片,然后输入自己想要说的话,之后生成就可以了:

图片

最后就可以得到比较逼真的真人 AI 说话视频了。

有了这个技术,就可以批量制作二次元甚至是真人说话视频。这对于 AICG 这个行业是一个颠覆性的技术,相信未来这个技术在多个领域上都能够推广开来。

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/18697.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

工业工程师日子越来越受不了?IE们都在做什么?

有一位工业工程师(IE)毕业在一家工厂工作,入职一年了,本科读的是工业工程,他说理想很美好现实很骨感,以为做和本科一样的职业就能够大展宏图,结果上司天天让他盯生产线,在厂房一站就…

基于jeecgboot-vue3的Flowable增加表单功能(三)

因为这个项目license问题无法开源,更多技术支持与服务请加入我的知识星球。 接上一节 10、新建表单,打开VForm3编辑页面 /*** 新增事件*/function handleAdd() {designer.open true;nextTick(() > {reset();vfDesignerRef.value.clearDesigner();}…

m1系列芯片aarch64架构使用docker-compose安装nacos

之前看到 DockerHub 上发布了 m1 芯片 aarch64 架构的 nacos 镜像, 所以就尝试的安装了下, 亲测可用: 一. docker-compose.yml 编写 请确保自己的 mysql 服务已经启动了, 并且允许远程连接 volumes 挂载目录需要换成自己的目录 二. 容器运行和网络组 2.1 查看容器运行情况 …

【ai】livekit服务本地开发模式及example app信令交互详细流程

文档要安装git lfs 下载当前最新版本1.6.1 windows版本:启动dev模式 服务器启动 (.venv) PS D:\XTRANS\pythonProject\LIVEKIT> cd .\livekit_release\ (.venv) PS D:\XTRANS\pythonProject\LIVEKIT\livekit_release> lsDirectory: D:\XTRANS\pythonProject\L…

css-表头筛选的特定样式

背景 饿了么的表头筛选样式比较简单,如图1,产品觉得不够醒目(觉得用户可能不知道这是筛选,我表示不理解) 要求改进筛选的样式,达到图2的效果,主要是状态列,既希望这列的宽度固定&a…

[UE5]安卓调用外置摄像头拍照(之显示画面)

目录 部分参考文献(有些有用的我没标,没放上来) 要点 总蓝图 结果 部分参考文献(有些有用的我没标,没放上来) 【UE】获取USB摄像头画面_虚幻捕获硬件摄像头-CSDN博客 UE4安卓调用摄像头拍照确保打…

高边坡监测常用的主要仪器设备

随着人类的发展,近几年由于人类生活生产的破坏,地球环境不断恶化。鉴于这一现象,监测行业也随之应运而生。常见的监测类型有:边坡监测,地灾监测,水库监测,大坝监测,矿山监测&#xf…

重生之 SpringBoot3 入门保姆级学习(01、Hello,SpringBoot3)

重生之 SpringBoot3 入门保姆级学习(01、Hello,SpringBoot3)) 1、快速体验1.1 创建项目1.2 导入 SpringBoot3 依赖1.3 导入 SpringBoot3 Web 依赖1.4 代码编写1.5 浏览器测试 1、快速体验 场景:浏览器发送 /hello 请求…

Balabolka-一款完全免费的电子书朗读及文本转语音软件

下载地址:Balabolka Balabolka能够进行简单的文本转语音任务,支持各种语言包,该软件可以读取剪贴板的内容, 可以查看AZW,CHM,DjVu,DOC,EPUB,FB2,LIT&#xff…

Centos安装nvm管理node版本(让安装变得可控又快捷)

Centos安装nvm管理node版本(让安装变得可控又快捷) 没有找到一个对的人,有可能是你没有走对那条路,也有可能是你没有睁开眼睛,而更大的可能是,你根本就没有出发去找。 安装说明 nvm安装目录:/us…

PG TOAST技术

1.Toast简介: Toast是超长字段在PG的一个存储方式,对于用户来说不用关注这一技术的实现,完全是透明的,它会将大字段值压缩或分散为多个物理行来存储,与Oracle的CLOB,BLOB类似。 2.Toast的存储方式&#xf…

vscode: console.log快捷键设置

webstorm 编辑器自带一个 console.log 的快捷方式,即 .log 然后按回车键就可以了,但是webstorm 用着用着就得找解码,还是 vscode 好啊 那 vscode有类似的方法吗,答案是必然的 在VScode中打开文件 → 首选项 → 用户代码片段 → 在…

人工智能在乳腺癌领域的最新进展|【医学AI·文献速递·05-29】

小罗碎碎念 2024-05-29|文献速递 今天分享的文章,主题是AI乳腺癌。 第三篇文章,个人觉得是今天最有借鉴价值的——临床故事接地气,工科算法赶潮流。这篇文章主要做的事情是利用多模态多组学,去区分乳腺腺病和乳腺癌&a…

[Linux打怪升级之路]-进程和线程

前言 作者:小蜗牛向前冲 名言:我可以接受失败,但我不能接受放弃 如果觉的博主的文章还不错的话,还请点赞,收藏,关注👀支持博主。如果发现有问题的地方欢迎❀大家在评论区指正 目录 一、进程 1…

玩转STM32-直接存储器DMA(详细-慢工出细活)

文章目录 一、DMA介绍1.1 DMA简介1.2 DMA结构 二、DMA相关寄存器(了解)三、DMA的工作过程(掌握)四、DMA应用实例4.1 DMA常用库函数4.2 实例程序 一、DMA介绍 1.1 DMA简介 DMA用来提供外设与外设之间、外设与存储器之间、存储器与…

有免费通配符证书吗?哪里可以申请?

市面上的免费SSL证书大多数为单域名证书,如果您的主域名拥有众多子域名,逐一申请单域名SSL证书不太现实,下面为介绍一款永久免费使用的通配符SSL证书申请流程 1 选择免费通配符证书提供商 免费通配符证书申请点击这里直接获取https://www.…

前端渲染页面的原理

之前一直不愿意写一篇关于原理的,因为说起来实在是太繁杂,要写得细,码字梳理,计算下来起码都要差不多三周。以前一直躲避这个事情,现在反正有时间,为了不荒废自己,那就从头捋一遍。也方便自己后…

数据分析项目有哪些实施流程?揭示从数据准备到解决方案全过程

在当今数据驱动的商业环境中,数据分析项目的成功实施对于企业洞察市场趋势、优化产品服务、提升用户体验以及增强竞争力具有至关重要的作用。特别是对于直播类应用软件这样的快速增长领域,如何通过数据分析来扩大付费用户基础、提高用户留存率&#xff0…

音视频开发10 FFmpeg 内存模型-AVPacket, AVFrame

从现有的 Packet 拷贝一个新 Packet 的时候,有两种情况: • ①两个 Packet 的 buf 引用的是 同一数据缓存空间 ,这时 候要注意数据缓存空间的释放问题; • ②两个 Packet 的 buf 引用不同的数据缓存空间 ,每个 Pac…

D2Admin:企业中后台产品前端集成方案的探索与实践

D2Admin:企业中后台产品前端集成方案的探索与实践 摘要:随着企业信息化建设的不断深入,中后台管理系统的前端技术选型与集成方案成为了关键。D2Admin作为一款完全开源免费的前端集成方案,通过采用最新的前端技术栈,提…