AI复活,让老照片动起来【数字永生】

✅  适宜人群:关注 AI 复活缅怀逝者或以此变现的人群

     内容出品人:@领航猿1号

     更多AI知识分享:https://www.yuque.com/lhyyh/ai/readme?singleDoc

1、前言

        AI“复活”实质上是利用人工智能技术,通过对人物已有“形象、声音、语言、思想”等内容的学习,克隆数字化的虚拟人物形象,让人类生命以数字化形式存在。这项技术旨在帮助人们在失去亲人后,通过与逝者的数字化身进行互动,来缓解思念之情和悲痛感。

网上示例

让老照片动起来

        

        但数字永生面临技术、伦理和道德的双瓶颈,目前,AI克隆数字人领域的行业标准尚未明晰,企业行为大多依靠自律。因为它可能会引发关于死亡尊严、人类情感真实性、隐私权保护等问题的讨论。因此,技术的开发者和使用者需要在创新的同时,考虑到这些潜在的风险,并确保技术的合理和道德使用。只有构建符合伦理、法律的数字永生技术生态,才能让人类更安全、更幸福地享受‘云上栖居’的生存方式。

2、商业模式

2.1 商业模式介绍

        做过自媒体(抖音、小红书、公众号、私域...)的人应该都知道,信息差很重要,目前 AI 有很多场景可以副业变现,这个 AI 复活亲人更不用说,相信或多或者大家都在抖音等平台上刷到过这种让老照片动起来的视频,对于怀旧场景来说,变现真的太容易了。据调查发现,目前市面上,有关AI克隆数字人的服务售价可谓是千差万别。少则几十元,多则几万元。

2.2 项目愿景与技术实现

2.2.1 项目背景

        在现代社会中,失去亲人带来的痛苦和思念是难以言喻的。我们的项目旨在通过先进的人工智能技术,为人们提供一种新的方式来与已故亲人的“数字化身”进行互动。这不仅能帮助他们缓解内心的悲伤与思念,还能在情感上提供一定的慰藉,让亲情在数字世界中得以延续。

2.2.2 项目目标

        我们的项目目标是利用AI技术,将已故亲人的照片和声音合成一个具有真实感的有声视频。通过精准模拟逝者的外貌和声音特征,我们希望为用户创造出一个高度逼真的数字人物,以达到“复活”的效果。

2.2.3 核心技术

        数字永生技术的核心在于生成式人工智能(AIGC),这是一种结合了图像处理、语音合成以及自然语言处理等多种先进技术的综合系统。通过高质量的数据输入,AIGC能够学习和模拟逝者的特征,生成一个外观和行为都高度相似的数字化人像。

以下是一些技术细节:

    • 图像处理:高分辨率的图像输入能显著提升数字人物的外观相似度。
    • 语音合成:利用录音样本,生成与逝者声音高度相似的语音。
    • 自然语言处理:通过分析逝者生前的语言习惯和表达方式,使数字人物能够进行自然流畅的对话。
    • 个性化数据输入:输入兴趣爱好等个人特征数据,以模拟逝者的性格和行为模式。

精度越高、数据越定制化,生成的数字人物效果就越接近真人,成本也相应提高。这些精度体现在以下几个方面:口型准确度、图像分辨率、动作复杂性、服饰与发型的丰富度、语音相似度、多情感语调、互动性以及交互的真实性。

2.2.4 技术应用

AI数字永生技术的应用形式多样,以满足不同用户的需求。其主要应用场景包括:

    • 数字遗照:高分辨率的静态数字照片,真实再现逝者的形象。
    • AI疗愈:通过生成的数字视频或互动内容,帮助用户缓解心理压力和情感痛苦。
    • AI复活:提供实时视频互动服务,使用户能与数字化的亲人进行对话和互动。

每种应用形式都力求在不同程度上满足用户的情感需求,帮助他们在数字空间中重新构建与逝者的联系。

2.3 变现方式

        理解AI数字永生项目的变现方式,就是理解如何将这一技术转化为商业价值。以下是该项目主要的8种变现模式:

2.3.1 销售智能化应用程序

        开发简单易用的智能化应用程序,让用户可以自行操作。用户可以通过这些应用程序将静态照片“动起来”或者生成简单的AI语音。这类应用程序价格较低,通常在10元到几十元之间,非常适合普通用户购买和使用。

2.3.2 提供定制化服务

        为客户提供个性化的数字人复活服务。商家可以根据客户需求,利用AI技术“复活”逝者,并提供定制化的视频、音频或互动体验。根据服务复杂度和定制程度,收费从几百元到上万元不等。

2.3.3 个性化心理疗愈服务

        通过模拟逝者的形象和声音,提供心理疗愈服务,为用户在情感上提供慰藉和支持。此类服务可以采用按次、按小时或包月的收费模式。利用这种方式,不仅可以缓解用户的心理压力,还能产生稳定的收入。

2.3.4 开发面向C端的互动APP

        开发一款专门的互动APP,允许用户通过APP与“复活”的数字人进行互动交流。此类应用可以提供订阅服务或一次性购买服务,使用户能长期与数字化亲人保持联系。此模式适合有一定情感需求且愿意长期投入的用户。

2.3.5 数字人形象和声音的克隆服务

        提供高端的数字人形象和声音克隆服务,通过收集逝者生前的照片、视频和音频资料,利用AI技术创建一个高度逼真的数字人。用户可以与这个数字人进行实时文字或语音交流。由于技术复杂性和高精度要求,服务费用较高,一般从万元起步。

2.3.6 面向B端市场的服务

        将AI复活技术应用于企业级市场,例如医疗机构、教育机构、文化传承等领域。通过提供定制化解决方案来获取收益,例如复活历史人物用于文化教育或科研。此模式适合有一定技术储备和资源的创业者或公司。

2.3.7 授课和带教学徒

        掌握了AI数字永生技能后,开发相关课程和带教学徒也是一种变现方式。通过在线课程、线下培训等方式教授这项技能,课程费用可以从几百到几千元不等,而1对1的教学价格则可能从几千到几万元不等。此方式不仅能获得经济收益,还能扩大技术影响力。

2.3.8 内容创作和营销

        利用AI复活技术进行内容创作,例如在短视频平台上发布“复活”名人的视频来吸引流量,并通过广告或合作方式进行变现。这种方式适合有一定内容创作能力和平台运营经验的人,通过高点击率的视频内容来获得广告收入。

3、项目实操

        📌 声明:

        由于缺少行业标准,目前 AI 复活场景存在“伦理、道德、法律、诈骗” 等问题,请大家遵守法律法规,合理、合情、合法的进行应用。不要侵犯他人肖像权、隐私权等。如果出现任何法律问题,责任自负。

        根据我国《民法典》第 994 条规定,当死者的姓名、肖像、名誉、荣誉、隐私、遗体等人格利益受到侵犯时,其配偶、子女、父母有权依法请求行为人承担民事责任。在规范应用方面,我国出台了《生成式人工智能服务管理暂行办法》,自 2023 年 8 月 15 日起施行。

考虑到技术可能被违法滥用,一定要强调,只是为了缅怀,人脸识别绕道,眨眼、摇头、点头、张嘴等动作都拒绝制作,防止造成 AI 视频诈骗。

3.1 照片处理(四款工具)

        如果照片模糊不清晰,可以使用照片修复工具进行修复,这类工具大多数收费,你可以根据你跟客户的收费标准决定① 免费提供照片修复服务 | ② 额外照片修复收费服务,下面提供几款照片修复工具

产品       官网特点
腾讯ARCARC官网-腾讯模糊图片修复
Apeaksoft免费图像放大 - 由 AI 提供支持的即时照片增强器增强照片分辨率,消除模糊和噪点
BigJPGBigjpg - AI Super-Resolution lossless image enlarging / upscaling tool using Deep Convolutional Neural Networks照片无损放大
UpscaylUpscayl - AI Image Upscaler照片无损放大

3.2 音频合成(百度飞浆)

        至少需要提供一分钟的原声视频,越清晰越好,用于分析人物音色、声纹等特点。

🎯 这里我们使用,百度飞浆产品进行操作

  • 预防针:这块稍微有点难度,涉及代码,不过不用担心,照着操作即可。
  • 官网链接:飞桨AI Studio星河社区-人工智能学习与实训社区

3.2.1 选择项目并运行 GPU 环境

1、进入项目大厅,进入【有手就行】项目

2、点击运行,大家也可以看看项目说明,里面教程也很详细

3、进入环境时,一定要选择 32G或以上的GPU环境运行,CPU环境无法运行


等待启动

点击进入

3.2.2 开始微调【慢慢来】

🎯 注意:

  • 这是一个 python 文件,前面买的 CPU 就是作微调用的。
  • 大家需要挨个代码段点击▶️按钮运行程序,一定要按顺序运行,并且要保证前面的代码运行成功再运行后面的代码,运行前请看好如下说明。
  • 如果跳着运行,会出错。

点击红框处的 ▶️ 按钮运行

运行完,重启一下内核(同一个文件,往下滑就看到了)

然后开始挨个运行下面的代码段(不需要重启内核了)

下载依赖,这步骤时间较长,耐心等待

中间几个同样操作,挨个运行,省略...

当运行到下图位置时,修改文件路径上传音频文件后,再运行

修改文件路径(同一个文件,往下滑就看到了)

将准备好的音频上传到刚刚的文件夹(音频切割工具可以使用 slicer-gui)

🎯 上传的音频数据说明:

  • 对于语音合成任务,对数据是有一定要求的,尽可能上传干净的人声数据,比如像示例中的人声数据,在安静环境下录制,录制设备无论是手机,电脑,还是别的设备都可以,注意一定要控制噪音,或者提前使用音频剪辑软件进行降噪。
    1. 音频不要太长,也不要太短,建议2s~10s之间
    2. 音频尽量是干净人声,不要有BGM,不要有比较大的杂音,不要有一些奇奇怪怪的声效,比如回声等
    3. 声音的情绪尽量稳定,以说话的语料为主,不要是『嗯』『啊』『哈』之类的语气词
  • 关于录音工具
    • 你可以使用一些在线运行的录音工具或者 【Adobe Audition】,【Cool Edit Pro】, 【Audacity】 等录音软件录制音频,保存为 24000采样率的 Wav 格式
  • 这里方便大家联系,给大家提供一组音频如下👇
  • 📎SpkA.zip

记得点击▶️按钮运行哦

微调参数调整

修改文本

全部运行完成后

下载音频:上面代码块运行后,按下面的方式下载音频

3.3.3 微调模型下载与使用

模型下载

上面 微调训练 结束后,会在 【inference】目录下生成对应 【exp_name】的模型文件夹,使用下面的代码块生成对应压缩文件,右键点击下载即可

3.2.4 停止服务

一般人不会告诉你这一步,服务记得停掉,因为前面的 GPU 是按小时收费的。

不过刚刚用的这会,不用担心,新人有免费额度。

查看自己剩余算力卡

3.3 视频合成

前面的声音文件用于合成声音的,如果你的场景不需要声音,可以跳过 3.2 章节

接下来是用【图片+声音】通过诸如“D-ID、HeyGen、腾讯智影”等数字人工具进行最后的合成

🎯 三款最火的数字人合成工具

1、腾讯智影数字人

  • 官网:腾讯智影-在线智能视频创作平台
  • 官方教程:腾讯智影帮助文档

2、D-ID 数字人

  • 官网链接:D-ID | The #1 Choice for AI Generated Video Creation Platform

3、HeyGen 数字人

  • 官网链接:https://app.heygen.com/

下面以 D-ID 为例

1、Create a video

2、 上传你准备好的照片

3、导入音频

4、生成视频

5、下载视频

4、产品定价参考


👇🏻学习、交流更多 AI 前沿知识👇🏻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/50606.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用Python实现Cmpp协议的教程

引言&协议概述 (CMPP)是中国移动为实现短信业务而制定的一种通信协议,用于在客户端(SP,Service Provider)和中国移动短信网关之间传输短消息,有时也叫做移动梦网短信业务。CMPP3.0是该协议…

嵌入式Linux学习: 设备树实验

设备树(DeviceTree)是一种硬件描述机制,用于在嵌入式系统和操作系统中描述硬件设备的特性、连接关系和配置信息。它提供了一种与平台无关的方式来描述硬件,使得内核与硬件之间的耦合度降低,提高了系统的可移植性和可维…

立创梁山派--移植开源的SFUD和FATFS实现SPI-FLASH文件系统

本文主要是在sfud的基础上进行fatfs文件系统的移植,并不对sfud的移植再进行过多的讲解了哦,所以如果想了解sfud的移植过程,请参考我的另外一篇文章:传送门 正文开始咯 首先我们需要先准备资料准备好,这里对于fatfs的…

【ESP32 IDF 软件模拟SPI驱动 W25Q64存储与读取数组】

目录 SPISPI介绍SPI时序代码编写(spi&w25q64) 代码调试 SPI SPI介绍 SPI(Serial Peripheral Interface,串行外围设备接口)是一种高速、全双工、同步的串行通信总线,常用于微控制器与各种外围设备&…

苍穹外卖浏览器前端界面修改

背景: 客户原始方案是期望做一个Spring Boot Vue的饿了么系统,但时间上太仓促,所以建议选择开源的苍穹外码目作为作业提交。 客户接受了建议的方案后,期望对前端页面做一些个性化的定制修改。 过程: 苍穹外卖简单介…

【HTML+CSS】HTML超链接:构建网页导航的基石

目录 什么是HTML超链接? 基本语法 示例 链接到另一个网页 链接到同一页面内的不同部分 常用属性 在Web开发的广阔世界中,HTML(HyperText Markup Language)作为网页内容的标准标记语言,扮演着至关重要的角色。而在…

重拾CSS,前端样式精读-函数(颜色,计算,图像和图形)

前言 本文收录于CSS系列文章中,欢迎阅读指正 在计算机编程中,函数有着重要的作用和意义,它可以实现封装,复用,模块化,参数等功能效果,在如何在CSS中写变量?一文带你了解前端样式利…

操作系统杂项(十)

目录 一、简述socket中select、epoll的使用场景和区别 1、使用场景 2、区别 二、epoll水平触发和边缘触发的区别 三、简述Reactor和Proactor模式 1、Reactor 2、Proactor 3、区别 四、简述同步和异步的区别,阻塞和非阻塞的区别 1、同步与异步 2、阻塞与非…

深入分析 Android ContentProvider (五)

文章目录 深入分析 Android ContentProvider (五)ContentProvider 的性能优化和实践案例1. 性能优化技巧1.1. 数据库索引优化示例:添加索引 1.2. 批量操作与事务管理示例:批量插入操作 1.3. 使用异步操作示例:使用 AsyncTask 进行异步查询 1.…

Linux:基础

一、安装 二、 一些组件 2.1 git管理 集中式版本控制系统:版本库是集中存放在中央服务器的,需要时要先从中央服务器取得最新的版本进行修改,修改后再推送给中央服务器。集中式版本控制系统最大的毛病就是必须联网才能工作,网速慢的话影响太大。 分布式版本控制系统:分布…

Linux网络-wget命令

作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注我,我尽量把自己会的都分享给大家,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 Linux服务器作为一个常用的网络服务器,主要的作用就是向客户端提供网络…

设计模式14-享元模式

设计模式14-享元模式 由来动机定义与结构代码推导特点享元模式的应用总结优点缺点使用享元模式的注意事项 由来动机 在很多应用中,可能会创建大量相似对象,例如在文字处理器中每个字符对象。在这些场景下,如果每个对象都独立存在&#xff0c…

PyCharm 2024.1.4:一站式教程与新特性解析

简介 PyCharm是由JetBrains开发的一款Python集成开发环境(IDE),自发布以来,凭借其强大的功能、智能的代码补全、广泛的插件支持和用户友好的界面,成为了Python开发者的首选工具之一。无论是数据科学、Web开发还是其他…

Redis - SpringDataRedis - RedisTemplate

目录 概述 创建项目 引入依赖 配置文件 测试代码 测试结果 数据序列化器 自定义RedisTemplate的序列化方式 测试报错 添加依赖后测试 存入一个 String 类型的数据 测试存入一个对象 优化 -- 手动序列化 测试存入一个Hash 总结: 概述 SpringData 是 S…

在 ArchLinux 上编译运行 axmol 引擎

本文将在 Windows 10 上安装 Arch WSL 中编译 axmol 请确保 WSL2 已正确安装 1. 在微软应用商店安装 ArchLinux 2. 打开 Arch,按照提示输入用户名和密码,尽量简单 3. 配置清华源,速度快的起飞,否则,各种包会安装失败…

光伏电站气象站:现代光伏系统的重要组成部分

光伏电站气象站,作为现代光伏系统的重要组成部分,集成了气象学、电子信息技术、数据处理与分析等多学科技术于一体,能够实时监测并记录包括温度、湿度、风速、风向、太阳辐射强度、降雨量在内的多种气象参数。这些数据不仅是评估光伏板发电效…

GLSL教程 第8章:几何着色器

目录 8.1 几何着色器的介绍 几何着色器的主要功能: 几何着色器的工作流程: 8.2 实现基本的几何变换 示例:将三角形扩展成多个三角形 8.3 几何着色器的高级应用 1. 粒子系统 2. 光晕效果 3. 线框模型 小结 几何着色器是图形管线中的一…

应用层自定义协议以及序列化和反序列化

文章目录 应用层自定义协议以及序列化和反序列化1、应用层自定义协议1.1、应用层1.2、协议 2、序列化和反序列化3、TCP 为什么支持全双工4、jsoncpp基础4.1、序列化4.2、反序列化 5、实现网络版计算器6、手写序列化和反序列化 应用层自定义协议以及序列化和反序列化 1、应用层…

爬取贴吧的标题和链接

免责声明 感谢您学习本爬虫学习Demo。在使用本Demo之前,请仔细阅读以下免责声明: 学习和研究目的:本爬虫Demo仅供学习和研究使用。用户不得将其用于任何商业用途或其他未经授权的行为。合法性:用户在使用本Demo时,应确…

智能算法驱动的爬虫平台:解锁网络数据的无限潜力

摘要 在信息爆炸的时代,网络数据如同深海宝藏,等待着有识之士发掘其无尽价值。本文将探索智能算法驱动的爬虫平台如何成为解锁这一宝库的关键,不仅剖析其技术优势,还通过实例展示它如何助力企业与开发者高效、稳定地采集数据&…