虚拟数字人及AI相关应用分享

一、虚拟数字人

1、简介

        虚拟数字人可分为基础类和仿真智能类。可用于直播的,一般是仿真智能类;基础类动作缓慢,体验差,很容易被直播平台封号。

        目前各大短视频平台上介绍的数字人,出于营销目的,有夸大宣传的情况。很多声称几百元领回一个数字人,大多是使用提前录制或生成的视频,而非通过建模学习的数字人,更无法进行人机对话。

        仿真写实类数字人,不但可以预测嘴唇的动作,还可以用文字合成语音来表达,整个虚拟数字人的面容、身体、声音、动作生成均由AI实现,具有真人质感、辨识度高、互动性强的特点。数字人形象分为标准定制两种。其中定制形象可根据真人比例制作,包括动作和声音学习等。

        由于数字人全套软硬件设备等投入费用较高,目前市面上流行的玩法,初期找服务商购买数字人服务,降低运营成本。等到测试数字人直播结果适合自己,且达到理想的投入产出比后,再考虑搭建全套的数字人配套设施。

2、场景及应用

        可用于短视频直播。短视频可用于视频号中企业形象或产品宣传;直播主要用于带货,数字人直播本质只是一种工具,它能解决效率问题,但并不能很好地解决流量问题

        目前市面上的数字人直播,都是用于辅助形为,比如将数字人用于流量较差的深夜时段直播,晚间黄金时间段仍然由真人主播进行带货讲解。

        直播需要通过电脑端数字人直播软件来实现,提前设置好直播间常见问题和答案,可以通过捕捉关键词模式自动回答问题。数字人开播方式:
(1)文本驱动,输出声音为AI声音,需提前编辑好直播文本;
(2)音频驱动,输出声音为真人声音,需要提前录制好声音文件;
(3)真人驱动,真人在后台说话驱动数字人口型进行直播,实时互动。

        当前各大直播平台对数字人带货的规则限制各有不同,比如美团较松、抖音平台要求最严,经常会被封号。封禁理由一般有互动回答问题不智能,影响客户体验;发现有重复数字人形象在不同商家中使用,涉嫌违规。还有一种24小时使用数字人直播,无真人在线运营等,也会被封号。

3、投入预算及费用

        目前数字人算力大模型中,百度和京东已经完成电脑端和手机安卓端的研发使用,很多数字人工厂平台也是接入他们的系统。腾讯、阿里也在数字人上有投入,主要在电脑端。

        另外,南京本地数字人原创企业中,南京硅基智能科技有限公司是最早一批做数字人,且通过自研产品取得成功的代表。该企业先后被评为国家级专精特新“小巨人”企业和南京人工智能独角兽企业。

        以下是南京硅基智能科技有限公司有关数字人的参考价格:

序号

项目

价格

定制周期

备注

1

形象克隆

8000元/年

3个工作日

包含1个形象克隆+赠送500分钟视频合成时长(有效期1年);不包含声音克隆,【用系统的AI声音】或【自己传录音】

2

声音克隆

15000元/年

5个工作日

1个声音克隆+赠送5000分钟音频合成时长(有效期1年);不包含形象克隆,还原度较高,接近真人声音,若自身带口音等,会适当存在机械感

3

数字人直播

5500元/月

内置30个免费的数字人模特选用,如需选用硅语平台其他数字人另加1999/个*年,如需定制专属形象另加8000元/个*年

4

季度直播

19800元/季

三个月直播+赠送一个数字人形象克隆名额

5

直播机

9000元

预估一次性投入,也可自行配置高配电脑。

        如果前期只尝试做数字人短视频,也可以选择第三方的AI工具,例如万兴科技的“万兴播爆”,输入文案,可一键生成“真人”营销视频。购买年度会员(998元/年),可导出360分钟的视频。

综合来看,数字人短视频和直播每年需投入至少10万元,且不包含电脑硬件、运营人员费用等。

二、AI在其他方面的应用

        AI在其他方面的应用相对较广,但大多数仍处于发展阶段,可作为文案和设计等人员的辅助工具,用于提高工作效率。离替代人工还有相当长的差距。

1、生成文案

        除了国外的ChatGPT,国内百度的“文心一言”和阿里的“通义千问”也都很成功,能够根据用户需求生成对应的策划方案稿等。中文方面,后者较ChatGPT更出色。但不管是哪类AI生成的文稿,目前来看也只能做为极好的参考资料,仍需要人工来分析、编辑加工、再创作。AI可有效节约文案工作者的时间。

2、编写程序

        主要是针对程序员编写代码方面,可根据需求自动生成相关代码,由程序员来进行二次编辑修改利用,可快速提高开发效率。

3、生成图片

        针对图形图像设计师,可根据用户需求描述,生成图像设计稿供设计师参考,开拓设计思路,节约基础设计时间。

AI生成图片的技术主要依赖于深度学习和生成对抗网络(GAN)。以下是一些常用的AI生成图片工具:

    DeepDream:由Google开发,可以将一张图片转换成类似于迷幻艺术的图像。

    StyleGAN:由NVIDIA开发,基于GAN的图像生成算法,尤其擅长生成人脸图片。

    DALL-E:由OpenAI开发,基于GAN的图像生成算法,可以根据文字描述生成各种图像。

    ArtBreeder:一款在线艺术创作平台,使用GAN算法和进化算法生成各种图像,可以通过调整参数生成不同的艺术风格。

此外还有一些设计软件,比如Pixso、Adobe Express 中的文字生成图像功能,也可以根据文字描述来生成出色的图像。

4、生成视频

        针对视频制作者(例如我们的摄影师),有些工具可以帮助他们通过输入文字内容,快速生成高质量的视频。以下列举一些软件,暂不作深入介绍。

  1. D-ID:使创作者能够生成逼真的 AI 角色;
  2. Pictory:可将文字内容转变成短视频;
  3. Deepbrain:使用文本即可生成逼真的 AI 视频;
  4. Opus Clip:利用AI将长视频调整为短视频;
  5. 万兴播爆:输入文案,一键生成“真人”营销视频;
  6. Synthesia:基于ChatGPT的文本到视频生成器

5、获客

        通过AI技术,企业可以分析客户的行为和需求,制定更加精准的营销策略,提高获客效率和质量。同时,AI还可以自动化一些重复性的获客任务,如客户数据整理、初步筛选等,从而减轻人工劳动力负担。以下是一些常见的AI获客工具:

(1)AI智能销售机器人:可模拟销售人员的行为,自动与潜在客户进行沟通、答疑和推荐产品。

(2)AI客户画像工具:可通过分析和挖掘潜在客户的行为、兴趣、需求等,构建精准客户画像。

(3)AI智能推荐系统:可根据潜在客户的历史行为、偏好和兴趣等数据,智能推荐符合其需求的产品或服务。最常见的是电商类购物网站,已经在使用。

(4)AI语音识别和语音合成工具:可以通过语音识别和语音合成技术,实现与潜在客户的语音交互,提供便捷和个性化服务。

AI获客较多应用于金融行业、零售行业(电商平台、实体店铺等)、教育行业(在线教育平台、培训机构等)、医疗行业(智能问诊等)。

        然而,AI技术并不能完全取代人工获客团队。人工获客团队在与客户沟通、建立信任关系、提供个性化服务等方面具有独特优势,这是AI技术难以替代的。此外,人工获客团队还可以根据市场变化和客户需求,灵活调整营销策略和方案,确保获客效果的最大化。

三、总结

        综上所述,有关AI应用,总结为三个方面:

(1)虚拟数字人在短视频和直播带货方面,可以给企业相应岗位的人员带来方便,节约时间,提高效率。成本和性价比需结合我们具体的需求来做评估。

(2)AI获客方面,需要结合自身的实际情况和目标,合理配置AI获客团队和人工获客团队,充分发挥两者的优势,实现获客效果的最大化。我们是否适合,与具体需求是分不开的

(3)AI生成文案、图片、视频、代码等,此类生成的结果目前仍只能作为备用参考素材,需要人工编辑加工再创作。例如我们人事部、行政部、设计部等同事,可以结合自身工作需求,利用相关AI工具提高工作效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/11507.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

代码随想录35期Day38-Java(Day37休息)

Day38题目 LeetCode509.斐波那契数列 核心思想:很简单dp[i]dp[i-1]dp[i-2].这里用了数组存储的形式,也可以递归 class Solution {public int fib(int n) {int[] dp new int[n2];dp[0] 0;dp[1] 1;for(int i 2 ; i < n ; i ){dp[i] dp[i-1] dp[i-2];}return dp[n];} …

go语言冒泡排序算法之泛型实现 支持整型,浮点型和字符串排序 golang bubble sort general

冒泡排序是一个比较经典的基础算法&#xff0c; 是学习编程的同学们所必备的算法之一&#xff0c;今天就介绍一个go语言里面使用泛型实现的冒泡排序算法&#xff0c; 支持字符串 string&#xff0c;数字 int float 等的排序。 在go语言中通常我们在进行数据比较时都是使用的c…

prophet时间序列模型水质预测应用

前言 此前已经分析了&#xff0c;ARIMA 模型在水质预测中的应用&#xff0c;今天用 prophet 模型测试下在水质预测中的效果。 Prophet 简介 Prophet 是 Facebook 于2017年开源的一个时间序列预测框架&#xff0c;特别适合于处理具有明显趋势性和季节性的数据。该模型设计初衷…

领略Java内部类的“内部”

内部类有两种情况&#xff1a; (1) 在类中定义一个类(私有内部类&#xff0c;静态内部类) (2) 在方法中定义一个类(局部内部类&#xff0c;匿名内部类) 1、私有内部类 —— 在方法之间定义的内部类&#xff0c;非静态 我们首先看看类中内部类的两个特点&#xff1a; (1) 在外部…

springboot3项目练习详细步骤(第三部分:文章管理模块)

目录 发布文章 接口文档 业务实现 自定义参数校验 项目参数要求 实现思路 实现步骤 文章列表(条件分页) 接口文档 业务实现 mapper映射 更新文章 接口文档 业务实现 获取文章详情 接口文档 业务实现 删除文章 接口文档 业务实现 文章管理业务表结构…

数据可视化训练第6天(美国人口调查获得关于收入与教育背景的数据,并且可视化)

数据来源 https://archive.ics.uci.edu/dataset/2/adult 过程 首先&#xff1b;关于教育背景的部分翻译有问题。 本次使用字典嵌套记录数据&#xff0c;并且通过lambda在sorted内部进行对某个字典的排序&#xff0c;最后用plotly进行绘图 本次提取数据的时候&#xff0c;用到…

ubuntu server 22.04.4 系统安装详细教程

本教程使用vmware workstation 17创建虚拟机进行安装演示&#xff0c;安装方式和真机安装没有区别。 1、下载镜像 下载ubuntu server版本系统镜像&#xff0c;官网下载地址&#xff1a;https://cn.ubuntu.com/download/server/step1 注意&#xff1a;自己下载时需要确认是否是…

MySQL索引的存储结构

2.3.2. 索引存储结构 索引存储结构有堆表和索引组织表两种方式。 堆表和索引组织表有什么区别&#xff1f; 堆表&#xff1a; 数据和索引是分开存放的&#xff0c;索引是排序后的&#xff0c;但堆数据是无序的进行的都是随机访问&#xff0c;索引的叶子节点中存放的是数据在…

基于springboot + vue 实现的简易博客系统

项目效果图 登陆页面 文章列表 发表文章 用户管理 栏目管理 数据统计 后端技术栈后端主要采用了&#xff1a; 1.SpringBoot 2.SpringSecurity 3.MyBatis 4.部分接口遵循Restful风格 5.MySQL 前端技术栈前端主要采用了&#xff1a; 1.Vue 2.axios 3.Elemen…

每周一算法:传递闭包

题目描述 不等式排序 给定 n n n个变量和 m m m个不等式。其中 n n n小于等于 26 26 26&#xff0c;变量分别用前 n n n 的大写英文字母表示。 不等式之间具有传递性&#xff0c;即若 A > B A>B A>B 且 B > C B>C B>C&#xff0c;则 A > C A>C …

GPU prompt

提问&#xff1a; GPU是如何与CPU协调工作的&#xff1f; GPU也有缓存机制吗&#xff1f;有几层&#xff1f;速度差异是多少&#xff1f; GPU渲染流程有哪些阶段&#xff1f;他们的功能分别是什么&#xff1f; Early-Z技术是什么&#xff1f;发生在哪个阶段&#xff1f;这个…

Cocos 2048从创建到发布上线

二、审核通过之后上线流程 代码通过审核之后&#xff0c;会通过站内信和微信消息发送通知&#xff0c;在管理后台&#xff0c;点击提交发布&#xff0c;去备案

ensp简单ac+ap+sta无线配置和脚本

接入交换机与ap连线配置: interface E0/0/5 port link-type trunk port trunk pvid vlan 10 port trunk allow-pass vlan all配置AC的IP配置&#xff1a; [AC]Vlan 2 创建vlan 2 [AC]interface Vlanif 2 进入vlan 2 [AC-Vlanif2]ip address 192.168.80.3 24 设置一个IP地址…

File类~路径、创建文件对象

路径分为相对路径&#xff08;不带盘符&#xff09;&#xff0c;绝对路径&#xff08;带盘符&#xff09; 路径是可以存在的&#xff0c;也可以是不存在的 创建文件对象的三个方法&#xff1a;

IDEA-SpringBoot项目启动类位置错误导致启动报错

文章目录 前言&#xff1a;本文为SpringBoot项目启动类位置错误导致启动报错解决方案 笔者在初学SpringBoot项目时遇到过因启动类位置错误导致项目启动报错现象&#xff0c;总结如下&#xff1a; SpringBoot启动发送请求后遇到如下错误&#xff1a; Postman界面信息&#xff1…

速了解及使用布隆过滤器

布隆过滤器 介绍 概念&#xff1a;是一种高效查询的数据结构 作用&#xff1a;判断某个元素是否在一个集合中。&#xff08;但是会出现误判的情况&#xff09; 实现原理 加入元素&#xff1a; 当一个元素需要加入到布隆过滤器中时&#xff0c;会使用一组哈希函数对该元素进…

个人模拟面试java2

文章目录 SQL如何进行优化数据库性能调优1. 性能评估2. 确定调优目标 3. 监控和分析4. 硬件和配置调优5. 数据库设计和模式优化6. 查询优化7. 并发控制8. 缓存策略9. 定期维护10. 监控和持续调优 Redis支持哪些数据类型&#xff1f;Redis如何实现持久化&#xff1f;如何解决Red…

☀️提高生产力:这10个Lambda表达式必须掌握!!!

1.使用Lambda表达式进行集合遍历 ❌ 未使用Lambda表达式: List list Arrays.aslist("apple", "banana", "orange"); for (String fruit : list) {System.out.println(fruit); }✅使用Lambda表达式: List list Arrays.aslist("apple&qu…

Dubbo为何放弃JDK SPI机制:一探究竟

引言 在当今的软件开发领域&#xff0c;随着微服务架构的普及和服务化治理的需要&#xff0c;Dubbo作为一款优秀的分布式服务框架&#xff0c;扮演着至关重要的角色。Dubbo以其强大的功能和易用性成为了众多企业和开发者的首选。然而&#xff0c;在Dubbo的设计中&#xff0c;我…

JVM调优:JVM运行时数据区详解

一、前言 Java运行时数据区域划分&#xff0c;Java虚拟机在执行Java程序时&#xff0c;将其所管理的内存划分为不同的数据区域&#xff0c;每个区域都有特定的用途和创建销毁的时间。 其中&#xff0c;有些区域在虚拟机进程启动时就存在&#xff0c;而有些区域则是随着用户线程…