本文背景
用AI工作这么久了,我经常碰到各种关于AI的问题,比如制作让照片中人物开口说话的数字人。
很多小伙伴想知道是怎么弄的,不知从何下手。不过不用担心,今天就给大家带来三种实用的方法,快来一起试试吧。
首先是腾讯智影
步骤如下:
第一步:制作人物照片
第二步:写文案
第三步:合成视频
网址是https://zenvideo.qq.com/。
打开智影后,点击数字人播报模块。
选择照片播报 - 本地上传,将制作好的照片传上去。
这里推荐用即梦(https://jimeng.jianying.com/)生成的照片,效果挺不错。
接着在 灵想AI 中编辑口播文案,复制到右侧栏,选好声音和语速,需要停顿就插入停顿,然后点击合成视频。
不过要注意,智影在小孩子声音选择方面少得可怜,甚至可以说几乎没有,这就导致配音有时会很出戏,而且整体效果比较一般。
但如果对质量要求不高,只是想让人物开口说话,那也算是个可用的选择。
D - ID
步骤为:
一、先制作人物照片
二、写文案
三、然后在剪映中制作台词音频
四、最后合成视频
制作人物照片步骤这里就省略啦
文案可以用之前准备好的。这一步来到剪映专业版(电脑版)
点击文本 - 新建文本,将文本插入进度条
再插入右侧文本中
点击朗读 - 选择小萝莉音,一定要记得点击「开始朗读」,这样才能真正将音色和文本融合。
试听没问题后,点击导出,去掉视频导出的对勾,选择音频导出(默认 mp3 格式)。
之后来到 D - ID 官网(https://studio.d - id.com/,注意需要突破网络限制哦)
打开主页 Create - 视频
在化身处上传制作好的人物图片
传好后点击脚本 - 音频 - 上传音频,将刚才制作的文本音频文件上传
最后点击生成视频,稍等片刻就大功告成啦。
看看效果,是不是比智影好多了呢?
不过免费版有水印,如果觉得效果好,可以考虑充值。
有些朋友可能会抱怨收费问题,但大家要知道,如今所有免费工具都有商业化的趋势。
资本不是慈善机构嘛。而且从目前众多 AI 工具来看,收费的往往效果会更好一些,当然,是否选择付费就看大家自己的情况啦。
Hedra
如果觉得 D - ID 效果不错但收费让你不爽,那就来试试它吧,目前它在免费公测阶段,中文名叫海德拉
网址是https://www.hedra.com/
无需突破网络限制,直接打开就能用。
制作照片和文案的步骤这里就不多说了,进入后直接选择 Create 开始生成。
步骤和 D - ID 差不多,可以提前做好音频或者使用网站生成的音频。
不过要注意,海德拉不接受未成年人的照片,这可能是出于对未成年人的保护。
在导入音频和照片(这里建议使用成年人照片)后
右下角点击生成
但它也有个小问题,我感觉人物的动作幅度和表情像是按照欧美人的状态设计的,所以如果是中国人的脸,看起来会有点出戏,换张脸可能会更和谐。
总结
让照片开口说话,本质上是一种数字人效果。
目前市面上效果相近的数字人大多是收费的,我还没发现效果好又免费的,如果你们知道,可一定要告诉我。
要是想追求更加立体、真实的效果,飞影、万兴播爆、商汤如影、快剪、剪影的数字人等都可以尝试一下。
经常有粉丝问哪种工具最好用,其实在这个快速发展、竞争激烈的时代,没有绝对的最好,变化太快了,我只能把自己用过觉得不错的工具推荐给大家。
好啦,今天的分享就到这里了,还有不懂的再来私我吧。
本文由 mdnice 多平台发布