5月10日凌晨,著名语音生成式AI平台ElevenLabs在社交平台宣布,推出文本生成歌曲产品ElevenLabs Music。
从其展示的效果来看,音乐的节奏感、和声、乐器的搭配、情感表达、创意性、风格的多样性、高/低音,可媲美该领域的两款头部产品Suno和Udio。
特别是人声独唱部分,清晰度、拟人化和乐器的融合度超过了那两款产品。这是因为ElevenLabs就是靠语音克隆起家的,在研究人声方面更专业,并且积累了海量超29种语言的语音,为训练AI模型提供了极大帮助。
本以为Sora的出现会改变影视、游戏领域的创作方式,没想到最先被变革的却是音乐领域,铁了心要砸音乐人的饭碗。
Suno、Udio、ElevenLabs Music产品对比
ElevenLabs Music在社交平台展示了通过文本生成的多首音乐。
歌曲名:《伤透我的心》
文本描述:平滑的当代 R&B 音乐,带有微妙的电子元素,拍子为 104 BPM 的鼓机节拍,过滤的合成器,华丽的电钢琴和高亢的弦乐,营造出亲密的氛围。
歌曲名:《我的爱》
文本描述:90年代摇滚风格,沧桑的嗓音结合清晰的吉他,强劲的鼓点和突出的贝斯线,中等的 120 BPM 节奏,混合亢奋的情绪唤起怀旧和希望的感觉。
下面在给大家听两首Suno和Udio生成的歌曲,来评价下这三家平台各自的产品特点。
Udio生成的是一首女声摇滚风格,关于爱情的歌曲。
Suno生成的一首怀旧摇滚风格,是关于描述区块链、AI、数字金融的歌曲。
这里可以明显听出来,ElevenLabs Music的人声更通透、清晰一些。
如果没有人提醒,相信多数人很难能听的出来上面所有音乐是AI自动生成的吧。这些产品可以帮助普通人实现当“歌手”的梦想,你只需要写出详细的歌曲文本描述,其他的交给AI即可。
此外,对于那些需要创作灵感的专业音乐人来说帮助也是巨大的,可以从AI生成的音乐中找出创作灵感。其实早期的80、90年代的歌坛就是互相借鉴来创作出不同的音乐作品。
ElevenLabs介绍
ElevenLabs是一家「AIGC开放社区」介绍多次的生成式AI语音平台,由前谷歌工程师Piotr Dąbkowski 和Palantir部署策略师Mateusz Staniszewski于2022年共同创立。曾在今年1月22日获得8000万美元B轮融资。
ElevenLabs的主打产品有语音克隆、文本转语音、AI配音等,支持中文、英文、日文、韩文等29种主流语言。
产品免费体验地址:https://elevenlabs.io/text-to-speech
语音克隆:用户只需上传一段1分钟—30分钟的样板音频,ElevenLabs就能生成几乎和原声一模一样的音频。例如,上传一段西游记孙悟空的语音,用户便可以提取其音频用在别的地方。
文本转语音:用户输入文本,就能生成29种语言、120种不同类型的语音,并且在情感、节奏方面非常好机器感很少。
AI配音:这是ElevenLabs最新推出专门针对电影、长音频领域的产品,可实现端到端的高保真音频。
此外,ElevenLabs还提供了一个语音库,用户可以将自己生成的音频或声音与其他人分享来换取报酬。未来,通过Music生成的音乐,也可以通过该平台进行分享。
目前,ElevenLabs Music处于早期预览版,全面开放测试后「AIGC开放社区」会第一时间告诉大家。
本文素材来源ElevenLabs社交平台、官网,如有侵权请联系删除
END