14天
本节学了基于MindNLP+MusicGen生成自己的个性化音乐。
MusicGen是来自Meta AI的Jade Copet等人提出的基于单个语言模型的音乐生成模型,能够根据文本描述或音频提示生成高质量的音乐样本。
MusicGen模型基于Transformer结构,可以分解为三个不同的阶段:
1.用户输入的文本描述作为输入传递给一个固定的文本编码器模型,以获得一系列隐形状态表示。
2.训练MusicGen解码器来预测离散的隐形状态音频token。
3.对这些音频token使用音频压缩模型(如EnCodec)进行解码,以恢复音频波形。
通过以下步骤生成了自己的个性化音乐
1.下载模型
2.生成音乐
2.1无提示生成
2.2文本提示生成
3.生成配置
通过MindNLP+MusicGen及关键词生成需要的音乐。