目录
引言
使用半精度
使用CPU卸载
使用Better Transformer
使用Flash Attention 2
安装
使用
组合优化技术
使用技巧
BarkConfig
实例化 BarkConfig
参数说明
BarkProcessor
参数
__call__ 方法
from_pretrained 方法
save_pretrained 方法
BarkModel
生成语音
示例
启用 CPU 卸载
参数
BarkSemanticModel
forward 方法
参数
BarkCoarseModel
forward 方法
参数
BarkFineModel
forward 方法
参数
BarkCausalModel
forward 方法的参数
BarkCoarseConfig
参数
示例:
BarkFineConfig
参数
示例:
BarkSemanticConfig
参数
示例:
引言
Bark是由Suno AI提出的基于变换器的文本到语音模型,它包括四个主要模型:
- BarkSemanticModel(文本模型):一个因果自回归变换器模型,它接收被标记化的文本作为输入,并预测捕捉文本含义的语义文本标记。
- BarkCoarseModel(粗糙声学模型):一个因果自回归变换器,