目录
引言
使用例子
AltCLIPConfig
参数
示例
AltCLIPTextConfig
参数详解
示例
AltCLIPVisionConfig
参数详解
示例
AltCLIPProcessor
参数
方法
示例使用
AltCLIPModel
前向传播方法 forward
返回值
示例使用
AltCLIPTextModel
方法 forward
返回值
示例使用
AltCLIPVisionModel
方法 forward
返回值
示例使用
引言
AltCLIP模型是一种为了扩展语言能力而修改CLIP中语言编码器的神经网络模型。具体而言,AltCLIP通过将CLIP的文本编码器替换为预训练的多语言文本编码器XLM-R,实现了对图像-文本对和文本-文本对的训练。这种改变使得AltCLIP不仅在几乎所有任务上都能达到与原始CLIP非常接近的性能,而且还扩展了原始CLIP的能力,如多语言理解。
该模型所属的任务可以被归类为双