Overview
- 多模态大模型关于RLHF的代表性文章
- 一、LLaVA-RLHF
- 二、RLHF-V
- 三、SILKIE
多模态大模型关于RLHF的代表性文章
一、LLaVA-RLHF
题目: ALIGNING LARGE MULTIMODAL MODELS WITH FACTUALLY AUGMENTED RLHF
机构:UC伯克利
论文: https://arxiv.org/pdf/2309.14525.pdf
代码:https://llava-rlhf.github.io/
任务:
特点:
方法:
前置相关工作:
二、RLHF-V
题目:RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from Fine-grained Correctional Human Feedback
机构:清华,新加坡国立
论文ÿ