1. RichHF-18K 论文地址 解决问题: 如何对生成图质量进行算法评价,以优化图片质量,提升模型生成能力 解决思路: 参考多模态模型,构建评价模型,从7个维度分三个分支对生成图进行测评: Tips: 预测keyword misalignment sequence时,是通过修改输入的prompt,在针对图文不符的相应词汇后加上_0Implausibility/misalignment是通过热力图实现,打标只需要标注中心点,通过高斯热力图形成heat map该模型可用于筛选高质量图片,或作为模型训练时的guidance