知识图谱 多模态学习 2024 最新综述

知识图谱遇见多模态学习:综述

论文题目:Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey

论文链接:http://arxiv.org/abs/2402.05391

项目地址:https://github.com/zjukg/KG-MM-Survey

备注:55 pages, 619 citations, 11 Tables, 13 Figures

机构:浙江大学,东南大学,牛津大学,爱丁堡大学,曼彻斯特大学,普渡大学

Task

目录

知识图谱遇见多模态学习:综述

引言

KG驱动的多模态(KG4MM)学习 (KG-driven Multi-modal Learning)

理解与推理任务 (Understanding & Reasoning Tasks)

分类任务 (Classification Tasks)

内容生成任务 (Content Generation Tasks)

检索任务 (Retrieval Tasks)

KG-aware多模态预训练 (KG-aware Multi-modal Pre-training)

多模态知识图谱(MM4KG) (Multi-modal Knowledge Graphs)

MMKG资源 (MMKG Resources)

MMKG资源

MMKG获取 (MMKG Acquisition)

KG 信息抽取

MMKG融合 (MMKG Fusion)

MMKG推理 (MMKG Inference)

MMKG驱动的任务 (MMKG-driven Tasks)

MMKG-driven 任务

挑战与机遇 (Challenges and Opportunities)

MMKG构建与获取 (MMKG Construction & Acquisition)

KG4MM任务 (KG4MM Tasks)

MM4KG任务

大型语言模型 (Large Language Models)


引言

本综述深入分析了2020至2023年间超过300篇文献,聚焦于两个主要方向:一是知识图谱驱动的多模态学习(KG4MM),探讨知识图谱如何支持多模态任务;二是多模态知识图谱(MM4KG),研究如何将知识图谱扩展到多模态知识图谱领域。作者从定义KGs和MMKGs的基本概念入手,继而探讨它们的构建和演化,涵盖KG-aware多模态学习任务(如图像分类、视觉问答)及固有的MMKG任务(如多模态知识图谱补全、实体对齐)。本文还强调了研究重点,提供了任务定义、评估基准,并概述了基本见解。通过讨论当前面临的挑战和评估新兴研究趋势,如大型语言模型和多模态预训练策略的进展,本调研旨在为KG与多模态学习领域的研究人员提供一个全面的参考框架,以及对该领域不断演进的洞察,从而支持未来的工作。

KG驱动的多模态(KG4MM)学习 (KG-driven Multi-modal Learning)

理解与推理任务 (Understanding & Reasoning Tasks)

KG4MMR

视觉问答 (Visual Question Answering)

视觉问答 Benchmark

视觉问题生成 (Visual Question Generation)

视觉对话 (Visual Dialog)

分类任务 (Classification Tasks)

图像分类 (Image Classification)

IMGC

IMGC Benchmark

假新闻检测 (Fake News Detection)

电影类型分类 (Movie Genre Classification)

内容生成任务 (Content Generation Tasks)

SG Generation

图像注释 (Image Captioning) 视觉故事讲述 (Visual Storytelling) 条件文本到图像生成 (Conditional Text-to-Image Generation) 场景图生成 (Scene Graph Generation)

检索任务 (Retrieval Tasks)

跨模态检索

跨模态检索 (Cross-Modal Retrieval) 视觉指代表达与定位 (Visual Referring Expressions & Grounding)

KG-aware多模态预训练 (KG-aware Multi-modal Pre-training)

结构知识感知预训练 (Structure Knowledge aware Pre-training)

知识图谱感知预训练 (Knowledge Graph aware Pre-training)


多模态知识图谱(MM4KG) (Multi-modal Knowledge Graphs)

N-MMKG Ontology

Taxonomy of MMKG tasks

MMKG资源 (MMKG Resources)

公开的MMKGs (Public MMKGs)

MMKG资源

MMKG构建方法 (MMKG Construction Methods)

MMKG获取 (MMKG Acquisition)

KG 信息抽取

多模态命名实体识别 (Multi-modal Named Entity Recognition)

MNER Benchmark

多模态关系抽取 (Multi-modal Relation Extraction)

MMRE Benchmark

多模态事件抽取 (Multi-modal Event Extraction)

MMEE Benchmark

MMKG融合 (MMKG Fusion)

多模态实体对齐 (Multi-modal Entity Alignment)

MMEA Benchmark

多模态实体链接与消歧 (Multi-modal Entity Linking & Disambiguation)

MMEL Benchmark

MMKG推理 (MMKG Inference)

多模态知识图谱补全 (Multi-modal Knowledge Graph Completion)

MKGC Benchmark

多模态知识图谱推理 (Multi-modal Knowledge Graphs Reasoning)

MMKG驱动的任务 (MMKG-driven Tasks)

MMKG-driven 任务

检索 (Retrieval)

预训练 (Pre-training)

科学交叉领域的AI应用(AI for Science)

行业应用 (Industry Application)

挑战与机遇 (Challenges and Opportunities)

MMKG构建与获取 (MMKG Construction & Acquisition)

KG4MM任务 (KG4MM Tasks)

多模态内容生成 (Multi-modal Content Generation)

多模态任务集成 (Multi-modal Task Integration)

扩展MMKG以适应多模态任务的挑战 (Challenges in Scaling MMKG for Multi-modal Tasks)

释放大规模MMKG在多模态任务中的潜力 (Unlocking the Potential of Large-Scale MMKGs for Multi-Modal Tasks)

MM4KG任务

MMKG融合 (MMKG Fusion)

MMKG推理 (MMKG Inference)

将多模态任务转化为MMKG范式 (Transfer Multi-modal Task into MMKG Paradigm)

应用多模态任务进行MMKG内任务增强 (Apply Multi-modal Task for In-MMKG Task Augmentation)

大型语言模型 (Large Language Models)

大模型微调 (Fine-Tuning)

大模型幻觉 (Hallucination)

大模型智能体(Agent)

大模型检索增强生成(Retrieval Augmented Generation (RAG))

大模型编辑 (Editing)

大模型偏好对齐 (Alignment)

MMKG精炼 (MMKG Refinement)

MMKG MoE

详细内容见原文:http://arxiv.org/abs/2402.05391

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/681860.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Unresolved reference: kotlinx 和 Unresolved reference:xxx

Unresolved reference: kotlinx 这个报错是因为build.gradle中忘记apply plugin了 apply plugin: kotlin-android-extensions如下 同步以后再次编译发现报错 Unresolved reference:xxx 是因为用于使用 Gradle 构建的 Kotlin 版本与 IDE 插件中的版本不一样的原因 解决方法 …

剪辑视频衔接怎么操作 剪辑视频衔接过渡自然方法 剪辑视频教程新手入门 抖音剪辑短视频 会声会影视频制作教程

视频剪辑在现代社交媒体和数字媒体时代中变得越来越重要。它广泛应用于各种领域,包括电影制作、广告宣传、教育培训、社交媒体内容创作等。 一、剪辑视频衔接怎么操作 会声会影是一款功能强大、易于使用的视频编辑软件。接下来我们拿会声会影为例讲解剪辑视频如何…

二叉树的垂直遍历

1.题目 这道题是2024-2-13的签到题,题目难度为困难。 考察的知识点是DFS算法和自定义排序。 题目链接:二叉树的垂直遍历 给你二叉树的根结点 root ,请你设计算法计算二叉树的 垂序遍历 序列。 对位于 (row, col) 的每个结点而言&#xff…

HotCoin Global: 澳洲双牌照持有平台,坚守全球合规之路

前言: 加密交易平台的合规性不仅是相关法规遵守的问题,更是市场透明度和用户公平性的关键。为促使加密市场的交易活动有规范、有秩序地进行,确保加密投资者的资产与交易安全,部分国家明确对加密资产的交易和经营活动进行监督及管…

C++ matplotlib 画图 Linux

Matplotlib-cpp画图 命令行下载matplotlibcpp git clone https://github.com/lava/matplotlib-cpp将matplotlibcpp.h移动到自己所用的工程 CMakeList.txt文件如下所示 cmake_minimum_required(VERSION 3.0.2) project(huatu)set(CMAKE_CXX_STANDARD 11)file(GLOB_RECURSE P…

生成树(习题)

模板】最小生成树 生成树有两种方法,但是我只会克鲁斯卡尔算法,所以接下来下面的的题目都是按照这个算法来实现的,首先来见一下生么是这个算法,在之前的我写的一篇博客中有题使叫修复公路,其实这一题就是使用了这个算…

Redis相关介绍

概念 Redis:非关系型数据库(non-relational),Mysql是关系型数据库(RDBMS) Redis是当今非常流行的基于KV结构的作为Cache使用的NoSQL数据库 为什么使用NoSQL 关系型 数据库无法应对每秒上万次 的读写请求 表中的存储记录 数量有限 无法简单…

JUC-java并发编程的艺术

一、并发问题 上下文切换:CPU通过时间片分配算法来循环执行任务,当前任务执行一个时间片后会切换到下一个任务。在切换前会保存上一个任务的状态,以便下次切换回这个任务时,可以再加载这个任务的状态。所以任务从保存到再加载的过…

MySQL:常用指令

MySQL官网 一、在Windows 系统 cmd窗口里执行的命令 启动:net start MySQL停止:net stop MySQL卸载:sc delete MySQL 二、在macOS系统终端里执行的命令 启动:mysql.server start停止:mysql.server stop重启:mysql.server restart 三、执行帮…

Qt:槽函数的五种写法

一、Qt4写法(不推荐) connect(ui.btnOpen,SIGNAL(clicked),this,SLOT( open() ) );因为是以宏定义的方式展开,所以如果SIGNAL写错,或者信号名字、槽函数写错、编译器是无法检验出来的,导致出现隐性BUG,不容…

【医学大模型 知识增强】SMedBERT:结构化语义知识 + 医学大模型 = 显著提升大模型医学文本挖掘性能

SMedBERT:结构化语义知识 医学大模型 显著提升医学文本挖掘任务性能 名词解释结构化语义知识预训练语言模型医学文本挖掘任务 提出背景具体步骤提及-邻居混合注意力机制实体嵌入增强实体描述增强三元组句子增强 提及-邻居上下文建模域内词汇权重学习领域自监督任务…

【项目】高并发内存池

高并发内存池 【项目】高并发内存池项目介绍这个项目做的是什么? 内存池相关知识池化技术内存池malloc 定长内存池的实现高并发内存池整体框架设计ThreadCache对齐规则封装FreeList类封装thread cache类TLS无锁访问 CenctralCache整体设计页号规定span结构SpanList结…

QQ强制聊天,加好友。临时会话接口跳转单页源码

QQ互动增强工具:一键聊天、加好友与临时会话 🔥 全新体验,轻松连接 🔥 在数字社交时代,QQ仍然是我们与亲朋好友、工作伙伴沟通的重要桥梁。但有时候,复杂的设置和权限障碍让简单的“加个好友”或“说句话…

【Linux学习】生产者-消费者模型

目录 22.1 什么是生产者-消费者模型 22.2 为什么要用生产者-消费者模型? 22.3 生产者-消费者模型的特点 22.4 BlockingQueue实现生产者-消费者模型 22.4.1 实现阻塞队列BlockQueue 1) 添加一个容器来存放数据 2)加入判断Blocking Queue情况的成员函数 3)实现push和pop方法 4)完…

FPGA模块——SPI接口设计

SPI接口设计 SPI基础代码模版1. SPI协议与芯片交互接口2. SPI协议的控制器(状态机) SPI基础代码模版 user输入: valid信号 , 要输出的值 输出 :一个周期读valid , 读到的值 module spi_drive#(parameter…

Vue源码系列讲解——模板编译篇【三】(HTML解析器)

目录 1. 前言 2. HTML解析器内部运行流程 3. 如何解析不同的内容 3.1 解析HTML注释 3.2 解析条件注释 3.3 解析DOCTYPE 3.4 解析开始标签 3.5 解析结束标签 3.6 解析文本 4. 如何保证AST节点层级关系 5. 回归源码 5.1 HTML解析器源码 5.2 parseEndTag函数源码 6. …

前端(二十七)——封装指南:Axios接口、常用功能、Vue和React中的封装技术

😊博主:小猫娃来啦 😊文章核心:前端封装指南:Axios接口、常用功能、Vue和React中的封装技术 本文目录 小引前端封装以真实项目举个例子 Axios接口封装常用功能封装封装 Vue中的封装技术React中的封装技术Vue和React封装…

Istio复习总结:xDS协议、Istio Pilot源码、Istio落地问题总结

1、xDS协议 1)、xDS是什么 xDS是一类发现服务的总称,包含LDS、RDS、CDS、EDS以及SDS。Envoy通过xDS API可以动态获取Listener(监听器)、Route(路由)、Cluster(集群)、Endpoint&…

Map和Set(哈希表)

目录 map: map说明: Map.Entry的说明:,v> Map 的常用方法: 演示: 注意: TreeMap和HashMap的区别 Set: 常见方法说明: 注意: TreeSet和HashSet的区别 哈希表: 冲突&a…

19 删除链表的倒数第 N 个结点

19. 删除链表的倒数第 N 个结点 中等 相关标签 相关企业 提示 给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 这段代码使用了双指针的方法,其中一个指针先走 n 步,然后两个指针一起走,直到第一…