开源开放 | 一个融合多元关系和事件表示的金融领域本体模型FTHO(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/ftho

开放许可协议:GPL 3.0

贡献者:武汉科技大学(高峰、郑丽丽、顾进广)


摘要

在此开放资源中,面对金融领域多元关系表示的困境和时序事件表示需求,我们以OWL语义为基础,结合金融领域专业知识,融合超图概念和事件5W(When,where,Why,What,WHo)定义构建了可通用化的金融时序超图本体模型(Finanical Temporal Hypergraph Ontology,FTHO)。

1. 前言:超图与事件表示

知识图谱以<s,p,o>三元组的形势存储数据,使用Ontology对知识框架进行描述,因为知识图谱灵活的图结构,近年来,基于其在金融领域智能问答、语义搜索、辅助决策、智能分析等应用得到了关注。

但在传统的图结构中,两点之间的连接只能表示一对节点之间的二元实体关联,这种结构对现实金融领域中复杂多元关系表示能力较弱,例如,金融领域的(债券)共同担保关系,若以普通图表示这种关系,则多个担保者之间的“共同”性被削弱。

同时,现有知识图谱以静态的实体为核心,世间万物瞬息变化,现实世界中不断在发生着各类事件,动态的事件为社会实践提供参考并承载更深层次的信息。例如,投资者要参考公司以往发生的事件来评估公司的投资风险;股价的多次涨跌可能有相同规律性。因此,对时序事件的通用化表示也是金融领域的重要需求。

基于现有问题,本文提出了金融时序超图表示模型,主要分为两点:一是将现实世界复杂多元关系抽象为拓扑结构,根据超图理论,结合OWL语义建立金融超图表示模型;二是结合事件五元组5W(When,where,Why,What,Who)定义,提出一种通用化时序事件表示模型。接下来,将依次对这两方面的相关工作进行介绍。

2. 资源构建及概况

金融时序超图FTHO表示模型分为超边模型、普通图拓扑表示模型和事件时序表示三个部分,将现实世界中的复杂多元关系抽象为拓扑结构,不仅兼容金融领域多元关系,同时以超图模式建立索引,提高检索效率。

(1)超边定义

超图中的超边是属于该边的普通任意数目节点的聚合,借鉴与RDF中容器的表示方法,根据超边内节点特性,将超边分为无序超边、有序超边和选择超边三类,分别基于rdf中的相应容器进行定义,如图1。

a7cf0668f8d60f39472f2619d3c52211.png

图1 金融时序超图中的超边定义

(2)构成超边的普通图拓扑结构

构成超图的普通边是具有传递性的边和具有共指性的边所形成的边的集合(子图),我们称这些普通边为“超边成份边”。超边成份边的传递性基于OWL提供的边的传递性(owl:TranstiveProperty)提供,共指性通过多边指向同一节点或来自同一节点得出。传递性边可形成链状子图或环状子图(图2a、2b),共指性边可形成星型内向子图或星型外向子图(图2c、2d)。同时,由于传递性边具有方向,其形成的链状或环状子图可能形成有序或无序超边(图3a、3b)。最后,根据传递性或共指性边是否可以存在于多个子图中,我们将构成超边的成份边分为融合成份边和共享成份边两类,其中融合成份边指其形成的链、环、星状子图中的任意一条成份边与其形成的超边之间不存在多对一关系(图4a);而共享成份边指其子图中的成份边与其形成的超边之间存在多对一关系,即成份边可为多个子图共享,如图4b中V2指向V7的成份边可为E1、E2、E3超边共享。

4e9096c6450f2907dfa97a628c7afcb2.png

图2 普通图特殊拓扑结构

005a49d3ea2176ad015a2bc59032090e.png

图3 普通图特殊拓扑结构构建超边

efab920ec3765f3170b4bae8d11f0f21.png

图4 融合超边和共享超边

根据构成超边拓扑结构的普通边特性,金融时序超图的超边成份边定义如图5所示

f2fc080ec266e7252d7783c84136a21a.png

图5 金融时序超图的普通边定义

(3)事件时序表示

本文依据事件5W(When,Where,Why,Who,What)概念,将事件知识概括为事件元数据(包含时间信息在内)和事件内容两部分,其中事件元数据(包含事件概念本身)利用现有本体模型进行描述,包括使用GeoSparql来表示空间信息,使用OWL-Time来表示时间信息;而通过hasEventPayload用于描述事件内容,事件内容同样表示为一个无序集合(rdf:Bag),其中包含一系列的rdf:Statement用于表述事件知识,每个rdf:Statement使用三元组形式存储不可再分的事件原子内容。这样,事件的内容可以是任何三元组知识。金融时序超图事件时序表示模型如图6所示。

06b9b5a933c89b1dd88f7577a2b51c68.png

图6 金融时序超图事件时序表示模型

(4)实验验证

为验证FTHO模型的通用性和灵活性,我们记录了三个现实场景通过普通边方式和超边方式SPARQL检索所需要的时间,时间对比如图7所示。

d9ab2bc745c454f2c8384e054f97dbe8.png

图7 普通边与超边检索时间对比

3. 资源用途

对于构建后的资源,我们可以从以下几个方面进行利用:

(1)用于结合领域知识,标识金融领域中可以形成多元关系的各种二元关系;

(2)利用推理机,对标注为超边成分边的二元、时序关系进行推理,构建多元时序关系;

(3)结合金融领域风控等应用,实现基于多元时序金融知识的应用落地。

4. 总结

在本开放资源中,从金融领域实际应用场景出发,扩展现有知识图谱表示机制,构建了金融时序超图(FTHO)。将现实场景中复杂的多实体关联关系抽象为拓扑结构,并根据其结构特性,建立拓扑子图的二元构成边节点映射超边的规则集,其次,本文结合事件5W概念建立了通用化的金融时序事件表示模型。为金融领域多元、时序事件表示困境提供了解决方案,促进金融领域人工智能系统的进步。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

20a5cd5e9aaaa51f4c4a1ab485a7cab1.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477901.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 114. 二叉树展开为链表(递归)

1. 题目 给定一个二叉树&#xff0c;原地将它展开为链表&#xff08;右侧路径&#xff09;。 例如&#xff0c;给定二叉树1/ \2 5/ \ \ 3 4 6 将其展开为&#xff1a;1\2\3\4\5\6来源&#xff1a;力扣&#xff08;LeetCode&#xff09; 链接&#xff1a;https://leet…

论文浅尝 - CIKM2021 | DT-GCN: 一种双曲空间中的数据类型感知的知识图谱表示学习模型...

论文作者&#xff1a;申雨鑫&#xff0c;天津大学硕士发表会议&#xff1a;CIKM 2021链接&#xff1a;https://dl.acm.org/doi/pdf/10.1145/3459637.3482421动机知识图谱表示学习旨在将实体和关系编码到一个连续的低维向量空间中。大多数现有方法主要在欧氏空间中学习结构三元组…

NLP太难学了!?吃透NLP的方法来拿走

最近有粉丝私信我&#xff0c;NLP很难学&#xff0c;这条路能坚持走吗&#xff1f;有相同困惑的朋友可以一起探讨一下&#xff1a;大佬你好&#xff0c;我目前从事ERP运维工作&#xff0c;想转行NLP&#xff0c;开始是学数据结构和c刷了些leetcode题&#xff0c;然后把cs224n和…

LeetCode 1161. 最大层内元素和(层序遍历)

1. 题目 给你一个二叉树的根节点 root。设根节点位于二叉树的第 1 层&#xff0c;而根节点的子节点位于第 2 层&#xff0c;依此类推。 请你找出层内元素之和 最大 的那几层&#xff08;可能只有一层&#xff09;的层号&#xff0c;并返回其中 最小 的那个。 示例&#xff1…

图谱实战 | 京东商品图谱构建与实体对齐

转载公众号 | DataFunTalk 分享嘉宾&#xff1a;赵学敏博士 京东科技编辑整理&#xff1a;蔡丽萍 TRS出品平台&#xff1a;DataFunTalk导读&#xff1a;在电商企业采购和运营过程中&#xff0c;如果要想掌握商品的实时价格等行情信息&#xff0c;就需要对齐各个电商网站的商品…

Quartz应用与集群原理分析

一、问题背景 美团CRM系统中每天有大量的后台任务需要调度执行&#xff0c;如构建索引、统计报表、周期同步数据等等&#xff0c;要求任务调度系统具备高可用性、负载均衡特性&#xff0c;可以管理并监控任务的执行流程&#xff0c;以保证任务的正确执行。 二、历史方案 美团CR…

卖萌屋新闻联播栏目,倾情上线~

编 | 小轶感谢提供本期内容的 iven、ZenMoore、 jxyxiangyu、付瑶今天这篇推文是卖萌屋全新的原创系列———暂且取名为“卖萌屋新闻联播”节目。卖萌屋的作者、小编日常都会在团队群里分享各种最新发现的实用资源、有意思的学术工作。小伙伴们在互相分享的过程中都受益匪浅。我…

LeetCode 386. 字典序排数(DFS循环)

1. 题目 给定一个整数 n, 返回从 1 到 n 的字典顺序。 例如&#xff0c; 给定 n 1 3&#xff0c;返回 [1,10,11,12,13,2,3,4,5,6,7,8,9] 。 请尽可能的优化算法的时间复杂度和空间复杂度。 输入的数据 n 小于等于 5,000,000。来源&#xff1a;力扣&#xff08;LeetCode&#…

论文浅尝 | 基于多模态特征的视觉实体链接

转载公众号 | 数据智能英文刊文章题目&#xff1a;Visual Entity Linking via Multi-modal Learning作者&#xff1a;郑秋硕&#xff0c;闻浩&#xff0c;王萌&#xff0c;漆桂林引用&#xff1a;Zheng, Q.S., et al.: Visual Entity Linking via Multi-modal Learning. Data I…

一训练就显存爆炸?Facebook 推出 8 比特优化器,两行代码拯救你的显存!

文 | jxyxiangyu编 | 小轶“小夕&#xff0c;小夕&#xff01;又出来了个 SOTA 模型&#xff01;赶紧 follow &#xff01;”小夕看了看新模型的参数量&#xff0c; 然后看了看实验室服务器的几张小破卡。小夕&#xff0c;陷入了沉默。自从人们发现越大的模型性能越好后&#x…

论文浅尝 | 基于正交普鲁克分析的高效知识图嵌入学习

笔记整理&#xff1a;朱渝珊&#xff0c;浙江大学在读博士&#xff0c;研究方向为快速知识图谱的表示学习&#xff0c;多模态知识图谱。1.Motivation知识图谱是许多NLP任务和下游应用的核心&#xff0c;如问答、对话代理、搜索引擎和推荐系统。知识图中存储的事实总是以元组的形…

LeetCode 979. 在二叉树中分配硬币(DFS)

文章目录1. 题目2. DFS 解题1. 题目 给定一个有 N 个结点的二叉树的根结点 root&#xff0c;树中的每个结点上都对应有 node.val 枚硬币&#xff0c;并且总共有 N 枚硬币。 在一次移动中&#xff0c;我们可以选择两个相邻的结点&#xff0c;然后将一枚硬币从其中一个结点移动…

有福利! 好书推荐:从《实用推荐系统》学习寻找用户行为之法

大多数关于推荐系统的图书都讲述了算法及其优化方法。这些书都认为你已经有了一个大的数据集来供算法使用。数据集不会像变魔术那样凭空出现。要想收集到正确的用户偏好数据&#xff0c;就需要投入精力和进行思考。它会成就你的系统&#xff0c;或者搞砸你的系统。“垃圾进&…

灵活强大的构建系统Gradle

前言 构建&#xff0c;软件生命周期中重要的一环&#xff0c;在现代软件开发过程中&#xff0c;起着越来越重要的作用。过去在Java或类Java的世界里&#xff0c;Ant、Maven再熟悉不过了&#xff0c;Maven凭借其强大的依赖配置战胜Ant&#xff0c;基本上成为了Java构建的标准。而…

LeetCode 791. 自定义字符串排序(map)

1. 题目 字符串S和 T 只包含小写字符。在S中&#xff0c;所有字符只会出现一次。 S 已经根据某种规则进行了排序。我们要根据S中的字符顺序对T进行排序。更具体地说&#xff0c;如果S中x在y之前出现&#xff0c;那么返回的字符串中x也应出现在y之前。 返回任意一种符合条件的…

6万字解决算法面试中的深度学习基础问题

文 | 清卢雨源 | 对白的算法屋前言真的是千呼万唤始出来emmmm&#xff0c;去年春招结束写了篇面试的经验分享。在文中提到和小伙伴整理了算法岗面试时遇到的常见知识点及回答&#xff0c;本想着授人以渔&#xff0c;但没想到大家都看上了我家的 &#xff01;但因本人执行力不足…

OpenKG开源系列 | 海洋鱼类百科知识图谱(浙江大学)

OpenKG地址&#xff1a;http://openkg.cn/dataset/ocean开放许可协议&#xff1a;CC BY-SA 4.0贡献者&#xff1a;浙江大学&#xff08;徐雅静、邓鸿杰、唐坤、郑国轴&#xff09;1、背景海洋是生命的摇篮,是人类文明的重要发祥地,在人类社会发展的进程中起着举足轻重的作用。海…

Presto实现原理和美团的使用实践

Facebook的数据仓库存储在少量大型Hadoop/HDFS集群。Hive是Facebook在几年前专为Hadoop打造的一款数据仓库工具。在以前&#xff0c;Facebook的科学家和分析师一直依靠Hive来做数据分析。但Hive使用MapReduce作为底层计算框架&#xff0c;是专为批处理设计的。但随着数据越来越…

图谱实战 | 徐美兰:深度应用驱动的医学知识图谱构建

转载公众号 | DataFunSummit分享嘉宾&#xff1a;徐美兰 浙江数字医疗卫生技术研究院 数字医学知识中心主任编辑整理&#xff1a;李杰 京东出品平台&#xff1a;DataFunTalk导读&#xff1a;数研院这些年在知识图谱建设上取得了丰硕成果&#xff0c;今天我们将图谱构建过程中的…

6 年大厂面试官,谈谈我对算法岗面试的一些看法

文 | 不敢透露姓名的 Severus 和小轶面试官坐在那撇着大嘴的&#xff0c;“咳&#xff0c;给你一机会&#xff0c;最短的时间内让我记住你。”这个我会&#xff0c;我抡圆了“啪&#xff01;”&#xff0c;扭头我就走。我刚到家&#xff0c;录取通知书就来了&#xff0c;请你务…