章乐焱 | 用“科技”监管“科技”,知识图谱能做什么?

本文转载自公众号:恒生技术之眼



人工智能、大数据等前沿科技的爆发,推动金融科技进入了一个崭新的时代,也成为监管科技发展的重要推动力。在这个Fintech的黄金时代,前沿科技正在如何赋能监管?这方面,恒生公司首席架构师章乐焱带来了一场关于“大数据+知识图谱在RegTech的应用探索”分享:


640?wx_fmt=jpeg


变革时代,Regtech如何提档升级?

 

随着信息资源呈爆炸式增长,海量数据源源不断涌现,DT(Data Technology)时代已然开启。而金融业更是高度数字化的行业,背后沉淀了丰富的数据资源,包括舆情信息、新闻资讯、市场行情、经济数据、公司公告、财务数据等等,有巨大的价值挖掘空间。因此,对于DT时代的监管科技来说,深挖金融数据价值并赋能监管,是一个新的趋势


为了更好地挖掘数据的价值,一方面需要将人工智能等前沿科技应用于数据处理,另一方面也需要更强的专业性。建立数据中台是提升专业性的一个重要方式,可以将原来分散在各个条线上的能力汇聚起来,进行技术上、业务上的专业能力沉淀以及专业分工,从而提升数据处理能力。

 

知识图谱能为Regtech做什么?

 

在DT时代,监管科技需要加强数据处理、数据价值挖掘能力,那么如何能做到这一点呢?

 

这就需要应用到大数据、知识图谱等技术。尤其知识图谱,能够对大数据做深度加工,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,从而在此基础上做更高效的计算。

 

用知识图谱的图数据库、图计算技术处理金融数据,很多事物都能用关系图来表示。例如,企业图谱以企业为中心,可以把围绕企业的种种关系建立起来,比如企业与企业的关系、企业与人的关系、企业与行业的关系、企业与舆情事件的关系、企业与宏观要素的关系等。

 

640?wx_fmt=gif

企业图谱中的关系网络可以按需逐级展开

 

产业链图谱所展示的则是行业结构和上下游关系,能够建立行业之间的传导逻辑,颗粒度细化到公司和产品,并且公司、行业之间能够相互映射、影响。此外,还能够形成宏观图谱、行业图谱、产品图谱等多种类的图谱。


640?wx_fmt=jpeg

医药产业链图谱


金融领域每天会产生大量动态的新闻、资讯,对资产价格有很大的影响。那么,当某个事件发生之后,会基于哪些事件传播逻辑对市场产生影响?金融领域的事件有哪些类型,哪些事件是值得深入分析的?这些都是需要事件图谱解决的问题。

 

通过引入动态事件、动态数据,恒生事件图谱能够提供从数据到业务的一套完整解决方案:在数据层面,能够整合多源异构数据源,建立产业金融大数据中心,构造产业金融知识图谱;在业务层面,可以基于静态知识图谱形成企业画像,基于动态数据进行舆情事件分析,根据事件基于知识图谱的影响传导进行企业深度分析。

 

恒生公司在知识图谱构建方面不断沉淀的同时,也在积极探索其赋能监管科技的方式,例如在舆情挖掘、风险识别等方面,知识图谱都能发挥较大的作用。


舆情挖掘与事件分析


金融监管对于舆情捕捉有很高的要求。基于人工智能的舆情挖掘与事件分析不仅需要知识图谱技术,还需要用自然语言处理技术对舆情信息做一些分析,例如识别信息中涉及哪些实体,判断事件的类别、情感的正负面等等。处理好这些信息之后,再结合知识图谱技术分析哪些事件会顺着图谱链进行传导,捕捉舆情事件的风险传导路径,从而及时预警。


基于股权穿透的风险识别

 

一家公司向上有哪些股东,向下有哪些子公司、孙公司,是金融关系网中重要的关联关系。应用知识图谱技术可以实现股权穿透,逐层展示公司控股持股关系,帮助监管机构理清企业之间错综复杂的关系。例如,当一个P2P平台发生爆雷,监管机构可以根据企业股权链判断风险的传播路径和影响范围;再如,资本市场中有很多资本系,通过精准分析企业背后的股权结构,可以深度挖掘资本系成员,助力监管机构及时发现资本系中存在的问题。


640?wx_fmt=jpeg


当下,互联网已经迎来了下半场——产业互联网,To B将是未来发展的一个主要方向。在这个过程中,前沿金融科技将重构金融基础设施,带来一个金融行业的发展新时代,不仅可以让监管更智能,还将促进投研、投顾、量化等诸多领域的蝶变。


未来,恒生研究院也将不断探索大数据、知识图谱、自然语言处理等前沿技术的金融场景落地,输出数据处理等多方面的能力,以开放的姿态与行业共建金融新生态。


(本文整理自章乐焱在2019金融集团大数据及监管科技应用研讨会的演讲《大数据+知识图谱在RegTech的应用探索》)

 



OpenKG


开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479928.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 23. 合并K个排序链表(优先队列)

文章目录1. 题目信息2. 思路3. 代码1. 题目信息 合并 k 个排序链表,返回合并后的排序链表。请分析和描述算法的复杂度。 示例:输入: [1->4->5,1->3->4,2->6 ] 输出: 1->1->2->3->4->4->5->6来源:力扣(…

直通BAT必考题系列:JVM性能调优的6大步骤,及关键调优参数详解

JVM系列 直通BAT必考题系列:7种JVM垃圾收集器特点,优劣势、及使用场景 直通BAT必考题系列:JVM的4种垃圾回收算法、垃圾回收机制与总结 直通BAT必考题系列:深入详解JVM内存模型与JVM参数详细配置 JVM内存调优 对JVM内存的系统级…

论文浅尝 | 知识图谱三元组置信度的度量

论文笔记整理:叶橄强,浙江大学计算机学院,知识图谱和知识推理方向。https://arxiv.org/pdf/1809.09414.pdf动机在构建知识图谱的过程中,不可避免地会产生噪声和冲突。基于知识图谱的任务或应用一般默认假定知识图谱中的知识是完全…

跟小伙伴们做了个高效刷论文的小站

好久木有在知乎冒泡了,不知道还能不能出现在大家的timeline上哇QAQ正文开始之前还是先习惯性的碎碎念一下。前段时间换了研究方向,重新pick了问答和检索,为了追上相关问题的最新进展,就顾不上写文的刷了一堆paper,加上…

模拟进化与遗传算法

遗传算法是目前研究得最为广泛的一类模拟进化算法。 假定考虑全局优化问题(P)。遗传算法基于以下两条基本策略求解问题: 对于给定的目标函数F,它使用F的任一适应性函数(换言之,一个值域非负、…

消息中间件系列(六):什么是流量削峰?如何解决秒杀业务的削峰场景

流量削峰的由来 主要是还是来自于互联网的业务场景,例如,马上即将开始的春节火车票抢购,大量的用户需要同一时间去抢购;以及大家熟知的阿里双11秒杀, 短时间上亿的用户涌入,瞬间流量巨大(高并发…

论文浅尝 | 基于深度序列模型的知识图谱补全

本文转载自公众号:DI数据智能。 Learning to Complete Knowledge Graphs with Deep Sequential Models作者:郭凌冰、张清恒、胡伟、孙泽群、瞿裕忠单位:南京大学供稿:胡伟引用L. Guo, Q. Zhang, W. Hu, Z. Sun, & Y. Qu. …

拨开算力的迷雾:聊聊不同 GPU 计算能力的上限

文 | 卜居知乎编 | 兔子酱通过深入了解自己手头 GPU 的计算能力上限,能够在买新卡时做出更理性判断。本文深入GPU架构,重点介绍了其中的ampere架构。另外,作者还对比了不同GPU之间的峰值计算能力,增加读者对硬件资源的了解。前言2…

LeetCode 20. 有效的括号(栈)

文章目录1. 题目信息2. 解题1. 题目信息 给定一个只包括 ‘(’,’)’,’{’,’}’,’[’,’]’ 的字符串,判断字符串是否有效。 有效字符串需满足: 左括号必须用相同类型的右括号闭合。 左括…

消息中间件系列(八):Kafka、RocketMQ、RabbitMQ等的优劣势比较

在高并发业务场景下,典型的阿里双11秒杀等业务,消息队列中间件在流量削峰、解耦上有不可替代的作用。 之前介绍了MQ消息队列的12点核心原理总结,以及如何从0到1设计一个MQ消息队列,以及RPC远程调用和消息队列MQ的区别 今天我们一…

论文浅尝 | 一种用于多关系问答的可解释推理网络

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答。来源:COLING 2018链接:https://www.aclweb.org/anthology/C18-1171问题背景与动机多关系问答(multi-relationquestion answering&#…

蚁群优化算法 ACO

群体智能(swarm intelligence) 定义: 由单个复杂个体完成的任务可由大量简单个体组成的群体合作完成,而后者往往更具有健壮性、灵活性等优势。在没有集中控制,不提供全局模型的前提下,为寻找复杂问题解决…

量化投资交易 vn.py

前言:当初接触到vnpy,一开始当然是按照该项目在GitHub上的指南,开始安装,配置,阅读Wiki,但是作为一个python新手,并不能马上利用vnpy来写策略回测甚至实盘。所以我决定还是从源码看起&#xff0…

掌握神经网络,我应该学习哪些至关重要的知识点?

人工智能作为计算机科学领域的一个分支,在互联网和大数据的时代浪潮中显现出其巨大的潜力和蓬勃的活力,类似电子医生、无人驾驶等新名词纷纷涌现。人工智能凭借着它无与伦比的发展优势,推动了各大产业和技术的革命与创新,使得生产…

LeetCode 32. 最长有效括号(栈DP)

文章目录1. 题目信息2. 栈 解题3. 动态规划 解题1. 题目信息 给定一个只包含 ‘(’ 和 ‘)’ 的字符串,找出最长的包含有效括号的子串的长度。 示例 1:输入: "(()" 输出: 2 解释: 最长有效括号子串为 "()" 示例 2:输入: ")()())" 输…

消息中间件系列(四):消息队列MQ的特点、选型、及应用场景详解

前面集中谈了分布式缓存Redis系列: 高并发架构系列:分布式锁的由来、特点、及Redis分布式锁的实现详解 高并发架构系列:Redis并发竞争key的解决方案详解 高并发架构系列:Redis缓存和MySQL数据一致性方案详解 Redis的高可用详解…

基金定投

https://www.zhihu.com/question/19909886 相信我,这篇攻略能让你彻底搞懂基金,每年大概率能赚10%左右的收益!基金定投核心要搞懂两个问题:买什么基金,什么时候买。今天我给大家一篇文章讲透这两个问题!我说…

卖萌屋学术站发布!通往高效刷论文之路

文 | 夕小瑶编 | 兔子酱学术站诞生好久没有冒泡啦,大家还记得雁栖湖畔的夕小瑶吗!(划掉(*/ω\*)趁着国庆假期,跟卖萌屋小伙伴们终于把拖延已久的《Arxiv神器》翻新了,零零星星做了几个月,最近终…

消息中间件系列(五):MQ消息队列的12点核心原理总结

消息队列已经逐渐成为分布式应用场景、内部通信、以及秒杀等高并发业务场景的核心手段,它具有低耦合、可靠投递、广播、流量控制、最终一致性 等一系列功能。 无论是 RabbitMQ、RocketMQ、ActiveMQ、Kafka还是其它等,都有的一些基本原理、术语、机制等&…

征稿 | 2019年全国知识图谱与语义计算大会(CCKS2019)投稿时间延长

全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专业委员会组织和承办。全国知识图谱与语义计算大会是两个全国性会议的合并:中文知识图谱研讨会the Chines…