本文转载在公众号:恒生技术之眼。
在《人工智能+知识图谱:如何规整海量金融大数据?》一文中,笔者曾提到,面向人工智能的大数据治理,势必能有效支撑智能金融从感知智能向认知智能变革。这是因为目前在资本市场中,大数据的治理存在一些问题,比如非结构化数据的处理与使用、实时敏捷的数据处理与使用以及多源异构的数据孤岛等。
而知识图谱在智能金融中扮演的正是数据加工、处理的角色,能够为数据服务提供相应的支持。比如对于多源异构的数据,知识图谱能做到比较好的集成,通过统一的数据表示与建模、统一数据处理与存储来降低数据的使用难度。
正所谓“玉不琢不成器”,数据是金融的生命线,经过知识图谱的“琢磨”,大数据治理会有更多成果呈现出来,从而更好地赋能智能金融,助力金融机构实现数据驱动下的业务运营和创新。那么想要达到这样的目的,资本市场的知识图谱应该如何构建呢?
资本市场知识图谱构建的核心目标
有目标,才有方向。在资本市场中,人们都在关注资产的价格、走势以及相关的分析,这是一个永恒的话题。所以资本市场知识图谱的建立应该有两个核心目标:
核心目标1:企业画像&企业分析
以前,我们为企业做信息规整的时候,以集合企业的360度属性信息为目标。而通过知识图谱技术,我们可以改变这种思路,以企业为中心,把围绕企业的实体关系建立起来,比如企业与企业的关系、企业与人的关系、企业与行业的关系、企业与舆情事件的关系、企业与宏观要素的关系等等。当我们将企业放在关系网络里,把种种关系都建立起来的时候,我们会发现,企业的画像也就完成了。
企业分析也是从关系分析开始的。在关系网络具备的情况下,我们可以以关系分析为起点进行企业的分析,一步步达到我们最终所需的分析目标和结果。
核心目标2:舆情事件基于知识图谱的传播
为企业做画像,是相对静态的一个结果,因为汇集的很多都是关于企业的静态信息。而舆情事件在每天的新闻、公告、研报里都会发生,是相对动态的。那么舆情事件有没有传递效应?有什么样的传递效应?这也是我们在资本市场中构筑知识图谱时需要考虑的。
资本市场知识图谱构建的关键点
有了这两个核心目标,资本市场的知识图谱应该怎么构建呢?对于资本市场来说,知识图谱的构建也需要知识建模、知识获取、知识融合、知识存储、知识展示、知识计算、知识应用等环节,这与传统行业是一样的。不一样的地方在于以下几个关键点:
场景驱动按需迭代
在金融行业,新的数据源源不断地产生、汇集,那么我们在构建知识图谱之时,需要以场景驱动来解决这个问题,在数据建模上不断地更新,先建立Schema再去寻找相应的数据,集合起来之后对特定的应用场景提供相应的数据服务。随着Schema 1.0、2.0、3.0不断演化,一个企业级的知识图谱可能就建立起来了。
充分利用第三方数据
起点不一样,是资本市场知识图谱与其他领域知识图谱的一个不同点。在资本市场中,有很多第三方数据公司为证券公司、基金公司等金融机构提供数据服务,充分利用第三方数据对于知识图谱的构建非常重要。这个起点有什么影响呢?一方面,第三方数据公司会通过自然语言处理等技术做一些数据的梳理工作,其数据结构质量会比较高,基于高质量数据来构建的知识图谱,质量也会比较好,如果我们放弃这种方式,从大规模自动建立开始做,很难达到同等的效果;另一方面,第三方数据也是在不断更新的,因此在知识获取和知识融合方面,第三方数据可以帮我们解决冷启动的问题。
事件与时序的支持
事件是相对动态的,动态的新闻、资讯对资产价格有非常大的影响,所以我们在资本市场的知识图谱构建中,包括建模、分析、展示、存储等各个环节,都要充分考虑到对事件和时序支持。
灵活的图展示方式
资本市场的知识图谱对于展示有一些不一样的需求,比如可不可以按照产业链的方式把某一行业的上下游全部展示出来,能不能按照股权结构把实际受益人的图谱关系展示出来等等,这些都是金融领域的图展示需要做到的。
资本市场知识图谱的应用场景
从数据的关系网络支撑这个角度来看,知识图谱作为数据治理的工具、手段,可以助力原有的传统金融业务实现智能化的升级。另外,知识图谱与机器学习等技术的结合,也会帮助原有的模型实现升级。那么具体来看,知识图谱能够对现在的金融业务产生哪些方面的赋能呢?
基础赋能
▲基础数据服务:把知识图谱当做数据库、知识库,用KBQA(Knowledge Base Question Answering)的方式,为金融问答系统、智能客服系统以及金融智能搜索等业务提供相应的支持。
▲关系穿透/挖掘服务:知识图谱对于关系穿透、挖掘的能力,使其非常适合找到一致行动人、实际控制人以及资本系挖掘,从而有助于关联交易关联账号识别、信息批露等风控控制,并且能够对风控风险的传播和原因做深入分析,这在合规风控领域的应用有非常大的空间。
▲建模/推理服务:知识图谱把一些关系的数据梳理得比较清楚,这对于营销服务领域来说是一次革新的机会。无论从数据的提供层面,还是从模型的建立层面,知识图谱在KYC/KYP(Know Your Customer / Know Your Product)、产品服务推荐、智能投顾等领域都会带来非常大的价值。
进阶赋能
▲基于知识图谱事件传播影响的智能资讯服务
这是静态与动态知识图谱能够结合并产生金融服务的一个场景。目前对于头部金融机构的终端服务来说,智能资讯已经是一种标配,可以把相应的资讯推送给相应的标的持有人,进行风险警示或投资机会提示。
在知识图谱技术的加持下,智能资讯服务能够做进一步的延伸,因为企业是处在关系网络之中的,任何一个事件的传递都会沿着关系网络传播。比如“行业的原材料价格上涨”这样一件事,会在企业的关系网络里沿着企业的上下游来进行传递,据此我们可以把涉及到的相关企业从知识图谱中找出来,命中事件传播波动相关性标的、事件要素投研逻辑相关性标的等,从而对相应投资人进行相应标的的智能资讯服务,例如持仓/自选股预警、投顾等辅助服务。
▲基于知识图谱的智能投研:分析师工作平台
智能投研是知识图谱能够有较多应用的一个场景。每个行业分析师都有一套行业产业链逻辑,并且依据这套逻辑准确定位市场现状、动态,预测并制作市场模型。借助知识图谱,这套逻辑可以演化成一个投研工具,一个智能投研的分析平台,满足分析师私有化、个性化的要求,做到能够自动添加实体(公司)、关系(产业链条)、属性(私有数据),自定义投研逻辑与预警规则,帮助分析师进行产业链与企业关系的分析。
展望
在当下的智能金融时代,一方面我们需要着手进行面向人工智能的大数据治理,在数据层面上通过知识图谱将原有的金融数据做再一次的加工、整理;另一方面,一个金融机构往往动辄几十套、上百套系统,如何把知识图谱等人工智能技术的服务能力开放给传统的业务系统,进行面向人工智能的服务治理,这也是我们必须面对的一个挑战。
此外,浙江大学陈华钧教授曾提到过知识图谱的数据源问题,由于数据太容易被复制了,一旦发生数据外泄很容易侵犯个人隐私与数据所有权,所以在知识图谱领域,我们也可以考虑结合区块链技术来对数据来源进行溯源。现在知识图谱更多是集中式的,未来可能有更多分散式的知识图谱架构出现,来帮助我们解决这个问题。
300多年,英国哲学家培根曾说,知识就是力量。而随着人工智能时代的启幕,我们或许也可以说:知识图谱就是力量。知识图谱起于搜索,又不止于搜索,它是底层的,是无处不在的,支撑着人工智能在各个场景中的应用。未来,知识图谱必将让金融更智能,在更多的金融业务场景中发挥更大的价值。
OpenKG.CN
中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。