领域应用 | 从数据到智慧，知识图谱如何推动金融更智能？

本文转载在公众号：恒生技术之眼。

在《人工智能+知识图谱：如何规整海量金融大数据？》一文中，笔者曾提到，面向人工智能的大数据治理，势必能有效支撑智能金融从感知智能向认知智能变革。这是因为目前在资本市场中，大数据的治理存在一些问题，比如非结构化数据的处理与使用、实时敏捷的数据处理与使用以及多源异构的数据孤岛等。

而知识图谱在智能金融中扮演的正是数据加工、处理的角色，能够为数据服务提供相应的支持。比如对于多源异构的数据，知识图谱能做到比较好的集成，通过统一的数据表示与建模、统一数据处理与存储来降低数据的使用难度。

正所谓“玉不琢不成器”，数据是金融的生命线，经过知识图谱的“琢磨”，大数据治理会有更多成果呈现出来，从而更好地赋能智能金融，助力金融机构实现数据驱动下的业务运营和创新。那么想要达到这样的目的，资本市场的知识图谱应该如何构建呢？

资本市场知识图谱构建的核心目标

有目标，才有方向。在资本市场中，人们都在关注资产的价格、走势以及相关的分析，这是一个永恒的话题。所以资本市场知识图谱的建立应该有两个核心目标：

核心目标1：企业画像&企业分析

以前，我们为企业做信息规整的时候，以集合企业的360度属性信息为目标。而通过知识图谱技术，我们可以改变这种思路，以企业为中心，把围绕企业的实体关系建立起来，比如企业与企业的关系、企业与人的关系、企业与行业的关系、企业与舆情事件的关系、企业与宏观要素的关系等等。当我们将企业放在关系网络里，把种种关系都建立起来的时候，我们会发现，企业的画像也就完成了。

企业分析也是从关系分析开始的。在关系网络具备的情况下，我们可以以关系分析为起点进行企业的分析，一步步达到我们最终所需的分析目标和结果。

核心目标2：舆情事件基于知识图谱的传播

为企业做画像，是相对静态的一个结果，因为汇集的很多都是关于企业的静态信息。而舆情事件在每天的新闻、公告、研报里都会发生，是相对动态的。那么舆情事件有没有传递效应？有什么样的传递效应？这也是我们在资本市场中构筑知识图谱时需要考虑的。

资本市场知识图谱构建的关键点

有了这两个核心目标，资本市场的知识图谱应该怎么构建呢？对于资本市场来说，知识图谱的构建也需要知识建模、知识获取、知识融合、知识存储、知识展示、知识计算、知识应用等环节，这与传统行业是一样的。不一样的地方在于以下几个关键点：

场景驱动按需迭代

在金融行业，新的数据源源不断地产生、汇集，那么我们在构建知识图谱之时，需要以场景驱动来解决这个问题，在数据建模上不断地更新，先建立Schema再去寻找相应的数据，集合起来之后对特定的应用场景提供相应的数据服务。随着Schema 1.0、2.0、3.0不断演化，一个企业级的知识图谱可能就建立起来了。

充分利用第三方数据

起点不一样，是资本市场知识图谱与其他领域知识图谱的一个不同点。在资本市场中，有很多第三方数据公司为证券公司、基金公司等金融机构提供数据服务，充分利用第三方数据对于知识图谱的构建非常重要。这个起点有什么影响呢？一方面，第三方数据公司会通过自然语言处理等技术做一些数据的梳理工作，其数据结构质量会比较高，基于高质量数据来构建的知识图谱，质量也会比较好，如果我们放弃这种方式，从大规模自动建立开始做，很难达到同等的效果；另一方面，第三方数据也是在不断更新的，因此在知识获取和知识融合方面，第三方数据可以帮我们解决冷启动的问题。

事件与时序的支持

事件是相对动态的，动态的新闻、资讯对资产价格有非常大的影响，所以我们在资本市场的知识图谱构建中，包括建模、分析、展示、存储等各个环节，都要充分考虑到对事件和时序支持。

灵活的图展示方式

资本市场的知识图谱对于展示有一些不一样的需求，比如可不可以按照产业链的方式把某一行业的上下游全部展示出来，能不能按照股权结构把实际受益人的图谱关系展示出来等等，这些都是金融领域的图展示需要做到的。

资本市场知识图谱的应用场景

从数据的关系网络支撑这个角度来看，知识图谱作为数据治理的工具、手段，可以助力原有的传统金融业务实现智能化的升级。另外，知识图谱与机器学习等技术的结合，也会帮助原有的模型实现升级。那么具体来看，知识图谱能够对现在的金融业务产生哪些方面的赋能呢？

基础赋能

▲基础数据服务：把知识图谱当做数据库、知识库，用KBQA（Knowledge Base Question Answering）的方式，为金融问答系统、智能客服系统以及金融智能搜索等业务提供相应的支持。

▲关系穿透/挖掘服务：知识图谱对于关系穿透、挖掘的能力，使其非常适合找到一致行动人、实际控制人以及资本系挖掘，从而有助于关联交易关联账号识别、信息批露等风控控制，并且能够对风控风险的传播和原因做深入分析，这在合规风控领域的应用有非常大的空间。

▲建模/推理服务：知识图谱把一些关系的数据梳理得比较清楚，这对于营销服务领域来说是一次革新的机会。无论从数据的提供层面，还是从模型的建立层面，知识图谱在KYC/KYP（Know Your Customer / Know Your Product）、产品服务推荐、智能投顾等领域都会带来非常大的价值。

进阶赋能

▲基于知识图谱事件传播影响的智能资讯服务

这是静态与动态知识图谱能够结合并产生金融服务的一个场景。目前对于头部金融机构的终端服务来说，智能资讯已经是一种标配，可以把相应的资讯推送给相应的标的持有人，进行风险警示或投资机会提示。

在知识图谱技术的加持下，智能资讯服务能够做进一步的延伸，因为企业是处在关系网络之中的，任何一个事件的传递都会沿着关系网络传播。比如“行业的原材料价格上涨”这样一件事，会在企业的关系网络里沿着企业的上下游来进行传递，据此我们可以把涉及到的相关企业从知识图谱中找出来，命中事件传播波动相关性标的、事件要素投研逻辑相关性标的等，从而对相应投资人进行相应标的的智能资讯服务，例如持仓/自选股预警、投顾等辅助服务。

▲基于知识图谱的智能投研：分析师工作平台

智能投研是知识图谱能够有较多应用的一个场景。每个行业分析师都有一套行业产业链逻辑，并且依据这套逻辑准确定位市场现状、动态，预测并制作市场模型。借助知识图谱，这套逻辑可以演化成一个投研工具，一个智能投研的分析平台，满足分析师私有化、个性化的要求，做到能够自动添加实体（公司）、关系（产业链条）、属性（私有数据），自定义投研逻辑与预警规则，帮助分析师进行产业链与企业关系的分析。

展望

在当下的智能金融时代，一方面我们需要着手进行面向人工智能的大数据治理，在数据层面上通过知识图谱将原有的金融数据做再一次的加工、整理；另一方面，一个金融机构往往动辄几十套、上百套系统，如何把知识图谱等人工智能技术的服务能力开放给传统的业务系统，进行面向人工智能的服务治理，这也是我们必须面对的一个挑战。

此外，浙江大学陈华钧教授曾提到过知识图谱的数据源问题，由于数据太容易被复制了，一旦发生数据外泄很容易侵犯个人隐私与数据所有权，所以在知识图谱领域，我们也可以考虑结合区块链技术来对数据来源进行溯源。现在知识图谱更多是集中式的，未来可能有更多分散式的知识图谱架构出现，来帮助我们解决这个问题。

300多年，英国哲学家培根曾说，知识就是力量。而随着人工智能时代的启幕，我们或许也可以说：知识图谱就是力量。知识图谱起于搜索，又不止于搜索，它是底层的，是无处不在的，支撑着人工智能在各个场景中的应用。未来，知识图谱必将让金融更智能，在更多的金融业务场景中发挥更大的价值。

OpenKG.CN

中文开放知识图谱（简称OpenKG.CN）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg