交通银行信息技术管理部副总经理张漫丽:交通银行“大数据+人工智能”应用研究...

文 | 交通银行信息技术管理部副总经理张漫丽

大数据隐含着巨大的社会、经济、科研价值,已引起了各行各业的高度重视。如果能通过人工智能技术有效地组织和使用大数据,将对社会经济和科学研究发展产生巨大的推动作用,同时也孕育着前所未有的机遇。

在过去的五年中,云计算、大数据及人工智能的发展催生了金融行业的一系列产品和业务模式创新,可以预见,迅猛发展的大数据和人工智能技术未来可能使整个金融环境和交易模式产生彻底性的、颠覆式的改变。2016年,AlphaGo把人工智能推向了风口浪尖,AlphaGo围棋的获胜体现的不仅是人工智能的水平,更是背后云端大数据处理和分析能力的提升。

一、“大数据和人工智能”金融行业发展现状

1.银行转型改革恰逢“大数据+人工智能”全面崛起

近年来,我国经济金融形势都呈现出新的态势,银行业面临经济增速放缓、结构调整加快、化解产能过剩和金融改革等诸多挑战。加上全球金融监管日趋严格、新巴塞尔协议对资本的约束,银行业金融机构面临着前所未有的压力和风险。市场竞争空前激烈,不仅银行之间的竞争愈发激烈,银行与非银行金融机构、类金融机构的跨界式竞争也愈演愈烈。依靠规模和高速扩张的外延式发展方式已严重透支,银行纷纷开始主动或被动地进行内涵式发展转型。

统计显示,全国小微企业贷款覆盖率仅21.6%,还有78.4%的小微企业得不到银行资金的支持。这表明银行服务覆盖的广度、深度还远远不够,仍存在巨大的服务空间。但在规模和效益驱使下,银行基于传统风险和成本考量,仍难以有效开拓维护小微客户。

伴随着高质量的大数据积累,同时得益于强大的并行计算能力,特别是深度学习算法上的突破,人工智能技术近年来全面崛起。“大数据+人工智能”的相关理论与分析方法,很好地弥补了数据获得的时间连续性、数据的地理位置分布、数据样本的覆盖程度等传统分析方法中的不足,其精准度更高、覆盖面更广和响应速度更快的特点,有助于银行优化资源配置,降低服务成本,提高服务效率,丰富风控手段。将其定位为降本增效、提升体验、扩大获客的有效工具,运用到银行运营、营销及服务等业务中将大有裨益。

2.金融同业应用探索

银行是信息密集型服务产业,其数据强度高踞各行业之首——银行业每创收100万美元,平均就会产生820GB的数据,在整体价值、企业平均数据量、绩效波动性、交易密度等方面遥遥领先于其他行业。人工智能所展示的机器深度学习能力让大数据处理呈现了新的方向。

无论是大型银行还是中小股份制银行都开始大范围地尝试通过大数据来驱动业务运营,比如工商银行的大数据风控、建设银行的大数据模型实验室、招商银行利用大数据开展小微贷款、光大银行建立社交网络数据库等。人工智能机器人也走进交通银行、农业银行、浦发银行等各家银行营业网点。2016年12月招商银行强势发布了财富管理应用摩羯智投,推出了中国银行业的首个智能投顾,实例证明金融科技将为金融产业带来新生。

二、交通银行探索实践和发展思路

交通银行在业务发展过程中首先积累了海量的客户信息、交易信息等各种信息,具有数据优势;

其次拥有数据仓库处理传统海量结构化数据的经验,经过几年的整合,交通银行数据信息管理工作已经形成了以数据标准制定、数据信息采集、数据信息工具设计、数据信息质量控制为主线的数据集中管理模式,为基础数据信息同源统一提供了基本条件。

加上近年来大数据多维查询、搜索、图计算等技术的兴起,对信息视图多层次、灵活化的诉求提供了有力的技术支持;

最后是IT技术和人才储备相对充裕,具备实施大数据的基本条件和巨大发展潜力,在发展模式转型、金融创新和管理升级等方面充分利用人工智能技术、运用大数据思维更具潜在价值和针对性。目前交通银行也在上述领域进行了探索,并取得了一些成果。

1.建立“顶层设计,自上而下”的创新组织体制

交通银行高度重视金融科技创新工作,2010年就成立产品创新与推进委员会(简称“创新委”),目前基本建立了自上而下分三层的矩阵式创新组织体制,以项目制改革大力推动重点产品创新。

总行创新委是全集团产品创新工作的决策机构,下设公司、零售、同业三个产品创新委员会,并设有创新项目评估与推进委员会,作为集团创新项目评估和推进的议事、协调和决策机构。各省直分行也参照设置了相应创新委员会,统筹分行层面产品创新工作。初步形成了突出重点、分类管理的创新产品体系,建立了重大创新项目、常规创新项目、创新实验项目三大产品创新体系。

首批明确了七项重大创新项目,成立了重大创新项目制改革试点领导小组,出台了指导意见,通过专项团队、专项授权、专项政策、专项资源、专项考核的“五专机制”集中资源重点突破,着力打造品牌产品。同时依托产品创新实验项目机制,总分联合快速研发了二十余项创新产品,经创新产品发布会发布后在各省直分行大力推广,取得了良好的市场反响。

2.依托创新实验室开展大数据和人工智能基础研究

密切关注全球金融科技的创新与应用,内部设立主题创新课题群,关注市场热点、研究业务重点、突破技术难点,强化交通银行在云计算、大数据和人工智能新兴领域的自主技术储备。加强与外部金融科技企业的连接,实时掌握最新的金融科技发展趋势,打造快速获取新科技并转化为银行产品服务应用的能力。不断搜寻数字化合作机遇与伙伴,布局金融科技生态圈。开展科技为引领的“跨界”创新研究,在风险可控的前提下,通过创新实验室这片试验田“先行先试”,不断培养自身运用新一代技术的能力。

目前,交通银行已依托创新实验室对区块链、人工智能等新兴技术开展基础研究,对大数据、生物识别等已有储备技术开展在金融业的综合应用研究。同时与金融科技企业、高校保持良好的沟通互动,积极开展重点金融科技相关领域的联合创新,建立快速获取新科技并转化为银行产品服务应用的能力。

3.完善大数据平台,促进和支撑业务创新

建设集团统一、数据标准、运行高效、技术强大的数据服务平台。完善大数据应用环境,支持对用户数据进行超百万维度的数据建模,深刻洞察用户的行为和特征,为全新价值点、商业决策以及新业务商机的挖掘提供更加科学、全面的业务支持,为集团经营管理、业务发展和内部控制提供良好的技术支持和服务。

4.整合外部数据丰富银行数据资源,健全客户信息统一视图

联合业务部门及分行共同进行大数据的搜集、整理、存储、分析和应用,全面采集、多方式整合行内外各类有价值数据,增加外部数据业务视图和数据探查功能,为各部门在业务开展过程中查询和使用外部数据提供便利。将金融服务与社交网络、电子商务、移动网络等深度融合,与行内数据形成有效互补,充分发挥外部数据资产价值,实现广义通用的客户信息统一视图。

5.依托大数据技术实现客户行为分析及精准营销

在产品开发、营销方面,通过对客户在交通银行及关联单位的海量交易、行为、及访问足迹数据进行收集、分析和挖掘,科学构建数据模型,使不同层级客户的差异化金融需求可以得到充分展示,进而针对客户需要、市场需求研发产品、开展营销,真正做到以客户为中心进行产品开发设计,实现精准营销,而不是以银行为中心制造、推销产品。通过对智慧感知技术、互联互通技术和智能洞察技术的综合应用,实现对用户的行为感知和需求预测,从而提供新型的主动推送或推荐式金融服务,实现对特定族群的精准营销,提升客户交叉销售率。

6.推进风险管理的精细化

当前银行的贷前授信和贷后监控,无论从深度和广度均有不足,交通银行着重研究银行业风险发展方向和趋势,以大数据思维将现场调查与非现场数据挖掘分析相结合,更加全面地评估客户风险状况,大幅提升贷前风险判断和贷后风险预警能力,实现对潜在风险的及时防控。

首先,结合挖掘的外部数据进行客户关联画像,将企业登记状态、资金、信用、声誉、征信、股东、法人、主要管理人员、控股及关联企业等信息均纳入风险监测系统中,有效提升客户识别及风险预警水平。

其次,依据预先设定的风险指标及已知的风险客户评级,通过机器学习算法进行近似性匹配,完成数据挖掘分析,并依据机器学习的结果,逐步调整指标范围和关联程度,完善机器学习的风险模型及算法,以实现机器学习结果与人工认定结果达成极高匹配为目标,训练出更精准的风险防控模型。

最后,深度挖掘历史数据,并逐步扩展机器学习所涉及的数据范围,做出更专业的判断,使风险识别、防范、决策更加可靠、更加贴近实际。

7.强化分布式架构研究,拓展数据实时处理展示范围

近年来,IT系统面对的数据量越来越大,业务对处理时效要求越来越高,数据量和处理时效的矛盾越来越突出。目前银行传统应用由于在事物一致性方面的要求,基本仍然采用集中式应用架构,但是随着互联网金融的发展,数据分析正在向更多类型的分布式架构和实时智能服务发展,通过实时的智能服务可以支持实时的决策制定。从而最终优化和解决处理数据越来越大、处理时效要求越来越高的问题。

前期已实现的交通银行头寸、销售、授信等信息实时展示获得行内各部门一致好评。搭建的实时数据服务系统专注于处理实时和准实时数据需求,支持CDC、MQ等多种准实时同步技术,尽可能压缩传统业务链条,应用大数据的处理模式,以高实时性的中间数据层为媒介,引入机器学习和数据湖概念,建立效率更高、实时性更强、管理者自定义程度更深的商业智能系统,实现报表的实时化、移动化、定制化。

8.研究和拓展人工智能应用场景

充分利用大数据平台研究成果,结合人工智能在语音识别、语义处理、生物识别、机器学习、专家系统等方面的核心技术,围绕数据跨界融合和深度挖掘进行应用探索,进一步升级和优化大数据平台功能与模型,并重点应用在客户画像、需求挖掘、精准营销、服务质检、智能投顾等环节,为客户提供定制化、智能化、有管控的金融服务,综合提升交通银行服务创新和产品营销能力。

交通银行于2014年6月率先在业内建立了全行统一的生物识别身份认证平台。该平台是以虹膜、人脸、指纹及指静脉等多种生物识别技术为核心的跨平台的、开放的、可扩展的统一身份认证平台,实现了客户身份安全便捷、真实、准确认证。通过与现有业务系统对接,大大提高了客户的满意度、忠诚度和舒适度。目前,人脸识别技术已在全行智能柜、ITM机、个性化发卡机上推广使用,提升身份认证效率的同时,有效挖掘了各个渠道潜在的客户营销信息。

未来,交通银行准备在如下场景拓展人工智能应用:一是结合多种生物识别技术,如语音识别或声纹识别技术,来提高金融中心或客服中心的质检水平和服务质量。二是结合私人银行部多年资产管理经验、大数据分析及人工智能技术研发智能财富管理系统,为中产阶级客户提供更加全面和优质的投资顾问服务,提升客户忠诚度及黏度。三是通过人工智能技术和大数据风控,将曾经繁琐的业务审批流程自动化处理,通常数十秒即可完成,其中超过85%的审批都不需要人工操作,纯自动化实现。

三、挑战和机遇

1.面临的挑战

(1)虽然银行经过多年数据仓库建设对信息、流程及渠道进行了全面整合,构建了统一的数据标准和信息模型,但目前的数据结构基本上是条块分割的,“线下为主”的体制对互联网数据价值的不适应,数据规划、清洗和标签不尽合理,将这些数据进行大数据分析,现实情况下仍不尽如人意。

(2)客户行为偏好数据往往隐藏在海量的移动网络设备及社交网络之中,现有银行系统难以有效分析和利用。最好的行为数据在BAT,但BAT不会与银行分享。目前主流的数据源供应模式包括传感终端、互联网、政府机关、运营商等,主要是以数据为产品输出,不涉及数据的分析处理,但信息安全的政策风险较高,市场空间有限,特别是《中华人民共和国网络安全法》将于今年6月1日起正式生效,为涉及客户隐私的大数据合作画上了红线。

(3)数据挖掘和深度学习方面的专家目前非常稀缺,一个好的平台需要好的人才方能发挥最大效用,目前银行主要以软件开发人员为主,缺乏数据和算法方面的人才,特别是真正的数据专家在银行不是很多,顶尖的数据科学家更是稀缺。

2.存在的机遇

正如互联网和电子商务曾经风靡一时一样,虽然“大数据+人工智能”如今方兴未艾,但作为人工智能发展的原动力,大数据正在史无前例地聚集,我们有理由相信只要它朝着健康的方向发展,未来必将成为社会发展的新引擎。





本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/390830.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安软件一劳永逸_如何克服一劳永逸地公开演讲的恐惧

安软件一劳永逸If you’re like most people, the idea of public speaking terrifies you (it terrifies me too). So how do you get over those jitters, get up on stage, and give an amazing talk? First, a disclaimer: this article is purely about your stage prese…

Go语言实战 : API服务器 (8) 中间件

为什么需要中间件 我们可能需要对每个请求/返回做一些特定的操作,比如 记录请求的 log 信息在返回中插入一个 Header部分接口进行鉴权 这些都需要一个统一的入口。这个功能可以通过引入 middleware 中间件来解决。Go 的 net/http 设计的一大特点是特别容易构建中间…

缺失值和异常值的识别与处理_识别异常值-第一部分

缺失值和异常值的识别与处理📈Python金融系列 (📈Python for finance series) Warning: There is no magical formula or Holy Grail here, though a new world might open the door for you.警告 : 这里没有神奇的配方或圣杯,尽管…

SQL Server 常用分页SQL

今天无聊和朋友讨论分页,发现网上好多都是错的。网上经常查到的那个Top Not in 或者Max 大部分都不实用,很多都忽略了Order和性能问题。为此上网查了查,顺带把2000和2012版本的也补上了。 先说说网上常见SQL的错误或者说局限问题 12345select…

Word中摘要和正文同时分栏后,正文跑到下一页,怎么办?或Word分栏后第一页明明有空位后面的文字却自动跳到第二页了,怎么办?...

问题1:Word中摘要和正文同时分栏后,正文跑到下一页,怎么办?或Word分栏后第一页明明有空位后面的文字却自动跳到第二页了,怎么办? 答:在word2010中,菜单栏中最左侧选“文件”->“选…

leetcode 664. 奇怪的打印机(dp)

题目 有台奇怪的打印机有以下两个特殊要求: 打印机每次只能打印由 同一个字符 组成的序列。 每次可以在任意起始和结束位置打印新字符,并且会覆盖掉原来已有的字符。 给你一个字符串 s ,你的任务是计算这个打印机打印它需要的最少打印次数。…

SQL数据类型说明和MySQL语法示例

SQL数据类型 (SQL Data Types) Each column in a database table is required to have a name and a data type. 数据库表中的每一列都必须具有名称和数据类型。 An SQL developer must decide what type of data that will be stored inside each column when creating a tab…

PHP7.2 redis

为什么80%的码农都做不了架构师?>>> PHP7.2 的redis安装方法: 顺便说一下PHP7.2的安装: wget http://cn2.php.net/distributions/php-7.2.4.tar.gz tar -zxvf php-7.2.4.tar.gz cd php-7.2.4./configure --prefix/usr/local/php…

leetcode 1787. 使所有区间的异或结果为零

题目 给你一个整数数组 nums​​​ 和一个整数 k​​​​​ 。区间 [left, right]&#xff08;left < right&#xff09;的 异或结果 是对下标位于 left 和 right&#xff08;包括 left 和 right &#xff09;之间所有元素进行 XOR 运算的结果&#xff1a;nums[left] XOR n…

【JavaScript】网站源码防止被人另存为

1、禁示查看源代码 从"查看"菜单下的"源文件"中同样可以看到源代码&#xff0c;下面我们就来解决这个问题&#xff1a; 其实这只要使用一个含有<frame></frame>标记的网页便可以达到目的。 <frameset> <frame src"你要保密的文件…

梯度 cv2.sobel_TensorFlow 2.0中连续策略梯度的最小工作示例

梯度 cv2.sobelAt the root of all the sophisticated actor-critic algorithms that are designed and applied these days is the vanilla policy gradient algorithm, which essentially is an actor-only algorithm. Nowadays, the actor that learns the decision-making …

共享语义 unix语义_语义UI按钮

共享语义 unix语义什么是语义UI按钮&#xff1f; (What are Semantic UI Buttons?) A button indicates a possible user action. Semantic UI provides an easy-to-use syntax that simplifies not only the styling of a button, but also the natural language semantics.按…

垃圾回收算法优缺点对比

image.pngGC之前 说明&#xff1a;该文中的GC算法讲解不仅仅局限于某种具体开发语言。 mutator mutator 是 Edsger Dijkstra 、 琢磨出来的词&#xff0c;有“改变某物”的意思。说到要改变什么&#xff0c;那就是 GC 对象间的引用关系。不过光这么说可能大家还是不能理解&…

标准C程序设计七---77

Linux应用 编程深入 语言编程标准C程序设计七---经典C11程序设计 以下内容为阅读&#xff1a; 《标准C程序设计》&#xff08;第7版&#xff09; 作者&#xff1a;E. Balagurusamy&#xff08;印&#xff09;&#xff0c; 李周芳译 清华大学出版社…

leetcode 1190. 反转每对括号间的子串

题目 给出一个字符串 s&#xff08;仅含有小写英文字母和括号&#xff09;。 请你按照从括号内到外的顺序&#xff0c;逐层反转每对匹配括号中的字符串&#xff0c;并返回最终的结果。 注意&#xff0c;您的结果中 不应 包含任何括号。 示例 1&#xff1a; 输入&#xff1a…

yolo人脸检测数据集_自定义数据集上的Yolo-V5对象检测

yolo人脸检测数据集计算机视觉 (Computer Vision) Step by step instructions to train Yolo-v5 & do Inference(from ultralytics) to count the blood cells and localize them.循序渐进的说明来训练Yolo-v5和进行推理(来自Ultralytics )以对血细胞进行计数并将其定位。 …

oauth2-server-php-docs 授权类型

授权码 概观 在Authorization Code交付式时使用的客户端想要请求访问受保护资源代表其他用户&#xff08;即第三方&#xff09;。这是最常与OAuth关联的授予类型。 详细了解授权码 用例 代表第三方来电履行 创建一个实例OAuth2\GrantType\AuthorizationCode并将其添加到您的服务…

flask框架视图和路由_角度视图,路由和NgModule的解释

flask框架视图和路由Angular vs AngularJS (Angular vs AngularJS) AngularJS (versions 1.x) is a JavaScript-based open source framework. It is cross platform and is used to develop Single Page Web Application (SPWA). AngularJS(版本1.x)是一个基于JavaScript的开源…

NGUI EventDelagate事件委托

using System.Collections; using System.Collections.Generic; using UnityEngine;public class BUttonClick : MonoBehaviour {public UIButton button_01;void Start(){if (button_01 null){Debug.Log("button组件丢失了");}else{//首先将脚本中的ClicktheButton…

leetcode 461. 汉明距离(位运算)

两个整数之间的汉明距离指的是这两个数字对应二进制位不同的位置的数目。 给出两个整数 x 和 y&#xff0c;计算它们之间的汉明距离。 注意&#xff1a; 0 ≤ x, y < 231. 示例:输入: x 1, y 4输出: 2解释: 1 (0 0 0 1) 4 (0 1 0 0)↑ ↑上面的箭头指出了对应二进…