【转需】【金融干货】四步教你:开发风控模型?

一、市场调研

  • 目前市面主流的风控模型

1、互联网金融前10名排行榜(数据截止日期2017-09-12)

  • 互联网金融公司排名分别是蚂蚁金服、陆金所、京东金融、苏宁金融、百度金融、腾讯理财通、宜信、钱大掌柜、万达金融和网易理财。
1.1 蚂蚁金服
  • 1.1.1 大数据技术

    • 对接第三方征信公司芝麻信用分,通过用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度对海量数据行综合的处理评估,同时也给予阿里电商交易和蚂蚁金服互联网金融交易数据,对接公安系统和第三方数据公司建立联系。(这块就是用户画像的作用,投资人画像,融资企业/个人 画像,这块的内容比较复杂。后面一定会展开分析,风险定价,推荐系统全部靠它了)
  • 1.1.2 人脸识别技术

    • 人脸识别技术核心算法分别是活体检测算法、图像脱敏算法以及人脸比对算法,国际公开人脸数据库 LFW 上,人脸识别算法准确率(99%)。(像这块的技术已经很成熟有百度都已经推出成型产品,可以通过人脸识别对融资企业/法人进行风险验证,是否存在风险欺诈,多头借贷等嫌疑)
  • 1.1.3 云计算技术 
    • 是一个开放的云平台,它助力金融创新、助力金融机构的IT架构实现升级,去构建更加稳健安全、低成本、敏捷创新的金融级应用。(其实就高可用,可靠性等)
  • 1.1.4 风控技术 
    • 历史交易数据进行个性化的验证,提高账户安全性。80%左右的风险事件在智能风控环节就能解决。除了事后审核,事前预防、事中监控也非常重要——事前,将账户的风险分级,不同账户对应不同风险等级;事中,对新上线的产品进行风险评审以及监控策略方案评审。(解决80%的问题因此这块才是真正的核心。贷前,贷中,贷后等方方面面的监控,贷前最为重要,如何去检测,抓取哪些数据,与哪些第三方平台合作)
  • 1.1.5 人工智能技术 
    • 蚂蚁金服通过大数据挖掘和语义分析技术来实现问题的自动判断和预测。可以识别到用户的身份信息,总结在大的用户层面大家可能都会遇到的问题,100%的自动语音识别。智能质检能力与智能赔付能力,具备了品质的判断能力以及情感判断能力。(总结:公司 PC 的人工语言不完善,很多关键字无法识别。这块应该跟后台没有交互,数据都是写死。移动端也可以考虑在标的详情页介入 draglayout 控件进行智能语音服务,解答用户疑惑。技术核心应该是在数据挖掘,语义分析技术等方式)
1.2 陆金所风控调研
  • 1.2.1 七步风控体系

    • 1、风险政策制度框架体系:所有交易对手和产品引入都制定了明晰的风险政策指引,所有业务必须在制度框架内运行。(说白了就是自己风控业务流程,对于投资人者以及融资用户进行风险等级划分)
    • 2、信用评级:交易对手和产品进行主体评级及债项评级。(对于投资人者、融资用户、产品进行风险等级划分)
    • 3、信息披露:针对每一个不同的产品,将其内部评级、底层资产、主要风险、还款来源、保障措施。(就目前风险披露数据只是按照国家要求进行风险披露,但是并没有标地产品进行风险披露,融资企业进行风险披露,这个披露系统可以做成风险评估报告,后期也可以利用企业供应链关系库一定会用到(但是这部分数据都是针对上市而言,数据不全;))
    • 4、投后预警监控:所有在售资产至少每三个月进行一次检视。(对于融资周期过长的企业可以每三个月进行企业经营状况的上报,重点在于资金用途,回款方式以及周期;如果我们企业够强大的话,可以利用大数据征信对于那些未按时回款融资企业用户的企业进入黑名单系统)
    • 5、风险管理系统:陆金所的风险管理系统覆盖全产品线、整个产品生命周期,实现风控的标准化、智能化、模型化,大幅提升陆金所风险管理工作的效率和效果。(这些东西都太虚了)
    • 6、风险评价体系:同的风险程度给予业务部门不同的业绩评价。
    • 7、资产、资金的精准匹配:投资者进行风险分类,产品与投资者风险适配系统,确保投资者都能买到适合其投资风格与风险偏好的产品。(个人认为这个才是风控的意义,还有我们平台本身存在的价值;具体的实现的方式,利用画像技术对于投资用户,融资用户,标的产品进行风险等级划分,通过数据挖掘进行实时推荐)
  • 小结

    • 风险评级分为三部分:投资人风险等级分类,融资企业信息等级分类,标的产品等级划分。

      • 投资人等级划分:可以参考以往投资标的的利率,投资金额,投资人的站岗资金,投资人的提现金额,也可以通过投资人基本个人信息,例如移动设备Android 或 IOS,年龄,居住地,职业,评判投资人也可以调用第三方平台去综合判断投资的经济状况等方面维度

      • 融资企业等级划分:企业所在行业的整体现状,国家政策是否扶持,企业的纳税证明,银行流水,公司规模,注册资本等维度

      • 标的产品 :项目所属行业,项目的整体周期,项目成本,利润率,项目的合作企业,项目合同,发票等内容等维度
    • 投资用户与产品匹配度 
      • 根据风险评级系统去高度匹配融资用户,产品标的的内容信息。这部分用到的应该是数据挖掘,推荐系统。根据用户以往投资标的金额,利率进行离线推荐,也可以根据用户的点击流日志分析去进行实时推荐,在某个标的详情页的停留时间,标的的点击次数信息。
1.3 京东金融风控调研
  • 1.3.1 用户支付瞬间需要做的事情

    • 如判断用户的设备信息、登录行为、访问特征、信用状况、商品信息、商家特征、配送区域、银行卡状态等。如建立信用、反欺诈、伪冒交易等一系列模型,其中多达近百项的模型需实时计算。这样庞大的运算量在一秒内,甚至几十毫秒内完成,不是易事。 (感觉这些内容任何一点都够我研究一段时间的)
  • 1.3.2 风控的灵魂是数据,所有决策都以数据为驱动

    • 1、业务系统产生的数据和点击流作为主要挖掘的素材来源;但是随着时间推移,恶意用户可以模仿真实用户。因此才会用设备指纹识别,生物探针,语音识别,人脸识别等。

    • 2、风控模型 
      这里写图片描述

      • 原始层数据: 由于原始数据存在杂乱无章的现象,此处使用各种颜色来示意

      • 数据原子化: 数据原子化是经过整理后,把数据按业务归属分类,形成最原子的类别,比如账户,资金,投资,消费等

      • 数据抽象层: 按风控关注的业务做数据整合,这层是最贴近业务的。每一块代表一类业务,一个原子数据类是可以被放入多个抽象数据块里的

      • 数据模型层: 对分析场景使用的,基本就是一个数据模型块对应一个分析场景。

    • 3、机器学习在京东金融的天盾风控系统应用
    • 这里写图片描述

      • 根据经验,在算法的选择上尽可能的多做选择,对比模型的性能择优选取。另外,对样本库做好治理工作,可使用随机抽样和使用聚类把样本数据分层抽取。这些工作是建模人员在大数据环境中也就是离线做的,那么,怎么把训练的模型应用到线上做实时呢,下图是架构: 
        这里写图片描述

      • 京东金融目前正在开发机器学习平台,让懂机器学习的人就可以使用机器学习做想的事情,当前懂机器学习的人不在少数,但真正使用机器学习做具体事情不多,故此平台不但满足内部建模训练、发布等,还可对外输出。 
        数据风控还有很长的路要走,如量化投资风险评估与运营也属风控范畴,风控也可和推荐领域相结合。如数据会有阶段性差异,质量会随时间推移,慢慢发生变化,可能花费很大精力产出的预测产品会失效,调整代价难易不可估。如不同场景准确度和覆盖度都是不同的,尺度如何把握。如怎样能降低统计分析学和分布式计算相结合的成本等等。 
        总之,互联网金融风控核心还是服务客户,提升产品价值,最大程度的做到差异化的防范,智能化是风控的发展方向,京东金融从开始就致力于打造智能化的风险管控解决方案。(机器学习部分了解)

2、第三方风控产品以及服务(数据截止日期2018-01-12)

  • 20强榜单分为三个梯队,三个梯队覆盖的放贷机构数量依次递减,大致比例为10:3:1。

    • 第一梯队(5家):放贷类公司使用最集中的征信机构,分别是上海资信、同盾科技、芝麻信用、鹏元征信和百融金服。

    • 第二梯队(8家):FICO、聚信立、致诚信用、EXPERIAN、安融征信、考拉征信、前海征信、维氏盾征信。

    • 第三梯队(7家):GEO集奥聚合、白骑士、华道征信、立木征信、算话征信、银联智策、正信用。

  • 前海征信可以获取到个人用户的公积金信息。芝麻信用目前是最优秀的征信公司,当中很多公司有自己渠道去获取用户的信息 。

3、国家政策法规

  • 1、 个人单平台借贷余额不能过20万
  • 2、 个人全部平台借贷余额不能过100万
  • 3、 企业法人单平台借贷不能过100万
  • 4、 企业全平台不能过500万

  • 从政策层面上来p2p服务的是属于中小企业,p2p行业不利。因此风控显的更加尤为重要。通过风控模型获取优质的资产。

二、风控模型

  • 风控模型应该是从两个角度去考虑,第一个角度是资产端风控策略,第二个角度是资金端风控策略。考虑主要出发点应该是从贷前、袋中、贷后三个方向去考虑,结合传统业务的风控模型和互联用户的行为数据。针对资金,资产进行风险等级划分,防欺诈系统、袋中的舆情监控、贷后的权重叠加。

    这里写图片描述

1.1 欺诈用户的识别

  • 1.1.1、防欺诈风控系统,下面我列举的参考维度指标;针对黑色产业业务梳理 
    • 根据现有数据统计分析移动端登录用户占比与 PC 用户占比为8:2划分,因此移动的防欺诈系统为主要参考因数,
    • 1、根据以往的业务系统数据可以建立黑名单、白名单。 
      • 白名单: 可以通过建立数据模型已经数据挖掘,机器学习相关算法进行优质用户的挖掘。
      • 黑名单: 黑名单企业可以针对那些逾期、破产企业(法人作为黑名单)、通过手机号码、imei作为用户判断标识,调用第三放征信公司去进行鉴别。
    • 2、对移动端用户进行实时监测,获取用经纬作为、获取用户重力感应数据、mac 地址、ip、移动设备注册时长等数据判断用户是否存在恶意欺诈,恶意注册

1.2 可信度分析

  • 1.2.1、风险等级划分 
    • 风险等级划分,分为三种类型、投入用户风险承受能力等级划分、融资企业以及个人用户的等级划分、融资项目标的等级划分 
      • 1、投资用户等级划分:可以参考投资年龄、居住地、职业、银行流水、固定资产、收入、学历等角度去划分
      • 2、融资企业等级划分:企业所在行业、国家政策、企业现金流、企业注册资本、管理层背景、资产负债率、法人个人信息、企业纳税证明、公司人员数量等维度去
      • 3、标的信息:标的项目类型、回款周期、合作企业、回款方式、融资金额

1.3 贷后预警

  • 对于回款周期比较长的项目,可以至少三个做个回访、让融资企业按时提供目前经营现状、融资标的是否按时回款。根据贷后的状态进行预警、等级划分

四、技术实现

  • 用户画像、人脸识别、推荐系统、智能语音、数据挖掘、风控模型。
  • 风控系统业务流程

    • 访用户欺诈系统

    • 风险评估等级划分系统

    • 用户画像

    • 用户点击流日志分析系统

    • 推荐系统

    • 风险预警系统

    • 风险定价系统

五、产品与服务

  • 参考科法智能提供的服务与产品,将案例信息换位标的信息、将诉讼公司换位融资企业。对照数据就可以解决提供类似的服务。下面是具体相关部分信息。

  • 企业信用信息查询

    • 包括企业基本信息、经营状态、法人以及高管信息披露
    • 对于一些重要信息提供收费服务、本平台高等级投资用户可以免费查看,比如企业的目前经验状况、本平台内部信用等级、所在行业排名等。
  • 企业融资项目标的信息查询 
    • 结合本平台以往类似融资项目信息历史数据进行信息关联、结构归类、风险解读、精准检索。出具融资项目风险测评报告
  • 对于优质资产本平台进行充分的信息披露

  • 科法智能逻辑思维导图

这里写图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/565941.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

推箱子

推箱子小游戏原理的实现 功能分析: 1.找一张类似于箱子的图片自行设置图片的大小 2.设置控制箱子移动的四个方向的按钮 3.使用键盘控制图片上下左右的移动、 效果图演示 原始位置 点击键盘向右移动三次向下移动一次后的位置 看了上述过程是不是感觉很有意思呀&…

我的Go+语言初体验——(5)Go+ 基本语法之 Switch

我的Go语言初体验——(5)Go 基本语法之 Switch “我的Go语言初体验” | 征文活动进行中… Go 语言中提供多路分支条件语句 switch, 用于在不同条件下执行不同动作。 使用 if-else 嵌套结构也可以实现多路分支条件结构,但程序冗长…

java web 开发之写在前面(0)

java是sun公司(现在属于Oracle公司)推出的能够跨越多平台的、可以执行最高的一种面向对象的编程语言,也是目前最先进、特征最丰富、功能最强大的计算机语言。利用java可以编写桌面应用程序,web应用程序、分布式系统、嵌入式系统程…

【OpenCV 例程200篇】52. 图像的相关与卷积运算

【OpenCV 例程200篇】52. 图像的相关与卷积运算 欢迎关注 『OpenCV 例程200篇』 系列,持续更新中 欢迎关注 『Python小白的OpenCV学习课』 系列,持续更新中 滤波通常是指对图像中特定频率的分量进行过滤或抑制。图像滤波是在尽可能保留图像细节特征的条件…

java web 之 网页前端开发基础(1)

1.HTML(Hypertext Markup Language,HTML,超文本标记语言) 1.1 创建第一个HTML文件 编写html语言可以通过两种方式,一种是手工编写html代码,一种是借助一些开发软件,如Dreamweaver或者微软公司…

文本框为空按钮不可点击

在form表单的提交中判断输入框的内容是否为空,如果输入框的内容为空则按钮不可点击,只有当输入框的内容不为空时才能点击并执行之后的提交等操作。 效果图演示 输入框为空(按钮不可点击,点击无效果) 输入框不为空时…

【youcans 的 OpenCV 学习课】7. 空间域图像滤波

专栏地址:『youcans 的图像处理学习课』 文章目录:『youcans 的图像处理学习课 - 总目录』 【youcans 的 OpenCV 学习课】7. 空间域图像滤波 图像滤波是在尽可能保留图像细节特征的条件下对目标图像的噪声进行抑制,是常用的图像预处理操作。 …

java web开发之上机指导(2)

创建一个用户注册的页面,让用户输入姓名、密码、电话和邮箱,使用javascript脚本完成密码校验、电话号码校验、邮箱校验和空格内容校验。 开发步骤如下。 (1)创建一个项目名为CheckInfomation,在WebContent文件夹下创…

小程序开发之基础知识(0)

前言:2016年9月21日,微信小程序正式开启内测。 2017年1月9日0点,万众瞩目的微信第一批小程序正式上线,用户可以体验到各种各样小程序提供的服务。 人类发展史大抵经历了石器时代,青铜器与铁器时代、工业与科技时代(从第一次工业革命算起&…

鼠标悬浮改变背景颜色

将鼠标放在div上时div的背景颜色发生改变,把鼠标移走div之后,div的背景颜色回复原来的颜色。 效果图演示 没有将鼠标放在div上时(lanse) 将鼠标放在div上之后(变为红色) 下面看代码 由于代码较短&…

我的Go+语言初体验——(6)整型有理数数据类型

我的Go语言初体验——(6)整型有理数数据类型 “我的Go语言初体验” | 征文活动进行中… Go 语言使用后缀 ‘r’ 表示有理数,支持整型、分数型、浮点型三种有理数数据类型(Rational number)。 在整型有理数变量声明时&…

利用python进行数据分析之准备工作(1)

目录 一、简介 二、重要的python库 1.numpy库 2.pandas 3.matplotlib 4.IPython 5.Scipy 三、python环境安装和数据分析前的数据准备 一、简介 什么是数据?本栏目的数据主要指的是结构化的数据,通常我们使用数据这一说法来笼统地概括所有通用格式…

获取焦点改变输入框背景色

当输入框获取焦点时&#xff08;鼠标点到输入框时&#xff09;为红色&#xff0c;失去焦点时还原&#xff08;鼠标未点输入框内&#xff09;为白色。 效果图演示 没有获取焦点 获取焦点 代码演示 <!DOCTYPE html> <html><head lang"en"><…

【OpenCV 例程200篇】53. Scipy 实现图像二维卷积

【OpenCV 例程200篇】53. Scipy 实现图像二维卷积 欢迎关注 『OpenCV 例程200篇』 系列&#xff0c;持续更新中 欢迎关注 『Python小白的OpenCV学习课』 系列&#xff0c;持续更新中 滤波通常是指对图像中特定频率的分量进行过滤或抑制。图像滤波是在尽可能保留图像细节特征的条…

python基础课程1(看代码看注释)--基本操作和数据类型

python环境自行安装&#xff0c;建议安装3版本的环境。编辑器可以使用pycharm或者sublime&#xff0c;也可以在线上使用jupyterimport this #函数存在于模块中&#xff0c;我们需要先引用这个模块才能使用这个模块里的函数 print(hello,world)#单引号 print("hello,world&…

点击按钮切换图片

点击按钮时将当前显示的图片切换为指定要显示的图片 效果图演示 未点击更换图片之前显示的图片 点击更换图片之后 程序详解&#xff1a; 准备两张互相切换的图片给更换图片按钮添加点击事件把两张图片放在一个数组里点击按钮后执行判断如果是第一张图片就换成第二张&#…

【OpenCV 例程200篇】54. OpenCV 实现图像二维卷积

【OpenCV 例程200篇】54. OpenCV 实现图像二维卷积 欢迎关注 『OpenCV 例程200篇』 系列&#xff0c;持续更新中 欢迎关注 『Python小白的OpenCV学习课』 系列&#xff0c;持续更新中 滤波通常是指对图像中特定频率的分量进行过滤或抑制。图像滤波是在尽可能保留图像细节特征的…

python基础课程2(看代码看注释)--条件判断|循环|函数|生成器|类

##人生苦短&#xff0c;我用python ##课程内容 #条件判断 #循环 #类&#xff1a;简单介绍类的用法##条件判断 #if condiction:# dosomething #else: # dosomething total_cost 32.5 if total_cost>30:discount 0.9 elif total_cost>20:diacount 0.95 else :disco…

【OpenCV 例程200篇】55. 可分离卷积核

【OpenCV 例程200篇】55. 可分离卷积核 欢迎关注 『OpenCV 例程200篇』 系列&#xff0c;持续更新中 欢迎关注 『Python小白的OpenCV学习课』 系列&#xff0c;持续更新中 空间滤波器是由邻域和定义的操作构成的&#xff0c;滤波器规定了滤波时采用的邻域形状及该区域内像素值的…

Anaconda 安装 Python 库(MySQLdb)的方法

转载自&#xff1a;苏皖静儿 [已解决]Anaconda 安装 Python 库&#xff08;MySQLdb&#xff09;的方法 zoerywzhou163.com http://www.cnblogs.com/swje/ 作者&#xff1a;Zhouwan 2017-12-4 安装python库的过程中&#xff0c;最重要的地方就是版本需要兼容。其中操作系统为…