【40分钟速成智能风控8】智能反欺诈模型2

目录

​编辑

智能反欺诈模型

图计算

智能信用风险模型

专家模型

逻辑回归

决策树

集成树

深度神经网络

循环神经网络


智能反欺诈模型

图计算

图计算(Graph Computing)是以关联图谱为基础引申出来的一类算法的统称,主要解决了图数据模型的表示和计算问题。图计算是目前比较热门的一个研究方向,比较成熟的应用场景有社区发现、标签传播、图嵌入等。社区发现(Communication Detection)主要用于关联图中社区的划分,与聚类算法的目标类似,我们也希望社区划分后每个社区内部节点联系密切,而社区之间的连接较为稀疏,因而这里定义了模块度的概念。简单理解,模块度是社区内部节点的连接边数与随机情况下边数的差,这个差值越大说明社区内部的连接程度越紧密。以最大化全局模块度为学习目标,就有了经典的Louvain算法。Louvain算法在初始化的时候将每个节点看作一个社区,通过分配节点使得相邻社区的模块度增益最大,直至所有社区不再变化,之后将生成的社区压缩成一个新的节点,重复上述工作,直至整个图中的模块度不再变化。Louvain在Spark环境下已经实现分布式,因而可以较好地支持工业界的需求。

标签传播(Label Propagation Algorithm,LPA)是一种基于关联图的半监督学习方法,利用已标记的样本来推论未标记的样本。标签传播算法的核心在于利用节点之间边的权重构建转移矩阵,每轮传播后更新除已标记样本外其他样本的标签,直至所有样本的标签收敛。标签传播算法最大的优势是简单高效,不过也存在结果不稳定等问题。

图嵌入(Graph Embedding)借鉴了NLP中word2vec的思想,将关联图中的节点嵌人某个高维空间中,使得每个节点向量化,并且映射后的向量还能够保留图的结构和性质。图嵌人的方式有很多,例如DeepWalk、Line、node2vec、SDNE等,并没有绝对意义上最优的嵌人方式,需要建模人员根据数据的分布特性和实际业务效果,不断地尝试和迭代。图嵌入后的向量可以表示每个样本的社交属性,既可以作为入模特征放到欺诈或者风险模型中训练,又可以利用聚类算法进行客群间的划分。

智能信用风险模型

评分卡模型存在人模变量少、迭代周期长等劣势,并不足以支持互联网金融机构的风险管理需求。随着大数据和机器学习技术在风险管理场景中应用的相对成熟,新一代的智能信用风险模型出现了。智能信用风险模型基于海量数据搭建,利用了先进的机器学习和人工智能算法,构建多个子模型和集成主模型的方式,大大提升了模型的区分度和时效性,弥补了传统风险管理体系中的诸多不足。

对于智能信用风险模型,风控建模人员通常会将整个信贷生命周期划分为准入、贷前、贷中、贷后四大场景,由于每个场景中的目标和数据源存在差异,又会选择不同的算法来搭建模型。下面会简单介绍一些智能风控时代常用的模型算法及其适用的场景和原因

专家模型

额度和利率模型本身对于准确性并没有很高的要求,更多的是业务人员出于经验给出的一个合理的额度和利率范围,要求有较好的可解释性,因而传统的专家模型(Expert Model)在这里较为适合。对于额度模型,目前行业内比较常见的思路有两种。

第一种是利用申请评分卡和价值模型构建二维矩阵,针对逾期风险较低且平台价值较高的客户给予较高的额度,针对逾期风险较高且平台价值较低的客户给予较低的额度。

第二种是从客户的收入、资产、支出、负债四个方面衡量,大致计算出客户的可支配收入,通常客户每个月的还款金额不超过每个月可支配收人的60%。

利率模型相对简单,通常直接与申请评分卡所预测的逾期风险挂钩,最高不超过监管要求的综合年化利率36%。

逻辑回归

作为风险管理领域中最为经典的算法,逻辑回归(Logistic Regression,LR)在智能风控时代依旧被使用,其兼顾区分度和稳定性的优点,对于白名单模型来说较为适合。在准人环节,机构希望了解整个平台的客群质量,进行风险分层并圈定产品的目标客群,并且每个分层对应的客群逾期率相对于时间的推移是稳定的,逻辑回归模型可以很好地满足这个需求。另外由于白名单模型需要覆盖平台的全部流量并且进行批量更新,出于数据成本的考虑,不会像申请评分模型一样调取大量的外部数据,能够依赖的数据维度较为单一,这种低维情况下选取逻辑回归较为合适。

决策树

决策树(Decision Tree)是智能风控时代运用最广泛的技术,不仅可以被业务人员应用来搭建风控策略中的决策流,还是许多建模人员常用的集成树算法的基础。通常情况下,一棵决策树包括一个根节点、若干个内部节点和若干个叶子节点,根节点和内部节点对应数据维度,每一层节点对应的客群根据数据维度阈值的划分结果,落入下一层节点,叶子节点对应最终的决策结果。对于每一层节点的划分,希望划分后的客群尽可能属于同一个类别,例如逾期或不逾期,这样一层层下来搭建的决策树才能最终将客群区分开。对于决策树的使用,业务人员和建模人员的侧重点有较大的区别。业务人员更偏向于决策树的可视化,希望找到若干条决策路径,构建涵盖多个数据标签的复杂规则;而建模人员则利用多棵决策树集成的算法,学习到已有逾期客群和正常客背后分布的规律,并把这个规律应用到未来进行逾期预测。

集成树

集成树(Ensemble Tree)是树类模型集成算法的统称,例如Random Forest、AdaBoost、GBDT以及大名鼎鼎的XGBoost都属于集成树的范畴。顾名思义,集成树将决策树作为基学习器,利用集成学习的思想,以不同的方式叠加而形成。集成树既具有决策树本身解释性好的优点,又具有集成学习带来的准确性和区分度的提升,一些特殊的框架例如XGBoost,由于加入了正则化项,还保证了模型的稳定性。集成树算法相比于神经网络算法,对于数据量和数据维度的要求并不算高,通常数据量满足5万、数据维度大于100,就可以尝试建模,因此被各大互联网机构应用于申请评分模型、行为评分模型、催收评分模型、价值模型的搭建工作中,是目前建模人员首选的机器学习算法。

深度神经网络

深度神经网络(Deep Neural Network,DNN)在AI领域已经落地较多,在智能风控领域也有着越来越多的尝试。对于头部互联网金副机构的贷前场景来说,由于业务开展较早和规模较大,已经积累了几十万的申请样本和对应的还款表现,并且内外部数据标签上千维,可以利用DNN建立申请评分模型。DNN是深度学习中最经典的框架,由输入层、若干个隐藏层和输出层组成。其中,每个隐藏层都具有若千个节点,层与层的节点之间具有连接,需要求解连接的函数,来确定一个最优的DNN模型。看似复杂,其实DNN与我们熟悉的逻辑回归存在紧密联系,逻辑回归的本质是一个仅含有一个节点的单层神经网络模型,DNN可以理解为多个逻辑回归“交织”在一起,因此具有比逻辑回归强得多的学习能力。比DNN更进一步,Google 于2016年提出Wide&Deep的框架,将线性模型和深度模型利用联合训练的方式结合起来,既保证了显性特征的可解释性,又挖掘了隐性特征的预测能力,也被智能风控领域的建模人员广泛尝试。

循环神经网络

除了DNN算法,循环神经网络(Recurrent Neural Network,RNN)是另一种在智能风控领域被尝试的神经网络结构。RNN的特性是在时间维度上具有“记忆”功能,具体的实现原理是对于RNN的隐藏层,t-1时刻的输出会作为t时刻的输入,这样当前时刻的隐藏层会包括之前所有时刻隐藏层的信息。这个特性使得RNN被应用到行为评分模型和催收评分模型的搭建中,因为支用行为序列和催收行为序列都具有很强的时间属性,利用RNN可以自动提取这些时间序列中的隐性特征。在时间序列中我们通常更希望关注近期行为,忽略远期行为带来的噪声,因此便有了长短期记忆网络(Long Short Term Memory,LSTM)。与RNN相比,LSTM在各隐藏层节点之间传递信息的过程中,加入了输入门、遗忘门和输出门的结构,使得整个网络结构可以有选择性地“记忆”过去的信息,对于时间序列上的信息提取有了重大提升。

print('要天天开心呀')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/806759.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

windows linux服务器 以及Azure平台 密码策略配置

密码策略配置 windows 服务器Ubuntu 服务器安装libpam-pwquality密码质量检查库设置密码过期的天数密码策略限制使用过去使用过的密码 centos 7 服务器设置密码过期的天数设置最小密码长度限制使用过去使用过的密码 Azure云默认密码策略 windows 服务器 WinR或右键开始—运行—…

头歌-机器学习 第12次实验 Adaboost算法

第1关:什么是集成学习 任务描述 本关任务:根据本节课所学知识完成本关所设置的选择题。 相关知识 为了完成本关任务,你需要掌握:1.什么是集成学习。 什么是集成学习 集成学习方法是一种常用的机器学习方法,分为b…

Vue2.x实现商城购物车

1.实现购物车页面 在页面中显示购物车中的商品信息,并能进行数量增减及商品删除操作,购物车中金额也随商品数量的变化而变化 2.创建cart.html页面 创建cart.html页面,在其中创建Vue实例,实例中首先准备一些商品信息以供显示&a…

天软特色因子看板 (2024.4 第3期)

该因子看板跟踪天软特色因子A05005(近一月单笔流出金额占比(%),该因子为近一月单笔流出金额占比(% 均值因子,用以刻画下跌时的 单成交中可能存在的抄底现象 今日为该因子跟踪第3期,跟踪其在SH000852 (中证1000) 中的表现,要点如下…

微信小程序转盘抽奖

场景: 在微信小程序里面开展抽奖活动使用转盘抽奖;类似下图(图片来自百度) 方法: 使用lukcy-canvas组件 在 微信小程序 中使用 | 基于 Js / TS / Vue / React / 微信小程序 / uni-app / Taro 的【大转盘 & 九宫…

Dolphinscheduler单机部署

目录 概述实践二进制包前置准备工作解压并启动 Dolphinscheduler登录 Dolphinscheduler启停服务配置数据库 结束 概述 Standalone仅适用于 Dolphinscheduler 的快速体验 实践 官网 官网standalone 二进制包 二进制包:在下载页面下载 Dolphinscheduler 二进制包…

IO流【 文件字符输入、出流;带缓冲区的字符输入、出流;对象流】

day36 IO流 字符流继承图 字符流 继day35 应用场景:操作纯文本数据 注意:字符流 字节流编译器 编译器:可以识别中文字符和非中文字符,非中文字符获取1个字节(一个字节一个字符),编译器会根据…

深入浅出Golang image库:编写高效的图像处理代码

深入浅出Golang image库:编写高效的图像处理代码 引言image库概览图像处理基础概念image库的主要组成和功能image接口图像格式的支持color模型 结论 图像的基本操作创建图像新图像的创建从文件加载图像 图像的保存与导出图像的颜色和像素处理绘制基本形状和文字 高级…

【开源社区】openEuler、openGauss、openHiTLS、MindSpore

【开源社区】openEuler、openGauss、openHiTLS、MindSpore 写在最前面开源社区参与和贡献的一般方式开源技术的需求和贡献方向 openEuler 社区:开源系统官方网站官方介绍贡献攻略开源技术需求 openGauss 社区:开源数据库官方网站官方介绍贡献攻略开源技术…

数据结构(三)----栈和队列

目录 一.栈 1.栈的基本概念 2.栈的基本操作 3.顺序栈的实现 •顺序栈的定义 •顺序栈的初始化 •进栈操作 •出栈操作 •读栈顶元素操作 •若使用另一种方式: 4.链栈的实现 •链栈的进栈操作 •链栈的出栈操作 •读栈顶元素 二.队列 1.队列的基本概念 2.队列的基…

关于ABP 新增表,dbfirst模式

下面的代码是基于abp生成的项目,项目名:Store 1.在Domain结尾的项目中通过EF工具生成数据实体: Scaffold-DbContext Data Source服务器IP;Initial Catalog数据库;User Idsa;Password密码;EncryptFalse; Microsoft.EntityFrameworkCore.SqlS…

Java基础_15集合及其方法

今天的内容 1.集合 1.集合【重点】 1.1为什么使用集合 集合和数组是一样的都是用来存储数据的!!! 真实的开发的时候,使用的是集合不是数组,为啥? 数组存数据: ​ 1.数组的容量是固定的 ​ 2.数组封装的方法…

慢品人间烟火色,闲观万事岁月长

小女孩的衣柜里,怎能缺少一套别致的新中式穿搭?让我们的小公主在时尚与传统中寻找平衡 演绎属于自己的中国风魅力精致的小立领,淡淡的文艺复古气息 上衣系带设计,外加一层高透轻纱穿上身如亭亭玉立的大小姐整个人仿佛笼罩了一层…

【docker】之linux写shell脚本备份线上数据库(备份为dump文件)

目录 1. SH文件1.1 SH文件示例1.2 文件解释1.3 .sh文件执行 2. 备份线上数据库的.sh文件2.1 文件命令解析 3. 命令执行4. 线下dump文件的恢复与备份 环境:linux容器:docker 1. SH文件 SH文件通常指的是 Shell 脚本文件,文件后缀名为.sh&…

IP查询在追踪网络攻击源头中的应用

随着网络攻击事件的不断增加,追踪攻击源头成为网络安全领域的重要任务之一。IP查询技术通过分析网络流量中的IP地址,可以帮助确定攻击的来源。本文将探讨IP查询在追踪网络攻击源头中的应用,包括其原理、方法以及实际案例分析。 IP地址查询&a…

比特币减半后 牛市爆发

作者:Arthur Hayes of Co-Founder of 100x 编译:Qin jin of ccvalue (以下内容仅代表作者个人观点,不应作为投资决策依据,也不应被视为参与投资交易的建议或意见)。 Ping PingPing,我的手机发出的声音&…

Linux CentOS 安装 MySQL 服务教程

Linux CentOS 安装 MySQL 服务教程 1. 查看系统和GNU C库(glibc)版本信息 1.1 查询机器 glibc 版本信息 glibc,全名GNU C Library,是大多数Linux发行版中使用的C库,为系统和应用程序提供核心的API接口。在Linux系统中,特别是在…

js 数组 按列循环二维数组

期待效果&#xff1a; 核心代码&#xff1a; //js function handle(array) {var result [];for (let i 0; i < array[0].length; i) {var item []; for (let j 0; j < array.length; j) {item.push(array[j][i])} result.push(item);} return result; } 运行代码&a…

酷开科技 | 酷开系统打破客厅局限让大家享受更智能便捷的服务

曾经电视是家庭场景中的重要屏幕&#xff0c;是家庭发现世界和获取资讯的中心。但经历了近一百年的发展&#xff0c;传统电视行业进入瓶颈期&#xff0c;电视在家庭中的地位被逐渐替代。特别是智能手机的诞生&#xff0c;让手机成为个人生活的中心和全社会关注焦点&#xff0c;…