智能风控体系之Y定义与样本选择(A卡)

评分卡模型设计里面,最重要的一环就是Y的定义和好坏样本的选择,即样本范围选择和Y变量确定。一般来说,产品评分卡开发需要有需求、设计、开发、测试、部署上线等过程。需要思考几个问题:

1.需要做几个评分卡模型,根据贷款产品的类型、场景、客群分类、数据可用性进行模型细分。

2.业务目标是什么?例如预测客群贷款后6个月内违约的概率,对违约高风险客户进行拦截。

3好坏客户如何定义,样本如何选择等问题。

为了解决以上的这些问题,需要确定几个内容(业务目标、表现期、观察点、观察期、逾期表现),主要通过滚动率矩阵、vintage曲线、产品制度来最终确定。

▍Y定义

业务目标:预测客群贷款后未来一段时间内可能逾期的概率,拦截逾期概率较高的客群。

好坏定义:通过滚动率矩阵分析,可以确认客群逾期到什么程度再还款的概率极低,一般客群逾期M2+就不再还款。定义坏客户为M2+,好客户为逾期0天。逾期在0~M2之间的客群就是灰客户。

图片

表现期定义:表现期就是vintage曲线未来一段时间内趋于稳定的长度,表现期就是业务放款后客群还款一段时间后,会完全暴露出好坏逾期情况,即需要多久后客群会暴露出好坏表现。例如12期的贷款产品,一般表现期为9期。业务目标就是预测客群贷款后还款9个月内可能逾期的概率。那表现期不足9期的客户就是灰样本。

图片

观察点定义:贷款A卡评分模型的观察点一般就是贷款申请时点。

图片

观察期定义:观察期一般用来提取样本的预测特征变量,观察期一般要长些,一般是近2年,例如部分征信指标为近24个月银行贷款查询次数等。

▍剔除灰样本

1.剔除被前置风控规则命中的样本;

2.剔除表现期特殊客群的样本

3.剔除未提款客群的样本

4.剔除表现期不足9个月客群的样本

5.剔除逾期状态不足M2+客群的样本

注释:另外需要考虑客群是否需要分群建模。

▍样本选择与Y定义

样本一般分为训练集、测试集、时间外验证集,进行模型的训练、参数选择、验证。对于Y目标变量的定义不同,建设出来的A卡评分模型应用场景就会不同,那么选择样本客群就会不一样。评分模型建设前提,就是未来客群样本分布与历史进件的客群样本分布保持一致且独立。评分模型才会有效地准确预测未来进件客群的违约概率。

常见的Y定义,例如A卡根据Y的表现期分前3期(偏欺诈)和前6期、前9期去做不同的组合A卡;坏客户定义历史最大逾期天数15+或30+;基于组合矩阵来进行客户综合的风险评级。对Y变量给予不同的短中长期的表现期,建设不同组合的A卡评分,建设A卡评分矩阵,可以更加精细化管理进件客群。建设评分卡模型主要基于逻辑回归、Xgboost和LightGBM机器学习模型。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/692392.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【动态规划】:路径问题_下降路径最小和

朋友们、伙计们,我们又见面了,本专栏是关于各种算法的解析,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成! C 语 言 专 栏:C语言:从入门到精通 数据结构专栏&…

OpenGL学习——17.模型

前情提要:本文代码源自Github上的学习文档“LearnOpenGL”,我仅在源码的基础上加上中文注释。本文章不以该学习文档做任何商业盈利活动,一切著作权归原作者所有,本文仅供学习交流,如有侵权,请联系我删除。L…

C# CAD交互界面-自定义面板集-comboBox选择图层

运行环境Visual Studio 2022 c# cad2016 一、代码说明 SelectLayer方法是一个自定义的AutoCAD命令方法,通过[CommandMethod("SelectLayer")]进行标记。方法首先获取当前活动文档,并检查是否有效。创建一个名为"SelectLayer"的Pale…

【复现】XMall 开源商城 SQL注入漏洞_54

目录 一.概述 二 .漏洞影响 三.漏洞复现 1. 漏洞一: 四.修复建议: 五. 搜索语法: 六.免责声明 一.概述 XMall基于SOA架构的分布式电商购物商城 前后端分离 前台商城:Vue全家桶 后台管理系统 二 .漏洞影响 攻击者未经授权可以访问数据库…

ES 在单个节点的查询并发限制是多少?增加分片一定会提高聚合/查询速度吗

背景 对于搜索集群而言,小节点多节点化一般是最佳实践。对于OLAP/日志集群而言,难以避免使用大节点(单节点高配置),因为太多节点容易造成master的压力。对于OLAP集群而言单节点可能存在数百甚至数千shard。此时我们就…

使用 RAG 创建 LLM 应用程序

如果您考虑为您的文件或网站制作一个能够回应您的个性化机器人,那么您来对地方了。我可以帮助您使用Langchain和RAG策略来创建这样一个机器人。 了解ChatGPT的局限性和LLMs ChatGPT和其他大型语言模型(LLMs)经过广泛训练,以理解…

Leetcoder Day16| 二叉树 part05

语言:Java/C 513.找树左下角的值 给定一个二叉树的 根节点 root,请找出该二叉树的 最底层 最左边 节点的值。 假设二叉树中至少有一个节点。 示例 1: 输入: root [2,1,3] 输出: 1示例 2: 输入: [1,2,3,4,null,5,6,null,null,7] 输出: 7 本题需要满足两…

在vue事件中传入$event,使用e.target和e.currentTarget有什么区别

在Vue中,事件处理是前端开发中非常重要的一部分。当我们在Vue中处理事件时,经常会用到事件对象event,而在事件对象中,有两个常用的属性:e.target和e.currentTarget。这两个属性在使用上有些细微的差别,本文…

备战蓝桥杯---数学之矩阵快速幂基础

我们先不妨看一道题&#xff1a; 看见n的数据范围就知道直接按以前的递归写肯定狗带&#xff0c;那我们有什么其他的方法吗&#xff1f; 下面是分析&#xff1a; 我们就拿斐波那契数列试试手吧&#xff1a; 下面是AC代码&#xff0c;可以当作模板记&#xff1a; #include<b…

qt-交通路口仿真

qt-交通路口仿真 一、演示效果二、核心代码三、程序链接 一、演示效果 二、核心代码 #include "generator.h"Generator::Generator(SimulationScene *scene):m_scene(scene),m_mode(VEHICLEMETHOD::GO_THROUGH),m_running_state(false),m_VisionOn(false),m_IsInter…

HTML元素和属性快速参考指南

​ 以下是几个与HTML元素和属性相关的参考资料网站链接&#xff1a; HTML Reference - 提供所有HTML元素和属性的免费指南。W3Schools HTML Reference - W3Schools 提供一个广泛的HTML标签和属性参考。freeCodeCamp HTML Cheat Sheet - freeCodeCamp 提供了一个HTML元素列表参…

【Label Studio运行报错】ModuleNotFoundError: No module named ‘google.rpc‘

报错截图&#xff1a; 解决方法&#xff1a; 新建虚拟环境&#xff0c;安装google相关包 pip install google-cloud-core google-cloud-storage把虚拟环境中site-packages下google文件夹拷贝到当前环境的对应位置下。去官网下载最新的sqlite3&#xff0c;复制到AppData\Loca…

Android挖取原图中心区域RectF(并框线标记)放大到ImageView宽高,Kotlin

Android挖取原图中心区域RectF(并框线标记)放大到ImageView宽高&#xff0c;Kotlin 红色线框区域即为选中的原图中心区域&#xff0c;放大后放到等宽高的ImageView里面。 import android.content.Context import android.graphics.Bitmap import android.graphics.BitmapFactor…

163邮箱发邮件

1、Jenkins安装Email Extension Plugin 2、网易邮箱里获取授权码:qa_jenkins_robot@163.com 开启POP3/SMTP 我已经配置过了,所以这里会有一个使用设备 3、配置Jenkins邮箱通知 Manage Jnekins-Configuration System Jenkins Location: Extended E-mail Notification: …

【MySQL】如何处理DB读写分离数据不一致问题?

文章内容 1、前言读写库数据不一致问题我们如何解决&#xff1f;方案一&#xff1a;利用数据库自身特性方案二&#xff1a;不解决方案三&#xff1a;客户端保存法方案四&#xff1a;缓存标记法方案五&#xff1a;本地缓存标记 那DB读写分离情况下&#xff0c;如何解决缓存和数据…

【最新Dubbo3深入理解】Dubbo特性、工作原理以及负载均衡策略

欢迎关注公众号&#xff08;通过文章导读关注&#xff1a;【11来了】&#xff09;&#xff0c;及时收到 AI 前沿项目工具及新技术的推送&#xff01; 在我后台回复 「资料」 可领取编程高频电子书&#xff01; 在我后台回复「面试」可领取硬核面试笔记&#xff01; 文章导读地址…

代码随想录算法训练营第56天 | 300.最长递增子序列 674.最长连续递增序列 718.最长重复子数组

最长递增子序列 这里dp数组的定义比较难想。dp[i] 表示 i 之前的序列中以 nums[i] 结尾的最长递增子序列长度&#xff0c;只有这样才能实现状态递推。对于dp数组初始化&#xff0c;所有下标位置都应该初始化为1。 class Solution{ public:int lengthOfLIS(vector<int>&a…

课后延时服务选课报名管理系统功能清单

课后延时服务选课报名管理系统分为学校端&#xff0c;培训机构端&#xff0c;家长端。 学校端提供学生管理&#xff0c;课程管理&#xff0c;班级管理&#xff0c;班级排课&#xff0c;班级课表&#xff0c;可直接安排学生入班上课&#xff0c;查看学生考勤情况&#xff0c;查…

网关服务gateway注册Consul时报错Consul service ids must not be empty

网关服务gateway启动时&#xff0c;初始化Consul相关配置时报错。 Consul service ids must not be empty, must start with a letter, end with a letter or digit, and have as interior characters only letters, digits, and hyphen: cbda-server-gateway:10.111.236.142:…

stm32学习笔记-STLINK使用

stm32学习笔记-STLINK使用 使用ST-LINK调试程序进度表格 使用ST-LINK调试程序 说明 组成 总结 记录使用STLINK进行项目的烧写和调试&#xff0c;旨在高效的进行代码调试学习工具包括笔记本、keil5MDK、stm32f030c8t6电表主机、STLINK V2、导线、电表代码总的来说&#xff0…