目录
风控策略开发
策略类型划分
单维度策略开发
风控策略开发
在风控过程中,风控策略最终是要直接参与风控决策的,风控策略的好坏会对风控结果产生直接影响,因此,开发有效的风控策略至关重要。
策略类型划分
在实际生产中,我们开发的所有策略可以分为单维度和多维度两种类型。
若策略由一个变量构成,那么我们称之为单维度策略。单维度策略比较简单,常见的示例形式:“变量+取值方向判断+切分点+风控建议”。若策略由至少两个变量构成,则称之为多维度策略。多维度策略复杂很多,常见的一种示例形式:“变量1+取值方向判断+切分点且(或)变量2+取值方向判断+切分点+风控建议”。
下表展示了贷前、贷中、贷后的一些风控场景涉及的策略类型及其对应的策略样例,这些样例可以方便读者更好地了解单维度策略和多维度策略。
分控场景 | 策略类型 | 策略样例或说明 |
贷前授信审批 | 单维度策略 | 进件客户年龄不属于[22,60],授信审批拒绝 |
单维度策略 | A卡模型分<500,授信审批拒绝 | |
多维度策略 | 近3个月,客户申请贷款机构数>5且客户当前负债>60000元,授信审批拒绝 | |
贷前定额 | 多维度策略 | 在定额场景中,通常基于贷前风险模型分,以及客户收入、负债和多头等相关变量进行组合,构建定额策略。定额策略的构建往往会使用多个变量且定额策略中的变量的组合形式通常不固定。定额策略基本上是多维度策略 |
贷前定价 | 多维度策略 | 在定价场景中,通常基于客户的风险评级、动支意愿等相关变量构建定价策略。定价策略基本上是多维度策略 |
贷中用信审批 | 单维度策略 | 客户近10天借款申请次数>10,用信审批拒绝 |
多维度策略 | 客户近10天借款申请机构数次数>5且B卡模型分<510,用信审批拒绝 | |
贷中调额 | 多维度策略 | 在调额场景中,往往是先基于一些策略筛选出满足调额条件的客户,形成清单,再基于调额规则对客户进行调额。调额策略相对复杂,属于多维度策略 |
贷中调价 | 多维度策略 | 在调价场景中,往往是先基于一些策略筛选出满足调价条件的客户,形成清单,再基于调价规则对客户进行调价。调价策略相对复杂,属于多维度策略 |
贷后催收 | 单维度策略 | 客户逾期天数≤2,短信催收 |
多维度策略 | 客户逾期天数>30且C卡模型分<300,委外催收 |
单维度策略和基于CART 模型的多维度策略主要的、通用的分析和挖掘过程如图
单维度策略的开发相对简单,方法论也比较成熟,多维度策略的开发比较复杂,没有一套普适的方法论。在大多数情况下,主要基于CART模型进行多维度策略的开发。
需要注意的是,在实际生产中,风控策略开发涉及的场景多种多样,若项目处于冷启动阶段,那么,因没有足够的样本积累,将无法采用量化分析的方法进行策略的分析和挖掘,往往基于专家经验采用定性分析的方法构建冷启动策略。构建冷启动策略主要有以下两种方式:第一,借鉴同类型产品的规则进行策略构建;第二,利用头脑风暴方式获得一些与业务强相关的变量,从而利用它们进行策略构建。接下来主要讲述项目非冷启动阶段的风控策略量化开发方法。
单维度策略开发
在策略开发过程中,所有的风控场景都涉及单维度策略的开发。单维度策略开发其实就是对单个变量进行分析和挖掘,评估其是否适合单独用来进行风控决策的过程。单维度策略开发包括策略测算和策略泛化两个主要环节,策略测算是在训练集(TrainSet)上分析策略效果,策略泛化是在验证集(Validation Set)上分析策略效果。若策略在训练集和验证集上的效果都较好,那么我们才认为策略效果较好,可以上线做决策。需要指出的是,在做单维度策略开发时,很多人会忽略策略泛化环节,其实这是不对的,因为策略测算效果好,不见得泛化效果会好,而泛化效果不好,说明策略效果是不稳定的,不适合上线做决策,若不做策略泛化就进行策略上线,则可能带来不符合预期的结果。
单维度策略测算包括三个主要步骤,具体如下所述。
- 1)变量描述性统计分析和筛选:对变量进行描述性统计分析,剔除缺失值占比或众数占比过高的变量,其余变量进入下一轮分析。
- 2)变量最优分箱:针对变量描述性统计分析筛选的变量,结合业务需求对变量进行有监督或无监督分箱,分箱时,对头部或尾部的分箱,需要足够精细,以便能快速找到对坏样本区分度足够好的切分点,分箱完成后,可结合目标字段计算不同分箱对应的样本量、样本占比、Bad_Rate、Odds Ratio、Lift 等指标,为规则测算效果分析和筛选做好准备。上述指标的计算逻辑将在下文介绍。
- 3)规则测算效果分析和筛选:基于分箱结果,筛选效果好且有业务解释性的单维度规则进行泛化。
单维度策略泛化包括两个主要步骤,具体如下所述。
- 1)规则泛化效果分析和筛选:将策略测算环节筛选的效果好的规则在验证集上进行泛化分析,筛选泛化效果好且稳定的规则进入待上线规则集。若最终只筛选了1条待上线规则,则基于规则泛化结果直接上线即可;若最终筛选了至少两条待上线规则,则需要对待上线规则集进行合并泛化。
- 2)待上线规则集合并泛化:若待上线规则集中有不少于两条规则,则需要将这些规则合并成1条规则并进行泛化,然后分析所有规则同时上线对风险指标的影响。
待上述步骤完成后,筛选待上线的规则在风控内部进行策略评审,评审通过后,就能部署上述规则并上线决策了。
print('要天天开心啊')