特征变换
分箱
为什么分箱
连续数值离散化
降低异常值带来的影响
提升模型的稳定性
如何分箱
等频
等距
卡方
风控场景下常用
决策树
KMeans
编码
one-hot encoding(热编码)
label encoding(标签编码)
WOE encoding(WOE编码)