智能风控体系之逻辑回归

逻辑回归就是这样的一个过程:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型的好坏。在信贷风控领域最常用的广义线性模型就是逻辑回归。其实逻辑回归线性可分和线性回归里面的单/多变量线性回归类似,只不过在原有的基础上增加了sigmod函数。其使用的分类函数是sigmoid函数,其可以将模型结果输出约束在【0,1】之间

逻辑回归主要用于解决分类问题,比如:客户是否该买某个商品,借款人是否会违约等问题。实际上,“分类”是逻辑回归的目标和结果,中间过程依旧是涉及“回归”问题,因为通过逻辑回归模型,我们得到的是0-1之间的连续型结果值,即概率,例如借款人未来违约的概率。然后给这个概率加上一个合理的阈值,就变成了分类问题。

▍逻辑回归原理

首先二分类的问题,输出概率P大于某个值时,则判别为类别A,输出概率P小于某个值的时候判为类别B。sigmod函数主要作用是:对于任意实数,那么对应任何的y的取值范围,即将输入的任意实数映射到0-1之间,实现了数值到概率的转换。具体函数为:

图片

图片

逻辑回归的预测函数:

图片

逻辑回归参数求解:上面得到了预测函数,那么我们如何求解参数呢?这里采用了最大似然估计。其中极大似然估计是数理统计中参数估计的一种重要方法。

▍逻辑回归求解

基于极大似然估计进行逻辑回归模型最优参数求解,根据定义损失函数。例如信贷风控违约问题来说,目标函数Y为0就是未违约,1就是已违约。逻辑回归模型预测的Yn根据合理阈值会进行分类,落到0或1分类上。求解损失函数(所有样本的|Y-Yn|求和)最小化问题的最优模型参数,再结合AUC和KS来判断模型性能效果。

图片

其思想就是一个事件发生了,那么发生这个事件的概率就是最大的。这里我们可以这么理解:我们有一批数据,并且他们对应的分类A,B用0,1来表示,即对应的,我们希望寻找一组参数使得每组数据发生得概率最大(最好每个数据x都和其分类一一对应)。即:

图片

对数似然函数为:

图片

最大似然估计就是求使l(θ)取最大值时的θ,其实这里也可以使用梯度上升法求解,求得的θ就是要求的最佳参数。

正则化项主要是对各个参数的权重做控制的函数,也是惩罚项,它可以让整个曲线更平滑,可以有效的抑制过拟合。学习过程中,我们碰到的就是「L1正则化项、L2正则化项」,它们分别又被称为:「lasso回归项、岭回归项」。L1有一个特殊的功能:它可以稀疏化的取值,即会让某些值为0。L2正则化可以防止模型过拟合,在一定程度上,L1也可以防止过拟合,提升模型的泛化能力

过拟合问题,模型训练过程中要避免过拟合问题,下面左图即为欠拟合,中图为合适的拟合,右图为过拟合:

图片

▍逻辑回归应用

当数据不能够通过线性边界(直线、平面等)进行区分分类的时候,为了更好的拟合数据,这个时候就需要考虑从每个数据点建立更多特征来预测。

图片

在这个高维特征向量上训练的逻辑回归模型分类器将具有更复杂的决策边界,并且在我们的二维XY图中绘制时将呈现非线性,这就是逻辑回归中的线性不可分。

图片

逻辑回归是在线性回归的基础上加了一个 Sigmoid 函数(非线性)映射,使得逻辑回归称为了一个优秀的分类算法。两者都属于广义线性模型,但它们两个要解决的问题不一样,逻辑回归解决的是分类问题,输出的是离散值,线性回归解决的是回归问题,输出的连续值。在信贷风控业务中,一般求解的变量参数不能为负数,因为需要将逻辑回归模型预测的概率进行转换成评分卡模型的分数0-1000之间。其中要求属性点数为正、总分数为正、分数某个值代表特定的信用质量、分数差异代表统一的信用质量变化。

from sklearn.linear_model import LogisticRegression
Model = LogisticRegression()
Model.fit(X_train, y_train)
Model.score(X_train,y_train)
# Equation coefficient and Intercept
Print(‘Coefficient’,model.coef_)
Print(‘Intercept’,model.intercept_)
# Predict Output
Predicted = Model.predict(x_test)

参考文献:

[1] https://blog.csdn.net/weixin_60737527/article/details/124141293

[2] https://zhuanlan.zhihu.com/p/74874291

[3] https://cloud.tencent.com/developer/article/1412823

[4] https://zhuanlan.zhihu.com/p/352437358

[5] 逻辑回归算法之如何实现客户逾期还款业务

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/693318.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Jetpack Compose 与 Kotlin 的兼容性对应关系

点击查看:Jetpack Compose Kotlin 的兼容性 官网 声明依赖项 如需添加 Compose Compiler 的依赖项,您必须将 Google Maven 代码库添加到项目中。如需了解详情,请参阅 Google 的 Maven 代码库。 在应用或模块的 build.gradle或者build.grad…

【报错】npm ERR! ERESOLVE could not resolve、certificate has expired

前情提要 使用npm淘宝镜像 https://registry.npm.taobao.org 年前创建的vue3项目npm install 完后没有使用ui写了点杂七杂八的东西,年后看到一篇文章有点兴趣,掏出来准备试一下,本打算安装element-plus 写起来方便点npm install element-plu…

说一下JVM类加载机制?

Java中的所有类,都需要由类加载器装载到JVM中才能运行。类加载器本身也是一个类,而它的工作就是把class文件从硬盘读取到内存中。 在写程序的时候,我们几乎不需要关心类的加载,因为这些都是隐式装载的,除非我们有特殊…

pc微信逆向最新3.9.8.25版本

朋友让我开发一个关于微信的计数、统计、自动回复功能的机器人,主要是用在win10上面。 先看看结果! 之前写过手机端的逆向,PC端逆向很长时间没写了,所以就在网上找了找。基本都是基于3.6,3.7,3.8版本的&a…

虹科方案 | 释放总线潜力:汽车总线离线模拟解决方案

来源:虹科汽车智能互联 虹科方案 | 释放总线潜力:汽车总线离线模拟解决方案 原文链接:https://mp.weixin.qq.com/s/KGv2ZOuQMLIXlOiivvY6aQ 欢迎关注虹科,为您提供最新资讯! #汽车总线 #ECU #汽车网关 导读 传统的…

长短期记忆神经网络

目录 LSTM 神经网络架构 分类 LSTM 网络 回归 LSTM 网络 视频分类网络 更深的 LSTM 网络 网络层 分类、预测和预报 序列填充、截断和拆分 按长度对序列排序 填充序列 截断序列 拆分序列 指定填充方向 归一化序列数据 无法放入内存的数据 可视化 LSTM 层架构 …

Find My资讯|苹果Vision Pro无法通过Find My进行远程定位和发声

苹果 Vision Pro 头显现在已经正式开售,不过根据该公司日前发布的支持文件,这款头显目前缺乏一系列关键查找功能,用户无法在 iCloud 网站或Find My应用中获悉头显的位置,也无法让这款头显远程播放声音。 不过支持文件同时提到 V…

DAY57:动态规划(子序列2)1143、1035、53

Leetcode: 1143 最长公共子序列 1、dp数组定义和下标 dp[i][j]:长度为[0, i - 1]的字符串text1与长度为[0, j - 1]的字符串text2的最长公共子序列。 2、确认递推公式 如果text1[i - 1] 与 text2[j - 1]相同,那么找到了一个公共元素,所以d…

Android 开机启动

一、添加权限 <uses-permission android:name"android.permission.RECEIVE_BOOT_COMPLETED"/> 二、写一个广播接收器 public class BootReceiver extends BroadcastReceiver {Overridepublic void onReceive(Context context, Intent intent) {if(Intent.ACT…

数学物理方法笔记——Γ函数

Γ \Gamma Γ函数 0.前言 本文是吴崇试的《数学物理方法》第七章学习笔记。今天是数学物理方法Ⅱ上课的第一天&#xff0c;老师在课上简单复习了一下上个学期数学物理方法I的内容&#xff0c;笔者闲着没事&#xff0c;总觉得梁昆淼先生的书不太够味儿&#xff0c;便开始翻弄起…

【机器学习】数据清洗之处理重复点

&#x1f388;个人主页&#xff1a;豌豆射手^ &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 &#x1f917;收录专栏&#xff1a;机器学习 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共同学习、交流进…

【栈】150. 逆波兰表达式求值

150. 逆波兰表达式求值 解题思路 初始化栈&#xff1a; 创建一个整数栈用于存储操作数。 遍历表达式数组&#xff1a; 对于数组中的每个元素&#xff1a; 如果是运算符&#xff0c;从栈中弹出两个操作数&#xff0c;并根据运算符进行相应的运算&#xff0c;然后将结果压入栈…

C++(18)——适配器概念以及stack、queue、优先队列的模拟实现

上篇文章中&#xff0c;给出了对于模拟实现中功能的补全&#xff0c;本篇文章将优先介绍一个新的容器之后引入什么是适配器&#xff0c;以及适配器的使用方法&#xff0c;再通过适配器的思想来完成对于&#xff0c;、优先级队列_的实现。 目录 1. deque: 1.1 什么是deque&…

导出docker MySQL中的数据库写一个shell 脚本

安装命令 mysqldump sudo apt update sudo apt install mysql-client编辑脚本内容 export_mysql.sh #!/bin/bash# Docker 容器的 IP 地址 container_ip"172.26.77.246"# MySQL 数据库的用户名和密码 mysql_user"root" mysql_password"your_password…

Android studio 安装以及第一个程序

一、配置 1、下载JDK&#xff08;JDK&#xff1a;Java Development Kit Java开发工具包&#xff09; 打开Java Downloads | Oracle下载地址下载相应的JDK版本即可&#xff0c;需要注意的是请下载JDK11以上的版本&#xff0c;并且是64位版 2、安装JDK 双击打开已经下载好的安装…

Query Rewrite —— 基于大模型的query扩展改写,PRF+ GRF协同发力减少LLM的幻觉问题(论文)

通过GRF和PRF&#xff0c;可以有效提升召回率&#xff0c;和top的数据质量。两者可以相互互补&#xff0c;发挥更好的作用。 论文&#xff1a;Generative and Pseudo-Relevant Feedback for Sparse, Dense and Learned Sparse Retrieval 什么是PRF &#xff1f; Pseudo-relevan…

python在flask中的请求数据“无限流”

文章目录 一、问题描述二、解决方案 一、问题描述 在flask请求中&#xff0c;有个需求是让调用方一直调接口&#xff0c;并立马返回&#xff0c;而接口方缓存请求&#xff0c;依次执行。 二、解决方案 from flask import Flask, request, jsonify from queue import Queue i…

新年伊始,VR全景释放“强信号”,可以结合哪些行业?

一年之计在于春&#xff0c;各行各业都想抢占在经济的第一线&#xff0c;那么如何抓住新一轮科技革命和产业变革新机遇呢&#xff1f;VR全景释放了“强信号”。对于大部分实体行业来说&#xff0c;都会有VR全景的制作需求&#xff0c;租房买房的&#xff0c;可能都见识过线上VR…

【JGit】分支管理实践

本文紧接【JGit】简述及学习资料整理。 以下梳理了使用 JGit 进行 Git 操作的实践 JGit实践 主函数 public static void main(String[] args) throws Exception {String localDir "D:\\tmp\\git-test\\";String gitUrl "http://192.168.181.1:3000/root/g…

如何邀请媒体参加活动报道?媒体邀约的几大步骤?

传媒如春雨&#xff0c;润物细无声&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 邀请媒体参加活动报道通常需要发送邀请函、提供详细活动信息&#xff0c;并通过电话或邮件进行跟进确认。 在邀请媒体之前&#xff0c;应该制定一个详细的媒体规划表&#xff0c;包括拟…