机器学习算法 —— 逻辑回归

🌟欢迎来到 我的博客 —— 探索技术的无限可能!


🌟博客的简介(文章目录)

目录

  • 逻辑回归
    • 逻辑回归的介绍
    • 逻辑回归的优点
    • 逻辑回归的缺点
    • 逻辑回归的应用
  • 实践
    • 演示
      • 库函数导入
      • 模型训练
      • 模型参数查看
      • 数据和模型可视化
      • 模型预测
    • 基于鸢尾花数据集的逻辑回归分类

逻辑回归

逻辑回归的介绍

逻辑回归是一种广义线性模型,常用于解决分类问题

        逻辑回归是一种常用的统计方法,通常用于处理分类问题。其基本原理是利用线性回归模型的结果通过一个sigmoid函数(也称为逻辑函数)将连续的预测值映射到0和1之间,从而进行分类。逻辑回归常被用于二分类问题,但也可以通过一些技巧进行多分类。逻辑回归的简洁性和直观性使其在实际应用中得到广泛采用。通过将线性回归的结果经过逻辑函数转换,逻辑回归可以将预测结果转化为类别概率,这为许多问题提供了更为直观的解释。此外,逻辑回归的数学基础相对简单,易于理解和实现,使其成为许多数据科学从业者入门机器学习的首选算法之一。

逻辑回归的优点

        逻辑回归具有许多优点。

  • 简单而直观,易于理解和实现。
  • 模型的训练和预测速度快,适用于大规模数据集。
  • 逻辑回归可以提供分类结果的概率估计,而不仅仅是类别标签,这对许多实际应用具有重要意义。
  • 逻辑回归对于特征之间的关系不敏感,即使特征之间存在一定的相关性,也能给出可靠的结果。这使得逻辑回归成为了许多实际问题的首选分类算法之一。

逻辑回归的缺点

        逻辑回归也存在一些缺点。

  • 它假设特征之间是线性相关的,这在某些情况下可能不成立,导致模型性能下降。
  • 逻辑回归往往不能很好地处理非线性关系,因此在特征之间存在复杂关系时效果可能不佳。
  • 逻辑回归对异常值敏感,需要进行一定的数据预处理和异常值处理。虽然逻辑回归有这些缺点,但在许多实际问题中,通过合适的特征工程和模型调优,仍然可以取得很好的分类效果。

逻辑回归的应用

        逻辑回归在许多领域都有广泛的应用。在医学领域,它常被用于疾病预测和诊断,如肿瘤预测、心脏病风险评估等。在市场营销中,逻辑回归常被用于客户分类和预测,帮助企业制定营销策略。在信用评分领域,逻辑回归可以用于评估借款人的信用风险,辅助银行和金融机构做出贷款决策。总的来说,逻辑回归作为一种简单而有效的分类算法,在各个领域都有着广泛的应用前景。

实践

演示

请提前下载

!pip install matplotlib seaborn
!pip install -U scikit-learn --user
!pip install matplotlib seaborn
!pip install -U scikit-learn --user

库函数导入

##  基础函数库
import numpy as np ## 导入画图库
import matplotlib.pyplot as plt
import seaborn as sns## 导入逻辑回归模型函数
from sklearn.linear_model import LogisticRegression

模型训练

演示LogisticRegression分类

        构造了一个简单的数据集,包含了6个样本和对应的标签。然后调用逻辑回归模型,并将数据集传入模型进行拟合。

## 构造数据集
x_fearures = np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]])
y_label = np.array([0, 0, 0, 1, 1, 1])## 调用逻辑回归模型
lr_clf = LogisticRegression()## 用逻辑回归模型拟合构造的数据集
lr_clf = lr_clf.fit(x_fearures, y_label) #其拟合方程为 y=w0+w1*x1+w2*x2

模型参数查看

        输出会显示逻辑回归模型的权重和截距值。

## 查看其对应模型的w
print('the weight of Logistic Regression:',lr_clf.coef_)## 查看其对应模型的w0
print('the intercept(w0) of Logistic Regression:',lr_clf.intercept_)

数据和模型可视化

可视化构造的数据样本点

        绘制数据集的散点图,其中样本的颜色表示其对应的类别

plt.figure()
plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=50, cmap='viridis')
plt.title('Dataset')
plt.show()

在这里插入图片描述

可视化决策边界

        绘制数据集的散点图,并在图中添加逻辑回归模型的决策边界(用蓝色线表示)。

plt.figure()
plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=50, cmap='viridis')
plt.title('Dataset')nx, ny = 200, 100
x_min, x_max = plt.xlim()
y_min, y_max = plt.ylim()
x_grid, y_grid = np.meshgrid(np.linspace(x_min, x_max, nx),np.linspace(y_min, y_max, ny))z_proba = lr_clf.predict_proba(np.c_[x_grid.ravel(), y_grid.ravel()])
z_proba = z_proba[:, 1].reshape(x_grid.shape)
plt.contour(x_grid, y_grid, z_proba, [0.5], linewidths=2., colors='blue')plt.show()

在这里插入图片描述

可视化预测新样本

        在散点图上添加了两个新的样本点,并在图中标注其位置。同时也包括了之前的训练样本和逻辑回归模型的决策边界。

plt.figure()
## new point 1
x_fearures_new1 = np.array([[0, -1]])
plt.scatter(x_fearures_new1[:,0],x_fearures_new1[:,1], s=50, cmap='viridis')
plt.annotate(s='New point 1',xy=(0,-1),xytext=(-2,0),color='blue',arrowprops=dict(arrowstyle='-|>',connectionstyle='arc3',color='red'))## new point 2
x_fearures_new2 = np.array([[1, 2]])
plt.scatter(x_fearures_new2[:,0],x_fearures_new2[:,1], s=50, cmap='viridis')
plt.annotate(s='New point 2',xy=(1,2),xytext=(-1.5,2.5),color='red',arrowprops=dict(arrowstyle='-|>',connectionstyle='arc3',color='red'))## 训练样本
plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=50, cmap='viridis')
plt.title('Dataset')# 可视化决策边界
plt.contour(x_grid, y_grid, z_proba, [0.5], linewidths=2., colors='blue')plt.show()

在这里插入图片描述

模型预测

        利用训练好的逻辑回归模型对新样本点进行预测,并输出其预测的类别和每个类别的概率。

## 在训练集和测试集上分别利用训练好的模型进行预测
y_label_new1_predict = lr_clf.predict(x_fearures_new1)
y_label_new2_predict = lr_clf.predict(x_fearures_new2)print('The New point 1 predict class:\n',y_label_new1_predict)
print('The New point 2 predict class:\n',y_label_new2_predict)## 由于逻辑回归模型是概率预测模型(前文介绍的 p = p(y=1|x,\theta)),所以我们可以利用 predict_proba 函数预测其概率
y_label_new1_predict_proba = lr_clf.predict_proba(x_fearures_new1)
y_label_new2_predict_proba = lr_clf.predict_proba(x_fearures_new2)print('The New point 1 predict Probability of each class:\n',y_label_new1_predict_proba)
print('The New point 2 predict Probability of each class:\n',y_label_new2_predict_proba)

在这里插入图片描述

可以发现训练好的回归模型将X_new1预测为了类别0(判别面左下侧),X_new2预测为了类别1(判别面右上侧)。其训练得到的逻辑回归模型的概率为0.5的判别面为上图中蓝色的线。

基于鸢尾花数据集的逻辑回归分类

接下文:机器学习算法 —— 基于鸢尾花数据集的逻辑回归分类

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/22571.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

11_JavaWeb监听器

文章目录 监听器1.监听器的分类2.application域监听器案例 监听器 概念:后端要发生一些事情的时候,自动触发一些代码的执行; 1.监听器的分类 web中定义八个监听器接口作为监听器的规范,这八个接口按照不同的标准可以形成不同的分类 按监听的…

下载ubuntu22.04

建议使用:清华源镜像 官网下载比较慢Ubuntu 22.04.4 LTS (Jammy Jellyfish) 打开清华源向下翻 然后找到22.04 下载完成:

C++的线性回归模型

线性回归模型是数理统计中的一种回归分析方法,其核心思想是通过建立一个线性方程来描述因变量与自变量之间的关系。这种关系可以表示为y wx e,其中y是因变量,x是自变量,w是回归系数向量,e是误差项,服从均…

28份 | FCIS 2023网络安全创新大会(公开)PPT分享

1、AIGC安全审计框架初探 2、AI领航,提效网络安全运营新未来 3、AI时代大模型安全分析 4、AI在企业内部的机遇与挑战 5、从0开始设计webshell管理工具 6、从实战看红队进攻技巧 7、移动终端软件供应链安全治理探讨 8、大模型时代下蓝军攻防实践 9、多视角下…

如何微调出自己的大模型——LoRA原理解析

1、前言 上一篇文章,我们已经讲了隐扩散模型——Stable Diffusion生成大模型。这种大模型,参数量及其之大。你没有足够的算力资源,就只能够使用人家已经训练好的大模型。既然没有办法训练属于自己的模型,那我们就想,是…

RocketMQ教程(一):RocketMQ的基本概念

RocketMQ是什么? RocketMQ 是一个分布式消息中间件和流计算平台,由阿里巴巴团队开源并贡献给 Apache 软件基金会,现为 Apache 顶级项目。它主要用于处理大规模数据的传输问题,支持高吞吐量、高可用性和可扩展性的消息发布和订阅服…

Kotlin 抽象类

文章目录 定义构造函数普通成员(属性或方法)抽象成员(属性或方法)实例化抽象类使用伴生对象继承抽象类 定义 在 Kotlin 中,抽象类使用abstract class定义: abstract class 类名 { 属性/方法 }我们可以尝试…

React - 实现走马灯组件

一、实现效果 二、源码分析 import {useRef, useState} from "react";export const Carousel () > {const images [{id: 3, url: https://sslstage3.sephorastatic.cn/products/2/4/6/8/1/6/1_n_new03504_100x100.jpg}, {id: 1, url: https://sslstage2.sephor…

RabbitMQ docker安装及使用

1. docker安装RabbitMQ docker下载及配置环境 docker pull rabbitmq:management # 创建用于挂载的目录 mkdir -p /home/docker/rabbitmq/{data,conf,log} # 创建完成之后要对所创建文件授权权限,都设置成777 否则在启动容器的时候容易失败 chmod -R 777 /home/doc…

团队项目开发使用git工作流(IDEA)【精细】

目录 开发项目总体使用git流程 图解流程 1.创建项目仓库[组长完成] 2. 创建项目,并进行绑定远程仓库【组长完成】 3.将项目与远程仓库(gitee)进行绑定 3.1 创建本地的git仓库 3.2 将项目添加到缓存区 3.3 将项目提交到本地仓库&#…

102、python-第三阶段-11-数据输出-输出到文件中

配置完成后,再次执行代码,发现输出的文件有好多,和电脑的内核数量有关系 这样就可以分别输出到一个对应的文件了

攻防世界---misc---normal_png

1、下载附件是一张图片 2、先看这张照片,我感觉它的宽高不一样,感觉有问题,但是我也没深想 3、接着用winhex分析,也没有发现奇怪的地方,于是我去binwalk,没什么发现,就是一张正常的图片&#x…

【Vue】Vue生命周期

Vue生命周期:就是一个Vue实例从创建(new一个Vue实例) 到 销毁(关闭网页) 的整个过程。 生命周期四个阶段:① 创建 ② 挂载 ③ 更新 ④ 销毁 创建阶段:创建响应式数据 通过data给当前的Vue实例提…

树莓集团:产学研一体化发展

树莓集团,通过与高校、研究机构等合作,旨在促进科技成果的转化和应用,提高技术创新能力,实现经济社会可持续发展。深刻认识产学研一体化对于推动产业创新、提升竞争力的关键作用。 1、与高校合作 紧密合作:树莓集团与…

Day08 备忘录页面设计

​ 当前章节完成后效果图 一.布局设计和生成静态数据 当前章节备忘录页面布局设计跟 第7章节一样,只是内容方面发生变化,其他样式都一样。直接把代码粘出来了当前章节备忘录 MemoView.xaml 页面完整示例代码 <UserControl x:Class="MyToDo.Views.MemoView"xmlns…

Python | 刷题日记

1.海伦公式求三角形的面积 area根号下&#xff08;p(p-a)(p-b&#xff09;(p-c)) p是周长的一半 2.随机生成一个整数 import random xrandom.randint(0,9)#随机生成0到9之间的一个数 yeval(input("please input:")) if xy:print("bingo") elif x<y:pri…

python数据分析——逻辑回归

参考资料&#xff1a;活用pandas库 逻辑回归 当响应变量为二值响应变量时&#xff0c;经常使用逻辑回归对数据建模。 # 导入pandas库 import pandas as pd # 导入数据集 acspd.read_csv(r"...\data\acs_ny.csv") # 展示数据列 print(acs.columns) # 展示数据集 pri…

[数据集][图像分类]茶叶叶子病害分类数据集304张4类别

数据集类型&#xff1a;图像分类用&#xff0c;不可用于目标检测无标注文件 数据集格式&#xff1a;仅仅包含jpg图片&#xff0c;每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数)&#xff1a;304 分类类别数&#xff1a;4 类别名称:[“anthracnose”,“bird_eye_spot”…

功效系数法

功效系数法&#xff08;Efficacy Coefficient Method&#xff09;是一种综合评价方法&#xff0c;它根据多目标规划的原理&#xff0c;对每个评价指标确定一个满意值和不允许值&#xff0c;以满意值为上限&#xff0c;以不允许值为下限。计算各指标实现满意值的程度&#xff0c…

ant-design vue3 中上传图片组件的回传图片显示问题

最近在做web端的上传图片 有一个数据列表中的编辑功能 是之前上传的图片 点击编辑进入编辑页面 会显示之前写的数据 现在需要把原来上传的图片 显示出来 因为之前给后端上传的 图片格式 是一个数组 ["图片链接"&#xff0c;“图片链接”。。。] 后端给我返回的数据也…