逻辑回归分析实战(根据鸢尾花的性质预测鸢尾花类别)

紧接着上过一个线性回归模型(一元线性回归模型实战)

 一元线性回归模型和逻辑回归模型是统计学中常见的两种回归模型,它们有以下几点不同之处:

1. 目标变量类型:一元线性回归模型适用于连续型目标变量,即预测一个数量;而逻辑回归模型适用于二分类目标变量,即预测一个属于两个类别的概率。

2. 输出类型:一元线性回归模型的输出是一个连续的数值,表示目标变量的预测值;而逻辑回归模型的输出是一个概率值,表示目标变量属于某个类别的概率。

3. 假设函数形式:一元线性回归模型假设自变量与因变量之间存在线性关系,通过拟合一条直线来描述它们之间的关系;逻辑回归模型则假设自变量与因变量之间存在一种S形曲线的关系,通过拟合一个Sigmoid函数来描述它们之间的关系。

4. 参数估计方法:一元线性回归模型通常使用最小二乘法来估计模型参数,目标是最小化实际值与预测值的差异;逻辑回归模型则使用最大似然估计法来估计参数,目标是最大化观测数据的概率。

总的来说,一元线性回归模型适用于预测连续型变量的数值而逻辑回归模型适用于二分类问题,预测目标变量属于两个类别的概率。

代码展示

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
import numpy as npx = load_iris().data
y = load_iris().target# 将x和y合并在一起
combined_data = np.concatenate((x, y.reshape(-1, 1)), axis=1)# 保存合并后的数据到文件
np.savetxt('combined_data.txt', combined_data, fmt='%f', delimiter=',')# print("语义:",x,"标签:",y)
# 具体来说,`load_iris().data`将返回Iris数据集中的特征数据,它是一个二维数组,每一行代表一个样本,每一列代表一个特征。
# `load_iris().target`将返回Iris数据集中每个样本的目标分类标签。在Iris数据集中,一共有3个不同的类别,分别代表3种不同的鸢尾花。x_train, x_test, y_train,y_test = train_test_split(x, y, test_size=0.29,random_state=0)
# 具体来说,`train_test_split()`函数可以将数据集划分为训练集和测试集,其中`x`是特征数据,`y`是目标标签。
# `test_size`参数指定了测试集所占的比例,这里设置为0.29,意味着将29%的数据用作测试集,剩下的71%用作训练集。
# `random_state`参数用于设置随机种子,以确保划分结果的可重现性。
# 划分后的训练集包含`x_train`和`y_train`,测试集包含`x_test`和`y_test`。您可以在后续的建模和评估过程中使用这些数据集。
# 例如,在使用逻辑回归模型进行训练和预测时,可以这样使用划分后的数据集:#对数据标准化处理
sc = StandardScaler()x_train = sc.fit_transform(x_train)
x_test = sc.fit_transform(x_test)#训练逻辑回归模型,并对测试集进行测试
model = LogisticRegression()
model.fit(x_train, y_train)pred_data = sc.fit_transform( [[combined_data[54,0],combined_data[54,1],combined_data[54,2],combined_data[54,3]]] )
print("使用逻辑回归模型的预测类别为:",model.predict(pred_data))
print("他的真是标签为:",combined_data[54,4])print("逻辑回归分类的准确率为:%4.4f"%model.score(x_test,y_test))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/12588.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023年基准Kubernetes报告:6个K8s可靠性失误

云计算日益成为组织构建应用程序和服务的首选目的地。尽管一年来经济不确定性的头条新闻主要集中在通货膨胀增长和银行动荡方面,但大多数组织预计今年的云使用和支出将与计划的相同(45%),或高于计划的(45%)…

大数据Flink(五十三):Flink流处理特性、发展历史以及Flink的优势

文章目录 Flink流处理特性、发展历史以及Flink的优势 一、Flink流处理特性 二、发展历史

opencv-28 自适应阈值处理-cv2.adaptiveThreshold()

什么是自适应阈值处理? 对于色彩均衡的图像,直接使用一个阈值就能完成对图像的阈值化处理。但是,有时图像的色彩是不均衡的,此时如果只使用一个阈值,就无法得到清晰有效的阈值分割结果图像。 有一种改进的阈值处理技术&#xff…

五、控制流(2)

本章概要 returnbreak 和 continue臭名昭著的 gotoswitchswitch 字符串 return 在 Java 中有几个关键字代表无条件分支,这意味无需任何测试即可发生。这些关键字包括 return,break,continue 和跳转到带标签语句的方法,类似于其…

不管如何吐槽,购买iPhone的用户依然义无反顾,苹果继续增长

市调机构IDC公布的二季度数据显示,苹果成为前五名之中除华为之外第二家取得增长的手机品牌,而其他国产手机品牌的出货量都在下滑,显示出国内的消费者仍然在热烈追捧iPhone。 二季度苹果在国内市场的手机出货量同比增长6%,虽然增速…

Android Studio下载及安装和Gradle的配置

文章目录 下载安装修改Sdk的位置创建项目修改Gradle的位置查看AS版本工具栏--View项工具栏--Build下的功能说明Build Variants视图说明下载模拟器(avd)/安卓虚拟设备屏幕熄灭功能关闭虚拟设备功能删除自己开发的应用软件将开发的应用运行到虚拟设备上。 …

从分片传输到并行传输之大文件传输加速技术

随着大文件的传输需求越来越多,传输过程中也会遇到很多困难,比如传输速度慢、文件安全性低等。为了克服这些困难,探讨各种大文件传输加速技术。其中,分片传输和并行传输是两种比较常见的技术,下面将对它们进行详细说明…

Java版知识付费源码 Spring Cloud+Spring Boot+Mybatis+uniapp+前后端分离实现知识付费平台

提供职业教育、企业培训、知识付费系统搭建服务。系统功能包含:录播课、直播课、题库、营销、公司组织架构、员工入职培训等。 提供私有化部署,免费售后,专业技术指导,支持PC、APP、H5、小程序多终端同步,支持二次开发…

【Opencv】视频跟踪算法KCF

目录 KCF算法简介opencv实现代码copencv实现代码python KCF算法简介 KCF(Kernelized Correlation Filter)是一种基于核相关滤波器的目标跟踪算法。它通过学习目标的外观特征和使用核相关滤波器进行目标定位。KCF属于传统算法的单目标跟踪器。下面是对KC…

【Java】Java多线程编程基础

文章目录 1. 进程与线程1.1 进程与线程的基本认识1.1.1 进程(Process)1.1.2 线程(Thread) 1.2 为什么会有线程1.2.1 以看视频为例 2. 多线程实现2.1 Thread类实现多线程2.2 Runnable接口实现多线程2.3 Callable接口实现多线程2.3 …

CTF线下赛AWD知识点【持续完善ing】

文章目录 CTF线下赛AWD知识点AWD规则前期准备SSH登录口令登录密钥登录 改密码SSH密码修改mysql密码修改 备份数据备份目录备份数据库 查找后门 自动提交flag防御思路基础查杀寻找最近20分钟修改过的文件寻找行数最短的文件关键字查杀查找命令执行函数 文件监控杀不死马0x01.杀进…

Grafana - TDEngine搭建数据监测报警系统

TDengine 与开源数据可视化系统 Grafana 快速集成搭建数据监测报警系统 一、介绍二、前置条件三、Grafana 安装及配置3.1 下载3.2 安装3.2.1 windows安装 - 图形界面3.2.2 linux安装 - 安装脚本 四、Grafana的TDEngine配置及使用4.1 登录4.2 安装 Grafana Plugin 并配置数据源4…

学习笔记|大模型优质Prompt开发与应用课(二)|第一节:大模型应用密码—Prompt的一千种打开方式

文章目录 第一节:大模型应用密码—Prompt的一千种打开方式01你可能听过一个小故事1910华盛顿纺织厂罢工事件 02 小问题:哪些场景会被提效类目一︰减少重复性工作的成本(降本)例如∶做策划初稿、写JD、润色文案prompt生成结果prompt生成结果prompt生成结果promptprom…

NodeJs后端项目使用docker打包部署

docker安装看之前的文章 默认已经安装好docker并且配置没有问题 拉取项目 https://gitee.com/coder-msc/docker-node 本地跑一个看看 pnpm install pnpm start 本地访问 http://localhost:1301/getname?name%E5%93%88%E5%88%A9%E6%B3%A2%E7%89%B9项目整个上传服务器 查看…

简化Java单元测试数据

用EasyModeling简化Java单元测试 EasyModeling 是我在2021年圣诞假期期间开发的一个 Java 注解处理器,采用 Apache-2.0 开源协议。它可以帮助 Java 单元测试的编写者快速构造用于测试的数据模型实例,简化 Java 项目在单元测试中准备测试数据的工作&…

C# 委托

一:委托(delegate):执行方法时,将方法当作参数传递到委托中进行执行; Action表示没有返回值的委托; Func表示有返回值的委托 《1》使用 需要先实例化一个委托 将方法当作参数传到委托中 注意&a…

工作纪实36-ES查询条件过长

问题 es中使用bool查询时查询内容长度太长导致报错: caused by: org.elasticsearch.common.io.stream.NotSerializableExceptionWrapper: too_many_clauses: maxClauseCount is set to 1024 错误信息提示:最大子句数量限制为1024 解决方案 1.设置es配…

老胡的周刊(第101期)

老胡的信息周刊[1],记录这周我看到的有价值的信息,主要针对计算机领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。 🎯 项目 ollama[2] 你可以下载 Ollama 在本地运行 Ll…

链表基础知识

一、什么是链表 链表是一种物理存储结构上非连续,非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。 链表的结构是多式多样的,当时通常用的也就是两种: (1)第一种是无头非循环单向…

live-server本地起node服务解决跨域问题

一、初始化node,构建package.json NPM 全局安装live-server npm install -g live-server在当前项目文件夹下cmd运行: npm init -y此时会在根目录下生成一个package.json文件。 二.生成代理脚本 在根文件夹新建一个build.js文件(名字可以自定义) var …