对鸢尾花进行分类预测-----pycharm

项目说明

#项目:  对鸢尾花进行分类预测
#实例数量150个(3类各50个)
#属性数量:4(数值型,数值型,帮助预测的属性和类)
#特征:花萼长度,花萼宽度,花瓣长度,花瓣宽度  单位:厘米
#类别:山鸢尾,变色鸢尾,维吉尼亚鸢尾

导包

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier,export_graphviz

用KNN算法对鸢尾花进行分类

def knn_iris():"""用KNN算法对鸢尾花进行分类:return:""""""1.获取数据"""iris = load_iris()"""2.数据集划分"""# train_test_split(要分割的数据集【可以是一个或多个数组,每个数组代表一个特征或标签】,测试集的大小,训练集的大小,随机数种子【用于控制数据的随机分割】,是否在分割数据前进行洗牌)# 把iris.data和iris.target按照相同的随机种子6进行随机分割,生成训练集和测试集x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)      # 此处数据集划分不一样对结果影响不一样,划分为6时,准确率约为0.92#x_train【训练模型的鸢尾花数据集的特征】,x_test【测试模型的鸢尾花数据集的特征】,y_train【训练集标签】,y_test【测试集标签】#X_train 中的数据是来自原始 X 数据集的随机选择的 6 行数据,而 X_test 中的数据则是剩下的 2 行数据。# 这种分割方法确保了训练集和测试集的数据是随机且保持了原始数据的分布特性,从而可以用来训练模型和评估模型的泛化能力""" 3.特征工程:无量纲化(标准化)"""transfer = StandardScaler()x_train = transfer.fit_transform(x_train)x_test = transfer.transform(x_test)     #用训练集特征中的平均值和标准差对测试集数据进行标准化#print("无量纲化后的x_train:\n",x_train)#print("无量纲化后的x_test:\n",x_test)"""4.训练    KNN预估"""estimator = KNeighborsClassifier(n_neighbors=3)estimator.fit(x_train,y_train)"""5.模型评估"""#方法1:直接比对真实值和预估值y_predict = estimator.predict(x_test)print("y_predice:\n",y_predict)print("y_test:\n",y_test)print("直接比对真实值和预估值是否一样:\n",y_test == y_predict)#方法2:计算准确率score = estimator.score(x_test,y_test)print("准确率为:\n",score)return Noneif __name__ == "__main__":# 用KNN算法对鸢尾花进行分类knn_iris()

效果:
在这里插入图片描述

KNN算法加入网格搜索交叉验证

def knn_iris_gscs():"""用KNN算法对鸢尾花进行分类,添加网格搜索交叉验证:return:""""""1.获取数据"""iris = load_iris()"""2.数据集划分"""x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=6)""" 3.特征工程:无量纲化(标准化)"""transfer = StandardScaler()x_train = transfer.fit_transform(x_train)x_test = transfer.transform(x_test)  # 用训练集特征中的平均值和标准差对测试集数据进行标准化# print("无量纲化后的x_train:\n", x_train)# print("无量纲化后的x_test:\n", x_test)"""4.训练    KNN预估"""estimator = KNeighborsClassifier(n_neighbors=3)"""5.网格搜索交叉验证"""#参数准备param_dict = {"n_neighbors":[1,3,5,7,8,11]}estimator = GridSearchCV(estimator,param_grid=param_dict,cv=10)estimator.fit(x_train,y_train)"""6.模型评估"""# 方法1:直接比对真实值和预估值y_predict = estimator.predict(x_test)print("y_predice:\n", y_predict)print("y_test:\n", y_test)print("直接比对真实值和预估值是否一样:\n", y_test == y_predict)# 方法2:计算准确率score = estimator.score(x_test, y_test)print("准确率为:\n", score)print("最佳参数:\n",estimator.best_params_)print("最佳结果:\n",estimator.best_score_)print("最佳估值器:\n",estimator.best_estimator_)print("交叉验证结果:\n",estimator.cv_results_)return None
if __name__ == "__main__":# 用KNN算法对鸢尾花进行分类,添加网格搜索和交叉验证knn_iris_gscs()

效果:
在这里插入图片描述

决策树算法对鸢尾花进行分类

def decision_iris():"""用决策树对鸢尾花进行分类:return:""""""1.获取数据"""iris = load_iris()"""2.划分数据集"""x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)"""3.决策树预估器"""estimator = DecisionTreeClassifier(criterion="entropy")  #按entropy信息增益进行分类estimator.fit(x_train,y_train)"""4.模型评估"""# 方法1:直接比对真实值和预估值y_predict = estimator.predict(x_test)print("y_predice:\n", y_predict)print("y_test:\n", y_test)print("直接比对真实值和预估值是否一样:\n", y_test == y_predict)# 方法2:计算准确率score = estimator.score(x_test, y_test)print("准确率为:\n", score)return Noneif __name__ == "__main__":#用决策树对鸢尾花进行分类decision_iris()

效果
 决策树算法对鸢尾花进行分类结果

决策树对鸢尾花分类可视化

先保存树的结构到dot文件
在这里插入图片描述
方法def decision_iris()末尾加入代码运行

 #可视化决策树
export_graphviz(estimator,out_file="iris.tree.dot")

在这里插入图片描述

然后可以在线可视化dot文件或者下载可视化工具可视化决策树

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/656382.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是事务?

事务 是一组操作的集合,它是一个不可分割的工作单位。事务会把所有的操作作为一个整体,一起向数据库提交或者是撤销操作请求。所以这组操作要么同时成功,要么同时失败。 1. 事务管理 怎么样来控制这组操作,让这组操作同时成功或…

机器学习 强化学习 深度学习的区别与联系

机器学习 强化学习 深度学习 机器学习 按道理来说, 这个领域(机器学习)应该叫做 统计学习 (Statistical Learning),因为它的方法都是由概率统计领域拿来的。这些人中的领军人物很有商业头脑, 把…

亚马逊测评:卖家如何操作测评,安全高效(自养号测评)

亚马逊测评的作用在于让用户更真实、清晰、快捷地了解产品以及产品的使用方法和体验。通过买家对产品的测评,也可以帮助厂商和卖家优化产品缺陷,提高用户的使用体验。这进而帮助他们获得更好的销量,并更深入地了解市场需求。亚马逊测评在满足…

【获奖必看2.0】美赛小技巧之一秒输入一个公式

大家好呀,美赛开赛还有四天的时间,今天给大家带来的是美赛论文写作时非常实用的一个小技巧——快速输入任何复杂公式。 相信很多小伙伴在论文写作的时候都有一个小烦恼,那就是在面对比较复杂的公式的时候,应该怎么进行快速输入呢…

vue3项目中让echarts适应div的大小变化,跟随div的大小改变图表大小

目录如下 我的项目环境如下利用element-resize-detector插件监听元素大小变化element-resize-detector插件的用法完整代码如下:结果如下 在做项目的时候,经常会使用到echarts,特别是在做一些大屏项目的时候。有时候我们是需要根据div的大小改…

【Three.js】Layers图层的使用

目录 前言 创建图层对象 启用图层 关闭图层 其他 前言 Layers 对象为Object3D对象分配了1-32个图层,编号为0-31。在内部实现上,每个图层对象被存储为一个bit mask, 默认所有 Object3D 对象都存储在第 0 个图层上。 图层对象可以用于控制…

美国将限制中国,使用Azure、AWS等云,训练AI大模型

1月29日,美国商务部在Federal Register(联邦公报)正式公布了,《采取额外措施应对与重大恶意网络行为相关的国家紧急状态》提案。 该提案明确要求美国IaaS(云服务)厂商在提供云服务时,要验证外国…

深度强化学习(王树森)笔记09

深度强化学习(DRL) 本文是学习笔记,如有侵权,请联系删除。本文在ChatGPT辅助下完成。 参考链接 Deep Reinforcement Learning官方链接:https://github.com/wangshusen/DRL 源代码链接:https://github.c…

【数据结构:顺序表】

文章目录 线性表顺序表1.1 顺序表结构的定义1.2 初始化顺序表1.3 检查顺序表空间1.4 打印1.5 尾插1.6 头插1.7 尾删1.8 头删1.9 查找1.10 指定位置插入1.11 删除指定位置数据1.12 销毁顺序表 数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一…

2024Cypress自动化测试开发指南!

cypress是基于JavaScript语言为编写语言的自动化测试开发工具,配合使用cucumber测试开发框架,以node.js为服务进程,可以简单的帮助测试人员完成需要人工手点的所有页面人机交互操作,可以模拟键盘和鼠标输入,快捷完成ca…

使用串口WiFi透传模块需要解决的几个问题,2串口双串口,3串口多串口转WiFi模块S2W-M02

我们知道在现在物联网时代,串口设备通过WiFi联网上传数据已经有很多的场景需求。但是,现在市面上的大部分串口转WiFi模块都仅仅支持一个串口的数据透传应用。 如果串口转WiFi模块仅仅有一个串口资源进行透传,那么它的应用场景是如下的&#x…

问卷发放实战指南:提高问卷回收率与数据质量的技巧

进行问卷调查分为四步:制作问卷、发放问卷、收集问卷、分析问卷。其中,发放问卷起到了关键性的作用。他关乎到我们后续收集问卷是否顺利,收集到的问卷数据是否具备真实性和有效性。那么,怎么有效地进行问卷发放呢? ​…

【C项目】顺序表

简介:本系列博客为C项目系列内容,通过代码来具体实现某个经典简单项目 适宜人群:已大体了解C语法同学 作者留言:本博客相关内容如需转载请注明出处,本人学疏才浅,难免存在些许错误,望留言指正 作…

网络战新高度!俄罗斯280台服务器被摧毁,200万GB数据丢失

Hackread网站消息,乌克兰国防部主要情报总局(HUR)的网络安全专家宣称对俄罗斯IPL咨询公司发起了一次成功的网络攻击,摧毁了该公司所有的IT基础设施,导致全国通信中断。 乌克兰HUR在Facebook上的发布公告表示&#xff0…

nginx负载均衡案例

大家好今天给大家带来nginx负载均衡实验案例,首大家先看一下我的各类版本信息。(还有两台设备信息相同就不展示了) 一,搭建nginx环境 ❶首先创建Nginx的目录并进入: [rootlocalhost]# mkdir /soft && mkdir /soft/nginx…

电气自动化行业,全面数字化工作流程

电气自动化行业数字化转型所需流程软件,与大家分享如下: D-Hub企业数字化协同平台、SuperHarness数字线束软件、SuperPanel母排设计软件、D-Hub生产管理系统,全面的数字化工作流程,智能降本增效! D-Hub D-Hub是一款…

解决网站 “debugger“ 阻止调试

某些网站耍小聪明 以为在网站内 添加了 debugger 就能阻止别人对网站进行调试! 针对某些网站 当你浏览器打开F12 后 你发现无论你怎么执行下一步 你始终停留在 debugger 这个代码文件内现在的问题是 每当我执行 下一步调试 时 都会被 “(function(){setInterval(f…

洗地机怎么选?洗地机选购必看

如今,洗地机已经成为了我们地板清洁的主力军了,但市场上的产品繁多让人眼花缭乱,不少朋友做了半天功课,还是不明白到底哪款产品适合自己。所以今天笔者给大家带来了满满的洗地机选购干货,还给大家附赠了选购清单&#…

AI创作之旅:探索提示工程的奇妙世界

目录 推荐 1. 引言 2. 什么是提示工程? 3. 准备工作 3.1 安装必要的库 3.2 获取 OpenAI API 密钥 4 设置 OpenAI API 密钥 5. 提示工程实战 6. 探索更多可能性 6.1 尝试不同的提示 6.2 调整参数 结语 ⭐️ 好书推荐 推荐 前些天发现了一个巨牛的人工智…

软件物料清单管理 | 打开“应用软件盲盒”,预警“开源组件风险”

更多网络安全干货内容:点此获取 ——————— 01 开源组件安全风险管控难 随着软件规模化发展和开源软件的兴起,越来越多的软件在开发过程中集成第三方组件或开源组件,这极大地提高了开发效率,但也难以避免地引入了安全风险。…