使用 Python 中的 `sklearn` 库实现 KNN 分类

Scikit-Learn

      • 使用 Python 中的 `sklearn` 库实现 KNN 分类
        • 安装 `sklearn` 库
        • 导入库并准备数据
        • 使用 `sklearn` 实现 KNN 分类
        • 详细说明
        • 重点内容

使用 Python 中的 sklearn 库实现 KNN 分类

K最近邻(K-Nearest Neighbors, KNN)是一种简单且有效的分类算法。在 Python 中,我们可以使用 sklearn 库(也称为 Scikit-Learn)轻松实现 KNN 分类。sklearn 库提供了丰富的机器学习算法,并且封装了许多底层实现,使得我们可以专注于算法的应用和调优,而无需编写底层代码。

安装 sklearn

如果还没有安装 sklearn 库,可以使用以下命令进行安装:

pip install scikit-learn
导入库并准备数据

首先,我们需要导入必要的库,并准备数据集。在这个示例中,我们将使用 sklearn 自带的鸢尾花数据集(Iris dataset)。

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score# 加载数据集
iris = load_iris()
X, y = iris.data, iris.target# 分割数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 数据标准化
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
使用 sklearn 实现 KNN 分类

在准备好数据后,我们可以使用 KNeighborsClassifier 进行 KNN 分类。

# 初始化 KNN 分类器,指定 k 值
knn = KNeighborsClassifier(n_neighbors=3)# 训练模型
knn.fit(X_train, y_train)# 进行预测
y_pred = knn.predict(X_test)# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy * 100:.2f}%")
详细说明
  1. 安装 sklearn
    使用 pip install scikit-learn 命令安装该库。

  2. 加载数据集

    from sklearn.datasets import load_iris
    iris = load_iris()
    X, y = iris.data, iris.target
    

    我们使用 load_iris 方法加载鸢尾花数据集。

  3. 分割数据集

    from sklearn.model_selection import train_test_split
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
    

    使用 train_test_split 方法将数据集分为训练集和测试集,其中 30% 的数据用于测试。

  4. 数据标准化

    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    X_train = scaler.fit_transform(X_train)
    X_test = scaler.transform(X_test)
    

    标准化数据有助于提高模型的性能。我们使用 StandardScaler 进行数据标准化。

  5. 初始化 KNN 分类器

    from sklearn.neighbors import KNeighborsClassifier
    knn = KNeighborsClassifier(n_neighbors=3)
    

    我们初始化一个 KNN 分类器,并指定 k=3

  6. 训练模型

    knn.fit(X_train, y_train)
    

    使用训练集训练模型。

  7. 进行预测并计算准确率

    from sklearn.metrics import accuracy_score
    y_pred = knn.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)
    print(f"Accuracy: {accuracy * 100:.2f}%")
    

    使用测试集进行预测,并计算模型的准确率。

重点内容
  • 安装 sklearn:通过 pip install scikit-learn 安装库。
  • 分割数据集:使用 train_test_split 方法分割数据集为训练集和测试集。
  • 数据标准化:使用 StandardScaler 对数据进行标准化处理。
  • 初始化 KNN 分类器:使用 KNeighborsClassifier 初始化分类器。
  • 训练模型:使用训练集训练 KNN 模型。
  • 进行预测并计算准确率:使用测试集进行预测,并计算模型的准确率。

使用 sklearn 库,我们可以轻松地实现 KNN 分类,并快速进行模型的训练、预测和评估。这种方法不仅简化了代码编写,还提高了开发效率,是机器学习实践中非常实用的工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/43513.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【问题记录】Windows中Node的express无法直接识别

问题描述 在使用express_generator的时候windows平台中出现无法识别express命令的问题,另外就算添加了全局环境变量也没用。 问题解决 查看官方文档发现在node版本8之前的时候使用的是express,但是之后的版本使用npx,这个工具的出现主要想…

keil mdk注释插件合集格式、时间、日期注释

文章目录 一、前言二、安装步骤2.1 解压tools.zip2.2 tools 文件解释2.3 添加注释带keil 三、配置3.1 格式化代码3.2 文件注释3.3函数注释3.4 当前日期3.5 当前时间 四、编辑注释模板4.1 编辑函数注释模板4.2 编辑C文件注释模板4.3 编辑h文件注释模板 五、为注释功能添加快捷键…

在冰火岛买火车票

题目 小张无忌在冰火岛听了谢逊爷爷讲了许多少林寺的故事,非常仰慕少林寺这样的武学圣地。特别是藏经阁中收藏了大量武学秘籍,金刚指、易筋经、龙象波若功都非常想学。一有空,便缠着谢逊爷爷教他一招半式。今年暑假,张翠山夫妇想…

【Kubernetes安装】从零开始使用kubeadm命令工具部署K8S v1.28.2 集群

文章目录 一、虚拟机配置参数说明二、kubernetes v1.28.2版本介绍三、CentOS 7.9 系统初始化配置3.1 配置CentOS系统基础环境3.1.1 配置hosts3.1.2 永久关闭selinux3.1.3 关闭swap分区3.1.4 所有节点全部关闭防火墙3.1.5 配置ntp server同步时间3.1.6 添加kubernetes镜像源 3.2…

python的类中的super是做什么的

其实就是子类调用一下父类的构造函数(或者其他函数也行)。:   在 Python 中,super() 是一个用于调用父类(或基类)的方法。它通常在子类中使用,以便调用其父类的初始化方法或其他方法,从而确保父类的初始化代码在子类…

spring boot easyexcel

1.pom <!-- easyexcel 依赖 --><dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>3.1.1</version></dependency><dependency><groupId>org.projectlombok</group…

uniapp,app端使用echarts不兼容,可以使用iframe来使用echarts

可以新建文件夹 echarts&#xff0c;里面放echart.min.js文件,echarts.html文件生成echarts图&#xff0c;之所以用iframe不用webview&#xff0c;是因为webview容易出问题&#xff0c;最明显问题是层级问题。 <!DOCTYPE html> <html lang"en"> <hea…

Maven依赖 dependencyManagement、 dependencies、 dependency

在Maven项目构建工具中&#xff0c;“dependencies”、“dependencyManagement”和“dependency”这三个概念扮演着重要的角色&#xff0c;它们之间既有区别又有联系。以下是对这三个概念的详细解释以及它们之间的区别与联系&#xff1a; 一、基本概念 dependencies 定义&…

12--RabbitMQ消息队列

前言&#xff1a;前面一章内容太多&#xff0c;写了kafka&#xff0c;这里就写一下同类产品rabbitmq&#xff0c;rabbitmq内容较少&#xff0c;正好用来过度一下&#xff0c;概念还是会用一些例子来说明&#xff0c;实际部署的内容会放在概念之后。 1、基础概念 1.1、MQ消息队…

CSS原子化

目录 一、定义 二、原子化工具 2.1、tailwind 2.1.1、以PostCss插件形式安装 2.1.2、不依赖PostCss安装 2.1.3、修改原始配置 2.2、unocss 三、优缺点 3.1、优点 3.2、缺点 一、定义 定义&#xff1a;使用一系列的助记词&#xff0c;利用类名来代表样式。 二、原子化…

FastGPT源码部署,不使用docker

在使用FastGPT的过程中&#xff0c;可能有的功能不符合自己的需求。如果使用docker部署没办法修改源码二次开发&#xff0c;所以需要本地通过源码部署。 操作如下&#xff1a; 下载最新代码 git clone https://github.com/labring/FastGPT.git按照pnpm npm install pnpm -g …

uniapp——银行卡号脱敏

样式 代码 {{bankNumber.replace(/(\d{4})(?\d)/g, "●●●● ").replace(/(\d{2})(?\d{2}$)/, " $1")}} 将银行卡号按照每四位一组的方式进行处理&#xff0c;前面的变成 剩下的正常显示

uniapp上架到appstore遇到的问题

1、appstore在美国审核&#xff0c;需要把服务器接口的国外访问权限放开 2、登陆部分 a、审核时只能有密码登陆&#xff0c;可以通过接口响应参数将其他登陆方式暂时隐藏&#xff0c;审核成功后放开即可 b、需要有账号注销功能 3、使用照相机和相册功能时需要写清楚描述文案

在 PostgreSQL 里如何实现数据的自动清理和过期处理?

文章目录 一、使用 TIMESTAMP 列和定期任务二、使用事件触发器&#xff08;Event Triggers&#xff09;三、使用分区表&#xff08;Partitioned Tables&#xff09;四、结合存储过程和定时任务示例场景实现步骤测试与验证 在 PostgreSQL 中&#xff0c;可以通过多种方式实现数据…

达梦数据库系列—25. DSC故障切换

目录 DSC故障切换 故障处理 故障自动切换 DSC故障切换 故障处理 在 DMDSC 故障处理机制下&#xff0c;一旦产生节点故障&#xff0c;登录到故障节点的所有连接将会断开&#xff0c;所有未提交事务将被强制回滚&#xff1b;活动节点上的用户请求可以继续执行&#xff0c;但是…

ChatEval:通过多代理辩论提升LLM文本评估质量

论文地址:ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate | OpenReviewText evaluation has historically posed significant challenges, often demanding substantial labor and time cost. With the emergence of large language models (LLMs…

MySQL资源组的使用方法

MySQL支持创建和管理资源组&#xff0c;并允许将服务器内运行的线程分配给特定的组&#xff0c;以便线程根据组可用的资源执行。组属性允许控制其资源&#xff0c;以启用或限制组中线程的资源消耗。DBA可以针对不同的工作负载适当地修改这些属性。 目前&#xff0c;CPU时间是一…

前端开发攻略---webSocket的简单实现与使用

1、演示 2、实现流程 安装依赖 npm i ws 服务端代码 const WebSocket require(ws)// 创建一个 WebSocket 服务器&#xff0c;监听端口 3000 const wss new WebSocket.Server({ port: 3000 })// 监听连接事件 wss.on(connection, function connection(ws) {console.log(客户端…

笔记:mysql双主,keepalived 配置

准备工作 1&#xff0c;两台主机,3个IP mysql-1:192.168.0.1 mysql-2:192.168.0.2 vip 192.168.0.3 2&#xff0c;mysql安装包 下载地址&#xff1a;https://dev.mysql.com/downloads/mysql/ 3&#xff0c;keepalived安装包 下载地址&#xff1a;https://www.keepalived.org…

HTML(29)——立体呈现

作用&#xff1a;设置元素的子元素是位于3D空间中还是平面中 属性名&#xff1a;transform-style 属性值&#xff1a; flat&#xff1a;子级处于平面中preserve-3d:子级处于3D空间 步骤&#xff1a; 父级元素添加 transform-style:preserve-3d 子级定位调整子盒子的位置&a…