K-近邻算法的 sklearn 实现

  1. 实验目的与要求
    1. 掌握基于 K-近邻分类算法的编程方法
    2. 通过编程理解 K-近邻分类算法和该算法的基本步骤

  2. 实验器材
    1. 硬件:PC 机(参与实验的学生每人一台)
    2. 软件环境:Python3.7 + Pycharm

  3. 实验内容
    1. 使用 sklearn 库中的 neighbors 模块实现 K-近邻算法,并对二手房样本所
      属类别进行预测,程序流程为:
      (1) 导入 sklearn 库中的 K-近邻算法模块(KNeighborsClassifier),数据集分割模块(train_test_split)以及机器学习准确率评估模块(metrics)
      (2) 读取数据,并分割成特征属性集和类别集
      (3) 将数据集分割成训练集和测试集
      (4) 构建模型
      (5) 利用循环语句,k 值取 1-8 分别训练模型以确定最优 k 值
      (6) 使用最优 k 值训练模型并对新样本[7,27]和[2,4]的类别进行预测
      (7) 使用测试集对模型进行测试
      (8) 预测新样本类别
      (9) 绘制分类边界图

  4. 数据集下载
    本实验的数据集可以点击此处去下载

  5. 代码实现
# coding = utf-8
# 导入必要的库
import numpy as np
import matplotlib.pyplot as plt
from sklearn.neighbors import KNeighborsClassifier
from sklearn import metrics  #引入机器学习的准确率评估模
from sklearn.model_selection import train_test_split  #数据分割模块
from sklearn.model_selection import cross_val_score  #交叉验证模块
# 导入数据
X1,y1=[],[]
fr = open('./knn.txt')
for line in fr.readlines():lineArr = line.strip().split()X1.append([int(lineArr[0]),int(lineArr[1])])y1.append(int(lineArr[2]))
X=np.array(X1)  #转换成 NumPy 数组,X 是特征属性集
y=np.array(y1)  #y 是类别标签集
X_train,X_test,Y_train,Y_test=train_test_split(X,y,test_size=0.16)
# 测试准确率
k_range = range(1, 9)
k_error = []  #保存预测错误率
for k in k_range:  #循环,k 取值为 1~8,查看 KNN 分类的预测准确率knn = KNeighborsClassifier(n_neighbors=k)scores = cross_val_score(knn, X, y, cv=3, scoring='accuracy')#cv 参数决定数据集划分比例,这里是按照 5:1 划分训练集和测试集k_error.append(1 - scores.mean())  #把每次的错误率添加到数组中
k_error.pop(0)
k_min = min(k_error)
k = k_error.index(k_min)
# 定义模型并训练
knn=KNeighborsClassifier(k + 2)
knn.fit(X,y)
KNeighborsClassifier(n_neighbors=3)
# 使用测试集对分类模型进行测试
y_pred=knn.predict(X_test)
print(knn.score(X_test,Y_test))  #输出整体预测结果的准确率
#输出准确率的方法 2
print(metrics.accuracy_score(y_true=Y_test,y_pred=y_pred))
#输出混淆矩阵,如果为对角矩阵,则表示预测结果是正确的,准确度越大
print(metrics.confusion_matrix(y_true=Y_test,y_pred=y_pred)) 
#输出更详细的分类测试报告
from sklearn.metrics import classification_report
target_names = ['labels_1','labels_2','labels_3']
print(classification_report(Y_test,y_pred))
1.0
1.0
[[2]]precision    recall  f1-score   support2       1.00      1.00      1.00         2accuracy                           1.00         2macro avg       1.00      1.00      1.00         2
weighted avg       1.00      1.00      1.00         2
# 预测新样本的类别
label=knn.predict([[7,27],[2,4]])
print(label)  #输出[2 1],表示新样本分别属于 2 和 1 类
[2 1]
# 绘制分类程序的界面图
import matplotlib as mpl
N, M = 90, 90  #网格采样点的个数,采样点越多,分类界面图越精细
t1 = np.linspace(0, 25, N)  #生成采样点的横坐标值
t2 = np.linspace(0,12, M)  #生成采样点的纵坐标值
x1, x2 = np.meshgrid(t1, t2)  #生成网格采样点 
x_show = np.stack((x1.flat, x2.flat), axis=1)  #将采样点作为测试点
y_show_hat = knn.predict(x_show)  #预测采样点的值
y_show_hat = y_show_hat.reshape(x1.shape)  #使之与输入的形状相同 
cm_light = mpl.colors.ListedColormap(['#A0FFA0', '#FFA0A0', '#A0A0FF'])
plt.pcolormesh(x1, x2, y_show_hat, cmap=cm_light,alpha=0.3)  #预测值的显示
<matplotlib.collections.QuadMesh at 0x3e6b6e10>

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/2933.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

idrac管理界面报错:RAC0508: 发生意外错误。

在idrac服务器-服务模块&#xff0c;看到如下报错信息&#xff1a; RAC0508: 发生意外错误。 等待几分钟然后刷新页面。 如果问题仍然存在&#xff0c;请联系服务提供商。 经查询&#xff0c;还是不知道是啥问题。 经查询&#xff0c;发现可能是数据库方面的报错&#xff0c;不…

xgp怎么取消续费 微软商店xgp会员取消自动续费详细教程

xgp怎么取消续费 微软商店xgp会员取消自动续费详细教程 XGP这个游戏平台小伙伴们并不陌生吧&#xff0c;它是微软Xbox游戏部门推出的游戏租赁制会员服务&#xff0c;主要用于主机和PC两个平台。这个平台的会员就可以免费享受多款大制作游戏&#xff0c;而且每个月还会自动更新…

Java中的运算符

运算符是用于数学函数、一些特殊的赋值语句和逻辑比较方面的特殊符号。 赋值运算符&#xff08;“”&#xff09; 赋值运算符是一个二元运算符&#xff08;即对两个操作数进行处理&#xff09;&#xff0c;功能是将右侧的操作数赋值给左侧的操作数。 int a 100; 该表达式就…

KeyguardBouncer的显示流程

开机会调用其show方法吗&#xff1f; 不会 锁屏界面滑动 java.lang.NullPointerException: Attempt to invoke virtual method int java.lang.String.length() on a null object referenceat com.android.systemui.statusbar.phone.KeyguardBouncer.show(KeyguardBouncer.java…

李廉洋:4.24-4.25现货黄金,WTI原油区间震荡,走势分析。

黄金消息面分析&#xff1a;金银近日回调。随着伊朗方面淡化以色列最新反击&#xff0c;中东地区局势没有进一步发酵下&#xff0c;风险溢价下降金银出现较大幅度调整。由于近期高于预期的通胀数据&#xff0c;降息预期持续降温。昨日疲软的美国PMI以及以色列在加沙攻击的加剧支…

宽字符的来历:从ASCII到Unicode,C语言中的宽字符处理

目录 一、ASCII编码&#xff1a;字符世界的开篇 二、Unicode与宽字符的诞生 宽字符类型与宽字符串 三、C语言中的宽字符处理函数 四、宽字符与多字节字符 结语 在计算机科学的发展历程中&#xff0c;字符编码经历了从简单到复杂、从单一语言到全球多语种支持的演变过程。…

【大模型应用极简开发入门(2)】GPT模型简史:从GPT-1到GPT-4:从小数据量的微调到大数据量的强化学习不断优化模型

文章目录 一. GPT-1&#xff1a;无监督与微调1. 在GPT-1之前的监督学习的问题2. GPT-1中新的学习过程-无监督的预训练3. 复杂任务下的微调4. GPT-1为更强大的模型铺平了道路 二. GPT-2&#xff1a;context learning1. 核心思想&#xff1a;context learning2. GPT-2的数据集 三…

Simulink从0搭建模型03-Enabled Subsystem 使能子系统

参考博客 b站视频 【Simulink 0基础入门教程 P4 使能子系统 Enabled Subsystem 的使用介绍】 个人听了这个博主的视频风格觉得很适合我入门学习&#xff0c;讲得很清楚。 另外&#xff0c;视频里面教得很详细了&#xff0c;我也不会再详细写怎么打开创建等步骤&#xff0c;跟着…

2024 证券从业资格证考试备考资料分享

2024 证券从业资格证考试备考资料分享 2024 年 06月1、2日 证券从业资格考试全国统一考试&#xff08;统考&#xff09;&#xff0c;预计将于5月初&#xff08;考前一个月&#xff09;左右开启报名 有没有小伙伴在准备备考的&#xff0c;不知道大家都准备怎么学习呢&#xff…

233 基于matlab的多通道非负矩阵分解(MNMF)算法

基于matlab的多通道非负矩阵分解&#xff08;MNMF&#xff09;算法。其能够寻找到一个非负矩阵W和一个非负矩阵H&#xff0c;满足条件VW*H,从而将一个非负的矩阵分解为左右两个非负矩阵的乘积。使用EM准则对混合信号进行分解。程序已调通&#xff0c;可直接运行。 233 多通道非…

SQL基础学习

一. SQL基础 1. SQL简介 SQL 是用于访问和处理数据库的标准的计算机语言。 1.1 什么是 SQL&#xff1f; SQL 指结构化查询语言SQL 使我们有能力访问数据库SQL 是一种 ANSI 的标准计算机语言 **编者注&#xff1a;**ANSI&#xff0c;美国国家标准化组织 1.2 SQL 能做什么&…

SpringBoot项目 nohup启动运行日志过大问题

如下SpringBoot启动命令 nohup java -Xmx2048m -Xms2048m -jar springboot-demo.jar >>./log.los 2>&1 &使用这条命令启动会导致日志文件和jar包同级&#xff0c;并且随着日积月累&#xff0c;越来越大。最终撑爆目录。 临时解决办法 如果日志已经撑爆了你…

面试被刷,原因居然是不会Git

大家好&#xff0c;我是知微&#xff01; 假设你是一个刚入行的菜狗程序员&#xff0c;正在开发一个软件。 现在老板需要你加一些功能&#xff0c;此时的你有一些担忧&#xff0c;如果对代码进行大刀阔斧的改动&#xff0c;最终却失败了。之前能正常运行的代码也被改得乱七八糟…

C语言-结构体基本概念2.0

结构体成员引用 结构体是一种集合&#xff0c;内部包含了多个独立的成员&#xff0c;每个成员都可以被单独引用。通过成员引用符 . 可以简单地访问结构体的各个成员。 示例 n.a 200; n.b y; n.c 2.22; printf("%d, %c, %lf\n", n.a, n.b, n.c); 结构体指针与数组…

NOIP2018 普及组 T4 对称二叉树

文章目录 题目传送门算法解析总代码提交记录尾声 题目传送门 洛谷 P5018 [NOIP2018 普及组] 对称二叉树 算法解析 本题 DFS 剪枝可过&#xff01;&#xff01;&#xff01; 输入左儿子右儿子时如果遇到 − 1 -1 −1 就把它设为 0 0 0&#xff0c;这样好判断。 输入函数…

布隆过滤器简介

布隆过滤器&#xff08;Bloom Filter&#xff09;是一种空间效率高、查询效率快的数据结构&#xff0c;用于快速判断一个元素是否可能存在于一个集合中。它通过使用多个哈希函数和位数组来实现。 布隆过滤器原理&#xff1a; 位数组&#xff08;Bit Array&#xff09;&#xf…

【力扣 Hot100 | 第六天】4.21(字母异位词分组)

9.字母异位词分组 9.1题目 给你一个字符串数组&#xff0c;请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。 字母异位词 是由重新排列源单词的所有字母得到的一个新单词。 示例一&#xff1a; 输入: strs ["eat", "tea", "tan&quo…

C语言oj题

题目 &#xff1a;保留小数 难度&#xff1a;白银 将一个浮点型K数保留n(1≤n≤5)位小数(四舍五入)的算法定义为宏。在主函数中输入数据输出计算结果。 格式 输入格式&#xff1a;输入k为实型&#xff0c;n为整数&#xff0c;空格分隔。 输出格式&#xff1a;输出为实型 样例1…

vue3中插槽的使用与用处

在Vue 3中&#xff0c;插槽&#xff08;slot&#xff09;是一种强大的机制&#xff0c;它允许开发者在父组件中向子组件传递内容&#xff0c;从而增强组件的灵活性和可重用性。插槽的使用和用处主要体现在以下几个方面&#xff1a; 使用方式&#xff1a; 默认插槽&#xff1a…

电商技术揭秘三十二:智能风控的案例研究与未来趋势

相关系列文章 电商技术揭秘相关系列文章合集&#xff08;1&#xff09; 电商技术揭秘相关系列文章合集&#xff08;2&#xff09; 电商技术揭秘二十八&#xff1a;安全与合规性保障 电商技术揭秘二十九&#xff1a;电商法律合规浅析 电商技术揭秘三十&#xff1a;知识产权保…