【机器学习】分类算法-KNN算法实现

一、前言

   最近,在学习机器学习相关的内容,就想着能不能跑一些机器学习的Demo,这样更方便后期的学习,于是在B站上,找了一个Up主【abilityjh】的视频,跟着学,跟着敲代码,自己在博客上将学的东西,以博客、大白话的形式记录,方便后期的回顾,也希望可以帮助到大家!

二、什么是KNN算法

   KNN算法也叫做K-临近算法,也就是说对于一个未知的样本,我们可以从已知的样本中,在一定范围内确定K个数,在K个数中,哪一类的类型个数多,我们就将未知样本归于哪一类,从而确定它的类型。

如图所示在这个圆圈范围内,有4个三角形,两个正方形,那么对于未知样本的红色圆形就最终判定为三角形。

三、KNN算法实现

(1)案例介绍

如上图所示,我们以B站Up主给的情况做一个案例,训练集是通过“接吻次数”、‘打斗次数’来确定电影类型,我们这个案例需要事先更具训练集来判断出测试集的电影类型。

(2)实现步骤

导入必须得数据库

import numpy as np
import matplotlib.pyplot as plt

①我们要建立训练和测试数据集

我们将接吻kiss和打斗fight分别一 一对应,用filmType代表不同的电影类型(1为爱情电影,2为动作电影),然后将数据转化为矩阵

# Python 的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号,列表使用方括号
# (1)建立数据集
fight = (3, 2, 1, 101, 99, 98)
kiss = (104, 100, 81, 10, 5, 2)
filmType = (1, 1, 1, 2, 2, 2)
plt.scatter(fight, kiss, c=filmType)
x = np.array([fight, kiss])
x = x.T
y = np.array(filmType)
plt.show()
print(x)
print(y)

效果:

②计算距离并排序

计算未知点到每个点的距离

xx = np.array([18, 90])
# numpy求和sum(x)函数,x==0按照列求和,x=1按照行求和
dist = (((x - xx) ** 2).sum(1)) ** 0.5
# 按照索引值排序的
sortdDist = dist.argsort()

③选取最近的K个点,来做选择

从上面的操作中,我们已经能够拿到,未知点到每个测试点的由近到远的距离对应的下标,此时我们采用一个classCount{}字典来统计,临近的K个点中,不同类型出现的次数。

k = 4
classCount = {}
for i in range(k):# 根据索引值去映射voteLabel = y[sortdDist[i]]classCount[voteLabel] = classCount.get(voteLabel, 0) + 1
print('class: count', classCount)

这段代码稍微有点绕,解释一下:我们选取临近的K个点,创建了一个字典classCount{},我们遍历循环从0开始,我们从上面的代码知道,sortdDist[0]=1,y[1]=1,所以classCount[voteLabel] = classCount.get(voteLabel, 0) + 1就是在classCount[1]=0的基础上+1,则classCount[1]=1,这是第一次循环;我们不妨在分析一次i=1时的循环:sortdDist[1]=2,y[2]=1,所以classCount[voteLabel] = classCount.get(voteLabel, 0) + 1就是在classCount[1]=1的基础上+1,则classCount[1]=2;其他的以此类推即可!最终的话classCount={1:3,2:1}

运行效果:

④根据多数表决,输出结果

其实,就是将我们classCount中的value做比较(比大小),得出value值最大的,对应的key,则对应key的类型就是未知点对应类型。

maxType = 0
maxCount = -1
for key, value in classCount.items():if value > maxCount:maxType = keymaxCount = value
print('output: ', maxType)

效果:

如图所示,我们就可以根据训练集和规定的K个参数,得到我们未知的点的类型为1即爱情类电影。

四、总结

   虽然这只是一个简单的案例,但是却可以帮助我们理解KNN算法的基本原理,以后面可以再出一篇通过读取文本数据(数据量较多),通过KNN算法来实现未知变量的分类和识别。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/40287.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

轻松搞定Docker!教你一键删除所有镜像!

大家好,我是CodeQi! 一位热衷于技术分享的码仔。 Docker 是一种流行的容器化平台,它提供了一种轻量级且可移植的方式来打包、分发和运行应用程序。 在使用 Docker 进行应用程序开发和部署时,我们通常会创建和使用各种镜像。然而,随着时间的推移,我们可能会积累大量的镜…

Python 正则表达式的应用与实践

正则表达式是一种强大的文本匹配和处理工具,广泛应用于Python编程中。本文将深入探讨正则表达式的基础知识、高级应用及其在实际开发中的重要性和应用场景。 正则表达式的基础知识与语法 正则表达式是一种用来描述、匹配一系列字符串的语法规则。在Python中&#…

【C语言】volatile 关键字

在C语言中,volatile关键字用于声明一个变量,告知编译器该变量的值可能会被程序之外的某些因素(如硬件或其他并发线程)改变。因此,编译器在优化代码时不能对这个变量做假设,也不能优化掉对它的读取或写入操作…

Python学习笔记六

1.实现4*4随机矩阵 #生成一个随机4*4的数组 import numpy as np np.random.seed(1)#固定随机数 每次都是同一个 ()里面的数字不同 对应的随机数也不同 np.random.rand() anp.random.randint(0,100,16).reshape(4,4)#0~100的随机整数 包含16个元素 pri…

[JS]正则表达式

介绍 正则表达式是定义匹配字符串的规则, 在JS中, 正则表达式也是对象, 通常用于查找或替换符合规则的文本 许多语言都支持正则表达式, 在前端中常见的场景就是表单验证和敏感词替换 语法 正则字面量 / / const str 好好学习,天天向上 // 1.定义规则: const reg /好///…

2024年上半年网络工程师下午真题及答案解析

试题一(20分) 某高校网络拓扑如下图所示,两校区核心(CORE-1、CORE-2),出口防火墙(NGFW-1、NGFW-2)通过校区间光缆互联,配置OSPF实现全校路由收敛,两校区相距40km。两校区默认由本地…

【C++】C++深拷贝与浅拷贝

在C中,深拷贝(Deep Copy)和浅拷贝(Shallow Copy)是两种不同的对象复制方式,主要涉及到动态内存分配的对象。它们之间的主要区别在于复制对象时是否复制了其所拥有的资源(如动态分配的内存&#…

Postman中的安全通行证:使用Bearer Token认证全指南

🗝️ Postman中的安全通行证:使用Bearer Token认证全指南 在现代API开发中,安全认证是保护数据和接口的关键环节。Bearer Token作为一种广泛使用的认证机制,允许用户在Postman中进行安全的API调用。本文将详细解释如何在Postman中…

世链集团|区块链行业领军者,打造专业资管、精准投研双标杆

世链集团报道,在区块链发展浪潮中,资产管理和投资研究一直是推动行业发展的两大关键力量。世链集团作为区块链行业的领军者,始终秉承创新精神,致力于打造专业资管和精准投研双标杆,为行业提供全方位、深层次的服务。 …

QT slots 函数

文章目录 概述小结 概述 在Qt中&#xff0c;slots 是一种特殊的成员函数&#xff0c;它们可以与对象发出的信号连接。当信号被触发时&#xff0c;连接的槽函数会被调用。 来个简单的示例吧&#xff0c;如下图&#xff1a; #include <QObject> #include <QDebug>…

第6章:结构化开发方法

第6章&#xff1a;结构化开发方法 系统设计基本原理 1、抽象 抽象是一种设计技术&#xff0c;重点说明一个实体的本质方面&#xff0c;而忽略或者掩盖不是很重要或非本质的方面。 模块化 模块化是指将一个待开发的软件分解成若干个小的、简单的部分一模块&#xff0c;每个模…

出海创新 | 璞华国际参加全球数字经济大会,助力出海创新生态合作

7月3日&#xff0c;2024全球数字经济大会“数字生态出海发展论坛”在国家会议中心&#xff08;北京&#xff09;隆重召开。本次论坛以“数字蓝海&#xff0c;扬帆远航”为主题&#xff0c;隆重启动“北京数字经济企业出海创新服务基地”&#xff0c;正式发布数字经济企业细分领…

模型情景制作-如何制作棕榈树

夏天&#xff0c;沙滩&#xff0c;海景&#xff0c;棕榈树&#xff0c;外加美女&#xff0c;想象下热带海滨的样子吧 可是口年的上班族没有多少机会去到海滩&#xff0c;肿么办&#xff1f;我们自己DIY一个海滨情景摆在办公桌上吧~~~ 什么什么&#xff1f;棕榈树不会做&#xf…

股指期货价格与股指现货价格是什么关系?

股指期货价格和股指现货价格之间的关系&#xff0c;可以想象成两个好朋友&#xff0c;他们总是想要保持一致的步伐&#xff0c;但有时候因为各种原因&#xff0c;他们的步伐会出现一些差异。 1. 正向市场 在这种情况下&#xff0c;股指期货的价格通常比现货价格要高一些。这就…

UE5 修改项目名称 类的名称

修改类的名称 这里推荐使用Rider编辑器修改&#xff0c;它会给你遍历所有的引用&#xff0c;然后一次性修改&#xff0c;并自动添加DefaultEngine.ini。接下来&#xff0c;我将给大家演示如何实现。 我们在一个类的文件上面选择重构此 然后选择重命名 在弹框内修改为新的名称…

B+树的元素检索过程

B树的检索方式主要是通过从根节点开始逐层向下搜索&#xff0c;直到找到目标数据或确定目标数据不存在为止。具体的检索过程如下&#xff1a; 从根节点开始&#xff1a; 初始时&#xff0c;从B树的根节点开始查找。 节点内部的查找&#xff1a; 在每个非叶子节点中&#xff0c…

Element中的选择器组件Select (一级选择组件el-select)

简述&#xff1a;在 Element UI 中&#xff0c;ElSelect&#xff08;或简称为 Select&#xff09;是一个非常常用的选择器组件&#xff0c;它提供了丰富的功能来帮助用户从一组预定义的选项中选择一个或多个值。这里来简单记录一下 一. 组件和属性配置 <el-selectv-model&q…

Sylar服务器框架——ByteArray模块

1、模块概述 字节数组容器&#xff0c;提供基础类型的序列化与反序列化功能。ByteArray的底层存储是固定大小的块&#xff0c;以链表形式组织。每次写入数据时&#xff0c;将数据写入到链表最后一个块中&#xff0c;如果最后一个块不足以容纳数据&#xff0c;则分配一个新的块…

C#上位机开发详解

在工业控制和自动化领域&#xff0c;上位机软件的开发至关重要。它可以用来监控和控制下位机设备&#xff0c;进行数据采集和处理。本文将详细介绍如何使用C#开发一个上位机应用程序&#xff0c;涵盖环境设置、代码实现以及具体功能的实现。 一、开发环境设置 1. 安装Visual …

layui在表格中嵌入上传按钮,并修改上传进度条

当需要在表格中添加上传文件按钮&#xff0c;并不需要弹出填写表单的框的时候&#xff0c;需要在layui中&#xff0c;用按钮触发文件选择 有一点需要说明的是&#xff0c;layui定义table并不是在定义的标签中渲染&#xff0c;而是在紧接着的标签中渲染&#xff0c;所以要获取实…