a*算法的优缺点_K-近邻算法以及案例

什么是K-近邻算法(KNN)

根据邻居判断类型。如果一个样本在特征空间中有K个最相似(距离相近)的样本大多数属于一个类别,则该样品也属于这个类别。

如何求距离呢?非常简单,如图。

84c6cc4b2a51a352d083ae1a6d4cdb0c.png

a1,a2,a3代表样本a的特征值 b1,b2,b3代表b的样本值,根据公式可以计算出a和b两个点的距离,各个特征值越相近,则距离越近。

K-近邻算法需要做标准化。

k-近邻算法的API(算法流程,无需考虑详细数据)

from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_splitimport pandas as pddata = pd.read_csv("路径")# 缩小数据范围
# data.query() 相当于sql语句,写条件,进行筛选
data = data.query("x > 1.0 & x < 1.25")
# 处理时间的数据 pd.to_datetime
time_value = pd.to_datetime(data['time'], unit='s')
# 把日期格式转换为字典数据
time = pd.DatetimeIndex(time_value)
# 构造一些特征,
data['day'] = time.day
data['hour'] = time.hour
data['weekday'] = time.weekday
# sklearn 1表示列
data = data.drop(['time'], axis=1)
# 把签到数量少于n的目标位置删除
place_count = data.groupby('place_id').count()
# reset_index() 把place_id当做一个属性,以便获取到
tf = place_count[place_count.row_id > 3].reset_index()# 判断是否存在包含关系 ,果果数据中的 place_id 不在 tf.place_id 中,被过滤
data = data[data['place_id'].isin(tf.place_id)]
# 去处数据中的特征值和目标值
y = data['place_id']
x = data.drop(['place_id'], axis=1)
# 进行训练值和特征值切分
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.25)# 特征工程,标准化
std = StandardScaler()
# 对测试集和训练集进行标准化
x_train = std.fit_transform(x_train)
# 因为前面已经fit一次了, fit会计算平均值和标准差,不用再计算一次,直接transform
x_test = std.transform(x_test)
# 进行算法流程
knn = KNeighborsClassifier(n_neighbors=5)
# fit ,predict,score
fit = knn.fit(x_train, y_train)
# 得出预测结果
y_predict = fit.predict(x_test)
# 评估预测结果,得出准确率
knn.score(x_test, y_test)

K-近邻算法优缺点

优点:

  • 简单,易于理解,易于实现,无需估计参数(超参数),无需训练。

缺点:

  • K值取值 , K值取很小容易受异常点影响 , K取值很大 , 容易受数量波动影响。
  • 性能问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/438967.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android 预约挂号代码_告别排队!用Python定时自动挂号和快捷查询化验报告

作者 | 阿文来源 | 程序人生(ID: coder_life)我什么要做这个事情去年单位体检查出问题来&#xff0c;经过穿刺手术确诊是个慢性肾脏病2期&#xff0c; IGA 肾病三期&#xff0c;可能大家对于这个病并不是很了解&#xff0c;但是另外一个词可能大家都听过&#xff0c;叫"尿…

灵动思绪EF(Entity FrameWork)

很久之前就想写这篇文章了&#xff0c;但是由于种种原因&#xff0c;没有将自己学习的EF知识整理成一片文章。今天我就用CodeFirst和ModelFirst两种方式的简单案例将自己学习的EF知识做个总结。 在讲解EF之前&#xff0c;我们先来看下ORM ORM全称&#xff1a;(Object-Relatio…

json qbytearray 串 转_JSON数据采集网关,json转Modbus RTU串IO口RS485转4~20mA边缘计算智能终端...

JSON数据采集网关边缘计算智能终端是一种能够将各种传感器仪表仪器设备的数据采集后按照JSON格式上传服务器的网关&#xff0c;可以实现云边协同。JSON(JavaScript Object Notation)是java中的数据格式。例如{“Energy”:”100”, “time”:”22:22:15”}这样的格式&#xff0c…

ABP入门系列(3)——领域层定义仓储并实现

一、先来介绍下仓储 仓储&#xff08;Repository&#xff09;&#xff1a; 仓储用来操作数据库进行数据存取。仓储接口在领域层定义&#xff0c;而仓储的实现类应该写在基础设施层。 在ABP中&#xff0c;仓储类要实现IRepository接口&#xff0c;接口定义了常用的增删改查以及…

java自适应table_Java 设置Word中的表格自适应的3种方式

概述在Word创建表格时&#xff0c;可设置表格“自动调整”&#xff0c;有3种情况&#xff0c;通过Java程序设置可调用相应的方法来实现&#xff0c;即&#xff1a;根据内容调整表格AutoFitBehaviorType.Auto_Fit_To_Contents根据窗口调整表格AutoFitBehaviorType.Auto_Fit_To_W…

ABP入门系列(4)——创建应用服务

ABP入门系列目录——学习Abp框架之实操演练 1. 解释下应用服务层 应用服务用于将领域(业务)逻辑暴露给展现层。展现层通过传入DTO(数据传输对象)参数来调用应用服务&#xff0c;而应用服务通过领域对象来执行相应的业务逻辑并且将DTO返回给展现层。因此&#xff0c;展现层和领…

sw槽钢插件_SolidWorks所有实用插件详解一览

1.3D Instant Website 是一套全新的工具&#xff0c; 能使 Solidworks 的使用者快速且方便的创造、发表一个生动又有安全性的 3D交互式的网页。利用 3D Instant Website将现有的3D实体模型利用网页格式发表在 Solidworks 提供的网站或是公司内部的网站上3D Instant…

XCIE-HUAWEI-PBR-MQC-引入形成的路由环路

XCIE-HUAWEI-PBR-MQC-引入形成的路由环路 首先来个测试 给你们选&#xff0c;答案选啥呢? 正确答案在结尾公布 正确答案是C 为什么呢&#xff1f; 首先&#xff0c;虽然ACL有一个齐总是拒绝的&#xff0c;但是呢&#xff0c;他两都是同一条路由 但是呢&#xff01;&#x…

ABP入门系列(5)——展现层实现增删改查

ABP入门系列目录——学习Abp框架之实操演练源码路径&#xff1a;Github-LearningMpaAbp 这一章节将通过完善Controller、View、ViewModel&#xff0c;来实现展现层的增删改查。最终实现效果如下图&#xff1a; 展现层最终效果 一、定义Controller ABP对ASP.NET MVC Controlle…

限制会话id服务端不共享_不懂 Zookeeper?看完不懂你打我

高并发分布式开发技术体系已然非常的庞大&#xff0c;从国内互联网企业使用情况&#xff0c;可发现RPC、Dubbo、ZK是最基础的技能要求。关于Zookeeper你是不是还停留在Dubbo注册中心的印象中呢&#xff1f;还有它的工作原理呢&#xff1f;经典应用场景呢&#xff1f;对前面三个…

防抖与节流方案_前端ajax优化解决方案

伴随着前端ajax的应用场景越来越多&#xff0c;那就免不了一个整合的ajax优化解决方案了&#xff0c;自己优化太麻烦&#xff1f;没事&#xff0c;有它帮你解决&#xff1a;hajax 与当下比较热门的请求库 axios 和原生的 fetch相比&#xff0c;hajax有什么一些什么内容和特点呢…

ABP入门系列(6)——定义导航菜单

ABP入门系列目录——学习Abp框架之实操演练源码路径&#xff1a;Github-LearningMpaAbp 完成了增删改查以及页面展示&#xff0c;这一节我们来为任务清单添加【导航菜单】。 在以往的项目中&#xff0c;大家可能会手动在layout页面中添加一个a标签来新增导航菜单&#xff0c;这…

ABP入门系列(7)——分页实现

ABP入门系列目录——学习Abp框架之实操演练源码路径&#xff1a;Github-LearningMpaAbp 完成了任务清单的增删改查&#xff0c;咱们来讲一讲必不可少的的分页功能。 首先很庆幸ABP已经帮我们封装了分页实现&#xff0c;实在是贴心啊。 来来来&#xff0c;这一节咱们就来捋一捋如…

下载matlab安装包太慢_Matlab2017a软件安装包以及安装教程

安装步骤&#xff1a;1.如图所示&#xff0c;完整的安装包应该有13个压缩包&#xff0c;必须要全部下载完成才能解压。鼠标右击“thMWoMaR17a.part01.rar”压缩包&#xff0c;选择“解压到thMWoMaR17a”&#xff0c;然后等待解压完成2.打开“thMWoMaR17a”文件夹&#xff0c;解…

【转】ORM系列之Entity FrameWork详解

一. 谈情怀 从第一次接触开发到现在&#xff08;2018年&#xff09;&#xff0c;大约有六年时间了&#xff0c;最初阶段连接数据库&#xff0c;使用的是【SQL语句ADO.NET】&#xff0c;那时候&#xff0c;什么存储过程、什么事务 统统不理解&#xff0c;生硬的将SQL语句传入SQL…

springcloud 微服务鉴权_Java微服务框架spring cloud

Spring Cloud是什么Spring Boot 让我们从繁琐的配置文件中解脱了出来&#xff0c;而 Spring Cloud&#xff0c;它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发&#xff0c;如服务发现注册、配置中心、消息总线、负载均衡、断路器、数据监控等&#xff0c;…

ABP入门系列(8)——Json格式化

ABP入门系列目录——学习Abp框架之实操演练源码路径&#xff1a;Github-LearningMpaAbp 讲完了分页功能&#xff0c;这一节我们先不急着实现新的功能。来简要介绍下Abp中Json的用法。为什么要在这一节讲呢&#xff1f;当然是做铺垫啊&#xff0c;后面的系列文章会经常和Json这个…

fxml设置背景_JavaFX – 如何获取Tab,Button等的背景颜色

问题描述&#xff1a;我无法在JavaFX中获得对象的背景.我不是指形状,而是像Buttons,Tabs等常规节点.我不知道如何访问他们的背景颜色.我想要的是&#xff1f;我正在开发IDE,我想在选项卡上运行Color动画,文件是用户想要打开的,并且已经存在于程序文件集合中.在做这个动画之前,我…

ABP入门系列(9)——权限管理

1.引言 完成了简单的增删改查和分页功能&#xff0c;是不是觉得少了点什么&#xff1f; 是的&#xff0c;少了权限管理。既然涉及到了权限&#xff0c;那我们就细化下任务清单的功能点&#xff1a; 登录的用户才能查看任务清单用户可以无限创建任务并分配给自己&#xff0c;但…