a*算法的优缺点_K-近邻算法以及案例

什么是K-近邻算法(KNN)

根据邻居判断类型。如果一个样本在特征空间中有K个最相似(距离相近)的样本大多数属于一个类别,则该样品也属于这个类别。

如何求距离呢?非常简单,如图。

84c6cc4b2a51a352d083ae1a6d4cdb0c.png

a1,a2,a3代表样本a的特征值 b1,b2,b3代表b的样本值,根据公式可以计算出a和b两个点的距离,各个特征值越相近,则距离越近。

K-近邻算法需要做标准化。

k-近邻算法的API(算法流程,无需考虑详细数据)

from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_splitimport pandas as pddata = pd.read_csv("路径")# 缩小数据范围
# data.query() 相当于sql语句,写条件,进行筛选
data = data.query("x > 1.0 & x < 1.25")
# 处理时间的数据 pd.to_datetime
time_value = pd.to_datetime(data['time'], unit='s')
# 把日期格式转换为字典数据
time = pd.DatetimeIndex(time_value)
# 构造一些特征,
data['day'] = time.day
data['hour'] = time.hour
data['weekday'] = time.weekday
# sklearn 1表示列
data = data.drop(['time'], axis=1)
# 把签到数量少于n的目标位置删除
place_count = data.groupby('place_id').count()
# reset_index() 把place_id当做一个属性,以便获取到
tf = place_count[place_count.row_id > 3].reset_index()# 判断是否存在包含关系 ,果果数据中的 place_id 不在 tf.place_id 中,被过滤
data = data[data['place_id'].isin(tf.place_id)]
# 去处数据中的特征值和目标值
y = data['place_id']
x = data.drop(['place_id'], axis=1)
# 进行训练值和特征值切分
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.25)# 特征工程,标准化
std = StandardScaler()
# 对测试集和训练集进行标准化
x_train = std.fit_transform(x_train)
# 因为前面已经fit一次了, fit会计算平均值和标准差,不用再计算一次,直接transform
x_test = std.transform(x_test)
# 进行算法流程
knn = KNeighborsClassifier(n_neighbors=5)
# fit ,predict,score
fit = knn.fit(x_train, y_train)
# 得出预测结果
y_predict = fit.predict(x_test)
# 评估预测结果,得出准确率
knn.score(x_test, y_test)

K-近邻算法优缺点

优点:

  • 简单,易于理解,易于实现,无需估计参数(超参数),无需训练。

缺点:

  • K值取值 , K值取很小容易受异常点影响 , K取值很大 , 容易受数量波动影响。
  • 性能问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/438967.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android 预约挂号代码_告别排队!用Python定时自动挂号和快捷查询化验报告

作者 | 阿文来源 | 程序人生(ID: coder_life)我什么要做这个事情去年单位体检查出问题来&#xff0c;经过穿刺手术确诊是个慢性肾脏病2期&#xff0c; IGA 肾病三期&#xff0c;可能大家对于这个病并不是很了解&#xff0c;但是另外一个词可能大家都听过&#xff0c;叫"尿…

灵动思绪EF(Entity FrameWork)

很久之前就想写这篇文章了&#xff0c;但是由于种种原因&#xff0c;没有将自己学习的EF知识整理成一片文章。今天我就用CodeFirst和ModelFirst两种方式的简单案例将自己学习的EF知识做个总结。 在讲解EF之前&#xff0c;我们先来看下ORM ORM全称&#xff1a;(Object-Relatio…

json qbytearray 串 转_JSON数据采集网关,json转Modbus RTU串IO口RS485转4~20mA边缘计算智能终端...

JSON数据采集网关边缘计算智能终端是一种能够将各种传感器仪表仪器设备的数据采集后按照JSON格式上传服务器的网关&#xff0c;可以实现云边协同。JSON(JavaScript Object Notation)是java中的数据格式。例如{“Energy”:”100”, “time”:”22:22:15”}这样的格式&#xff0c…

ABP入门系列(3)——领域层定义仓储并实现

一、先来介绍下仓储 仓储&#xff08;Repository&#xff09;&#xff1a; 仓储用来操作数据库进行数据存取。仓储接口在领域层定义&#xff0c;而仓储的实现类应该写在基础设施层。 在ABP中&#xff0c;仓储类要实现IRepository接口&#xff0c;接口定义了常用的增删改查以及…

XCIE-HUAWEI-PBR-MQC-引入形成的路由环路

XCIE-HUAWEI-PBR-MQC-引入形成的路由环路 首先来个测试 给你们选&#xff0c;答案选啥呢? 正确答案在结尾公布 正确答案是C 为什么呢&#xff1f; 首先&#xff0c;虽然ACL有一个齐总是拒绝的&#xff0c;但是呢&#xff0c;他两都是同一条路由 但是呢&#xff01;&#x…

ABP入门系列(5)——展现层实现增删改查

ABP入门系列目录——学习Abp框架之实操演练源码路径&#xff1a;Github-LearningMpaAbp 这一章节将通过完善Controller、View、ViewModel&#xff0c;来实现展现层的增删改查。最终实现效果如下图&#xff1a; 展现层最终效果 一、定义Controller ABP对ASP.NET MVC Controlle…

限制会话id服务端不共享_不懂 Zookeeper?看完不懂你打我

高并发分布式开发技术体系已然非常的庞大&#xff0c;从国内互联网企业使用情况&#xff0c;可发现RPC、Dubbo、ZK是最基础的技能要求。关于Zookeeper你是不是还停留在Dubbo注册中心的印象中呢&#xff1f;还有它的工作原理呢&#xff1f;经典应用场景呢&#xff1f;对前面三个…

防抖与节流方案_前端ajax优化解决方案

伴随着前端ajax的应用场景越来越多&#xff0c;那就免不了一个整合的ajax优化解决方案了&#xff0c;自己优化太麻烦&#xff1f;没事&#xff0c;有它帮你解决&#xff1a;hajax 与当下比较热门的请求库 axios 和原生的 fetch相比&#xff0c;hajax有什么一些什么内容和特点呢…

ABP入门系列(6)——定义导航菜单

ABP入门系列目录——学习Abp框架之实操演练源码路径&#xff1a;Github-LearningMpaAbp 完成了增删改查以及页面展示&#xff0c;这一节我们来为任务清单添加【导航菜单】。 在以往的项目中&#xff0c;大家可能会手动在layout页面中添加一个a标签来新增导航菜单&#xff0c;这…

ABP入门系列(7)——分页实现

ABP入门系列目录——学习Abp框架之实操演练源码路径&#xff1a;Github-LearningMpaAbp 完成了任务清单的增删改查&#xff0c;咱们来讲一讲必不可少的的分页功能。 首先很庆幸ABP已经帮我们封装了分页实现&#xff0c;实在是贴心啊。 来来来&#xff0c;这一节咱们就来捋一捋如…

下载matlab安装包太慢_Matlab2017a软件安装包以及安装教程

安装步骤&#xff1a;1.如图所示&#xff0c;完整的安装包应该有13个压缩包&#xff0c;必须要全部下载完成才能解压。鼠标右击“thMWoMaR17a.part01.rar”压缩包&#xff0c;选择“解压到thMWoMaR17a”&#xff0c;然后等待解压完成2.打开“thMWoMaR17a”文件夹&#xff0c;解…

【转】ORM系列之Entity FrameWork详解

一. 谈情怀 从第一次接触开发到现在&#xff08;2018年&#xff09;&#xff0c;大约有六年时间了&#xff0c;最初阶段连接数据库&#xff0c;使用的是【SQL语句ADO.NET】&#xff0c;那时候&#xff0c;什么存储过程、什么事务 统统不理解&#xff0c;生硬的将SQL语句传入SQL…

springcloud 微服务鉴权_Java微服务框架spring cloud

Spring Cloud是什么Spring Boot 让我们从繁琐的配置文件中解脱了出来&#xff0c;而 Spring Cloud&#xff0c;它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发&#xff0c;如服务发现注册、配置中心、消息总线、负载均衡、断路器、数据监控等&#xff0c;…

ABP入门系列(9)——权限管理

1.引言 完成了简单的增删改查和分页功能&#xff0c;是不是觉得少了点什么&#xff1f; 是的&#xff0c;少了权限管理。既然涉及到了权限&#xff0c;那我们就细化下任务清单的功能点&#xff1a; 登录的用户才能查看任务清单用户可以无限创建任务并分配给自己&#xff0c;但…

c#quartz触发_SpringBoot集成Quartz实现定时任务

1 需求在我的前后端分离的实验室管理项目中&#xff0c;有一个功能是学生状态统计。我的设计是按天统计每种状态的比例。为了便于计算&#xff0c;在每天0点&#xff0c;系统需要将学生的状态重置&#xff0c;并插入一条数据作为一天的开始状态。另外&#xff0c;考虑到学生的请…

ABP入门系列(10)——扩展AbpSession

一、AbpSession是Session吗&#xff1f; 1、首先来看看它们分别对应的类型是什么&#xff1f; 查看源码发现Session是定义在Controller中的类型为HttpSessionStateBase的属性。 public HttpSessionStateBase Session { get; set; } 再来看看AbpSession是何须类也&#xff0c…

太吾绘卷第一世攻略_耽美推文-BL-仿佛在攻略一只河豚

目录&#xff1a;《全能攻略游戏》by公子如兰《无限升级游戏》by暗夜公主《无限游戏》BY SISIMO《请听游戏的话》by木兮娘《游戏&#xff0c;在线直播》by雨田君《最强游戏制作人》by木兰竹《在逃生游戏里撩宿敌》by临钥《游戏加载中》by龙柒《狩猎游戏》by砯涯《当异性参加逃生…

ABP入门系列(11)——编写单元测试

1. 前言 In computer programming, unit testing is a software testing method by which individual units of source code, sets of one or more computer program modules together with associated control data, usage procedures, and operating procedures, are tested …

etl构建数据仓库五步法_带你了解数据仓库的基本架构

数据仓库的目的是构建面向分析的集成化数据环境&#xff0c;为企业提供决策支持&#xff08;Decision Support&#xff09;。其实数据仓库本身并不“生产”任何数据&#xff0c;同时自身也不需要“消费”任何的数据&#xff0c;数据来源于外部&#xff0c;并且开放给外部应用&a…