机器学习---KNN算法核心原理和思路分析

文章目录

  • 1.算法介绍
  • 2.过拟合和欠拟合
  • 3.几种不同的距离
  • 4.特征的归一化处理

特此声明:该内容是学习耿直哥的相关机器学习理论,也是文章里面的部分图片素材的来源

1.算法介绍

KNN全称叫做K Nearset Neighbor,翻译之后就是K个最近的邻居;

其实这个KNN是一个思想,在我们的分类问题和回归问题里面都是有所体现的:

首先看一下这个分类的问题:分类问题使用这个思想主要是给我们的未知的个体贴上一个标签,中间的那个白色的圆圈周围:有灰色的,有红色的,那我们的这个未知的个体应该是灰色的还是红色的呢?

这个时候,通过选择不同的l值,我们就可以为这个未知的个体贴上标签:k=3的时候,就是虚线的小圆圈,这个时候,这个未知个体的属性就是红色的,如果k-5,也就是虚线的大圆圈,这个时候未知的个体的属性就是灰色的;

在这里插入图片描述

在我们的回归问题里面,和上面的分类问题贴标签不一样,回归问题主要是确定这个未知点的数值,也就是周围是不同的数据,我们需要根据这个k和不同的个体的权重,计算这个未知的个体的具体数值;

2.过拟合和欠拟合

K值的选取会出现这个过拟合和欠拟合的现象:

K值太小就是过拟合,英文叫做overfit,fit是合身,合适的意思,over就是过度的意思,如图所示,这个未知的个体周围基本上都是红色的,但是如果你的这个k=1的时候,他应该是灰色的,这种情况就是过拟合;

右下角的小人是为了从英语的层面去解释这个问题,就是这个小人的裤子太紧了,具体到我们的数据上面,就是这个数据集选择这个范围太小了,所以称为过拟合,这个时候i很容易受到噪声的影响;其实,如果从英语的角度,也就是overfit进行理解,这个时候就很容易明白;

因为初学者很难理解,为什么这个数据选择的很少,但是这个现象称之为过拟合呢,实际上这个就是从我们的英文翻译来的,如果追根溯源,我相信这个overfit并不难理解;

欠拟合,即underfit,使用小人理解,就是裤子太大了,具体到数据上面就是数据的选择范围太大了,其实有些的影响程度很小,基本上就可以忽略,但是我们也考虑进来了,这个就是欠拟合,这个时候的决策的效率很低,因为你受到每一个样本的影响;

3.几种不同的距离

在我们的这个KNN算法里面,因为是最近邻吗,所以这个距离的计算是我们绕不开的,因为这个距离决定了我们是否要选取这个点作为我们的参考点,下面介绍几种不同的距离:

首先是明氏距离,这个根据数学家明可夫斯基来进行命名的,通式如下所示,p=1的时候就是曼哈顿距离,p=2的时候就是欧氏距离,这个欧氏距离就是我们熟悉的距离,也就是我们传统意义上面的距离;

下面的这个上面还是用蓝色这个直线表示的我们的欧氏距离,使用红色的两个直线段表示我们的曼哈顿距离,但是实际上,我们常用的还是我们很熟悉的这个欧氏距离,其他的两个了解即可;

4.特征的归一化处理

为什么要进行特征值的归一化处理:主要是为了让不同的特征对于我们的模型具有一样的影响,这个时候模型同等的对待每一个特征,提高模型的准确性;

下面的这个变换的过程就可以解释这个现象:就是我们的x,y轴相同的距离代表的长度需要是一致的,也就是我们说的这个标度,否则就会对于我们的模型训练产生影响;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/896219.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

书生大模型实战营14-MindSearch深度解析实践

文章目录 L2——进阶岛MindSearch深度解析实践1 MindSearch 简介2 开发环境配置2.1. 打开codespace主页,选择Blank模板进行创建2.2. 创建conda环境隔离并安装依赖 3. 获取硅基流动API KEY4. 启动MindSearch4.1. 启动后端4.2. 启动前端 5. 部署到自己的 HuggingFace …

uniapp实现app的pdf预览

实现效果 文件准备 static下添加该pdf文件&#xff08;下载地址&#xff1a;https://gitee.com/shallow-winds/resource_package/tree/master/%E6%96%B9%E6%B3%95%E4%B8%80/html&#xff09; 使用web-view进行展示&#xff1a; 在这里插入代码片 <web-view :src"u…

重启 nginx

首先确认Nginx是否已经安装&#xff0c;并检查它的安装位置。 执行以下命令来检查&#xff1a; which nginx#例如&#xff1a;显示/usr/local/nginx/sbin/nginx方法1&#xff1a;直接使用完整路径启动Nginx 1.1、启动 Nginx&#xff0c;执行命令&#xff1a; sudo /usr/loca…

java实现多图合成mp4和视频附件下载

java实现多图合成mp4和视频附件下载 在wutool中&#xff0c;封装了视频处理工具类&#xff0c;基于javacv和ffmpeg库&#xff0c;实现多图合成mp4、视频http附件下载等。 关于wutool wutool是一个java代码片段收集库&#xff0c;针对特定场景提供轻量解决方案&#xff0c;只…

ollama修改监听ip: 0.0.0.0

确认Ollama绑定IP地址 默认情况下&#xff0c;Ollama可能仅监听本地回环地址&#xff08;127.0.0.1&#xff09;。要允许外部访问&#xff0c;需将其配置为监听所有IP&#xff08;0.0.0.0&#xff09;或指定IP&#xff08;如10…19&#xff09;。 修改启动命令&#xff08;推荐…

STM32-温湿度上传OneNET项目

一、项目需求 使用 ESP8266 连接 OneNET 云平台&#xff0c;并通过 MQTT 协议上传 DHT11 获取的温湿度值。 二、项目框图 三、DHT11工作原理 参考于良许嵌入式手把手教你玩转DHT11&#xff08;原理驱动&#xff09; | 良许嵌入式 3.1 正常工作验证 #​ 上电后&#xff…

百度首页上线 DeepSeek 入口,免费使用

大家好&#xff0c;我是小悟。 百度首页正式上线了 DeepSeek 入口&#xff0c;这一重磅消息瞬间在技术圈掀起了惊涛骇浪&#xff0c;各大平台都被刷爆了屏。 百度这次可太给力了&#xff0c;PC 端开放仅 1 小时&#xff0c;就有超千万人涌入体验。这速度&#xff0c;简直比火…

Ubuntu:wvp-GB28181-pro安装、运行

参考 https://doc.wvp-pro.cn 下载源码 GitHub - 648540858/wvp-GB28181-pro: WEB VIDEO PLATFORM是一个基于GB28181-2016标准实现的网络视频平台&#xff0c;支持NAT穿透&#xff0c;支持海康、大华、宇视等品牌的IPC、NVR、DVR接入。支持国标级联&#xff0c;支持rtsp/rtm…

c++入门-------命名空间、缺省参数、函数重载

C系列 文章目录 C系列前言一、命名空间二、缺省参数2.1、缺省参数概念2.2、 缺省参数分类2.2.1、全缺省参数2.2.2、半缺省参数 2.3、缺省参数的特点 三、函数重载3.1、函数重载概念3.2、构成函数重载的条件3.2.1、参数类型不同3.2.2、参数个数不同3.2.3、参数类型顺序不同 前言…

Linux提权之计划任务反弹shell提权(十一)

实验环境还是一样的 当获取一个linux普通用户的时&#xff0c;查看计划任务 首先我们退出root用户 cat /etc/crontab crontab -l 查看当前用户命令 /var/spool/cron/crontabs/root 这个目录是root任务文件 默认是不是root权限是 看不到 tail -f /var/log/syslog 咋们切换用…

论文解读 | AAAI'25 Cobra:多模态扩展的大型语言模型,以实现高效推理

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入&#xff01; 点击 阅读原文 观看作者讲解回放&#xff01; 个人信息 作者&#xff1a;赵晗&#xff0c;浙江大学-西湖大学联合培养博士生 内容简介 近年来&#xff0c;在各个领域应用多模态大语言模型&#xff08;MLLMs&…

ai-financial-agent - 为金融投资打造的AI代理

探索人工智能在投资研究中的应用。本项目仅用于**教育**目的&#xff0c;不用于真实交易或投资。 作者声明&#xff1a; 本项目仅用于教育和研究目的。 不用于真实交易或投资不提供任何保证或担保过去的表现并不代表未来的结果Creator 对经济损失不承担任何责任咨询财务顾问…

Open WebUI选择模型为空,解决办法(for DeepSeek)

标签&#xff1a; DeepSeek&#xff1b; Open WebUI&#xff1b; 问题&#xff1a;Open WebUI选择模型为空&#xff0c;解决办法 &#xff08;for DeepSeek&#xff09; 操作系统&#xff1a;Ubuntu 22 硬件&#xff1a;台式电脑 Ubuntu 22系统&#xff0c;DeepSeek安装成功&…

欧几里得算法第二弹---计算多个数的最大公约数

如果要求多个数的 GCD&#xff0c;可以先求前两个数的 GCD&#xff0c;然后用这个结果与下一个数求 GCD&#xff0c;依次类推。 为什么可以用前两个数的 GCD 与下一个数继续求 GCD&#xff0c;从而得到所有数的 GCD 呢&#xff1f;&#xff08;之前我不知道&#xff0c;自己也没…

掌握 ElasticSearch 组合查询:Bool Query 详解与实践

掌握 ElasticSearch 组合查询&#xff1a;Bool Query 详解与实践 一、引言 (Introduction)二、Bool 查询基础2.1 什么是 Bool 查询&#xff1f;2.2 Bool 查询的四种子句2.3 语法结构 三、Bool 查询的四种子句详解与示例3.1 must 子句3.2 filter 子句3.3 should 子句3.4 must_no…

【练习】【类似于子集问题】力扣491. 非递减子序列/递增子序列

题目 非递减子序列 给你一个整数数组 nums &#xff0c;找出并返回所有该数组中不同的递增子序列&#xff0c;递增子序列中 至少有两个元素 。你可以按 任意顺序 返回答案。 数组中可能含有重复元素&#xff0c;如出现两个整数相等&#xff0c;也可以视作递增序列的一种特殊情况…

本地部署AI模型 --- DeepSeek(二)---更新中

目录 FAQ 1.Failed to load the model Exit code: 18446744072635812000 FAQ 1.Failed to load the model Exit code: 18446744072635812000 问题描述&#xff1a; &#x1f972; Failed to load the model Error loading model. (Exit code: 18446744072635812000). Unkn…

开源嵌入式实时操作系统uC/OS-II介绍

一、uC/OS-II的诞生&#xff1a;从开源实验到行业标杆 背景与起源 uC/OS-II&#xff08;Micro-Controller Operating System Version II&#xff09;诞生于1992年&#xff0c;由嵌入式系统先驱Jean J. Labrosse开发。其前身uC/OS&#xff08;1991年&#xff09;最初作为教学工…

Starlink卫星动力学系统仿真建模第七讲-卫星姿轨控系统(Attitude and Orbit Control System, AOCS)设计规范

以下是一份卫星姿轨控系统&#xff08;Attitude and Orbit Control System, AOCS&#xff09;设计规范的框架和核心内容示例&#xff0c;供参考&#xff1a; 卫星姿轨控系统&#xff08;AOCS&#xff09;设计规范 1. 总则 1.1 目的 本规范旨在规定卫星姿轨控系统的设计要求、…

C++之旅-C++11的深度剖析(1)

目录 前言/背景 1.C11的发展历史 2.列表初始化 2.1 C98传统的{} 2.2 C11中的{} 2.3 C11中的std::initializer_list 3.右值引用 3.1 左值和右值 3.2 左值引用和右值引用 3.3 引用延长生命周期 3.4 左值和右值的参数匹配 结束语 前言/背景 随着现代软件开发的快速发展…