数据挖掘与机器学习

一. 机器学习的种类

1. 有监督的机器学习 :

        分类 :

  •                  KNN 最近邻
  •                  逻辑回归 - 朴素贝叶斯估计
  •                  SVM 线性 或 非线性 优化模型
  •                  决策树模型 - 随机森林 - 其它集成模型
  •                  lightGBM - XGBOOST

        回归:

  •                   线性
  •                  非线性
  •                  加权平均回归

2.无监督的机器学习 :

  •                  聚类
  •                 关联
  •                 特征处理

二.  KNN ( K最近邻 )

argmax()  # 只返回索引
  1. 特征值(Features):(特征数据必须是2维数据)

     特征值是用来描述样本的属性或特征的值。在KNN中,每个样本都被表示为一个特征向量,其中每个特征对应向量中的一个维度。例如,在一个二维空间中,特征向量可以由两个特征值构成,分别表示样本在X轴和Y轴上的坐标。
  2. 标签(Labels)

    标签是我们希望预测的值,或者是我们希望将样本分类到的类别。在分类问题中,每个样本都有一个类别标签,而在回归问题中,标签通常是一个连续的数值。在KNN中,我们使用已知的特征值和标签构建模型,然后根据新的特征值预测或分类其对应的标签。

np.bincount([1,1,2,2,2,2,4,4,4,4]) # 看下标为几的出现几次下标为0的 没有出现 0
下标为1,数字也为1的出现2次
下标为2 数字也为2的出现4次
下标为3,数字为3 为0次  
下标为4,数字为3 为4次 
答案是 (0,2,4,0,4)

三.  KNN运用(字符识别、文本分类、图像识别),通过你的邻居判断你是什么类别 

# 选几个邻居 进行分类 
sklearn.neighbors.KNeighborsClassfier(n_neighbors=5)n_neighbors = 5 是默认的#获取数据
x = [[1],[2],[0],[0]]
y = [1,1,0,0]# 机器学习
# 1. 实例化一个训练模型
estimator = KNeighborsClassfier(n_neighbors=2)2. 调用fit方法进行训练
estimator.fit(x,y)3. 预测其他值
ret = estimator.predict([-1])
print(ret)

四. K值的选取

  • K值过小: 过拟合,容易受异常点影响, 因为用较小的领域中训练实例进行预测
  • k值过大 :   欠拟合,容易受到样本均衡的问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/825572.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

驱动云创建保存自己的环境

驱动云创建保存自己的环境 制作镜像方法一方法二报错 上一篇link介绍了如何在驱动云上部署llama2以及驱动云在训练大模型的方便之处。也说到了可以直接使用驱动云现有的环境,免得自己配置环境。 但是有的时候免不了自己想要安装一些包。 驱动云的环境是这样的&…

基于SpringBoot + Vue 的电影售票及影院管理系统(前后端分离)

后端:Spring Boot Mybatis 实现功能: 售票子系统:用户浏览电影信息,电影分类查看,搜索查看,购票操作(未实现支付沙箱),超时取消订单等 管理子系统:管理员…

电视音频中应用的音频放大器

电视机声音的产生原理是将电视信号转化为声音,然后通过扬声器将声音播放出来。当我们打开电视并选择频道时,电视机首先从天线或有线电视信号中获取声音信号。声音信号经过放大器放大之后,就能够通过扬声器发出声音。电视机声音的产生原理和音…

react中子父组件互相传值

在react中父子组件互相传值,除了使用类似于redux这样状态管理的工具,怎么实现?? 父传子(简单)父:子: 子传父(较麻烦)父:子: 父传子(简单) 父: 子: 子传父(较麻烦) 父: 子:

面试话术1

自我介绍 面试官您好!我叫王鹏宇,本科是在西南石油大学读的,是一所双一流大学。我本人对网络安全领域比较有兴趣的,并且想对国家网络安全建设做出贡献。我去年也参加了护网,在那边主要就是负责流量研判,然…

机器学习在基因组学中的应用

机器学习在基因组学中的应用 李升伟1 茅 矛1 陈 竺2 (1.特趣生物科技有限公司,广东省深圳市;2.上海交通大学医学院附属瑞金医院,上海市) 机器学习在基因组学中的应用已经变得日益重要和普遍,其核心价…

elementui中文官网

Element - The worlds most popular Vue UI frameworkElement,一套为开发者、设计师和产品经理准备的基于 Vue 2.0 的桌面端组件库https://element.eleme.cn/#/zh-CN/

android gradle引入其他gradle文件

在Android项目中,如果你想在一个Gradle文件中引入另一个Gradle文件,你可以使用apply from语句。以下是一个简单的例子: 假设你有一个通用的Gradle配置脚本common.gradle,它位于项目的根目录下。 common.gradle 文件内容示例&…

一个 .net 8 + Azure 登录 + Ant Design Blazor 的基本后台框架

一个 .net 8 Azure 登录 Ant Design Blazor 的基本后台框架 主界面使用了 Ant Design Blazor 项目模板搭建 后台技术是 .net 8 Blazor run at server 模式 登录方式使用 Azure 实现了菜单导航和路由 此外实现了读取和修改本地Json文件的功能,不是必须的&#x…

搭建Bootstrap5+Webpack项目

我是个前端菜鸡,最近准备学习一点前端知识,先从Bootstrap5开始,毕竟早期Bootstrap还是比较火的。推出的Bootstrap5不再和jQery强制绑定,这里直接按照官方文档上来操作,打包工具我们选择Webpack。 一 前期准备 前期准备…

[MySQL数据库] 索引与事务

1. 索引 1.1 概念 索引是一种特殊的文件,包含着对数据表里所有记录的引用指针.可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结构实现. 1.2 作用 数据库中的表、数据、索引之间的关系,类似于书架上的图书、书籍…

【力扣】148. 排序链表

148. 排序链表 题目描述 给你链表的头结点 head ,请将其按 升序 排列并返回 排序后的链表 。 示例 1: 输入:head [4,2,1,3] 输出:[1,2,3,4] 示例 2: 输入:head [-1,5,3,4,0] 输出:[-1,0,…

深度学习架构(CNN、RNN、GAN、Transformers、编码器-解码器架构)的友好介绍。

一、说明 本博客旨在对涉及卷积神经网络 (CNN)、递归神经网络 (RNN)、生成对抗网络 (GAN)、转换器和编码器-解码器架构的深度学习架构进行友好介绍。让我们开始吧!! 二、卷积神经网络…

【观察】容器化部署“再简化”,云原生体验“再升级”

自2013年云原生概念被提出以来,云原生技术和架构在过去十多年得到了迅速的发展,并对数字基础设施、应用架构和应用构建模式带来了深刻的变革。根据IDC预测,到2024年,新增的生产级云原生应用在新应用的占比将从2020年的10%增加到60…

Java学习-详述main方法、可变参数、数组的工具类、二维数组

详述main方法 【1】main方法:程序的入口,在同一个类中,如果有多个方法,那么虚拟机就会识别main方法,从这个方法作为程序的入口 【2】main方法格式严格要求: public static void main(String[] args){} p…

线性代数---行列式的性质

1. 行列式的行与列(按原顺序)互换

通过实例学C#之StreamReader类

简介 可以通过此类读取计算机上的文本文件内容。 在程序的Debug文件夹下面新建一个文本文件,命名为test.txt,在里面输入hello world! 构造函数 StreamReader (Stream stream,Encoding encoding) 使用流对象stream以及编码方式encoding来创建一个读取流s…

SpringCloud +UniApp技术开发saas模式的智慧工地云平台源码,支持可视化大屏端、手机端、平板端、PC端

基于微服务架构JavaSpring Cloud UniApp MySql技术开发saas模式的一套智慧工地云平台源码,支持多端展示:可视化大屏端、手机端、平板端、PC端。 智慧工地平台支持项目级、公司级、集团级多级权限划分,可根据企业的组织架构进行项目权限、功能…

基于双向长短期神经网络的居民用电功率预测,基于gru神经网络的居民用电功率预测

目录 背影 摘要 LSTM的基本定义 LSTM实现的步骤 BILSTM神经网络 基于双向长短期神经网络的居民用电功率预测,基于gru神经网络的居民用电功率预测 完整代码:基于双向长短期神经网络的居民用电功率预测,基于gru神经网络的居民用电功率预测(代码完整,数据齐全)资源-CSDN文库…

编程入门(四)【计算机网络基础(由一根网线连接两个电脑开始)】

读者大大们好呀!!!☀️☀️☀️ 🔥 欢迎来到我的博客 👀期待大大的关注哦❗️❗️❗️ 🚀欢迎收看我的主页文章➡️寻至善的主页 文章目录 前言两个电脑如何互连呢?集线器、交换机与路由器总结 前言 当你有…