机器学习 | 机器学习基础知识

 

一、机器学习是什么

 

        计算机从数据中学习规律并改善自身进行预测的过程。

 


 

二、数据集

 

1、最常用的公开数据集

2、结构化数据与非结构化数据

 


 

三、任务地图

 

 

1、分类任务 Classification

 

  • 已知样本特征
  • 判断样本类别
  • 二分类、多分类、多标签分类

        二分类:垃圾邮件分类、图像识别等

                

        多分类问题:鸢尾花分类问题

        多标签分类问题:标签间不互斥,概率和不为1        

        

 

2、回归任务 Regression

  • 线性回归
  • 多项式回归:一个因变量,一个或多个自变量。
  • 任何函数都可以用多项式逼近。
  • 逻辑回归:实际是分类,简单可并行,细节很多
    • 类似二分类,但求法不同

 


 

 三、机器学习的分类

 

 

 根据有没有老师 ~

 

1、监督学习 Supervised Learning

        分类和回归

        训练数据有标记

 

2、无监督学习 Unsupervised Learning

         训练数据未经标记

        聚类 —— K均值算法 K-means、密度聚类 DBSCAN、最大期望算法

        降维 —— 主成分分析 PCA、核方法

        关联规则学习 —— 挖掘特征间关联关系,Apriori方法、Eclat方法

                

 

3、半监督学习 Semi-supervised Learning

         少量标记学习,大量无标记数据

 

4、强化学习 Reinforcement Learning

        观测环境、估计状态、执行操作、获得回报或惩罚

 


 

 根据数据怎么用 ~

 

1、 批量学习 (Batch Learning)

        先训练再使用
        需要大量的时间和计算资源
        通常都是离线完成

 

2、在线学习

         

 


 

  根据模型怎么扩展 ~

 

1、基于实例的学习

        先记住训练实例,相似度计算

 

2、基于模型的学习

        先构建模型

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/222571.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

风速预测(二)基于Pytorch的EMD-LSTM模型

目录 前言 1 风速数据EMD分解与可视化 1.1 导入数据 1.2 EMD分解 2 数据集制作与预处理 2.1 先划分数据集,按照8:2划分训练集和测试集 2.2 设置滑动窗口大小为7,制作数据集 3 基于Pytorch的EMD-LSTM模型预测 3.1 数据加载&#xff0…

QT QIFW Linux下制作软件安装包

一、概述 和windows的操作步骤差不多,我们需要下装linux下的安装程序,然后修改config.xml、installscript.qs和package.xml文件。 QT QIFW Windows下制作安装包(一)-CSDN博客 一、下装QIFW 下装地址:/official_releases/qt-installer-fra…

SpringBoot中日志的使用log4j2

SpringBoot中日志的使用log4j2 1、log4j2介绍 Apache Log4j2 是对 Log4j 的升级,它比其前身 Log4j 1.x 提供了重大改进,并提供了 Logback 中可用的许多改 进,同时修复了 Logback 架构中的一些问题,主要有: 异常处理…

大语言模型--危害

危害 大语言模型 危害概述有毒性预期信息内容审查 概述 在本次内容中,我们将讨论另外两种行为伤害:有毒性和虚假信息(毒性和虚假信息)大型语言模型可能会产生攻击性、有害的内容,或者产生虚假性的内容。然而&#xff…

redis集群模糊获取缓存redisKey

redis cluster集群删除指定模糊redisKey的信息 **public int deleteRedisKey(String key){AtomicReference<Integer> result new AtomicReference<>(0);busnessLogger.info("开始删除指定业务的模糊Key,deleteRedisKey:{}",key);try{Set<HostAndPor…

Google DeepMind发布Imagen 2文字到图像生成模型;微软在 HuggingFace 上发布了 Phi-2 的模型

&#x1f989; AI新闻 &#x1f680; Google DeepMind发布Imagen 2文字到图像生成模型 摘要&#xff1a;谷歌的Imagen 2是一种先进的文本到图像技术&#xff0c;可以生成与用户提示紧密对齐的高质量、逼真的图像。它通过使用训练数据的自然分布来生成更逼真的图像&#xff0c…

Amazon CodeWhisperer:AI 编程助手

文章作者&#xff1a;prigioni 1. 什么是 Amazon CodeWhisperer&#xff1f; Amazon CodeWhisperer 能够理解以自然语言&#xff08;英语&#xff09;编写的注释&#xff0c;并能实时生成多条代码建议&#xff0c;以此提高开发人员生产力。该服务可以直接在集成开发环境&#…

C++某张不知名试卷

WARNING: MISBEHAVIOR AT EXAM TIME WILL LEAD TO SERIOUS CONSEQUENCE. SCUT Final Exam 《High-Level Language Programming&#xff08;C&#xff09;&#xff08;I&#xff09;》 Exam Paper B Notice: 1. Make sure that you have filled the form on the left sid…

小电流接地系统故障仿真-中性点不接地与经消弧线圈接地仿真模型

微❤关注“电气仔推送”获得资料&#xff08;专享优惠&#xff09; 中性点不接地 中性点不接地是最简单的一种&#xff0c;接地电流的大小受变电站、所出线的类型和长度影响。在此种方式下发生单相接地故障时&#xff0c;线路与对地电容构成故障回路&#xff0c;故障电流以电…

宠物自助洗护小程序系统

提供给宠物的自助洗澡机&#xff0c; 集恒温清洗、浴液 护毛、吹干、消毒于一体&#xff0c;宠物主人只需用微信小程序源码&#xff0c;即可一键开启洗宠流程。 主要功能&#xff1a; 在线预约 在线支付 洗护记录 会员系统 宠物管理 设备管理 多商户加盟

语音识别功能测试:90%问题,可以通过技术解决

现在市面上的智能电子产品千千万&#xff0c;为了达到人们使用更加方便的目的&#xff0c;很多智能产品都开发了语音识别功能&#xff0c;用来语音唤醒进行交互&#xff1b;另外&#xff0c;各大公司也开发出来了各种智能语音机器人&#xff0c;比如小米公司的“小爱”&#xf…

php与html缓存实现

参考gpt PHP与HTML中实现缓存可以帮助提高网页加载速度和减轻服务器负载。下面是一些常见的PHP与HTML缓存实现方法&#xff1a; 1. 服务器端缓存&#xff1a;使用服务器端缓存可以在每次请求时避免重新生成HTML页面。你可以使用诸如Memcached或Redis等缓存服务器来存储已生成…

阿里云SLS日志服务之数据导入与加工处理

一、背景 采集vm虚拟机上的Log日志文本&#xff0c;如果需要经过特殊的加工处理&#xff0c;在本文主要讲述如何在SLS把kafka采集上来的数据经导入并加工后存储。 二、数据流转图 三、数据导入 服务地址&#xff1a;填写kafka集群的地址数据格式&#xff1a;json字符串&#…

WPS没保存关闭了怎么恢复数据?3个方法,完成数据恢复!

“我今天在使用WPS时&#xff0c;突然有点急事出去了一趟&#xff0c;但是我忘记保存文档了&#xff0c;回来之后发现电脑自动关机了&#xff0c;我的文档也没了&#xff01;这可怎么办呢&#xff1f;有什么办法可以找回这些数据吗&#xff1f;” 在快节奏的工作中&#xff0c;…

黑马点评03一人一单

实战篇-07.优惠券秒杀-实现一人一单功能_哔哩哔哩_bilibili 1.之前的问题 虽然解决了超卖问题&#xff0c;但是无法保证一人只能买一张&#xff0c;容易发生黄牛行为。 2.解决方案 2.1订单查询&#xff1a;判断该用户是否已下单 在库存判断之前&#xff0c;判断用户id和优惠…

浅谈NLP和大模型的关系

目录 一、什么是NLP 二、NLP的应用举例 三、NLP的Python实现举例 四、NLP和大模型的关系 五、NLP的难点 5.1 内容的有效界定 5.2 消歧和模糊性 5.3 有瑕疵的或不规范的输入 5.4 语言行为与计划 六、研究热点 一、什么是NLP 如果单独说NLP这3个字母&#xff0c;具有两…

聚类笔记:聚类算法评估指标

1 内部评估方法 当一个聚类结果是基于数据聚类自身进行评估的&#xff0c;这一类叫做内部评估方法。如果某个聚类算法聚类的结果是类间相似性低&#xff0c;类内相似性高&#xff0c;那么内部评估方法会给予较高的分数评价。不过内部评价方法的缺点是&#xff1a; 这些评估方法…

Linux arm架构下构建Electron安装包

上篇文章我们介绍 Electron 基本的运行开发与 windows 安装包构建简单流程&#xff0c;这篇文章我们从零到一构建 Linux arm 架构下安装包&#xff0c;实际上 Linux arm 的构建流程&#xff0c;同样适用于 Linux x86 环境&#xff0c;只不过需要各自的环境依赖&#xff0c;Linu…

基于Spring Boot和微信小程序的智能小程序商城

文章目录 项目介绍主要功能截图:部分代码展示设计总结项目获取方式🍅 作者主页:超级无敌暴龙战士塔塔开 🍅 简介:Java领域优质创作者🏆、 简历模板、学习资料、面试题库【关注我,都给你】 🍅文末获取源码联系🍅 项目介绍 基于Spring Boot和微信小程序的智能小程…

运筹学经典问题(六):设施选址问题

问题描述 设施选址问题&#xff08;Facility Location Problem, FLP&#xff09;也成选址-分配问题&#xff0c;是企业面临的一类重要问题&#xff1a;在哪里建造设施&#xff1f;建造多少&#xff1f;以及将哪些客户分配给哪些设施去服务&#xff1f; 以物流业的航空站点选…