机器学习的原理是什么?

训过小狗没?
没训过的话总见过吧?

你要能理解怎么训狗,就能非常轻易的理解机器学习的原理.

比如你想教小狗学习动作“坐下”一开始小狗根本不知道你在说什么。但是如果你每次都说坐下”然后帮助它坐下,并给它一块小零食作为奖励,经过多次重复,狗就会学会当听到“坐下”这个词时就要坐下。

以此类推,小狗可以听懂各种指令,比如坐下,蹲下,握手等等

机器学习本质上跟教小狗一模一样,只不过机器学习不是一条狗或者一只猫,而是用的“模型“

我们用电脑和特殊的程序(叫做“模型”)来代替小狗。我们给电脑一堆数据,比如一堆照片,其中有些是猫,有些是狗。然后我们告诉电脑哪些是猫,哪些是狗(这叫“标签”)。电脑就像小狗一样,通过这些“示范”和“奖励”(或“惩罚”)来学习怎么区分猫和狗Q

比如“模型”每区分正确一张照片,就给它奖励一分,否则扣一分,然后我们设定了目标是分数越高越好,那么“模型”就会根据这个机制进行不断的学习,最后就成为了一个非常优秀的区分猫狗的“好模型”

但与教小狗不同,电脑可以快速地查看成千上万张照片,并从中学习。电脑也可以学习很多其他复杂的任务,比如识别人的声音、推荐你可能喜欢的音乐,甚至帮助医生诊断疾病。

从上面我们可以总结出来几个名词:

  1. 模型(Model):模型就像是电脑的“大脑”的决策用来处理和学习数据。你可以想象它为一个迷工厂,输入数据进去,输出结果。
  2. 数据集(Dataset):数据集就是用来训练模型的大量信息。这些信息可能是文字、图像、声音等。
  3. 标签(Label):标签是对数据集中每一项数据的解释或标记。比如,在一个由猫和狗照片组成的数据集中,每张照片会被标签为“猫”或“狗”。
  4. 训练(Train)和测试(Test):训练是让模型从标签好的数据集中学习的过程。测试则是检查模型是否真的学会了某件事。
  5. 奖励(Reward)和惩罚(Punishment):在某些机器学习模式中,模型会根据其预测的准确性获得奖励或惩罚。 监督学习
  6. (Supervised Learning) 和无监督学习 (Unsupervised
    Learning):在监督学习中模型从带有标签的数据中学习。在无监督学习中,数据没有标签,模型需要自己找出数据的结。

从上面来看其实我们归纳一下,机器学习就是让电脑通过数据和例子来学习做某件事,而不是由人直接编程告诉它每一步应该怎么做。

这一句话会有点儿难懂,那么还是拿训练计算机去分辨猫狗照片来举例。

我们想要做的是让计算机去自动的学会分辨猫和狗,而不是告诉计算机这是一张哈士奇的图,另张是金毛。

这跟自动的分辨有什么区别呢?

区别就在于“学习”,因为猫和狗不像是阿拉伯数字,只有从0到9的10个数字,你直接硬塞给计算机这10个数字是没问题的。

但是猫和狗不一样,世界上有很多种的猫和狗,纯种的,杂交的,国内的,国外的,还有不同角度拍的,俯拍的,正面拍的,背后拍的,照片不是很清楚的。

你没有办法告诉计算机所有的关于猫和狗的照片,另外给所有的照片打上标签也是不现实的,因为工作量太大,如果我们现在要把大象,老虎,狮子,马等等动物都进行分类呢?

每种动物都要打标签的话那工作量简直是天文数字

事实上,你想想自己分辨这些动物的过程,需要看很多的照片吗?

比如老虎和狮子Q,你基本上看个2,3张照片就可以轻松的进行分辨

根本不需要成千上万张,甚至一张不太清楚的照片也不会影响你去做分辨

而我们想要计算机实现的功能就是学习能力,我们提供给计算机每种动物几百张照片,然后告诉它每张照片对应的动物

我们希望它可以通过学习这些图片来获得识别动物的能力。

比如根据他们的毛色,提醒大小,形体特征等等。

对于机器学习以及人工智能的学习,与ChatGPT结合,这是对于新手来说避免被落下太多,甚至被取代的好方法。它比多数书籍更强大,像个知无不言的老师,它可以放大你的能力,比如说你不擅长代码,那么它可以帮助你实现你的想法,无论什么语言它都可以做的非常棒。其实无论是从业者,还是对这一行感兴趣的朋友,都特别推荐去看看[知乎知学堂%的2天公开课,快速掌握大模型的潜力和应用。
在这里插入图片描述

这就是[机器学习]Machine Learning这个名词的来源,主要原理可以概括为“从经验中学习”

  1. 明确目标:首先,你需要明确你想让模型(或小狗)完成的任务。例如,区分猫和狗。
  2. 收集数据:接着,你需要准备一个数据集。就像你会有很多“坐下”的场景来教狗一样
  3. 标签与示范: 在监督学习中,你需要标签来告诉模型数据集中每项数据的意义。这像是每次帮助小狗坐下并说“这是坐下”
  4. 训练与调整:使用数据和标签来训练模型,模型会尝试找出数据之间的规律或关系。如果模型做得好,它会获得“奖励”;做得不好,则会受到“惩罚”
  5. 测试与评估:一旦模型经过足够的训练,你就可以用没有标签的新数据来测试它,看看其表现如何.
  6. 应用与拓展:一旦模型经过测试并证明有效,它就可以用于各种其他任务,从识别声音到医疗诊断

总的来说,机器学习是一种通过数据和算法来训练模型,使其能够完成特定任务或做出预测的技术。与训练小狗不同,模型可以处理非常大量的数据,并用于解决各种复杂的问题。

区分下几个经常会被混淆的名词: 机器学习/人工智能/深度学习

从下图可以看到

人工智能AI是一个广泛的概念,包括所有模仿、延伸或者扩充人类智能的技术

机器学习是AI中的一个分支,主要关注通过数据来训练模型。

深度学习则是机器学习中的一个子集,专注于使用类似人脑的神经网络进行高级、复杂的任务

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/106476.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker在边缘计算中的崭露头角:探索容器技术如何驱动边缘计算的新浪潮

文章目录 第一部分:边缘计算和Docker容器边缘计算的定义Docker容器的崭露头角1. 可移植性2. 资源隔离3. 自动化部署和伸缩 第二部分:应用案例1. 边缘分析2. 工业自动化3. 远程办公 第三部分:挑战和解决方案1. 网络延迟2. 安全性3. 管理和部署…

边端小场景音视频流分发架构

备注:绿色线条,红色线条,蓝色线条,均是表示同一路流的不同的协议而已 1)IPC本身的流媒体的能力有限,一般IPC支持的客户端数10~50个,媒体分发能力:10~20路,看设备品牌能力…

Android---DVM以及ART对JVM进行优化

Dalvik Dalvik 是 Google 公司自己设计用于 Android 平台的 Java 虚拟机,Android 工程师编写的 Java 或者 Kotlin 代码最终都是在这台虚拟机中被执行的。在 Android 5.0 之前叫作 DVM,5.0 之后改为 ART(Android Runtime)。在整个…

UGUI交互组件ScrollBar

一.ScrollBar的结构 对象说明Scrollbar挂有Image和Scrollbar组件的主体对象Sliding Area表示滑动范围Handle滑块 二.Scrollbar的属性 属性说明Handle Rect控制柄对象的引用Direction拖动控制柄时滚动条值增加的方向Value滚动条的当前值,范围为 0.0 到 1.0Suze控制柄…

Hadoop3教程(四):HDFS的读写流程及节点距离计算

文章目录 (55)HDFS 写数据流程(56) 节点距离计算(57)机架感知(副本存储节点选择)(58)HDFS 读数据流程参考文献 (55)HDFS 写数据流程 …

软件测试学习(四)自动测试和测试工具、缺陷轰炸、外包测试、计划测试工作、编写和跟踪测试用例

目录 自动测试和测试工具 工具和自动化的好处 测试工具 查看器和监视器 驱动程序 桩 压力和负载工具 干扰注入器和噪声发生器 分析工具 软件测试自动化 宏录制和回放 可编程的宏 完全可编程的自动测试工具 随机测试:猴子和大猩猩 使用测试工具和自动…

Shell命令笔记2

大家好,分享下最近工作中用得比较多的shell命令,希望对大家有帮助。 获取数组长度: ${#array_name[*]}获取脚本相对路径 script_path$(dirname "$0")获取脚本的名字 script_name$(basename "$0")获取脚本的绝对路径 …

如何从 Pod 内访问 Kubernetes 集群的 API

Kubernetes API 是您检查和管理集群操作的途径。您可以使用Kubectl CLI、工具(例如curl)或流行编程语言的官方集成库来使用 API 。 该 API 也可供集群内的应用程序使用。Kubernetes Pod 会自动获得对 API 的访问权限,并且可以使用提供的服务帐户进行身份验证。您可以通过使…

论文阅读:Image-to-Lidar Self-Supervised Distillation for Autonomous Driving Data

目录 摘要 Motivation 整体架构流程 技术细节 雷达和图像数据的同步 小结 论文地址: [2203.16258] Image-to-Lidar Self-Supervised Distillation for Autonomous Driving Data (arxiv.org) 论文代码:GitHub - valeoai/SLidR: Official PyTorch implementati…

深度学习—cv动物/植物数据集

文章目录 动物相关植物相关 动物相关 Edinburgh Pig Behavior Video Dataset:https://homepages.inf.ed.ac.uk/rbf/PIGDATA/ WLD 动物目标检测数据集: https://github.com/hellock/WLD 猪脸识别:https://blog.51cto.com/u_15404184/5289690 AFD动物面部数据集&…

【随笔】论多线程CPU离线渲染器的实现:A CPU BASED OFFLINE RENDERING ENGINE

前言 小熊挺喜欢玩游戏的,对于游戏画面有所追求,记得高中第一次玩战地的时候,惊叹于画面细腻的表现,并且还能开坦克车,这样的事情深深吸引了我。我是一个画面党,为了追求更好的画质表现我开始研究设置面板…

【Linux常用命令10】用户管理和文件权限命令

useradd:用于创建新的用户 useradd [选项] 用户名 参数 含义 -D 改变新建用户的预设值 -c 添加备注文字 -d 新用户每次登陆时所使用的家目录 -e 用户终止日期,日期的格式为YYYY-MM-DD -f 用户过期几日后永久停权。当值为0时用户立即被停权&a…

sql 注入(2), 文件读写 木马植入 远程控制

sql 注入 文件读写 木马植入 远程控制 一, 检测读写权限 查看mysql全局变量 SHOW GLOBAL VARIABLES LIKE %secure%secure_file_priv 空, 则任意读写secure_file_priv 路径, 则只能读写该路径下的文件secure_file_priv NULL, 则禁止读写二, 读取文件, 使用 load_file() 函数…

mysql误删误操作恢复数据,比传统方式和binlog2sql更快速用的恢复方式-reverse_sql恢复数据(单表多表)

场景: 误操作删除了某个表的数据,本文只讲工具的使用,首先自己通过mysqlbinlog或者记录找到误操作的时间范围:开始时间和结束时间,已经确定好是哪个binlog了下面以误删为例。 查看binlog是否开启 show variables like …

SpringBoot面试题2:SpringBoot与SpringCloud 区别?SpringBoot和Spring、SpringMVC的区别

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:SpringBoot与SpringCloud 区别? Spring Boot 和 Spring Cloud 是 Spring 生态系统中的两个关键组件,它们有以下区别: 定位:Spring Boot 用于简…

Node.js中Buffer API详解

Node.js中Buffer API详解 在Node.js中,Buffer是一个用于处理二进制数据流的全局对象,它类似于数组,但可以存储任意大小的数据。Buffer对象是由C代码实现的底层结构,而JavaScript代码则提供了一些高级的API。本文将介绍Node.js中B…

数据结构:队列

特点 只允许在一端进行插入数据操作,在另一端进行删除数据操作的特殊线性表,队列具有先进先出 FIFO(First In First Out) 入队列:进行插入操作的一端称为 队尾( Tail/Rear ) 出队列:进行删除操作的一端称…

c#设计模式-行为型模式 之 备忘录模式

🚀简介 备忘录模式(Memento Pattern)是一种行为型设计模式,它保存一个对象的某个状态,以便在适当的时候恢复对象。所谓备忘录模式就是在不破坏封装的前提下,捕获一个对象的内部状态,并在该对象…

一致性公式证明

首先,假设存在两个不同的聚类假设 f 1 f^1 f1和 f 2 f^2 f2,它们在两个视角上的聚类结果分别为 y 1 ∈ { − 1 , 1 } n y^1\in\{-1,1\}^n y1∈{−1,1}n和 y 2 ∈ { − 1 , 1 } n y^2\in\{-1,1\}^n y2∈{−1,1}n。 证明一致性不等式: ​ …

Matlab-ODE45:求解状态变量(微分方程组)

ode45函数 ode45实际上是数值分析中数值求解微分方程组的一种方法,4阶五级Runge-Kutta算法。 调用方法 ​ 其实这种方程的每一个状态变量都是t 的函数,我们可以从现代控制理论的状态空间来想。因此返回[ t , x ],其中t是一个列向量&#xf…