<机器学习初识>——《机器学习》

目录

一、人工智能概述

1 人工智能应用场景

2 人工智能发展必备三要素

3 人工智能、机器学习和深度学习

二、人工智能发展历程

1 人工智能的起源

1.1 图灵测试

1.2 达特茅斯会议

2 发展历程

三、 人工智能主要分支

1 主要分支介绍

1.1 分支一:计算机视觉

1.2 分支二:语音识别

1.3 分支三:文本挖掘/分类

1.4 分支四:机器翻译

1.5 分支五:机器人

四、机器学习工作流程

1 什么是机器学习

2 机器学习工作流程

2.1 获取到的数据集介绍

2.2 数据基本处理

2.3 特征工程

2.3.1什么是特征工程

2.3.2 特征工程包含内容

五、机器学习算法分类

1 监督学习

2 无监督学习

3 半监督学习

4 强化学习

5 小结

 六、模型评估

1 分类模型评估

2 回归模型评估

3 拟合


一、人工智能概述

1 人工智能应用场景

人工智能发展必备三要素

  • 数据
  • 算法
  • 计算力 

        CPU,GPU,TPU

计算力之CPUGPU对比:
  • CPU主要适合I\O密集型的任务
  • GPU主要适合计算密集型任务
1)计算密集型的程序。
所谓计算密集型 (Compute-intensive) 的程序,就是其大部分运行时间花在了寄存器运算上,寄存器的速度和处理器的速度相当,从寄存器读写数据几乎没有延时。可以做一下对比,读内存的延迟大概是几百个时钟周期;读硬盘的速度就不说了,即便是SSD, 也实在是太慢了。
2)易于并行的程序。
GPU 其实是一种 SIMD(Single Instruction Multiple Data) 架构, 他有成百上千个核,每一个核在同一时间最好能做同样的事情。

3 人工智能、机器学习和深度学习

人工智能和机器学习,深度学习的关系:
  • 机器学习是人工智能的一个实现途径
  • 深度学习是机器学习的一个方法发展而来

二、人工智能发展历程

1 人工智能的起源

1.1 图灵测试

测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。
多次测试(一般为 5min 之内),如果有超过 30% 的测试者不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。

1.2 达特茅斯会议

1956 8 月,在美国汉诺斯小镇宁静的达特茅斯学院中,
约翰 · 麦卡锡( John McCarthy
马文 · 闵斯基( Marvin Minsky ,人工智能与认知学专家)
克劳德 · 香农( Claude Shannon ,信息论的创始人)
艾伦 · 纽厄尔( Allen Newell ,计算机科学家)
赫伯特 · 西蒙( Herbert Simon ,诺贝尔经济学奖得主)等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:
用机器来模仿人类学习以及其他方面的智能。
会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字: 人工智能
因此, 1956 年也就成为了人工智能元年。

2 发展历程

 

三、 人工智能主要分支

1 主要分支介绍

通讯、感知与行动是现代人工智能的三个关键能力,在这里我们将根据这些能力 / 应用对这三个技术领域进行介绍:
  • 计算机视觉(CV)
  • 自然语言处理(NLP)
       在 NLP 领域中,将覆盖文本挖掘 / 分类、机器翻译和语音识别。
  • 机器人

1.1 分支一:计算机视觉

计算机视觉 (CV) 是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。物体检测和人脸识别是其比较成功的研究领域。

1.2 分支二:语音识别

语音识别是指识别语音 ( 说出的语言 ) 并将其转换成对应文本的技术。相反的任务 ( 文本转语音 /TTS) 也是这一领域内一个类似的研究主题。

1.3 分支三:文本挖掘/分类

这里的文本挖掘主要是指文本分类,该技术可用于理解、组织和分类结构化或非结构化文本文档。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。

1.4 分支四:机器翻译

机器翻译 (MT) 是利用机器的力量自动将一种自然语言 ( 源语言 ) 的文本翻译成另一种语言 ( 目标语言 )

1.5 分支五:机器人

机器人学 (Robotics) 研究的是机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理。
机器人可以分成两大类 : 固定机器人和移动机器人。固定机器人通常被用于工业生产 ( 比如用于装配线 ) 。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。

四、机器学习工作流程

1 什么是机器学习

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。
 

2 机器学习工作流程

机器学习工作流程总结:
1. 获取数据
2. 数据基本处理
3. 特征工程
4. 机器学习 ( 模型训练 )
5. 模型评估
  • 结果达到要求,上线服务
  • 没有达到要求,重新上面步骤

2.1 获取到的数据集介绍

2.2 数据基本处理

即对数据进行缺失值、去除异常值等处理

2.3 特征工程

2.3.1什么是特征工程

特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。
意义:会直接影响机器学习的效果

2.3.2 特征工程包含内容

  • 特征提取:将任意数据(如文本或图像)转换为可用于机器学习的数字特征
  • 特征预处理:通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程
  • 特征降维:指在某些限定条件下,降低随机变量(特征)个数,得到一组不相关主变量的过程

五、机器学习算法分类

根据数据集组成不同,可以把机器学习算法分为:
  • 监督学习
  • 无监督学习
  • 半监督学习
  • 强化学习

1 监督学习

定义:
输入数据是由输入特征值和目标值所组成。
  • 函数的输出可以是一个连续的值(称为回归),
  • 或是输出是有限个离散值(称作分类)。

2 无监督学习

定义:
输入数据是由输入特征值组成,没有目标值
  • 输入数据没有被标记,也没有确定的结果。样本数据类别未知;
  • 需要根据样本间的相似性对样本集进行类别划分。
有监督,无监督算法对比:

3 半监督学习

定义:
训练集同时包含有标记样本数据和未标记样本数据。

4 强化学习

定义:
实质是 make decisions 问题,即自动进行决策,并且可以做连续决策。
监督学习和强化学习的对比:

5 小结

 六、模型评估

模型评估是模型开发过程不可或缺的一部分。它有助于发现表达数据的最佳模型和所选模型将来工作的性能如何。
按照数据集的目标值不同,可以把模型评估分为分类模型评估和回归模型评估。

1 分类模型评估

2 回归模型评估

均方根误差( Root Mean Squared Error RMSE
其他评价指标:相对平方误差( Relative Squared Error RSE )、平均绝对误差( Mean Absolute Error MAE) 、相对绝对误差(Relative Absolute Error RAE)

3 拟合

模型评估用于评价训练好的的模型的表现效果,其表现效果大致可以分为两类:过拟合、欠拟合

  • 欠拟合(under-fitting:模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来。
  • 过拟合(over-fitting):所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳。

 后记:
●本博客基于B站开源学习资源,是作者学习的笔记记录,仅用于学习交流,不做任何商业用途! 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/741134.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux 启动命令

添加权限 drwxr-xr-x -rwxr-xr-x <strong>第一位&#xff1a;-代表文件&#xff0c;d代表目录<br> 用户、组用户、其他用户都是rwx形式&#xff0c;其中r表示读、w表示写、x表示可执行&#xff0c;-表示没有权限&#xff0c;拿用户组举例&#xff0c;r只能出…

c++中string的模拟实现(超详细!!!)

1.string的成员变量、&#xff08;拷贝&#xff09;构造、析构函数 1.1.成员变量 private:char* _str;size_t _size; //string中有效字符个数size_t _capacity; //string中能存储有效字符个数的大小 1.2&#xff08;拷贝&#xff09;构造函数 //构造函数string(const char* …

【Linux进阶之路】HTTP协议

文章目录 一、基本概念1.HTTP2.域名3.默认端口号4.URL 二、请求与响应1.抓包工具2.基本框架3.简易实现3.1 HttpServer3.2 HttpRequest3.2.1 version13.2.2 version23.2.3 version3 总结尾序 一、基本概念 常见的应用层协议&#xff1a; HTTPS (HyperText Transfer Protocol Sec…

C# 8.0+版本项目 string不可为空

1.在某一次新建项目的时候发现&#xff0c;新建的项目&#xff0c;写的测试接口&#xff0c;接口的入参有string的参数&#xff0c; 但是调用接口的时候string的参数没有传报了400&#xff0c;很奇怪&#xff0c;也没有语法错误之类的。 2.解决办法 在项目上右键->属性->…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:Span)

作为Text组件的子组件&#xff0c;用于显示行内文本的组件。 说明&#xff1a; 该组件从API Version 7开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。 该组件从API Version 10开始支持继承父组件Text的属性&#xff0c;即如果子组件未设置…

单片机开发-实现Zigbee的LED灯交替闪烁

前言 前提须知&#xff1a; 1.本文所讲的单片机开发的代码&#xff0c;使用软件是IAR Embedded Workbench&#xff1b; 2.本文所讲的内容与全国职业院校技能大赛“物联网应用开发”赛项Zigbee模块题目类似&#xff1b; 3.单片机Zigbee内容以收入到我的专栏“单片机Zigbee当…

C# 数据结构初始化长度

在C#中&#xff0c;各个数据结构的初始化长度是动态的&#xff0c;下面是一个例子&#xff0c;展示了如何初始化各个数据结构并演示它们的长度&#xff1a; using System; using System.Collections.Generic;class Program {static void Main(){// 初始化数组int[] intArray …

直播美颜SDK的商业化应用:如何为直播平台带来更多商业机会?

直播过程中的自然环境和摄像头本身的限制可能会影响用户的体验&#xff0c;因此直播美颜SDK的商业化应用应运而生&#xff0c;它为直播平台带来了更多商业机会。 直播美颜SDK是一种集成在直播平台中的软件开发工具包&#xff0c;它能够对直播过程中的视频流进行实时的美颜处理…

双指针算法———C++

首先说明双指针&#xff0c;何为双指针顾名思义就是序列中有两个指针来分别配合调控遍历这序列。 与其生硬讲解&#xff0c;不如举个例子。 例题&#xff1a;给定一段序列&#xff0c;里面有一些单词&#xff0c;并且每个单词都是以空格隔开。 题目要求是将每个单词为一行重…

WPF制作带图标和文字的按钮模板(通过附件属性实现)

1.界面模板代码部分 <Window.Resources><Style x:Key"IconButton" TargetType"Button"><Setter Property"Template"><Setter.Value><ControlTemplate TargetType"Button"><Border x:Name"borde…

算法D45 | 动态规划7 | 70. 爬楼梯 (进阶) 322. 零钱兑换 279.完全平方数

70. 爬楼梯 &#xff08;进阶&#xff09; 这道题目 爬楼梯之前我们做过&#xff0c;这次再用完全背包的思路来分析一遍 代码随想录 Python: 翻译成背包问题&#xff0c;即&#xff1a;在容量为n的背包里&#xff0c;装入重量为1/2的物品&#xff0c;可以重复利用物品&#x…

快速安装mysql 5.7 服务步骤(包含clinet)及常见问题

1、centos上如何安装MySQL&#xff1a; 1.1.下载并安装mysql yum Repo&#xff1a; # 下载 wget https://dev.mysql.com/get/mysql57-community-release-el7-9.noarch.rpm # 安装 rpm -ivh mysql57-community-release-el7-9.noarch.rpm 1.2.进入yum.repos.d目录&#xff0c;安…

C语言每日一题(63)复写零

题目链接 力扣网 1089 复写零 题目描述 给你一个长度固定的整数数组 arr &#xff0c;请你将该数组中出现的每个零都复写一遍&#xff0c;并将其余的元素向右平移。 注意&#xff1a;请不要在超过该数组长度的位置写入元素。请对输入的数组 就地 进行上述修改&#xff0c;不…

【C++ Primer Plus学习记录】简单文件输入/输出

有时候&#xff0c;通过键盘输入并非最好的选择。例如&#xff0c;假设您编写了一个股票分析程序&#xff0c;并下载了一个文件&#xff0c;其中包含1000种股票的价格。在这种情况下&#xff0c;让程序直接读取文件&#xff0c;而不是手工输入文件中所有的值&#xff0c;将方便…

惬意了解 —— 前端发展史

下拉底部&#xff0c;参与投票&#xff5e;&#xff5e; 前端发展史&#xff1a;从洪荒时代到现代 前端开发已经走过了将近20年的历程&#xff0c;从最早的纯静态页面到如今的现代前端框架&#xff0c;我们见证了前端技术的蓬勃发展。让我们一起回顾这段历史。 洪荒时代&…

深入联合文件系统

Union File System&#xff08;联合文件系统&#xff0c;UnionFS&#xff09;是一种轻量级的高性能分层文件系统&#xff0c;它支持将文件系统中的修改信息作为一次提交&#xff0c;并层层叠加&#xff0c;同时可以将不同目录挂载到同一个虚拟文件系统下&#xff0c;应用看到的…

2024年A特种设备相关管理(锅炉压力容器压力管道)证考试题库及A特种设备相关管理(锅炉压力容器压力管道)试题解析

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 2024年A特种设备相关管理&#xff08;锅炉压力容器压力管道&#xff09;证考试题库及A特种设备相关管理&#xff08;锅炉压力容器压力管道&#xff09;试题解析是安全生产模拟考试一点通结合&#xff08;安监局&#…

【天池课堂】零基础入门数据挖掘-课程汇总

写在前面&#xff1a; 如果你现在很迷茫&#xff0c;但是又对数据挖掘感兴趣&#xff0c;建议先看看以下两个视频直播&#xff0c;两位大佬亲身讲述自己和数据挖掘的前世今生。 《如何入门数据挖掘竞赛》 鱼遇雨欲语与余。天池明星选手&#xff0c;武汉大学硕士&#xff0c;天…

前端框架的演进之路:从静态网页到现代交互体验的探索

前端框架的发展史 随着互联网的快速发展&#xff0c;前端技术也在不断进步&#xff0c;前端框架作为前端开发的重要工具&#xff0c;经历了从简单到复杂、从单一到多元的演变过程。本文将回顾前端框架的发展史&#xff0c;探讨其变迁背后的原因和趋势。 一、静态网页时代 在…

不同的二叉搜索树 01背包

96.不同的二叉搜索树 力扣题目链接(opens new window) 给定一个整数 n&#xff0c;求以 1 ... n 为节点组成的二叉搜索树有多少种&#xff1f; dp[3] dp[2] * dp[0] dp[1] * dp[1] dp[0] * dp[2] dp[i] &#xff1a; 1到i为节点组成的二叉搜索树的个数为dp[i]。 dp[i] d…