<机器学习初识>——《机器学习》

目录

一、人工智能概述

1 人工智能应用场景

2 人工智能发展必备三要素

3 人工智能、机器学习和深度学习

二、人工智能发展历程

1 人工智能的起源

1.1 图灵测试

1.2 达特茅斯会议

2 发展历程

三、 人工智能主要分支

1 主要分支介绍

1.1 分支一:计算机视觉

1.2 分支二:语音识别

1.3 分支三:文本挖掘/分类

1.4 分支四:机器翻译

1.5 分支五:机器人

四、机器学习工作流程

1 什么是机器学习

2 机器学习工作流程

2.1 获取到的数据集介绍

2.2 数据基本处理

2.3 特征工程

2.3.1什么是特征工程

2.3.2 特征工程包含内容

五、机器学习算法分类

1 监督学习

2 无监督学习

3 半监督学习

4 强化学习

5 小结

 六、模型评估

1 分类模型评估

2 回归模型评估

3 拟合


一、人工智能概述

1 人工智能应用场景

人工智能发展必备三要素

  • 数据
  • 算法
  • 计算力 

        CPU,GPU,TPU

计算力之CPUGPU对比:
  • CPU主要适合I\O密集型的任务
  • GPU主要适合计算密集型任务
1)计算密集型的程序。
所谓计算密集型 (Compute-intensive) 的程序,就是其大部分运行时间花在了寄存器运算上,寄存器的速度和处理器的速度相当,从寄存器读写数据几乎没有延时。可以做一下对比,读内存的延迟大概是几百个时钟周期;读硬盘的速度就不说了,即便是SSD, 也实在是太慢了。
2)易于并行的程序。
GPU 其实是一种 SIMD(Single Instruction Multiple Data) 架构, 他有成百上千个核,每一个核在同一时间最好能做同样的事情。

3 人工智能、机器学习和深度学习

人工智能和机器学习,深度学习的关系:
  • 机器学习是人工智能的一个实现途径
  • 深度学习是机器学习的一个方法发展而来

二、人工智能发展历程

1 人工智能的起源

1.1 图灵测试

测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。
多次测试(一般为 5min 之内),如果有超过 30% 的测试者不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。

1.2 达特茅斯会议

1956 8 月,在美国汉诺斯小镇宁静的达特茅斯学院中,
约翰 · 麦卡锡( John McCarthy
马文 · 闵斯基( Marvin Minsky ,人工智能与认知学专家)
克劳德 · 香农( Claude Shannon ,信息论的创始人)
艾伦 · 纽厄尔( Allen Newell ,计算机科学家)
赫伯特 · 西蒙( Herbert Simon ,诺贝尔经济学奖得主)等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:
用机器来模仿人类学习以及其他方面的智能。
会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字: 人工智能
因此, 1956 年也就成为了人工智能元年。

2 发展历程

 

三、 人工智能主要分支

1 主要分支介绍

通讯、感知与行动是现代人工智能的三个关键能力,在这里我们将根据这些能力 / 应用对这三个技术领域进行介绍:
  • 计算机视觉(CV)
  • 自然语言处理(NLP)
       在 NLP 领域中,将覆盖文本挖掘 / 分类、机器翻译和语音识别。
  • 机器人

1.1 分支一:计算机视觉

计算机视觉 (CV) 是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。物体检测和人脸识别是其比较成功的研究领域。

1.2 分支二:语音识别

语音识别是指识别语音 ( 说出的语言 ) 并将其转换成对应文本的技术。相反的任务 ( 文本转语音 /TTS) 也是这一领域内一个类似的研究主题。

1.3 分支三:文本挖掘/分类

这里的文本挖掘主要是指文本分类,该技术可用于理解、组织和分类结构化或非结构化文本文档。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。

1.4 分支四:机器翻译

机器翻译 (MT) 是利用机器的力量自动将一种自然语言 ( 源语言 ) 的文本翻译成另一种语言 ( 目标语言 )

1.5 分支五:机器人

机器人学 (Robotics) 研究的是机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理。
机器人可以分成两大类 : 固定机器人和移动机器人。固定机器人通常被用于工业生产 ( 比如用于装配线 ) 。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。

四、机器学习工作流程

1 什么是机器学习

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。
 

2 机器学习工作流程

机器学习工作流程总结:
1. 获取数据
2. 数据基本处理
3. 特征工程
4. 机器学习 ( 模型训练 )
5. 模型评估
  • 结果达到要求,上线服务
  • 没有达到要求,重新上面步骤

2.1 获取到的数据集介绍

2.2 数据基本处理

即对数据进行缺失值、去除异常值等处理

2.3 特征工程

2.3.1什么是特征工程

特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。
意义:会直接影响机器学习的效果

2.3.2 特征工程包含内容

  • 特征提取:将任意数据(如文本或图像)转换为可用于机器学习的数字特征
  • 特征预处理:通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程
  • 特征降维:指在某些限定条件下,降低随机变量(特征)个数,得到一组不相关主变量的过程

五、机器学习算法分类

根据数据集组成不同,可以把机器学习算法分为:
  • 监督学习
  • 无监督学习
  • 半监督学习
  • 强化学习

1 监督学习

定义:
输入数据是由输入特征值和目标值所组成。
  • 函数的输出可以是一个连续的值(称为回归),
  • 或是输出是有限个离散值(称作分类)。

2 无监督学习

定义:
输入数据是由输入特征值组成,没有目标值
  • 输入数据没有被标记,也没有确定的结果。样本数据类别未知;
  • 需要根据样本间的相似性对样本集进行类别划分。
有监督,无监督算法对比:

3 半监督学习

定义:
训练集同时包含有标记样本数据和未标记样本数据。

4 强化学习

定义:
实质是 make decisions 问题,即自动进行决策,并且可以做连续决策。
监督学习和强化学习的对比:

5 小结

 六、模型评估

模型评估是模型开发过程不可或缺的一部分。它有助于发现表达数据的最佳模型和所选模型将来工作的性能如何。
按照数据集的目标值不同,可以把模型评估分为分类模型评估和回归模型评估。

1 分类模型评估

2 回归模型评估

均方根误差( Root Mean Squared Error RMSE
其他评价指标:相对平方误差( Relative Squared Error RSE )、平均绝对误差( Mean Absolute Error MAE) 、相对绝对误差(Relative Absolute Error RAE)

3 拟合

模型评估用于评价训练好的的模型的表现效果,其表现效果大致可以分为两类:过拟合、欠拟合

  • 欠拟合(under-fitting:模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来。
  • 过拟合(over-fitting):所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳。

 后记:
●本博客基于B站开源学习资源,是作者学习的笔记记录,仅用于学习交流,不做任何商业用途! 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/741134.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c++中string的模拟实现(超详细!!!)

1.string的成员变量、(拷贝)构造、析构函数 1.1.成员变量 private:char* _str;size_t _size; //string中有效字符个数size_t _capacity; //string中能存储有效字符个数的大小 1.2(拷贝)构造函数 //构造函数string(const char* …

【Linux进阶之路】HTTP协议

文章目录 一、基本概念1.HTTP2.域名3.默认端口号4.URL 二、请求与响应1.抓包工具2.基本框架3.简易实现3.1 HttpServer3.2 HttpRequest3.2.1 version13.2.2 version23.2.3 version3 总结尾序 一、基本概念 常见的应用层协议: HTTPS (HyperText Transfer Protocol Sec…

C# 8.0+版本项目 string不可为空

1.在某一次新建项目的时候发现,新建的项目,写的测试接口,接口的入参有string的参数, 但是调用接口的时候string的参数没有传报了400,很奇怪,也没有语法错误之类的。 2.解决办法 在项目上右键->属性->…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:Span)

作为Text组件的子组件,用于显示行内文本的组件。 说明: 该组件从API Version 7开始支持。后续版本如有新增内容,则采用上角标单独标记该内容的起始版本。 该组件从API Version 10开始支持继承父组件Text的属性,即如果子组件未设置…

直播美颜SDK的商业化应用:如何为直播平台带来更多商业机会?

直播过程中的自然环境和摄像头本身的限制可能会影响用户的体验,因此直播美颜SDK的商业化应用应运而生,它为直播平台带来了更多商业机会。 直播美颜SDK是一种集成在直播平台中的软件开发工具包,它能够对直播过程中的视频流进行实时的美颜处理…

【C++ Primer Plus学习记录】简单文件输入/输出

有时候,通过键盘输入并非最好的选择。例如,假设您编写了一个股票分析程序,并下载了一个文件,其中包含1000种股票的价格。在这种情况下,让程序直接读取文件,而不是手工输入文件中所有的值,将方便…

惬意了解 —— 前端发展史

下拉底部,参与投票~~ 前端发展史:从洪荒时代到现代 前端开发已经走过了将近20年的历程,从最早的纯静态页面到如今的现代前端框架,我们见证了前端技术的蓬勃发展。让我们一起回顾这段历史。 洪荒时代&…

深入联合文件系统

Union File System(联合文件系统,UnionFS)是一种轻量级的高性能分层文件系统,它支持将文件系统中的修改信息作为一次提交,并层层叠加,同时可以将不同目录挂载到同一个虚拟文件系统下,应用看到的…

2024年A特种设备相关管理(锅炉压力容器压力管道)证考试题库及A特种设备相关管理(锅炉压力容器压力管道)试题解析

题库来源:安全生产模拟考试一点通公众号小程序 2024年A特种设备相关管理(锅炉压力容器压力管道)证考试题库及A特种设备相关管理(锅炉压力容器压力管道)试题解析是安全生产模拟考试一点通结合(安监局&#…

不同的二叉搜索树 01背包

96.不同的二叉搜索树 力扣题目链接(opens new window) 给定一个整数 n,求以 1 ... n 为节点组成的二叉搜索树有多少种? dp[3] dp[2] * dp[0] dp[1] * dp[1] dp[0] * dp[2] dp[i] : 1到i为节点组成的二叉搜索树的个数为dp[i]。 dp[i] d…

Vivado2021及以下版本 HLS生成IP核报错的解决方案

摘要:生成 HLS ip的时候会报错,无法生成;原因是2021及以下的版本都会有时间错误的问题,所以要用官方的补丁包,但是打了补丁包有时候也会没用 一、打补丁 以下是xilinx提供的解决办法: Export IP Invalid …

振弦采集仪在岩土工程施工质量监控中的应用案例分析

振弦采集仪在岩土工程施工质量监控中的应用案例分析 河北稳控科技振弦采集仪是一种用来监测振动的仪器设备,可以通过采集振弦信号来分析结构的振动特性。在岩土工程施工质量监控中,振弦采集仪可以用于以下几个方面的应用。 1. 地基与基础工程监测&#…

11.Java---语法总结之一个小项目

图书管理系统 Java学习了很久了,今天将运用之前学习的所有东西整理做个小小的小项目. 1.首先是各种包和操作方法建好 2.然后是项目的大框架搭好 3.然后就开始实现各个部分了 看看最后的运行结果吧! 管理员测试 1.登录&显示图书的运行结果 2.查找&新增图书的运行结…

【黑马程序员】python函数

文章目录 函数什么是函数为什么学习函数函数定义函数的传入参数函数的返回值返回值基础None返回值 函数说明文档函数的嵌套调用定义代码示例 全局变量和局部变量全局变量global变量局部变量 函数综合案例 函数 什么是函数 组织好的,可重复使用的、用来实现特定功能…

图像分割损失函数

为什么要乘以2,是为了让DICE的值域在0和1之间 优化:两种LOSS相加 Focus loss:

【PLSQL】plsqldeveloper查询结果记录显示不全

plsql版本号为12或13。 例如scott用户的emp表中共有14条数据,但select * from emp;查询结构只显示13条记录,如下: 这是由于查询结果显示条数,根据查询框高度自动计算可以显示多少条记录,如果想显示全,则需…

阿里云领盲盒活动

阿里云每次的活动都很给力,实打实地发东西。 这次是体验 通义灵码 的活动,这个是体验的推广链接 「通义灵码 体验 AI 编码,开 AI 盲盒」 我是在vscode安装的,体验还行,抽奖抽到了马克杯 这个是抽奖的具体步骤 https:…

程序猿成长之路之socket篇-socket通信原理简介

hello,各位小伙伴们大家好,上次以RSA加解密算法介绍作为密码学篇的结尾后,时光飞逝,转眼到了新一年的春季,这次将介绍一下socket通信和编程原理。 什么是socket(套接字)? socket(套…

Matlab|【分布鲁棒】数据驱动的多离散场景电热综合能源系统分布鲁棒优化算法

目录 主要内容 1.1 主要难点-分布鲁棒优化 1.2 程序求解步骤-主子问题迭代 部分结果 下载链接 主要内容 本程序主要对《基于场景聚类的主动配电网分布鲁棒综合优化》-高海淑的方法复现,应用到综合能源电热微网方向,采用拉丁超立方抽样对不同…

[计算机效率] 在当前文件夹以管理员身份运行批处理

2.7 在当前文件夹以管理员身份运行批处理 这个功能对于要经常运行批处理程序的人来说真的很方便。每次要要运行批处理,要么就是直接打开的批处理不是以管理员身份运行的,要么就是在批处理中要一步步的切换进入到目标文件夹中,非常费时间。 方…