人工智能核心技术:机器学习总览

💡机器学习作为人工智能的核心,与计算机视觉、自然语言处理、语音处理和知识图谱密切关联

💡【机器学习】是实现人工智能的核心方法,专门研究计算机如何模拟/实现生物体的学习行为,获取新的知识技能,利用经验来改善特定算法的性能。深度学习是机器学习算法的一种,深度学习算法具有多层神经网络结构,其在图像识别、语音处理等领域取得划时代的成果。

💡根据学习范式的不同,机器学习可划分为有监督学习、无监督学习、强化学习。 

⭕机器学习分类—有监督学习

有监督学习:从有标注训练数据中推导出预测函数

💡有监督学习(Supervised Learning):属于机器学习任务的一种类型,其主要是从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据该函数预测结果。

💡有监督学习的训练集要求包括【输入】和【输出】,或称为【特征】和【目标】,其中训练集中的目标是由【人工标注】的。

👉有监督学习一般包括确定训练类型、收集训练集、确定特征提取方法、选择算法、训练算法、评估准确性六大环节,通过已有的训练样本(即已知数据及其对应的输出)去训练得到一个最优模型,再利用该模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类目的。

🎈1.1有监督学习—逻辑回归

逻辑回归:对事件发生或不发生进行二元分类

逻辑回归(Logistic Regression,LR):是指学习某事件发生概率的算法,可对某个事件发生/不发生进行二元分类。💡逻辑回归使用Sigmoid函数,输出结果范围在[0,1]之间,逻辑回归的目标是发现特征与特定结果可能性之间的联系。

如下示例:根据学习时长预测学生是否通过考试,响应变量为“通过和未通过考试”。

 🎈1.2有监督学习—支持向量机

支持向量机:以间隔最大化为基准学习远离数据的决策边界

💡支持向量机(Support Vector Machine,SVM):主要是以间隔最大化为基准,学习得到尽可能远离数据的决策边界算法,支持向量是确定决策边界的重要数据。

🎈1.3有监督学习—决策树

决策树:以树结构形式表达的预测分析模型

💡决策树(Decision Tree): 是一种树状结构,通过做出一系列决策(选择)来对数据进行划分,这类似于针对👉一系列问题进行选择。一棵决策树一般包含一个根结点、若干个内部结点和若干个叶结点,其中每个内部结点表示一个属性上的测试,每个分支代表一个测试输出,每个叶结点代表一种类别。⚠ 决策树生成是一个递归过程。

🎈1.4有监督学习—随机森林

随机森林:利用多决策树模型,提高模型预测精度

随机森林(Random Forest):是指利用多棵决策树对样本进行训练并预测的一种分类器。💡随机森林算法:从每个决策树收集输出,通过多数表决得到最终的分类结果。

🎈1.5有监督学习—朴素贝叶斯

朴素贝叶斯是常用于自然语言分类问题的算法

💡具体来说,就是计算数据为某个标签的概率,并将其分类为概率值最大的标签。朴素贝叶斯主要用于文本分类和垃圾邮件判定等自然语言处理中的分类问题。

如训练数据类别为电影(那部让人感动的电影名作重映,华丽的动作电影首映,复映的名作感动了世界),训练数据类别为宇宙(沙尘暴笼罩着火星,火星探测终于重新开始,VR中看到的火星沙尘暴让人感动),验证数据为‘复映的动作电影名作让人感动’。🍻

另外,朴素贝叶斯也常用于自然语言分类问题的算法

⭕机器学习分类—无监督学习

无监督学习:对无标签样本进行学习揭示数据内在规律

💡无监督学习(Unsupervised Learning):主要是指训练数据在不含标记的情况下生成模型(通常在缺乏足够先验知识难以人工标注类别,或进行人工类别标注的成本高等情况下),无监督学习的目标是通过对无标签样本的学习来揭示数据的内在特性及规律。

💡无监督学习主要涉及聚类和降维问题,其中聚类问题涉及K-means聚类、概念聚类、模糊聚类等算法,聚类的目标是为数据点分组,使得不同聚类中的数据点不相似,同一聚类中的数据点则是相似的;

💡降维问题主要是主成分分析、线性判别分析、多维尺度分析等算法,其中主成分分析将数据中存在的空间重映射成一个更加紧凑的空间,此种变换后的维度比原来维度更小。

常见的无监督学习适用场景涵盖发现异常数据、用户类别划分、推荐系统等场景。

⭕机器学习分类—强化学习

💡强化学习(Reinforcement Learning,RL):又称再励学习或评价学习,是系统从环境到行为映射的学习,以使激励信号(强化信号) 函数值最大化。强化学习的关键要素有代理(Agent)、环境(Environment)、状态(State)、环境回报(Reward)

💡强化学习特点包括:
①学习过程中没有监督者,只有激励信号
②反馈信号是延迟而非即时的
③学习过程具有时间序列性质
④系统的动作会影响到后续的数据。、

🚄强化学习可分为策略迭代算法和价值迭代算法两类,典型算法包括策略梯度、Sarsa、Q-Learning、Actor-Critic等。 强化学习在游戏、自动驾驶、推荐系统等领域有着广阔应用前景。

🎈强化学习—策略梯度

策略梯度:有效处理高维及连续动作空间问题

💡策略梯度(Policy Gradient,PG):是一种基于策略优化的强化学习算法。强化学习中,机器通过判别特定状态下采取不同动作所得环境回报大小来评价采取该动作的优劣。

PG核心思想是:当一个动作环境回报较大,则增加其被选择概率;反之,减少该动作被选择概率。每个动作选择概率由神经网络决定,以参数化神经网络表示策略(记为𝜋𝜃),通过调整参数𝜃,使总体回报期望值最大化。而最大化问题可转化为求取回报函数关于参数𝜃的梯度,一般使用梯度上升算法,此即为策略梯度算法。

💡在PG算法基础上,通常进一步采取引入基线(baseline)、修改因果关系(当前策略不影响该时间点之前的回报)、引入回报权重等方式,来提高算法收敛性及收敛效率。

🎈强化学习—时序差分学习

时序差分学习:结合蒙特卡罗方法与动态规划特点,提升策略优化速度

💡时序差分学习(Temporal Difference,TD):与蒙特卡罗学习相似,不需要知晓具体环境模型,可直接从经验中学习。
TD学习结合动态规划与蒙特卡罗方法,可在每执行一步策略后即进行Q函数更新,而不必在完成一个采样轨迹后才做更新。

时序差分学习根据算法中采样策略和更新Q值策略是否相同,分为同策略算法(on-policy)和异策略算法(off-policy)。同策略代表算法为Sarsa,其行为策略和目标策略均为贪心策略;异策略代表算法为Q-Learning(或称SarsaMax),其行为策略为贪心策略,而目标策略为确定性策略。
⛳Sarsa收敛速度较快,但可能无法得到全局最优解;Q-Learning可找到全局最优解,但收敛速度较慢,因此需视具体问题选用。

🎈强化学习—深度Q网络

深度Q网络:神经网络与Q-Learning结合,有效应对复杂状态空间

🚄传统强化学习算法(如动态规划、蒙特卡罗方法、时序差分学习等),其状态均为离散、有限的,并使用查找表存储状态价值或Q函数,但现实生活中状态多为连续的,即使离散化后状态空间(系统全部可能状态的集合)仍十分庞大,因而产生内存不足、表格搜索耗时过长等问题。

💡DQN则通过DNN、CNN或RNN等神经网络对价值函数做近似表示,利用经验回放方式替代查找表,令最终结果无限逼近全局最优解,有效解决Q-Learning状态空间有限问题。

🎈强化学习—Actor-Critic算法

Actor-Critic算法:综合策略梯度与Q-Learning优势,提高学习效率和准确性

💡Actor-Critic算法(AC):又称“演员-评论家”算法,主要由策略网络Actor和评价网络Critic组成。其中,Actor使用策略梯度等基于策略优化的算法,决定当前状态下采取何种动作;Critic则使用Q-Learning等基于值优化的算法,对Actor所选动作进行评分,进而Actor根据Critic评分改进动作选择概率。

Actor-Critic算法结合策略梯度与Q-Learning算法优点,既可做到单步更新,又可扩展至连续状态空间,提高策略更新效率同时解决高偏差问题。目前,AC算法已发展出Advantage Actor-Critic(A2C)以及Asynchronousadvantage Actor-Critic(A3C)等改进型,进一步提高策略准确性、降低内存需求。

⭕机器学习—迁移学习

迁移学习:将知识由源域迁移至目标域,提高机器学习效率

迁移学习(Transfer Learning,TL):是一种机器学习方法,是把已训练好的模型参数迁移到新的模型来帮助新模型训练,其核心目标是将知识从源域迁移到目标域,让机器也可以做到“触类旁通”。

🚄迁移学习的主要优点是节省模型训练时间,且在目标域训练数据不足时,模型仍能取得较好的性能。迁移学习的训练框架可以概括为:
1)选择源模型,从可用模型中挑选出预训练模型
2)重用模型,在目标域中使用源模型进行训练
3)调整模型。模型可以在目标数据集中对输入-输出进行选择性微调,以让其适应目标任务。
🏁实现迁移学习的方式主要包括样本迁移、特征迁移、模型迁移。

⭕机器学习—联邦学习

联邦学习:以分布式机器学习方式,有效化解信息孤岛问题

🌟联邦学习(Federated Learning,FL):由Google公司首次提出,是一种由多个数据持有方协同训练模型,而不分享数据, 仅在中间阶段交换训练参数的学习机制。根据其数据分布情况,可分为【横向联邦学习、纵向联邦学习和联邦迁移学习】

🚄联邦学习的基本流程是:
1)客户端从服务器下载全局模型
2)训练本地数据得到本地模型
3)上传模型更新信息
4)中心服务器加权聚合本地模型,得到更新后的全局模型。
⚠经过多次迭代,得到趋近于集中式机器学习结果的模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/17854.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

垂类短视频:四川鑫悦里文化传媒有限公司

垂类短视频:内容细分下的新媒体力量 随着移动互联网的迅猛发展和智能手机的普及,短视频已成为当下最受欢迎的媒介形式之一。四川鑫悦里文化传媒有限公司而在短视频领域,一个新兴的概念——“垂类短视频”正逐渐崭露头角,以其独特…

设计模式 21 备忘录模式 Memento Pattern

设计模式 21 备忘录模式 Memento Pattern 1.定义 备忘录模式是一种行为型设计模式,它允许你将一个对象的状态保存到一个独立的“备忘录”对象中,并在之后恢复到该状态。 2.内涵 主要用于以下场景: 需要保存对象状态以备恢复: 当…

torch.matmul()的用法

这篇文章记录torch.matmul()的用法 这里仿照官方文档中的例子说明,此处取整数随机数,用于直观的查看效果: vector x vector 两个一维向量的matmul相当于点积,得到一个标量 tensor1 torch.randint(1, 6, (3,)) tensor2 torch.…

机器学习基础笔记

周志华老师的机器学习初步的笔记 绪论 知识分类 科学 是什么,为什么 技术 怎么做 工程 多快好省 应用 口诀,技巧,实际复杂环境,行行出状元 定义 经典定义 利用经验改善系统自身的性能 训练数据 模型 学习算法 分类 决策树…

Django5+React18前后端分离开发实战14 React-Router6 入门教程

使用nodejs18 首先,将nodejs切换到18版本: nvm use 18创建项目 npm create vitelatest zdpreact_basic_router_dev -- --template react cd zdpreact_basic_router_dev npm install react-router-dom localforage match-sorter sort-by npm run dev此…

nlohmann json C++ 解析

学习材料:nlohmann json json官方 源码解析 源码 要学习并理解这份代码,可以按照以下步骤进行,逐步梳理代码的逻辑: 基本步骤: 配置宏: 理解用于配置的宏定义,这些宏控制库的不同特性和行为。例如&…

Java-常见面试题收集(十五)

二十四 Elasticsearch 1 Elasticsearch 的倒排索引 传统的检索方式是通过文章,逐个遍历找到对应关键词的位置。 倒排索引,是通过分词策略,形成了词和文章的映射关系表,也称倒排表,这种词典 映射表即为倒排索引。 其中…

印度政策变革下,中国跨国企业如何应对?一家高科技企业的数据本地化之路

自2001年底印度加入世贸组织以来,印度政府一直积极采取措施促进经济的发展,推出相关政策吸引外资并调整产业结构,以推动经济实现跨越式增长。外资纷纷涌入印度,在各地建立大规模的企业,促使印度成为全球工厂之一&#…

回答网友问题:在C# 中调用非托管DLL

在一个QQ群里,有人在问如何“在C# 中调用非托管DLL”。 俺脑子抽抽了一下,就回了一句“你喜欢用那种声明方式,就用那种方式去调用。” 然后就有人说:“参数声明要和DLL的声明完全一致”。 俺脑子又抽抽了一下,又回了…

图论中的两种递推计数法

递推计数法 生成树计数: τ ( G ) τ ( G − e ) τ ( G ⋅ e ) \tau(G) \tau(G-e)\tau(G\cdot e) τ(G)τ(G−e)τ(G⋅e) G的生成树的颗数,可以分为两类:包含边e的为 τ ( G ⋅ e ) \tau(G\cdot e) τ(G⋅e),不包含边e的为 …

kafka跨地区跨集群同步工具MirrorMaker2 —— 筑梦之路

MM2简介 KIP-382: MirrorMaker 2.0 - Apache Kafka - Apache Software Foundation 有四种运行MM2的方法: As a dedicated MirrorMaker cluster.(作为专用的MirrorMaker群集) As a Connector in a distributed Connect cluster.&#xff08…

每日一练 - 揭秘高级ACL的奥秘

01 真题题目 以下关于高级 ACL 描述正确的是: A.高级 ACL 支持基于协议类型过滤报文 B.可以过滤的协议号的取值可以是 1-255 C.编号范围 3000-3999 D.可以定义生效时间 E.可以根据 MAC 地址过滤报文 02 真题答案 ABCD 03 答案解析 A. 正确:高级ACL的…

使用IDEA远程debug调试

文章目录 应用背景开启方式IDEA设置启动脚本改造 参考资料 应用背景 springboot项目,部署到服务器上,需要开启远程debug跟踪代码。 使用idea开启远程debug。 开启方式 IDEA设置 选择 Edit Configuration 如图,点击加号,选择Re…

【机器学习】利用机器学习优化陆军战术决策与战场态势感知

🔒文章目录: 💥1.引言 🛴2.机器学习在陆军战术决策中的应用 🛣️2.1数据收集与预处理 🌄2.2模型构建与训练: 🌅2.3实时决策支持: 🌅2.4代码实现 &…

力扣:454. 四数相加 II

454. 四数相加 II 给你四个整数数组 nums1、nums2、nums3 和 nums4 &#xff0c;数组长度都是 n &#xff0c;请你计算有多少个元组 (i, j, k, l) 能满足&#xff1a; 0 < i, j, k, l < nnums1[i] nums2[j] nums3[k] nums4[l] 0 示例 1&#xff1a; 输入&#xff…

排序算法——上

一、冒泡排序&#xff1a; 1、冒泡排序算法的思想 我们从左边开始把相邻的两个数两两做比较&#xff0c;当一个元素大于右侧与它相邻的元素时&#xff0c;交换它们之间位置&#xff1b;反之&#xff0c;它们之间的位置不发生变化。冒泡排序是一种稳定的排序算法。 2、代码实现…

5月20日分割等和子集+最后一块石头的重量Ⅱ

416.分割等和子集 给你一个 只包含正整数 的 非空 数组 nums 。请你判断是否可以将这个数组分割成两个子集&#xff0c;使得两个子集的元素和相等。 示例 1&#xff1a; 输入&#xff1a;nums [1,5,11,5] 输出&#xff1a;true 解释&#xff1a;数组可以分割成 [1, 5, 5] 和…

【ai】LiveKit Agent 的example及python本地开发模式工程实例

title: ‘LiveKit Agent Playground’ playgroundLiveKit Community playground的环境变量&#xff1a;LiveKit API # LiveKit API Configuration LIVEKIT_API_KEYYOUR_API_KEY LIVEKIT_API_SECRETYOUR_API_SECRET# Public configuration NEXT_PUBLIC_LIVEKIT_URLwss://YOUR_…

持续总结中!2024年面试必问 20 道 Rocket MQ面试题(一)

一、请简述什么是RocketMQ&#xff1f; RocketMQ是一个开源的消息中间件&#xff0c;由阿里巴巴团队开发&#xff0c;主要设计用于分布式系统中的异步通信、应用解耦、流量削峰和消息持久化。它支持高吞吐量、高可用性、可扩展性和容错性&#xff0c;是构建大规模实时消息处理…

Linux系统keepalived实现主备高可用方案

Linux系统keepalived实现主备高可用方案 环境准备 装备两台机器&#xff0c;IP地址信息如下&#xff1a; host1&#xff1a; 192.168.18.180 host2&#xff1a; 192.168.18.183 虚拟vip: 192.168.18.188为了测试&#xff0c;分别在两台机器上安装nginx服务&#xff0c;使下面…