人工智能笔记分享

文章目录

  • 人工智能
    • 图灵测试
    • 分类
      • 分类与聚类的区别(重点)
        • 分类 (Classification)
        • 聚类 (Clustering)
      • 特征提取 + 分类器(重点)
        • 特征提取
        • 为什么要进行特征提取?(重点)
        • 分类器
      • 训练集、测试集大小(重点)
      • K则交叉验证(重点)
      • 过拟合、欠拟合
      • 分类准确率
      • softmax
    • 卷积神经网络
      • 向量卷积计算
      • 矩阵、张量卷积计算
      • 池化层
    • 循环神经网络
      • RNN
      • GRU
      • LSTM
    • 光流骨架
      • 光流(重点)
      • 骨架
      • 光流骨架区别
    • 关联规则挖掘
      • 两个兴趣度度量
      • 衍生概念
    • AP算法
    • 聚类算法
      • k-means聚类(重点)
      • 层次聚类(重点)
      • 密度聚类-DBSCAN(重点)
      • 层次聚类和密度聚类区别(重点)

介绍
我整理了一些比较关键的、考试可能会考的点,只是为了应付考试,都是些概念,不涉及具体算法实现。希望对大家有所帮助!

人工智能

图灵测试

什么是图灵测试?

人和机器人对话, 且人不知道对方为计算机

三个老爷爷

阿兰·图灵、维纳、约翰·麦卡锡

分类

判断一个实物的类型,这样的过程在人工智能 领域里被成为分类

分类:根据所给数据的不同特点, 判断它属于哪个类别

分类与聚类的区别(重点)

  • 省流:分类有监督,要预定义数据,分训练集测试集 聚类则不用,丢个数据让机器自己训练
  • 应用场景:分类需提前指明分哪几类?否则只说分类特征的话,只能是聚类咯~
分类 (Classification)
  1. 定义: 分类是一种监督学习方法,它将输入数据分配到预定义的类别中。
  2. 目标: 通过学习一个模型来预测新数据点所属的类别。
  3. 数据类型: 需要带有标签的数据集,即每个输入数据都有一个已知的输出类别。
  4. 算法: 常见的分类算法包括决策树、随机森林、支持向量机(SVM)、k近邻算法(k-NN)、朴素贝叶斯和神经网络。
  5. 应用: 分类问题的典型应用包括垃圾邮件检测(邮件是垃圾邮件或正常邮件)、图像识别(图像中是猫还是狗)、疾病诊断(病人是否患有某种疾病)等。
聚类 (Clustering)
  1. 定义: 聚类是一种无监督学习方法,它将数据点分组为多个簇,使得同一个簇中的数据点彼此之间的相似度最大,不同簇的数据点之间的相似度最小。
  2. 目标: 发现数据中的自然分组或结构,而不是预测新数据点所属的类别。
  3. 数据类型: 不需要带有标签的数据集,即数据点没有预定义的输出类别。
  4. 算法: 常见的聚类算法包括k均值(k-means)、层次聚类(hierarchical clustering)、DBSCAN(基于密度的聚类方法)和均值漂移(mean-shift)。
  5. 应用: 聚类问题的典型应用包括客户细分(根据购买行为将客户分组)、图像分割(将图像像素分为不同区域)、文档分类(根据内容将文档分组)等。

特征提取 + 分类器(重点)

特征提取

如:花瓣长度 花瓣宽度 花瓣颜色 植株高度 花瓣面积 …

1、对同样的事物,我们可以提取出各种各样的特征
2、不同的特征对于分类器的准确分类会有很大的影响

表示方式:向量 (x1,x2,x3…)(长度,宽度,面积…)

  • 提取特征是关键!
为什么要进行特征提取?(重点)

简化数据:原始数据往往包含大量的冗余信息和噪音。通过特征提取,可以简化数据,只保留对模型有用的信息,提高计算效率。

提高模型性能:提取出具有代表性的特征,可以帮助模型更准确地识别数据中的模式,从而提高模型的预测性能。

降维:对于高维数据,特征提取可以减少维度,降低计算复杂度,并减轻“维度灾难”问题。

增强解释性:提取出具有物理意义或业务意义的特征,有助于理解模型的决策过程,增强结果的可解释性。

减少过拟合:通过提取关键特征并去除噪音数据,可以减少模型的复杂度,降低过拟合的风险。

提高训练效率:更小且更有代表性的特征集可以显著减少模型训练时间和资源消耗。

分类器

可线性,也可非线性,线性划分平面,也可以是超平面

可以用大量数据来训练分类器

训练集、测试集大小(重点)

数据充足可 1:1

数据不充足可 6:4, 7:3

K则交叉验证(重点)

K最小值为2,最大值为样本总数

K 小了:计算成本低,性能不稳定,影响模型的泛化能力
K 大了:计算成本高,性能稳定,但可能带来过于乐观的估计,每次验证集的大小较小,模型可能无法充分地从验证集中学习到数据的特性,导致评估的偏差较大

k 个 accuracy 如何处理?

  • 通常通过计算 平均准确率标准差 来评估模型的 总体表现 和 稳定性

过拟合、欠拟合

过拟合:训练集过好,而测试集糟糕

欠拟合:训练集就不行了,根本没好好训练!

how(了解就行):增加样本量、k则交叉验证、数据预处理、正则化、特征选择 …

分类准确率

分类准确率= 分类正确的样本数 / 测试样本的总数

softmax

softmax 是 归一化指数函数

用于多分类,可以归一化,将输出值转为概率

卷积神经网络

向量卷积计算

每次滑一步,分别进行向量点乘,最终结果还是一个向量

矩阵、张量卷积计算

和向量同理,反正我会算!

池化层

池化层通过减少特征图的空间维度,减少了后续卷积层的计算量和参数量,从而提高了网络的计算效率和训练速度,可防止过拟合

循环神经网络

RNN

时间序列,不适合处理长序列(会遗忘)

GRU

两个门,更新门和重置门,设定上一个时刻和当前时刻的权重比

LSTM

三个门,比GRU复杂,分量之前每关系,相对独立,可自由设置

遗忘门能决定需要保留先前步长中哪些相关信息

输入门决定在当前输入中哪些重要信息需要被添加

输出门决定了下一个隐藏状态。

光流骨架

光流(重点)

光流是指在一系列连续的图像帧之间,物体像素位置的运动变化
基于光流的方法主要关注的是像素级别的运动信息,通常用于计算图像中的运动矢量场

骨架

基于骨架的方法主要关注的是对象(通常是人类)的关节和身体部分的位置信息
通过检测和追踪人体的关键点(如头、肩、肘、膝等),可以重建出人体的骨架结构

  • 目标检测 先检测到人
  • 骨架提取 拿到这个人的骨架
  • 特征提取 对骨架进行特征提取并分析
  • 动作识别 根据特征来识别判断出是什么动作

光流骨架区别

  1. 运动信息的表示方式
    • 光流方法基于像素级别的运动矢量,表示的是连续帧之间的运动变化。
    • 骨架方法基于关键点和关节位置,表示的是人体的姿态和骨架结构。
  2. 应用场景
    • 光流方法适用于需要细粒度运动分析的场景,如目标跟踪、视频稳定等。
    • 骨架方法适用于人体动作识别、姿态估计和运动分析等。
  3. 计算复杂度和鲁棒性
    • 光流方法计算复杂度较高,容易受到光照变化和噪声的影响。
    • 骨架方法计算相对简单,更鲁棒于光照和背景变化。

关联规则挖掘

两个兴趣度度量

支持度 整体概率,比如某个项集在事务集中出现的概率

置信度 条件概率,比如含A的事务集中,出现AC的概率

  • 提升度 在B单独发生中,是 A 引起的,即 A → \rightarrow B 的概率

衍生概念

频繁k项集 大于人为设定的最小支持度

候选k项集 用于生成频繁k项集的项集

AP算法

不断往上推,然后看置信度和提升度满不满足要求

聚类算法

k-means聚类(重点)

分成k个簇,先选取k个样本点,每加入一个点时先分类,再重新计算簇中心点,循环直到所有点分完为止

k近邻(KNN)是选周围k个样本点,然后来进行归类,是监督算法,要进行区分!

层次聚类(重点)

根据距离最小的两个点来聚类,不断往上叠层,每次都使样本簇数-1,最终像一个树结构,有层次感

优点:

1、得到层次化表达,信息丰富
2、有利于把数据集的聚类结构视觉化

缺点:

1、对噪声和离群点很敏感,需要有力的预处理过程
2、计算量很大

密度聚类-DBSCAN(重点)

  • 具有噪声的基于密度的空间聚类
  • 把分布相对密集、距离较近的点聚到一起
  • 不是所有的点都是类的一部分
  • DBSCAN定义了噪声点,在具有噪声的情况下具有较大的作用

优点:

1、不需要指明类的数量
2、能灵活地找到并分离各种形状和大小的类
3、能有效处理数据集中的噪声和离群点

缺点:

1、从两类可达的边界点,被分配给了另一个类(因为这个类先发现这个点),不能保证回传正确的分类情况
2、较难找到不同密度的类

层次聚类和密度聚类区别(重点)

层次聚类密度聚类
数据完整数据不完整
更有层次化,利于可视化更有集中性,适用于有噪声情况
对噪声和离群点很敏感,受极端情况影响大可舍弃极端情况,只集中对密度大的部分进行聚类

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/42776.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【分布式技术】——监控平台zabbix 介绍与部署

一、监控系统的相关知识 1.监控系统运用的原因 当我们需要实时关注与其相关的各项指标是否正常,往往存在着很多的服务器、网络设备等硬件资源,如果我们想要能够更加方便的、集中的监控他们,zabix可以实现集中监控管理的应用程序 监控的初衷…

Spring SimpleAsyncTaskExecutor学习

一. 简介 SimpleAsyncTaskExecutor,不是真的线程池,这个类不重用线程,每次调用都会创建一个新的线程,没有最大线程数设置;并发大的时候会产生严重的性能问题;在 Java 中创建线程并不便宜,线程对…

C#——封装详情

C# 封装 封装是面向对象编程中的一个核心概念,它使得对象的状态(即数据)不会被直接访问,而是通过方法(即行为)来控制和操作。封装可以提高代码的内聚性和可维护性,同时也提供了一种保护数据不被…

ARM汇编与机器码、汇编指令

文章目录 1. CISC与RISC指令集 2. ARM汇编指令 3. 汇编与机器码 4. 汇编指令格式 5. MOV指令 6. BL指令 7. B指令 8. ADD/SUB指令 9. LDR/STR指令 1. CISC与RISC指令集 根据指令的复杂度,所有CPU可以分为两类: CISC(Complex Instr…

C#——多态详情

多态 多态: 是同一个行为,具有多个不同表现形式或形态的能力 多态分为两种 : 静态性多态: 函数重载,符号重载动态性多态: 虚方法,抽象类,接口 静态多态 在编译时,函数和对象的连接机制被称为早期绑定,…

知识图谱的符号表示

1、基于图的表示建模 2、有效标记图 3、属性图表示方法的优点和去点 4、RDF是什么?表达是有限的 5、OWL,本体语言 6、OWL有很多家族 7、属性图、RDF\三元组、关系图 ---------------------------PPT---------------------

三级_网络技术_07_IP地址规划技术

1.IP地址192.168.15.1/27的子网掩码可写为()。 255.255.255.192 255.255.255.224 255.255.255.240 255.255.255.248 2.IP地址块211.64.0.0/11的子网掩码可写为()。 255.192.0.0 255.224.0.0 255.240.0.0 255.248.0.0 3.IP地址块59.67.159.125/11的子网掩码可写为()。…

STM32与W25Q64 Flash:SPI通信协议的高效实现策略

摘要 在嵌入式系统中,SPI通信协议是实现微控制器与非易失性存储设备如W25Q64 Flash存储器之间数据交换的关键技术。本文将探讨STM32微控制器与W25Q64 Flash存储器通过SPI进行通信的高效实现策略,包括硬件配置、SPI接口编程、性能优化技巧以及实际代码示…

已解决 javax.xml.transform.TransformerFactoryConfigurationError 异常的正确解决方法,亲测有效!!!

已解决 javax.xml.transform.TransformerFactoryConfigurationError 异常的正确解决方法,亲测有效!!! 目录 一、问题分析 二、报错原因 三、解决思路 四、解决方法 五、总结 博主v:XiaoMing_Java 博主v&#x…

【微服务网关——服务发现】

1.服务发现 1.1 介绍 服务发现是指用注册中心来记录服务信息,以便其他服务快速查找已注册服务服务发现分类: 客户端服务发现服务端服务发现 1.2 客户端服务发现 客户端服务发现(Client-side Service Discovery)是一种微服务架构中的模式…

Vine: 一种全新定义 Vue 函数式组件的解决方案

7月6日的 vue confg 大会上 ShenQingchuan 大佬介绍了他的 Vue Vine 项目, 一种全新定义 Vue 函数式组件的解决方案。 和 React 的函数式组件有异曲同工之妙,写起来直接起飞了。 让我们来快速体验一下 vine, 看看到底给我们带来了哪些惊喜吧…

释放计算潜能:Mojo模型与分布式训练的融合之道

释放计算潜能:Mojo模型与分布式训练的融合之道 在当今数据驱动的世界中,机器学习模型常常需要处理庞大的数据集,并且模型的复杂性也在不断增加。这导致训练模型所需的计算资源和时间显著增长。分布式训练作为一种有效的解决方案,…

[Python]配置邮件服务,发送邮件

本文以163邮件系统为例,登录之后,点击设置,开启如下设置项。 即可使用代码发送邮件,并携带附件。 开启SMTP 普通邮件 import smtplib from email.mime.text import MIMEText from email.mime.multipart import MIMEMultipart# 1…

文心一言常用的指令

文心一言作为一款强大的人工智能模型,支持多种类型的指令,以满足用户的不同需求。以下是一些文心一言常用的指令类型及其具体示例,这些指令按照不同的功能和用途进行分类和归纳: 1. 查询类指令 知识问答: 指令示例&a…

[算法] 优先算法(四):滑动窗口(下)

🌸个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵️热门专栏: 🧊 Java基本语法(97平均质量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 🍕 Collection与…

python 性能提升-C扩展

文章目录 python的缺点性能提升C扩展案例python的缺点 运行效率低 性能提升 性能瓶颈问题使用如下方式解决: C/C++实现耗时的代码,然后使用gcc/g++编译为动态库dll/so,在python中使用ctypes模块进行加载动态库;C为python耗时的代码编写扩展,需使用 Python.h 头文件,…

20240708 每日AI必读资讯

🤖破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍 - 谷歌DeepMind研究团队提出了一种加快AI训练的新方法——多模态对比学习与联合示例选择(JEST),大大减少了所需的计算资源和时间。 - JE…

Java线程的创建·启动和休眠

一.线程的创建和启动 Java中创建线程的两种方式 ◆继承java.lang.Thread类 ◆实现java.lang.Runnable接口 ◆使用线程的步骤 继承Thread类创建线程 ◆自定义线程类继承自Thread类 ◆重写run()方法,编写线程执行体 ◆创建线程对象,调用start()方法启动…

目标检测YOLO实战应用案例100讲-基于深度学习的无人机影像小目标识别(续)

目录 3.2 实验平台和环境 3.3 实验评价指标 3.4 基础框架YOLOv5在无人机数据集上的实验 3.4.1 实验结果 3.4.2 结果分析 4基于深度学习的无人机影像目标检测算法 4.1 基于改进YOLOv5的小目标检测算法研究 4.1.1 增加注意力机制 4.1.2 增加检测层 4.1.3多尺…

2024年 春秋杯 网络安全联赛夏季赛 Web方向 题解WirteUp 部分

brother 题目描述:web哥,打点容易提权难。 打点就是最简单的SSTI。 执行下find / -user root -perm -4000 -print 2>/dev/null找一下具备suid权限的命令 /usr/lib/dbus-1.0/dbus-daemon-launch-helper /usr/bin/chsh /usr/bin/gpasswd /usr/bin/n…