数学建模学习(115):主成分分析(PCA)与Python实践

文章目录

    • 一.主成分分析简介
      • 1.1 数学背景与维度诅咒
      • 1.2 PCA的定义与应用
    • 二.协方差矩阵——特征值和特征向量
    • 三.如何为数据集选择主成分数量
    • 四.特征提取方法
    • 五.LDA——与PCA的区别
    • 六.PCA的应用
    • 七.PCA在异常检测中的应用
    • 八.总结

一.主成分分析简介

1.1 数学背景与维度诅咒

主成成分分析(PCA)是一种广泛使用的算法,用于从高维数据中提取主要特征,以便更有效地用于机器学习(ML)模型。从数学上讲,维度是指在空间中指定一个向量所需的最少坐标数。在高维空间中计算两个向量之间的距离需要大量的计算资源,因此随着维度的增加,计算复杂性迅速提升,这就是所谓的“维度诅咒”(见图1.1)。这种现象使得许多机器学习算法的效率难以提高。随着数据维度的增加,数据的稀疏性增加,计算距离和密度的努力呈指数级增长。从理论上讲,维度的增加通常会增加大数据集中的噪声和冗余。因此,PCA被广泛应用于应对高维问题中的复杂性。

在这里插入图片描述

PCA起源于线性代数,基本上是一种数据预处理方法,通过将数据投影到较低维度的子空间中,保留数据的主要信息,同时减少数据集中的冗余特征。这种技术广泛应用于高维数据的可视化、降维和分类任务中。PCA遵循主轴定理,其主要目标是通过寻找正交基来优化数据表示,按重要性或方差对维度进行排序,丢弃次要的维度,并集中关注主要的无关成分。

1.2 PCA的定义与应用

PCA是一种无监督方法,用于减少高维数据集的特征数量。通过矩阵分解(或分解)来将未标记的数据集减少为其组成部分,然后根据方差对这些部分进行排序。代表原始数据的投影数据成为训练ML模型的输入。

PCA定义

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/52329.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TOP10漏洞原理

## 本人为学习网安不久的新人,记一次学习笔记,有缺陷或者表述不对的地方欢迎大家指出,感谢! ## 1、sql注入:web应用程序对用户输入的数据没有进行过滤,或者过滤不严,就把sql语句拼接进数据库…

二叉树的统一迭代法

目录 一:中序遍历: 二:前序遍历: 三:后序遍历 记忆法:跟序列的遍历相反: 比如中序是中左右结点遍历输出的,那压入栈的顺序就是右左中 st.push(node); …

Mac电脑遇到DNS解析失败,ip可以访问,域名无法访问

当Mac电脑遇到DNS解析失败的问题时,可以尝试以下几个解决方法‌: 1.检查网络连接‌:确保Mac已连接到可用的网络,并且网络连接正常。可以尝试重新连接Wi-Fi或使用有线连接来排除网络问题。 2.清除DNS缓存‌:打开终端应…

docker容器基本命令、docker进入容器的指令、容器的备份、镜像底层原理、使用commit命令制造镜像、将镜像推送到阿里云镜像仓库与私服仓库

除了exit 还有 ctrlpq exit退出停止 ctrlpq 退出不停止 将本地镜像推到阿里云 登入阿里云 容器镜像服务 实力列表 镜像仓库 创建镜像仓库 安装里面步骤来 这里192.168.10.145这部分用自己ifconfig地址

【Android 远程数据库操作】

按正常情况下,前端不应该直接进行远程数据库操作,这不是一个明智的方式,应该是后端提供对应接口来处理,奈何公司各方面原因需要前端这样做。 对此,我对远程数据库操作做了总结,便于自己复盘,同…

python绘制爱心代码

效果展示 完整代码 Python中绘制爱心的代码可以通过多种方式实现,高级的爱心代码通常指的是使用较复杂的算法或者图形库来生成更加精致的爱心图形。下面是一个使用Python的Turtle模块来绘制爱心的示例代码: import turtledef draw_love():turtle.speed…

[Other]-安装ruby、ascli、ascp

最近新接到这样一个需求,将生物原始数据上传到某中心,其中用到ascp命令,阴差阳错的装了ruby、ascli,这里就都一并介绍下安装方式,由于服务器老旧默认安装时ruby2.0,又 升级到2.7等引发的一系列问题&#xf…

XSS-DOM

文章目录 源码SVG标签Dom-Clobbringtostring 源码 <script>const data decodeURIComponent(location.hash.substr(1));;const root document.createElement(div);root.innerHTML data;// 这里模拟了XSS过滤的过程&#xff0c;方法是移除所有属性&#xff0c;sanitize…

AI工具革新:国内外设计艺术的融合

在人工智能的浪潮中&#xff0c;全球的创新者和开发者们推出了一系列令人惊叹的工具&#xff0c;它们正以前所未有的速度改变着我们的工作、学习和生活方式。从图像生成到语言处理&#xff0c;从数据分析到自动化设计&#xff0c;AI 作图工具展示了其强大的能力&#xff0c;帮助…

【RH134知识点问答题】第11章 管理网络安全

目录 1. 防火墙在 Linux 系统安全中有哪些重要的作用&#xff1f; 2. 简单说明一下 firewalld。 3. 系统管理员可以通过哪三种方式与 firewalld 交互&#xff1f; 4. 使用什么命令可以获取当前端口标签分配概述&#xff1f; 5. 要允许 httpd 服务侦听端口 82/TCP&#xff0…

DRF——Filter条件搜索模块

文章目录 条件搜索自定义Filter第三方Filter内置Filter 条件搜索 如果某个API需要传递一些条件进行搜索&#xff0c;其实就在是URL后面通过GET传参即可&#xff0c;例如&#xff1a; /api/users?age19&category12在drf中也有相应组件可以支持条件搜索。 自定义Filter …

面试题详解

前言&#xff1a;这一期我们专门来巩固所学知识&#xff0c;同时见识一些面试题。对知识做出一个总结。 1 不创建临时变量交换两个整数 . 第一种方法 #include<stdio.h> int main() {int a 0;int b 0;scanf("%d %d", &a, &b);printf("交换前…

神经网络算法 - 一文搞懂BERT(基于Transformer的双向编码器)

本文将从BERT的本质、BERT的原理、BERT的应用三个方面&#xff0c;带您一文搞懂Bidirectional Encoder Representations from Transformers | BERT。 Google BERT BERT架构&#xff1a; 一种基于多层Transformer编码器的预训练语言模型&#xff0c;通过结合Tokenization、多种E…

Java基于数据库、乐观锁、悲观锁、Redis、Zookeeper分布式锁的简单案例实现(保姆级教程)

1. 分布式锁的定义 分布式锁是一种在分布式系统中用来协调多个进程或线程对共享资源进行访问的机制。它确保在分布式环境下&#xff0c;多个节点&#xff08;如不同的服务器或进程&#xff09;不会同时访问同一个共享资源&#xff0c;从而避免数据不一致、资源竞争等问题。 2…

等保测评服务的业务连续性规划:确保信息安全服务的韧性

在当前的数字化转型浪潮中&#xff0c;信息安全已成为企业运营的关键一环。等保测评服务作为信息安全合规的重要组成部分&#xff0c;其业务连续性规划对于保障服务的稳定性和客户信息资产的安全至关重要。本文将探讨等保测评服务的业务连续性规划策略&#xff0c;旨在构建一个…

树状数组算法

文章目录 树状数组是什么树状数组与线段树的区别与联系树状数组讲解点修&#xff0c;区查&#xff0c;讲解及模板点查&#xff0c;区修讲解及模板 树状数组是什么 树状数组是一种数据结构&#xff0c;提供O(logn)时间内的单点修改和区间求和操作&#xff0c;比线段树有更优的常…

MD编辑器学习笔记

MD编辑器学习笔记 目录标题文本样式列表图片链接代码片数学公式表格部分总结 目录 目录是使用“[TOC](目录&#xff09;”&#xff0c;记住别忘了加上&#xff08;&#xff09;标题 使用#来确定标题&#xff0c;几个#就是几级标题。记住#后面要加上空格文本样式 tips: 在写正…

Linux环境下配置jdk、Tomcat和Mysql详解

要在Linux系统中配置JDK、Tomcat和MySQL&#xff0c;是完成项目部署的首要步骤&#xff0c;为了方便初学者在项目部署时更加快捷&#xff0c;V 哥整理了 JDK&#xff0c;Tomcat&#xff0c;MySQL的环境配置&#xff0c;方便参考。 下面是Linux配置JDK、Tomcat和MySQL的详细步骤…

物流抓取机器人整体设计方案

一、功能简介 1、运行环境&#xff1a;巡线行驶&#xff08;7路数字循迹&#xff0c;麦克纳姆轮车底盘&#xff09; 2、目标识别&#xff1a;颜色识别&#xff08;Maix-II Dock 视觉模块&#xff09; 3、目标定位&#xff1a;视觉测距&#xff08;Maix-II Dock 视觉模块&#x…

VS实⽤调试技巧(附调试例题)

&#x1f381;&#x1f381;创作不易&#xff0c;关注作者不迷路&#x1f380;&#x1f380; VS实⽤调试技巧&#xff08;附调试例题&#xff09; 前言一、什么是bug&#xff1f;二、什么是调试&#xff08;debug&#xff09;&#xff1f;三、Debug和Release四、VS调试快捷键五…