【机器学习】必会降维算法之:奇异值分解(SVD)

奇异值分解(SVD)

  • 1、引言
  • 2、奇异值分解(SVD)
    • 2.1 定义
    • 2.2 应用场景
    • 2.3 核心原理
    • 2.4 算法公式
    • 2.5 代码示例
  • 3、总结

1、引言

一转眼,
小屌丝:鱼哥,就要到每年最开心的节日了:六一儿童节。
小鱼:你有啥想法?
小屌丝:想法没有,玩的地方倒是想
小鱼:拉倒吧, 我可不去
小屌丝:确定?
小鱼:看情况。
小屌丝:嘿嘿, 难得过节日,我们也得放松一下
小鱼:正有此意。
在这里插入图片描述

2、奇异值分解(SVD)

2.1 定义

奇异值分解(SVD)是线性代数中一种重要的矩阵分解方法,它将任意矩阵分解为三个矩阵的乘积形式,即A = UΣV^T, 其中

  • A是待分解的矩阵,
  • U和V是酉矩阵(正交矩阵在复数域的推广),
  • Σ是半正定的对角矩阵,
  • 对角线上的元素称为奇异值。

SVD是特征值分解在任意矩阵上的推广,对于非方阵或非对称矩阵也能进行有效分解。

2.2 应用场景

SVD 有着众多应用场景,以下是一些典型的应用:

  • 数据降维:在PCA中使用SVD来降维,以便可视化和减少特征维度。
  • 推荐系统:在协同过滤中,SVD用于分解用户-物品评分矩阵,识别潜在的用户偏好。
  • 图像压缩:通过分解图像矩阵,保留重要奇异值来实现图像压缩。
  • 噪声去除:通过保留主要的奇异值,再构建原始数据以达到去噪效果。

2.3 核心原理

SVD 的核心原理在于矩阵分解,通过将原始矩阵分解为奇异值和奇异向量的乘积,能够提取出矩阵的关键特征。

特别地,奇异值表示矩阵在不同方向上的投影强度,保留主要的奇异值可以保留大部分重要信息,去除不重要的奇异值能够减少噪声和数据冗余。

2.4 算法公式

对于一个 ( m × n ) ( m \times n ) (m×n) 矩阵 ( A ) ( \mathbf{A} ) (A),奇异值分解的具体数学表示如下:

[ A = U Σ V T ] [ \mathbf{A} = \mathbf{U} \mathbf{\Sigma} \mathbf{V}^T ] [A=VT]

其中,

  • A:待分解的m×n矩阵
  • U:m×m阶酉矩阵,其列向量是AA^T的特征向量
  • Σ:m×n阶对角矩阵,对角线上的元素是A的奇异值,通常按降序排列
  • VT:n×n阶酉矩阵V的共轭转置,其列向量是ATA的特征向量。
    在这里插入图片描述

2.5 代码示例

# -*- coding:utf-8 -*-
# @Time   : 2024-05-30
# @Author : Carl_DJimport numpy as np
import matplotlib.pyplot as plt# 生成一个随机矩阵
np.random.seed(0)
A = np.random.randn(6, 5)# 进行奇异值分解
U, Sigma, VT = np.linalg.svd(A, full_matrices=False)# 重构矩阵
Sigma_matrix = np.diag(Sigma)
A_reconstructed = np.dot(U, np.dot(Sigma_matrix, VT))# 显示原始矩阵和重构矩阵
print("原始矩阵 A:")
print(A)print("\n重构矩阵 A_reconstructed:")
print(A_reconstructed)# 确认重构矩阵与原始矩阵近似相等
assert np.allclose(A, A_reconstructed)# 绘制奇异值
plt.plot(Sigma, 'ro-', linewidth=2)
plt.title('奇异值')
plt.xlabel('索引')
plt.ylabel('值')
plt.show()

代码解析

  • 首先、生成了一个 6x5 的随机矩阵 ( A )。
  • 其次、使用NumPy的 np.linalg.svd 函数计算矩阵的奇异值分解,得到 ( U ) ( \mathbf{U} ) (U) ( Σ ) ( \mathbf{\Sigma} ) (Σ) ( V T ) ( \mathbf{V}^T ) (VT)
  • 第三、重构矩阵 ( A ) 并确认其与原始矩阵近似相等。
  • 最后、绘制奇异值,以便可视化奇异值的分布情况。

在这里插入图片描述

3、总结

奇异值分解(SVD)是一种强大且广泛应用的矩阵分解技术,在数据降维、推荐系统、图像处理等多个领域中发挥着重要作用。

通过对矩阵进行奇异值分解,我们可以提取出数据的关键特征,降低复杂性并提高计算效率。

掌握SVD的基本原理和实现方法,将对各类数据分析和机器学习任务大有裨益。

我是小鱼

  • CSDN 博客专家
  • 阿里云 专家博主
  • 51CTO博客专家
  • 企业认证金牌面试官
  • 多个名企认证&特邀讲师等
  • 名企签约职场面试培训、职场规划师
  • 多个国内主流技术社区的认证专家博主
  • 多款主流产品(阿里云等)评测一等奖获得者

关注小鱼,学习【机器学习】&【深度学习】领域的知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/23307.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

搭建Vulnhub靶机网络问题(获取不到IP)

搭建好靶场后,在攻击机运行arp-scan -l无法发现靶机IP。 这时候去看下靶机网络有没有问题。 重新启动客户机,一直按e进入安全模式(要是直接开机了就先按shift进入grub界面,再按e)找到ro,将ro改为rw signie…

XM平台的交易模式模式是什么?

外汇交易平台的盈利模式主要分为两种:有交易员平台和无交易员平台。 有交易员平台,也称为做市商平台,为客户提供交易市场,并在需要时与客户持相反方向的交易,从中赚取利润。交易者看到的买入卖出价可能与实际价格不同&…

python 巡检报告中的邮件处理

00.创作背景,在每天的巡检报告中要 要检查oa相关服务器的备份作业是否备份成功 那个备份软件有个功能,就是完成备份作业后,可以发送信息到我的邮箱。 01.通过检查我邮箱的信息,就可以了解那个备份作业的情况。 通过解释邮件的名称可以了解备…

Cassandra的基本概念以及对比SQL server中的概念进行理解

Cassandra是一个开源的分布式NoSQL数据库系统,它最初由Facebook开发,并因其高可扩展性、容错性和灵活性而被广泛应用于各种场景中。以下是Cassandra中的一些基本概念,以及与Microsoft SQL Server中的概念进行对比: Cassandra基本…

一分钟学习数据安全—自主管理身份SSI架构

上一篇我们概要介绍了SSI的几个组成部分,包括可验证凭证信任三角、治理框架等,后面的介绍文章我们将分别介绍一下相关的技术。 SSI的堆栈演进到现在,综合整个生态中的关键架构决策,普遍接受的是一个四层模型。 如上图所示&#xf…

如何将多个jtl文件合并到一个,并且生成html报告

项目背景: 使用jmeterjenkins做自动化测试,不同业务写在不同的jmx文件中,现在需要生成一份汇总的报告。 多个脚本,A.jtl,B.jtl,C.jtl,D.jtl..,需要将这些jtl文件生成一个html文件 1.创建汇总文件merged.jtl文件&…

mysql 拼接字段+根据特定值返回特定内容

1、这里,首选实现根据特定值返回特定内容,使用 case case when r.Namedemand then 采购商when r.Namesupplier then 供应商else 未知 end as roleName2、然后使用Group_Concat函数 group_concat((case when r.Namedemand then 采购商when r.Namesu…

Windows Docker手动迁移镜像

1 将镜像保存至本地 # docker save 镜像名称:版本号 > 镜像名称.tar (windows迁移windows使用 迁移到linux会报错archive/ tar : invalid tar header) docker save --outputC:\YOUR_PATH\my_docker_image.tar image_id 例如:docker save --outputD:\moviepilot…

论程序员的职业素养

文章目录 前言一、命名规范1. HTML命名规范2. CSS命名规范3. JavaScript命名规范4. 文件和文件夹命名规范5. 代码案例 二、代码注释规范1. 注释规范2. 案例代码HTMLCSS (styles/main.css)JavaScript (scripts/main.js) 三、代码逻辑规范1.逻辑规范2. 代码案例清晰的函数和模块化…

QT系列教程(8) QT 布局学习

简介 Qt 中的布局有三种方式,水平布局,垂直布局,栅格布局。 通过ui设置布局 我们先创建一个窗口应用程序,程序名叫layout,基类选择QMainWindow。但我们不使用这个mainwindow,我们创建一个Qt应用程序类Log…

使用API有效率地管理Dynadot域名,删除已设置的文件夹

关于Dynadot Dynadot是通过ICANN认证的域名注册商,自2002年成立以来,服务于全球108个国家和地区的客户,为数以万计的客户提供简洁,优惠,安全的域名注册以及管理服务。 Dynadot平台操作教程索引(包括域名邮…

河南省第十四届ICPC大学生程序设计竞赛-C结对编程

题面 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 524288K,其他语言1048576K 64bit IO Format: %lld 题目描述 A公司是一家主营软件开发的公司。公司内有n名员工,编号为1到n的整数,除了1号老板外每名员工…

用友NC downCourseWare 任意文件读取漏洞复现

0x01 产品简介 用友NC是一款企业级ERP软件。作为一种信息化管理工具,用友NC提供了一系列业务管理模块,包括财务会计、采购管理、销售管理、物料管理、生产计划和人力资源管理等,帮助企业实现数字化转型和高效管理。 0x02 漏洞概述 用友NC 系统 /portal/pt/downCourseWare…

PDF格式分析(八十四)——小部件注释(Widget)

小部件注释(PDF1.2及其以上版本),用于表示交互式表单的外观,并管理其与用户的交互。为了方便,当field仅与单个小部件注释相关联时,field词典会与annotation字典合并成一个字典,该字典既有field字典的条目,也有annotation字典的条目。 下表显示Widget注释字典的条目: 条…

【Go】编码结构体转换为json字符串

结构体内字段命名大小写问题导致无法解析到 package mainimport ("encoding/json""fmt" ) // 定义一个结构体 type Music struct {name string json:"名称" // 字段大小写命名问题!!!singer string json:&q…

【踩坑】minidlna一直提示文件权限问题No Accesible

1. media_dir xxx no accessible [Permission denied] 通过sudo apt install minidlna安装的,会自动开启minidlna服务,并且服务启动用户为minidlna,此时如果使用正常路径作为media_dir,会报错:No accessible[Permissi…

Javascript系统学习(三)

前端模块化前端模块化CommonJS、AMD、CMD、ES6_commonjs amd cmd es6模块化-CSDN博客 ES6: <script type"module" src"main.js"></script> //默认导出 export default function(ctx) {... } ----------------------------------- //模块命名…

创新科技,船舶岸电电源助力环保事业

岸电电源&#xff0c;也称为岸用变频电源或电子静止式岸电电源&#xff0c;是一种特别设计制造的大功率变频电源设备。这种设备主要针对船上、岸边码头等高温、高湿、高腐蚀性、大负荷冲击等恶劣使用环境&#xff0c;能够提供稳定的电源供应。它通常用于将岸边的工业用电&#…

【Mysql】mysql 拼接字符

在 MySQL 中&#xff0c;你可以使用 CONCAT() 函数来拼接&#xff08;连接&#xff09;字符串。CONCAT() 函数接受两个或多个字符串参数&#xff0c;并返回连接后的字符串。 示例&#xff1a; SELECT CONCAT(Hello, , World) AS Greeting; 输出&#xff1a; Greeting --…

SpringBoot 请求响应

SpringBoot 请求响应 来源于黑马程序员JavaWeb课程&#xff0c;总结笔记 1.ApiFox Apifox快速入门教程 2.基本参数 简单参数&#xff1a;在向服务器发起请求时&#xff0c;向服务器传递的是一些普通的请求数据。 //RequestController.java import jakarta.servlet.http.Htt…