线性代数|机器学习-P9向量和矩阵范数

文章目录

  • 1. 向量范数
  • 2. 对称矩阵S的v范数
  • 3. 最小二乘法
  • 4. 矩阵范数

1. 向量范数

范数存在的意义是为了实现比较距离,比如,在一维实数集合中,我们随便取两个点4和9,我们知道9比4大,但是到了二维实数空间中,取两点A(1,0),B(3,4),这时候我们就没办法比较它们之间的大小了,因为它们不是可以比较的实数,于是我们引入了范数这个概念,把我们的A,B两个点变成 ∣ ∣ A ∣ ∣ = 0 2 + 1 2 = 1 , ∣ ∣ B ∣ ∣ = 3 2 + 4 2 = 5 ||A||=\sqrt{0^2+1^2}=1,||B||=\sqrt{3^2+4^2}=5 ∣∣A∣∣=02+12 =1,∣∣B∣∣=32+42 =5,这样我们就可以比较这两个点了,范数它其实是一个函数,它把不能比较的向量转换成可以比较的实数

  • 向量的0-范数:非0元素个数
    ∣ ∣ X ∣ ∣ 1 = ∑ i = 1 n ∣ x i ∣ 0 \begin{equation} ||X||_1=\sum_{i=1}^n|x_i|^0 \end{equation} ∣∣X1=i=1nxi0

  • 向量的1-范数:各元素的绝对值之和
    ∣ ∣ X ∣ ∣ 1 = ∑ i = 1 n ∣ x i ∣ \begin{equation} ||X||_1=\sum_{i=1}^n|x_i| \end{equation} ∣∣X1=i=1nxi

  • 向量的2-范数:解决机器学习中的过拟合问题
    ∣ ∣ X ∣ ∣ 2 = ( ∑ i = 1 n x i 2 ) 1 2 \begin{equation} ||X||_2=(\sum_{i=1}^nx_i^2)^{\frac{1}{2}} \end{equation} ∣∣X2=(i=1nxi2)21

  • 向量的p-范数: 每个元素p次方和再p次方跟
    ∣ ∣ X ∣ ∣ p = ( ∑ i = 1 n x i p ) 1 p , p ≥ 1 \begin{equation} ||X||_p=(\sum_{i=1}^nx_i^p)^{\frac{1}{p}},p\geq 1 \end{equation} ∣∣Xp=(i=1nxip)p1,p1

  • 向量的 + ∞ + \infty +-范数: 所有向量元素绝对值中的最大值
    ∣ ∣ X ∣ ∣ + ∞ = max ⁡ i ∣ x i ∣ \begin{equation} ||X||_{+ \infty}=\max \limits_{i}|x_i| \end{equation} ∣∣X+=imaxxi

  • 向量的 − ∞ - \infty -范数: 所有向量元素绝对值中的最小值
    ∣ ∣ X ∣ ∣ − ∞ = min ⁡ i ∣ x i ∣ \begin{equation} ||X||_{- \infty}=\min \limits_{i}|x_i| \end{equation} ∣∣X=iminxi

  • 我们假设在二维平面上,我们就三个范数进行图形形象表达:
    在这里插入图片描述
    在这里插入图片描述

  • 小结,随着范数越大,图形由原来的菱形膨胀到了正方形,这个正方形就是极限了。这个思路真神奇!!!

2. 对称矩阵S的v范数

假设我们有一个矩阵S和一个列向量v,可得到如下方程
∣ ∣ v ∣ ∣ S = v T S v \begin{equation} ||v||_S=\sqrt{v^TSv} \end{equation} ∣∣vS=vTSv

  • ∣ ∣ v ∣ ∣ S ≤ 1 ||v||_S\leq1 ∣∣vS1,当矩阵S是单位矩阵的时候,那么我们就得到了 L 2 L_2 L2二范数,得到椭圆方程
    S = [ 2 0 0 3 ] , v = [ x y ] → [ x y ] [ 2 0 0 3 ] [ x y ] = 1 → x 2 1 2 + y 2 1 3 = 1 \begin{equation} S=\begin{bmatrix}2&0\\\\0&3\end{bmatrix},v=\begin{bmatrix}x\\\\y\end{bmatrix}\rightarrow \begin{bmatrix}x&y\end{bmatrix}\begin{bmatrix}2&0\\\\0&3\end{bmatrix}\begin{bmatrix}x\\\\y\end{bmatrix}=1\rightarrow \frac{x^2}{\frac{1}{2}}+\frac{y^2}{\frac{1}{3}}=1 \end{equation} S= 2003 ,v= xy [xy] 2003 xy =121x2+31y2=1

3. 最小二乘法

我们知道在我们得到很多点的情况下,需要拟合直线能更好的拟合所有点。
y = arg ⁡ m i n ( A x − b ) 2 \begin{equation} y=\arg \limits_{min}(Ax-b)^2 \end{equation} y=minarg(Axb)2

  • 我们定义需要拟合的直线方程如下:
    c 1 x + c 2 y = b \begin{equation} c_1x+c_2y=b \end{equation} c1x+c2y=b
  • 那么这个直线的最小二乘值为: z = x 2 + y 2 z=x^2+y^2 z=x2+y2,那么最小二乘的意义就是要在直线上找到一点,使得这个点距离原点的距离最短,那么我们就以原点作为中心画圆,当圆与直线相切的时候,这个距离就是最短的,就是我们要找的点。这个点满足L2范数最小;当我们用一个以原点为中心不断扩大菱形的时候,我们发现,目前以y轴上的与直线的交点为最先相交的点,这个就是L1范数最小值。如图所示
  • 在这里插入图片描述

4. 矩阵范数

具体定义请看如下链接:引用别人的笔记-矩阵范数
1-范数:列和范数,即所有矩阵列向量绝对值之和的最大值
2-范数:谱范数,即A’A矩阵的最大特征值的开平方
无穷范数:行和范数,即所有矩阵行向量绝对值之和的最大值
F-范数:Frobenius范数,即矩阵元素绝对值的平方和再开平方
核范数:矩阵A的奇异值之和,貌似很重要,但不太会,后续研究吧

  • 矩阵2范数
    ∣ ∣ A ∣ ∣ 2 = max ⁡ ∣ ∣ A x ∣ ∣ 2 ∣ ∣ x ∣ ∣ 2 , \begin{equation} ||A||_2=\max\frac{||Ax||_2}{||x||_2}, \end{equation} ∣∣A2=max∣∣x2∣∣Ax2,
  • 代入可得 A v = σ u Av=\sigma u Av=σu
    ∣ ∣ A ∣ ∣ 2 = max ⁡ ∣ ∣ A v ∣ ∣ 2 ∣ ∣ v ∣ ∣ 2 = max ⁡ ∣ ∣ σ u ∣ ∣ 2 ∣ ∣ v ∣ ∣ 2 = max ⁡ ∣ ∣ σ u ∣ ∣ \begin{equation} ||A||_2=\max\frac{||Av||_2}{||v||_2}=\max\frac{||\sigma u||_2}{||v||_2}=\max ||\sigma u|| \end{equation} ∣∣A2=max∣∣v2∣∣Av2=max∣∣v2∣∣σu2=max∣∣σu∣∣
  • 以前证明过向量乘以正交矩阵后范数大小不变, ∣ ∣ σ u ∣ ∣ = ∣ ∣ σ ∣ ∣ ||\sigma u||=||\sigma|| ∣∣σu∣∣=∣∣σ∣∣,最大的 σ \sigma σ σ 1 \sigma_1 σ1
    ∣ ∣ A ∣ ∣ 2 = max ⁡ ∣ ∣ A v ∣ ∣ 2 ∣ ∣ v ∣ ∣ 2 = max ⁡ ∣ ∣ σ u ∣ ∣ 2 ∣ ∣ v ∣ ∣ 2 = max ⁡ ∣ ∣ σ u ∣ ∣ = σ 1 \begin{equation} ||A||_2=\max\frac{||Av||_2}{||v||_2}=\max\frac{||\sigma u||_2}{||v||_2}=\max ||\sigma u||=\sigma_1 \end{equation} ∣∣A2=max∣∣v2∣∣Av2=max∣∣v2∣∣σu2=max∣∣σu∣∣=σ1
  • 综上所述可得:
    ∣ ∣ A ∣ ∣ 2 = max ⁡ ∣ ∣ A x ∣ ∣ 2 ∣ ∣ x ∣ ∣ 2 = σ 1 \begin{equation} ||A||_2=\max\frac{||Ax||_2}{||x||_2}=\sigma_1 \end{equation} ∣∣A2=max∣∣x2∣∣Ax2=σ1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/26120.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# Maui 报错:程序“[15748] MauiApp1.exe”已退出,返回值为 2147942405 (0x80070005)

“MauiApp1.exe”(CoreCLR: DefaultDomain): 已加载“C:\Program Files\dotnet\shared\ Microsoft.NETCore.App\8.0.6\System.Private.CoreLib.dll”。 “MauiApp1.exe”(CoreCLR: clrhost): 已加载“E:\cDemo\MauiApp1\MauiApp1\bin\Debug\net8.0-windows10.0.19041.0\win10-x…

LCD屏的价格和显示区的尺寸有关

LCD屏的价格和显示区的尺寸有关,和外尺寸无关。 下面通过12864点阵屏,对不同尺寸的屏,进行价格比较,就可以发现:LCD屏的价格和显示区的尺寸有关; 同点阵的屏,显示区域太小,显示12*1…

Python基础速成

文件操作 文件读取 with open语法 文件写入 注意事项 文件追加 异常、模块与包 捕获异常 捕获方法 捕获传递 模块的导入与自定义 定义 导入方式 自定义 测试模块 注意事项 python包 定义 操作 第三方包 定义 pip指令安装包

FlashSequence: SORA视频生成长序列任务训练解决方案

作者:黄奕桐、沈雯婷、艾宝乐、王昂、九丰 摘要 我们提出了长序列训练方案 FlashSequence 并集成在 PAI-TorchAcc (阿里云机器学习平台开发的Pytorch上的大模型训练加速框架)中,该方案能够支持SORA类超长序列模型的高效训练。在…

CAS Server Restful接口实现后台认证

背景 对于一些比较复杂定制化登录页的情况下,之前提到过可以自定义修改使用CAS Server提供的登录页这种操作已经明显跟不上复杂定制场景了,所以CAS Server也提供了支持Restful接口,支持服务端后台登陆,对于复杂登陆场景时&#x…

无忧易售ERP - 助力您的沃尔玛平台刊登之旅

在跨境电商的广阔天地里,沃尔玛平台以其庞大的流量与高质量的顾客群体吸引了无数卖家的目光。但要想在这片蓝海中乘风破浪,高效、精准的产品刊登策略是关键。今天,我们将借助强大的无忧易售ERP系统,为您带来一站式沃尔玛平台产品刊…

何为屎山代码?

在编程界,有一种代码被称为"屎山代码"。这并非指某种编程语言或方法,而是对那些庞大而复杂的项目的一种形象称呼。屎山代码,也被称为"祖传代码",是历史遗留问题,是前人留给我们的"宝藏"…

【Go语言精进之路】构建高效Go程序:了解map实现原理并高效使用

🔥 个人主页:空白诗 🔥 热门专栏:【Go语言精进之路】 文章目录 引言一、什么是map1.1 map的基本概念与特性1.2 map的初始化与零值问题1.3 map作为引用类型的行为 二、map的基本操作2.1 插入数据2.2 获取数据个数2.3 查找和数据读取…

前端开发部署:Visual Studio Code + vue

〇 说明 本教程全部采用默认安装路径,因为在进行自定义路径安装的时候,需要配置各种环境变量,在这个配置过程中,可能出现各种很混乱的问题。 一 安装Node.js 1 下载https://nodejs.org/en 2 按照默认NEXT执行 C:\Program Files…

文件传输系统主要用于哪些场景?要如何选型?

文件传输系统是一种用于在不同设备、网络或地理位置之间传输文件的产品解决方案,在各行各业中的应用还是很广泛的。 文件传输系统可以应用于多种场景,主要包括: 1、企业内部文件共享:在公司内部不同部门或团队之间共享文件&#…

9、编写业务逻辑

9、编写业务逻辑 9.1 编写博客接口(新增和查询一起编写了) 响应实体:(随便封装的,可以根据自己的想法封装) // entity/Response package com.example.fullstackblogback.commen;import lombok.Data;import java.util.List;@Data public class Response<T> {pri…

[经验] 梦见自己游泳是什么意思 周公解梦 #职场发展#微信#媒体

梦见自己游泳是什么意思 周公解梦 1、梦见自己游泳 梦见自己游泳是一种非常常见的梦境&#xff0c;而这个梦境通常代表着我们内心深处的渴望和憧憬。 游泳是一项需要技巧和勇气的运动&#xff0c;它需要我们在水中保持平衡和控制自己的呼吸。因此&#xff0c;梦见自己游泳通常…

代码随想录算法训练营第三十五天| 1005.K次取反后最大化的数组和、134. 加油站、135. 分发糖果

LeetCode 1005.K次取反后最大化的数组和 题目链接&#xff1a;https://leetcode.cn/problems/maximize-sum-of-array-after-k-negations/description/ 文章链接&#xff1a;https://programmercarl.com/1005.K%E6%AC%A1%E5%8F%96%E5%8F%8D%E5%90%8E%E6%9C%80%E5%A4%A7%E5%8C%9…

idea开发工具清除Git凭证(含Git凭证管理策略)

前言 网上很多人出现这个问题&#xff0c;也有很多文章或博客来说明这个问题&#xff0c;但是几乎都没有说到点子上&#xff0c;全网几乎都说清除credential.helper配置或者清空windows凭证管理器&#xff0c;还有一些文章说清除IDEA缓存&#xff0c;其实都是不对的。 creden…

黑龙江三级等保测评内容与等级划分

一、黑龙江等保三级测评内容 黑龙江等保三个层次&#xff0c;也就是三个级别的信息安全防护&#xff0c;这是我们国家的一项基础性的信息安全体系。在此基础上&#xff0c;提出了一种适用于非银行机构的最高级别的保障制度&#xff0c;即当该制度遭到破坏时&#xff0c;可能给…

Bankless:为什么 AI 需要 Crypto 的技术?

原文标题&#xff1a;《Why AI Needs Crypto’s Values》 撰文&#xff1a;Arjun Chand&#xff0c;Bankless 编译&#xff1a;Chris&#xff0c;Techub News 原文来自香港Web3媒体&#xff1a;Techub News 人工智能革命的梦想一直是一把双刃剑。 释放人工智能的潜力可以解…

springboot3一些听课笔记

文章目录 一、错误处理机制1.1 默认1.2 自定义 二、嵌入式容器 一、错误处理机制 1.1 默认 错误处理的自动配置都在ErrorMvcAutoConfiguration中&#xff0c;两大核心机制&#xff1a; ● 1. SpringBoot 会自适应处理错误&#xff0c;响应页面或JSON数据 ● 2. SpringMVC的错…

深入解析ETL与ELT架构:数据集成技术的演进与发展

摘要&#xff1a;随着大数据时代的到来&#xff0c;数据集成成为企业信息化建设的重要环节。本文将深入探讨ETL与ELT两种架构&#xff0c;分析它们在数据处理、性能、可扩展性等方面的差异&#xff0c;为企业数据集成提供技术指导。 一、引言 在大数据时代&#xff0c;企业需要…

13- 函数的定义与使用+形参实参区分

13- 函数的定义与使用形参实参区分 文章目录 13- 函数的定义与使用形参实参区分一、函数的定义与使用1.1 函数的结构1. 函数头2. 函数体 1.2 示例代码例子 1&#xff1a;无参数和无返回值的函数例子 2&#xff1a;带参数和返回值的函数 1.3 函数的基本语法1.4 函数的使用示例例…

Faster-RCNN基本思想和网络结构

简单来说&#xff0c;Faster RCNN RPN Fast RCNN RPN 是指 Region Proposal Network&#xff0c;建议区域生成网络。 Faster RCNN 中用 RPN 来代替了 Fast RCNN 中的SS算法。 算法流程&#xff1a; &#xff08;1&#xff09;将图像输入CNN网络得到相应的特征图。 &#x…