【什么是范数】L1、L2范数介绍

一、 什么是范数

范数(Norm)是数学中用于衡量向量大小(或距离)的一种概念。在几何和代数中,范数可以提供一个向量长度或大小的量度。更正式地说,范数是一个函数,它将向量的集合映射到非负实数,满足以下性质:

在这里插入图片描述
在数学上,范数包括向量范数和矩阵范数,向量范数表征向量空间中向量的大小,矩阵范数表征矩阵引起变化的大小。一种非严密的解释就是,对应向量范数,向量空间中的向量都是有大小的,这个大小如何度量,就是用范数来度量的,不同的范数都可以来度量这个大小,就好比米和尺都可以来度量远近一样

二、 L1范数——曼哈顿范数(Manhattan Norm)

在这里插入图片描述

表示向量各元素的绝对值之和,它对应于在坐标轴上移动到向量端点所需的最小步伐数。

使用 L1范数可以度量两个向量间的差异,如绝对误差和(Sum of Absolute Difference)
在这里插入图片描述

由于L1范数的天然性质,对L1优化的解是一个稀疏解, 因此L1范数也被叫做稀疏规则算子。 通过L1可以实现特征的稀疏,去掉一些没有信息的特征,例如在对用户的电影爱好做分类的时候,用户有100个特征,可能只有十几个特征是对分类有用的,大部分特征如身高体重等可能都是无用的,利用L1范数就可以过滤掉。

2.1 L1范数的性质

  • 稀疏性:L1范数倾向于产生稀疏解,即解中的许多元素为零。这在某些情况下非常有用,比如在稀疏编码或压缩感知中。
  • 线性:L1范数是一个线性算子,意味着它满足线性性质,即对于任意标量 α和向量 𝑥 和𝑦,有∣∣𝛼𝑥+𝑦∣∣=∣𝛼∣⋅∣∣𝑥∣∣+∣∣𝑦∣∣。
  • 次梯度:L1范数不是处处可微的,因为它在原点处有一个尖角。但是,它具有次梯度(subgradient),这允许在优化问题中使用它,即使它不是处处可微的。

2.2 L1范数的应用

  • 稀疏编码:在机器学习中,L1正则化(Lasso回归)通过惩罚较大的系数来促进特征选择和稀疏解。
  • 压缩感知:在信号处理中,L1范数用于从少量的随机测量中恢复稀疏信号。
  • 优化问题:在许多优化问题中,L1范数被用作正则化项,以防止模型过拟合。

在OpenCV中,cv2.norm() 函数可以用来计算两个点集之间的L1范数距离,通过指定 cv2.NORM_L1 作为参数。这在比较图像或点集时特别有用,尤其是在需要稀疏解的情况下。

三、 L2范数——欧几里得范数(Euclidean Norm)

在这里插入图片描述
表示向量元素的平方和再开平方,这是最直观的向量长度定义,对应于我们通常所说的“长度”。。

距离欧氏距离就是一种L2范数,如小学学过的求坐标轴上P(x,y)与坐标原点o的距离。
像L1范数一样,L2也可以度量两个向量间的差异,如平方差和(Sum of Squared Difference):(或者可以理解为两点之间的距离)
在这里插入图片描述

3.1 L2范数的性质:

在这里插入图片描述

3.2 L2范数的应用:

  • 几何距离:L2范数在几何上表示两点之间的直线距离,因此常用于计算两点之间的距离。
  • 优化问题:在优化问题中,L2范数用作正则化项,有助于控制模型的复杂度,防止过拟合。这种方法被称为L2正则化或Ridge Regression。
  • 机器学习:在机器学习算法中,如线性回归和支持向量机,L2范数用于惩罚模型参数的大值,从而促进模型的平滑性和泛化能力。

在OpenCV中,可以使用cv2.norm()函数计算两个点集之间的L2范数距离,通过指定cv2.NORM_L2作为参数。这在比较图像或点集时特别有用,尤其是在需要考虑真实距离或误差时。

3.3 与L1范数的比较:

  • L1范数(曼哈顿距离)是向量元素绝对值之和,它在几何上表示在坐标轴上移动到向量端点所需的最小步伐数。
  • L2范数与L1范数相比,通常会产生更平滑的解,而L1范数则倾向于产生稀疏解(即解中的许多元素为零)。

四、 L∞范数——最大值范数(Maximum Norm)

在这里插入图片描述
表示向量所有元素绝对值的最大值。

五、 总结

5.1 范数的一般形式:L-P范数

在这里插入图片描述

当 p=2 时,它是欧几里得范数;当 p=1 时,它是曼哈顿范数;当 𝑝→∞时,它是最大值范数。

在实际应用中,选择哪种范数取决于问题的特性和所需的解的性质。例如,L1范数促进稀疏解,而L2范数则倾向于产生平滑解。其他p-范数可能在需要特定平衡时使用。

5.2 L1正则化产生稀疏的权值, L2正则化产生平滑的权值为什么会这样?

在支持向量机学习过程中,L1范数实际是一种对于成本函数求解最优的过程,因此,L1范数正则化通过向成本函数中添加L1范数,使得学习得到的结果满足稀疏化,从而方便提取特征。
L1范数可以使权值稀疏,方便特征提取。 L2范数可以防止过拟合,提升模型的泛化能力。

5.3 L1和L2正则先验分别服从什么分布

L1服从拉普拉斯分布,L2服从高斯分布

六、 参考

https://blog.csdn.net/qq_37466121/article/details/87855185

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/11263.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

社交媒体数据恢复:陌陌

确保你的手机已经进行了备份。备份可以提高数据恢复的成功率。 在电脑上下载并安装数据恢复软件。在使用软件进行恢复之前,请确保你的安卓手机已经在开发者选项中开启了USB调试模式。 使用USB数据线将手机连接至电脑。打开数据恢复软件,选择“陌陌聊天…

毕业论文写作神器:使用Latex写论文 安装texlive+texstudio 并添加IEEE模板

听说Latex写论文方便,更改格式方便,而且颜值高 LexLive2024安装 清华镜像网址:Index of /CTAN/systems/texlive/Images/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 下载完双击打开texlive2024.iso,然后点击 修改路径&#xf…

稻盛和夫《活法》读后感

最近几天又重读了一边稻盛和夫的《活法》,里面的观点让我感触颇多,现分享给诸君。 稻盛和夫毕业后,适逢经济萧条,没有好机会进入大公司深造,只能在一名教授的推荐下进入了一家做陶瓷绝缘体的公司,虽然公司…

Arduino-ILI9341驱动实现TFT屏输出中文四

Arduino-ILI9341驱动实现TFT屏输出中文四 1.概述 ILI9341驱动在TFT屏幕上不支持直接输出汉字,需要借助提取字模软件将汉字转为十六进制地址,然后通过改地址控制每行和每列点阵的亮和灭实现显示汉字功能。 2.ILI9341显示汉字 2.1.PCtoLCD2002取模软件…

面试宝典(2)——缓存篇(Redis)

面试宝典(2)——缓存篇(Redis) 1.Redis的主要用途有哪些? 缓存分布式锁:setnx,redisson消息队列,延迟队列 2.什么是缓存穿透? 查询一个不存在的数据,数据…

C++入门指南(中)

目录 ​编辑 一、C关键字(C98) 二、命名空间 2.1 域 2.2 命名空间域 2.1 命名空间定义 2.2 命名空间使用 三、C输入&输出 四、缺省参数 4.1 缺省参数概念 4.2 缺省参数分类 五、函数重载 5.1 函数重载概念 5.2 C支持函数重载的原理--名字修饰(name Mangling)…

告别黑板粉笔 高新技术进课堂 未来教室会成什么

现在,全国许多院校都经过引进信息化技能,完成智慧校园建造,推进教育均衡展开。一些校园的小学教室的信息化配备投入经费已达50万元/每间,初中是70万元,高中是90万元。这些新技能的投入运用有用的共享教育内容、精准地分…

基于select for update 实现数据库分布式锁

1、select for update 的基本语法 SELECT * FROM table_name WHERE condition FOR UPDATE;2、select for update 的定义及作用 2.1 、select for update的含义是在查询数据的同时对所选的数据行进行锁定,以保证数据的一致性和并发控制。在并发环境下,多…

ES6 笔记02

目录 01 对象的扩展 02 链判断运算符 03 属性名表达式 04 Symbol 类型 05 set集合的使用 06 Map集合的使用 07 Set集合和Map集合的遍历方式 08 iterator迭代器 01 对象的扩展 对象的属性和方法的简洁表示: es6允许在字面量对象里面直接写变量名 let 变量名变量值; let …

金融业开源软件应用 评估规范

金融业开源软件应用 评估规范 1 范围 本文件规定了金融机构在应用开源软件时的评估要求,对开源软件的引入、维护和退出提出了实现 要求、评估方法和判定准则。 本文件适用于金融机构对应用的开源软件进行评估。 2 规范性引用文件 下列文件中的内容通过文中的规范…

WS2811 单线 256 级灰度三通道恒流 LED 驱动器芯片 IC

产品概述 WS2811 是三通道LED驱动控制专用电路,芯片内部包含了智能数字接口数据锁存信号整形放大驱动电路,还包含有高精度的内部振荡器和15V高压可编程定电流输出驱动器。同时,为了降低电源纹波,3个通道有一定的延时导通功…

【数据结构课程学习】:队列学习

🎁个人主页:我们的五年 🔍系列专栏:数据结构课程学习 🌷追光的人,终会万丈光芒 🎉欢迎大家点赞👍评论📝收藏⭐文章 目录 🚗 1.队列的基本概念&#xff1a…

软考高级最容易被挂掉的论文,千万别乱写!

高级考生最没把握的科目应该就是论文了,有些考生考了几次都败在论文上了。那么导致论文不合格的写作误区有哪些?最后十多天,该如何准备呢? 常见写作误区 误区一:偏题 在论文写作时不能偏题,要紧扣子题干…

Visual Studio构建NodeJS原生代码在Electron中的报错问题

文章目录 对比NODE-GYP工具解决问题进一步研究win_delay_load_hook.cc代码MAC中是不需要这个东西的这个标题有点长,相对是一个比较具体的场景,但是这个问题在我自己的实际开发中,确实困扰了我一段时间。 因为在windows下做设备驱动,上位机的开发中。Visual Studio是一个比较…

要想通过等保测评,这7个问题你必须了解

1.什么是等级保护测评? 2.为什么要做等级保护测评? 3.等保1.0与2.0的区别在哪里? 4.等级保护测评参考标准有哪些? 5.等级保护测评的级别有哪些以及哪些系统需要? 6.等保测评的主要内容是什么? 7.等级…

如何利用代理IP高效采集全球热点,赋能短视频创作?

如何利用代理IP高效采集全球热点,赋能短视频创作? 一、摘要二、代理IP1. 什么是代理IP?2. 代理IP的分类3. 代理的重要性 三、如何选择可靠的代理IP服务商?四、IPIDEA代理IP简介1.IPIDEA简介2.IPIDEA的优势 五、获取代理IP1. 注册平…

python随机显示四级词汇

python实现一个浮动窗口随机显示四级单词在桌面跑来跑去 实现一个浮动窗体随机显示四级单词在windows桌面置顶移动 tkinter库来创建窗口和显示单词,以及random库来随机选择单词。 使用after方法来定时更新窗口的位置,实现单词窗口的慢慢移动效果 使用…

有机硅改性氟树脂性能进一步提升 市场需求增长空间大

有机硅改性氟树脂性能进一步提升 市场需求增长空间大 有机硅改性氟树脂,利用有机硅树脂对氟树脂进行改性得到一种新型的、性能更为优异的树脂材料。 有机硅树脂,具有柔韧性好、电绝缘、憎水、耐候、耐老化等优点,但固化温度高且时间长、附着力…

使用Apache Spark从MySQL到Kafka再到HDFS的数据转移

使用Apache Spark从MySQL到Kafka再到HDFS的数据转移 在本文中,将介绍如何构建一个实时数据pipeline,从MySQL数据库读取数据,通过Kafka传输数据,最终将数据存储到HDFS中。我们将使用Apache Spark的结构化流处理和流处理功能&#…

MySQL中表的插入,修改,删除语法

插入 插入数据有四种方法,代码如下 -- 给表中添加元素 -- insert into 表名 (列名) values(数据)INSERT INTO student(NAME,gender,birthday,phone)VALUES(张三,男,2003-2-10,13333333333) INSERT INTO student(NAME,gender,birthday,phone,address,height,rig_time) VALUES(…