吉洪诺夫正则化随笔

前言

前几天在回顾压缩感知中的特征选择与LASSO回归发现了这个Tikhonov regularization,查了一下叫个如题的名字。先来浅说一下正则化这玩意:正则化(Regularization)是一种用来防止模型过拟合(Overfitting)的技术。过拟合指的是模型在训练数据上表现得过于完美,但是当遇到新的、未见过的数据时,模型的表现却大幅下降,即模型的泛化能力较差。这通常发生在模型过于复杂,以至于它开始捕捉训练数据中的噪声和随机波动,而不是数据背后的真实规律。
正则化通过在损失函数(Loss Function)中添加一个惩罚项(Penalty Term)来实现,这个惩罚项与模型的复杂度相关。模型越复杂,惩罚项的值就越大,从而使得损失函数的总值也越大。在训练过程中,模型会尝试同时最小化原始损失函数(如均方误差、交叉熵等)和正则化项,以达到一个平衡点。这样,正则化就鼓励模型在拟合训练数据的同时,保持较低的复杂度,从而提高模型的泛化能力。
常见的正则化方法包括:
1、L1正则化(LASSO回归):通过在损失函数中添加模型权重的绝对值之和作为惩罚项,来鼓励模型产生稀疏的权重,即许多权重变为零。这有助于降低模型的复杂度,因为它实际上移除了对最终预测没有贡献的特征。
2、L2正则化(岭回归):通过在损失函数中添加模型权重的平方和作为惩罚项,来防止权重变得过大。这有助于减少模型的复杂度,因为它限制了权重的大小,使得模型在拟合数据时更加平滑,不易受到极端数据点的影响。
3、Dropout:在神经网络中,Dropout通过在训练过程中随机丢弃(即将输出设置为零)一部分神经元来工作。这可以被视为一种集成方法,因为它训练了多个网络(每个都丢弃了不同的神经元),然后在测试时使用这些网络的平均输出来做预测。Dropout有效地减少了神经网络对特定神经元或连接的依赖,从而提高了模型的泛化能力。
4、早停法(Early Stopping):虽然不是直接对模型参数进行正则化,但早停法通过监控模型在验证集上的性能,并在性能开始下降时停止训练,来防止过拟合。这可以看作是一种对训练过程的正则化。
5、弹性网络:前两种的结合。

吉洪诺夫正则化

接下来的内容就是别人的内容了,我先介绍完再做补充吧。吉洪诺夫正则化,说实话这篇文章是我搜集到的关于此内容写的比较详细的了,尤其是文中的公式推导方面。
下面说一下它的结果:
公式推导

正则化的部分就是加了吉洪诺夫矩阵 Γ \Gamma Γ乘以变量 x x x,如果没有这项的话,令导数为 0 0 0所得的结果: x = ( C T C ) − 1 C T y x=(C^{T}C)^{-1}C^{T}y x=(CTC)1CTy,也就是用 ( C T C + Γ T Γ ) − 1 (C^{T}C+\Gamma ^{T}\Gamma)^{-1} (CTC+ΓTΓ)1代替了 ( C T C ) (C^{T}C) (CTC)
Tikhonov 正则化的本质是通过对非满秩的矩阵 C C C的协方差矩阵 C T C C^{T}C CTC加入吉洪诺夫矩阵的协方差矩阵,使得奇异的协方差矩阵 C T C C^{T}C CTC求逆变为非奇异矩阵 ( C T C + Γ T Γ ) − 1 (C^{T}C+\Gamma^{T}\Gamma)^{-1} (CTC+ΓTΓ)1的求逆,从而大大改善求解非满秩矩阵 y = C x y =Cx y=Cx的数值稳定性,增加的项对其施加一个惩罚,其得到的解比仅优化 C T C C^{T}C CTC更切合实际。
如果这个吉洪诺夫矩阵是单位矩阵的倍数,这样说不太恰当,就是等于 λ I \lambda I λI的时候,此时退化为二范数惩罚项。
对于图片中注释的矩阵求导部分,在B站上找到了相关讲解的视频:(在例题中提到)。
矩阵求导

参考

除了上边提到的两个,还有以下几个:
博客园吉洪诺夫正则化
腾讯云吉洪诺夫正则化更详细一点

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/41677.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

孙溟㠭篆刻《睡片原谅一切,醒来不问过往》

孙溟㠭篆刻《睡片原谅一切,醒来不问过往》 佛陀言:睡前原谅一切,醒来不问过往,珍惜所有不期而遇,看淡所有不辞而别甲辰夏溟㠭于寒舍小窗下刊。

相关向量机RVM算法介绍继承sklearn-SVM-API实现回归预测算例

一、相关向量机RVM与支持向量机SVM对比 1、相关向量机(RVM) ①定义与原理 相关向量机(Relevance Vector Machine, RVM)是一种基于概率模型的机器学习算法,主要用于分类和回归分析。基于稀疏贝叶斯学习框架&#xff…

Springboot助农农产品销售系统-计算机毕业设计源码16718

摘要 SpringBoot助农农产品销售系统旨在通过利用SpringBoot框架开发一个便捷高效的农产品销售平台。该系统包括用户注册登录、商品浏览、购物车管理、订单生成、支付功能等模块。通过整合支付接口、地图定位、推荐系统等技术,提供给用户更好的购物体验。本文介绍了…

Docker安装遇到问题:curl: (7) Failed to connect to download.docker.com port 443: 拒绝连接

问题描述 首先,完全按照Docker官方文档进行安装: Install Docker Engine on Ubuntu | Docker Docs 在第1步:Set up Dockers apt repository,执行如下指令: sudo curl -fsSL https://download.docker.com/linux/ubu…

人工智能开发中的数据隐私

人工智能开发中的数据隐私对于建立用户信任和遵守严格法规至关重要。保护敏感信息可确保合乎道德的人工智能使用并防止有害的数据泄露。 为什么在人工智能开发中优先考虑数据隐私至关重要 人工智能的迅猛发展开启了一个前所未有的技术进步时代,彻底改变了各行各业&…

使用Python绘制双向条形图

使用Python绘制双向条形图 双向条形图效果代码 双向条形图 双向条形图用于比较两个类别的数值分布,条形在中轴线两侧对称排列。这种图表常用于显示两个变量的对比情况,例如男女不同年龄段人口数量对比。 效果 代码 import matplotlib.pyplot as plt i…

Shopee(虾皮)怎么获取流量?

店铺流量的高低会直接关联到卖家店铺单量,也关系到一个店铺的营业情况和利润,那么Shopee的流量从哪里来呢? Shopee的平台流量可分为五个部分: 1.自然流量 2.关键字广告流量 3.平台活动流量 4.营销流量 5.粉丝流量 怎么提升…

【C语言小知识】getchar与putchar

getchar与putchar getchar介绍putchar介绍总结 在学习c语言阶段存在着许多要求输入数值的例子,在输入字符时,如果使用scanf()和printf()根据%c转换说明读写字符,接下来介绍一堆字符输入/输出函数:getchar()和putchar()。 getchar…

Andriod安装termux并换源

问题汇总 Error: The repository ‘https://mirrors.tuna.tsinghua.edu.cn/termux/termux-package-24 stable Release’ does not have a Release file. 更换源(这里使用的是清华大学源) 打开文件 nano $PREFIX/etc/apt/sources.list手动修改 deb htt…

ssm“落雪”动漫网站-计算机毕业设计源码81664

目 录 摘要 1 绪论 1.1 研究背景 1.2 研究意义 1.3论文结构与章节安排 2系统分析 2.1 可行性分析 2.2 系统流程分析 2.2.1 数据新增流程 3.2.2 数据删除流程 2.3 系统功能分析 2.3.1 功能性分析 2.3.2 非功能性分析 2.4 系统用例分析 2.5本章小结 3 系统总体设…

Golang | Leetcode Golang题解之第217题存在重复元素

题目: 题解: func containsDuplicate(nums []int) bool {set : map[int]struct{}{}for _, v : range nums {if _, has : set[v]; has {return true}set[v] struct{}{}}return false }

温州网站建设方案及报价

随着互联网的发展,网站建设已经成为企业推广和营销的重要手段。温州作为中国经济发达地区之一,各行各业企业纷纷意识到网站建设的重要性,纷纷加大网站建设工作的投入。那么,温州网站建设方案及报价是怎样的呢?下面我们…

Python | Leetcode Python题解之第218题天际线问题

题目: 题解: class Solution:def getSkyline(self, buildings: List[List[int]]) -> List[List[int]]:buildings.sort(keylambda bu:(bu[0],-bu[2],bu[1]))buildings.append([inf,inf,inf])heap [[-inf,-inf,-inf]]ans []for l,r,h in buildings:i…

开发必备基础知识【字符编码合集】

开发必备基础知识【字符编码合集】 大家在日常开发交流中会发现,别人那里运行的好好的文件,在你电脑上却无法编译,甚至出现一堆莫名其妙的字符,比如:��� 程序中经常遇到一些关于乱码…

探索人工智能在电子商务平台与游戏发行商竞争中几种应用方式

过去 12 年来,电脑和视频游戏的发行策略发生了巨大变化。数字游戏的销量首次超过实体游戏的销量 在20132020 年的封锁进一步加速了这一趋势。例如,在意大利,封锁的第一周导致数字游戏下载量 暴涨174.9%. 展望未来,市场有望继续增…

着急,为啥AI叫好不叫座啊?

关注卢松松,会经常给你分享一些我的经验和观点。 李彦宏在2024世界人工智能大会上说: 没有应用,光有基础模型,不管是开源还是闭源都一文不值,所以我从去年下半年开始讲,大家不要卷模型了,要去…

数学不好能搞人工智能吗?

很遗憾,不能。 人工智能(AI)实际上是一个将数学、算法理论和工程实践紧密结合的领域。AI 扒开来看就是算法,也就是数学、概率论、统计学、各种数学理论的体现。 新的时代,程序员想要跨入 AI 之门,只要稍微…

13 - Python网络编程入门

网络编程入门 计算机网络基础 计算机网络是独立自主的计算机互联而成的系统的总称,组建计算机网络最主要的目的是实现多台计算机之间的通信和资源共享。今天计算机网络中的设备和计算机网络的用户已经多得不可计数,而计算机网络也可以称得上是一个“复…

VSCode打开其它IDE项目注释显示乱码的解决方法

问题描述:VSCode打开Visual Studio(或其它IDE)工程,注释乱码,如下图所示: 解决方法:点击VSCode右下角的UTF-8,根据提示点击“通过编码重新打开”,再选择GB2312&#xff0…

R语言数据分析案例42-基于时间序列模型对股票预测分析和研究

一、研究背景和意义 随着全球经济的不断发展和数字化转型的加速推进,科技公司在全球市场中扮演着日益重要的角色。其中,中国的阿里巴巴集团作为全球最大的电子商务公司之一,其业务范围覆盖电子商务、云计算、金融科技等多个领域。由于其在中…