机器学习-面经(part3)

机器学习-面经(part3)

news/2025/10/26 14:25:55/文章来源:https://blog.csdn.net/qq_40102160/article/details/136422480

5. 正则化

5.0 手推L1,L2

5.1 什么是正则化，如何理解

定义: 在损失函数后加上一个正则化项（惩罚项），其实就是常说的结构风险最小化策略，即损失函数加上正则化。一般模型越复杂，正则化值越大。

正则化项是用来对模型中某些参数进行约束，正则化的一般形式如下：

第一项是损失函数（经验风险），第二项是正则化项

公式可以看出，加上惩罚项后损失函数的值会增大，要想损失函数最小，惩罚项的值要尽可能的小，模型参数就要尽可能的小，这样就能减小模型参数，使得模型更加简单。

5.3 L0 L1 L2正则化

L0范数是指向量中非0的元素的个数。如果我们用L0范数来规则化一个参数矩阵W的话，就是希望W的大部分元素都是0。L0范数不连续，不可求导，很难优化求解（NP难问题）

L1范数是指向量中各个元素绝对值之和。L1范数是L0范数的最优凸近似，而且它比L0范数要容易优化求解。

L2范数是指向量各元素的平方和然后求平方根。我们让L2范数的规则项 ||w||2 最小，可以使得W的每个元素都很小，都接近于0，但与L1范数不同，它不会让它等于0，而是接近于0。

5.3 L1 L2正则化的区别

稀疏性：L1>L2。L1会趋向于产生少量的特征，而其他的特征都是0，而L2会选择更多的特征，这些特征都会接近于0。Lasso在特征选择时候非常有用，而Ridge就只是一种规则化而已。

鲁棒性：L1>L2。鲁棒性定义为对数据集中异常值的容忍力。L1 范数比L2范数更鲁棒，原因相当明显：从定义中可以看到，L2范数取平方值，因此它以指数方式增加异常值的影响；L1范数只取绝对值，因此它会线性地考虑它们。

解的数量：L1多个，L2一个。

5.4 L1在0处不可导是怎么处理的

坐标轴下降法是沿着坐标轴的方向，Eg: lasso回归的损失函数是不可导的
近端梯度下降(Proximal Algorithms)
交替方向乘子法(ADMM)

5.5 L1正则化产生稀疏性的原因，以及稀疏矩阵

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/719086.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

固件和内核驱动

固件和内核驱动

驱动折腾小记很多人更新了内核，但是自己的外设依然没有驱动，是因为仅仅更新内核是不够的，还需要更新固件。什么是固件？ 在许多设备能够与操作系统通信之前，它们必须首先使用设备制造商提供的“固件”进行初始化。…

阅读更多...

实施工程师常遇技术问题

实施工程师常遇技术问题

文章目录一、对与一个项目，你认为项目的里程碑有哪几个？二、Tomcat服务器与Resin服务器的区别2.1、开发商和许可证：2.2、部署和配置：2.3、功能和扩展性：2.4、社区和生态系统： 三、版本控制工具SVN与Git的区…

阅读更多...

升级openssl

升级openssl

openssl版本一键升级（需要修改tar包名称和路径） --- - name: Install OpenSSLhosts: openssltasks:- name: Copy OpenSSL tar.gz to /tmpcopy:src: /root/shl/soft/openssl-1.1.1v.tar.gzdest: /tmp # remote_src: yes # 如果源文件在控制主机上…

阅读更多...

吴恩达《机器学习》学习笔记

吴恩达《机器学习》学习笔记

本笔记资料来源于 http://www.ai-start.com/ml2014/，该笔记来自于https://blog.csdn.net/dadapongi6/article/details/105668394，看了忘，忘了看，再看一遍。时间统计：2024.2.29 5个番茄钟，从week1开始&…

阅读更多...

【PyTorch][chapter 19][李宏毅深度学习]【无监督学习][ GAN]【理论】

【PyTorch][chapter 19][李宏毅深度学习]【无监督学习][ GAN]【理论】

前言： 生成对抗网络（Generative Adversarial Nets，GAN）是一种基于对抗学习的深度生成模型。 2014年，蒙特利尔博士 lan Goodfellow 发表了论文《Generative Adaversarial Networks》， 一经提出便成为了学术…

阅读更多...

Python CGI编程

Python CGI编程

文章目录什么是CGICGI架构Web服务器支持及配置CGI程序示例CGI环境变量GET和POST方法GET方法POST方法区别注意事项使用POST方法传递数据1. 创建HTML表单2. 编写CGI脚本3. 配置服务器4. 提交表单5. 服务器处理请求注意事项通过CGI程序传递checkbox数据创建HTML表单编写CGI脚本…

阅读更多...

二维码门楼牌管理系统技术服务：门牌编设规则详解

二维码门楼牌管理系统技术服务：门牌编设规则详解

文章目录前言一、门牌编设规则解读二、区间编号与分段编号策略三、多出入口建筑物的门牌编设前言随着城市化的快速推进，门楼牌管理成为城市管理中不可或缺的一环。二维码门楼牌管理系统的引入，不仅提升了管理的效率，也为市民提供了更为便…

阅读更多...

波奇学Liunx:信号的产生，保存，处理

波奇学Liunx:信号的产生，保存，处理

信号的产生，信号的保存，信号的处理在操作系统中进程接受到信号会保存，产生进程必须识别和能够处理信号，处理信号是进程的内置功能进程收到信号时不一定会立即执行，所以进程必然有一套识别，保存&#xff…

阅读更多...

Leetcode 3066. Minimum Operations to Exceed Threshold Value II

Leetcode 3066. Minimum Operations to Exceed Threshold Value II

Leetcode 3066. Minimum Operations to Exceed Threshold Value II 1. 解题思路2. 代码实现题目链接：Leetcode 3066. Minimum Operations to Exceed Threshold Value II 1. 解题思路这一题的话只需要排序之后按照题目条件逐一进行执行直至满足条件即可。唯一…

阅读更多...

Pytorch中，dim形象化的确切意义是什么？

Pytorch中，dim形象化的确切意义是什么？

在Pytorch中涉及张量的操作都会涉及“dim”的设置，虽然也理解个大差不差，但是偶尔还是有点犯迷糊，究其原因还是没有形象化的理解。首先，张量的维度排序是有固定顺序的，0，1，2，.....…

阅读更多...

（1）预处理

（1）预处理

我们需要的文件结构如上 main.cpp add.h add.cpp add.h 这里使用riscv的工具链编译为.i文件，需要使用-E，就是只进行预处理，我们可以得到两个.i文件即main.i和add.i main.i 这里看到main.i里头文件全部替换，然后多了三万多行所以…

阅读更多...

Leetcode 3068. Find the Maximum Sum of Node Values

Leetcode 3068. Find the Maximum Sum of Node Values

Leetcode 3068. Find the Maximum Sum of Node Values 1. 解题思路2. 代码实现题目链接：3068. Find the Maximum Sum of Node Values 1. 解题思路这一题虽然标记为一道hard的题目，但其实就是一个脑筋急转弯的题目。我们只需要想明白一点即可&…

阅读更多...

4G/5G执法记录仪、智能安全帽走国标GB28181接入海康、宇视等大平台，也可走平台与平台对接，以下级平台级联到上级大平台

4G/5G执法记录仪、智能安全帽走国标GB28181接入海康、宇视等大平台，也可走平台与平台对接，以下级平台级联到上级大平台

AIoT万物智联，智能安全帽生产厂家，执法记录仪生产厂家，智能安全帽、智能头盔、头盔记录仪、执法记录仪、智能视频分析/边缘计算AI盒子、车载DVR/NVR、布控球、智能眼镜、智能手电、无人机4G补传系统等统一接入大型融合通信可视指挥调度平台VM…

阅读更多...

Vue3和ElementPlus封装table组件

Vue3和ElementPlus封装table组件

最近学习vue3.2并自己在写一个项目，然后发现好几个页面都是列表页，重复写table和column也是觉得累，学习的项目列表页不算多，要是公司项目就不一样了，所以就想着自己封装一个table组件，免去大量重复工作和co…

阅读更多...

滑动窗口

滑动窗口

题目思路对于一个数组区间的最值，可以开辟一个队列记录（当然这里不能叫队列只是和队列相似，习惯性叫法)。每个区间的最值等于队首元素。扫描数组时，如果该元素大于队尾元素（取最大值时）将该队尾元素出队…

阅读更多...

Effective C++ 学习笔记条款07 为多态基类声明virtual析构函数

Effective C++ 学习笔记条款07 为多态基类声明virtual析构函数

有许多种做法可以记录时间，因此，设计一个TimeKeeper base class和一些derived classes作为不同的计时方法很合理： class TimeKeeper { public:TimeKeeper();~TimeKeeper();// ... };class AtomicClock : public TimeKeeper { /* ... */ }; …

阅读更多...

DM数据库学习之路(二十）DM8基于主备集群技术的两地三中心集群部署及测试(全网最详细）

DM数据库学习之路(二十）DM8基于主备集群技术的两地三中心集群部署及测试(全网最详细）

DM两地三中心介绍摘要金融行业对数据的可靠性和连续性有着极其严格的要求，任何数据丢失或服务中断都可能导致严重的经济损失。针对这一问题，基于达梦主备集群技术的两地三中心解决方案能够切实有效解决业务数据的可靠性和连续性需求。该方案通过构建两个数据中心和一个灾备…

阅读更多...

MyBatis标签获取数组或者集合长度的方法

MyBatis标签获取数组或者集合长度的方法

1、判断列表长度： <if test"list ! null and list.size() > 0">... </if> 可结合in条件使用：SELECT * FROM users<where><if test"idList ! null and idList.size() > 0">id IN<foreach item"…

阅读更多...

leetcode热题100学习计划-链表-相交链表

leetcode热题100学习计划-链表-相交链表

思路两条链表长短不一，找公共交点必须先对齐。记录两个链表各自长度，长的向短的看齐，长的先走多出来的那么一截，之后两者一起走，直到相遇或抵达末尾代码 /*** Definition for singly-linked list.* public class …

阅读更多...

解密Lawnchair：打造个性化极致的Android桌面体验

解密Lawnchair：打造个性化极致的Android桌面体验

解密Lawnchair：打造个性化极致的Android桌面体验 1. 简介 Lawnchair是一款知名的Android桌面定制工具，旨在为用户提供个性化极致的桌面体验。作为一个开源项目，Lawnchair融合了简洁、灵活和强大的特点，让用户能够自由定制其Andro…

阅读更多...

最新文章