归一化、标准化和正则化

归一化 Normalization

归一化一般是将数据映射到指定的范围,用于去除不同维度数据的量纲以及量纲单位。
常见的映射范围有 [0, 1] 和 [-1, 1] ,最常见的归一化方法就是 Min-Max 归一化:
在这里插入图片描述
举个例子,我们判断一个人的身体状况是否健康,那么我们会采集人体的很多指标,比如说:身高、体重、红细胞数量、白细胞数量等。
一个人身高 180cm,体重 70kg,白细胞计数 [公式] ,etc.
衡量两个人的状况时,白细胞计数就会起到主导作用从而遮盖住其他的特征,归一化后就不会有这样的问题。

###标准化 Normalization

归一化和标准化的英文翻译是一致的,但是根据其用途(或公式)的不同去理解(或翻译)

下面我们将探讨最常见的标准化方法: Z-Score 标准化。
在这里插入图片描述
在这里插入图片描述
机器学习的目标无非就是不断优化损失函数,使其值最小。在上图中, [公式] 就是我们要优化的目标函数

我们不难看出,标准化后可以更加容易地得出最优参数 [公式] 和 [公式] 以及计算出 [公式] 的最小值,从而达到加速收敛的效果。 [公式]

注:上图来源于 Andrew Ng 的课程讲义

正则化 Regularization

正则化主要用于避免过拟合的产生和减少网络误差。
正则化是指为解决适定性问题或过拟合而加入额外信息的过程,常用的额外项一般有两种,一般英文称作 l1−norml_1-norml1norml2−norml_2-norml2norm,中文称作 L1正则化 和 L2正则化,或者 L1范数 和 L2范数。
L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。对于线性回归模型,使用L1正则化的模型建叫做Lasso回归,使用L2正则化的模型叫做Ridge回归(岭回归)。
正则化一般具有如下形式:
在这里插入图片描述
其中,第 1 项是经验风险,第 2 项是正则项, [公式] 为调整两者之间关系的系数。
第 1 项的经验风险较小的模型可能较复杂(有多个非零参数),这时第 2 项的模型复杂度会较大。
下面是Lasso回归的损失函数,式中加号后面一项α∣∣w∣∣1\alpha∣∣w∣∣_1αw1即为L1正则化项。在这里插入图片描述
Lasso的优化目标为:
在这里插入图片描述
下面是Ridge回归的损失函数,式中加号后面一项α∣∣w∣∣22\alpha∣∣w∣∣_2^2αw22即为L2正则化项。
在这里插入图片描述
Ridge Regression的优化目标为:
在这里插入图片描述

一般回归分析中www表示特征的系数,从上式可以看到正则化项是对系数做了处理(限制)。L1正则化和L2正则化的说明如下:
L1正则化是指权值向量www中各个元素的绝对值之和,通常表示为∣∣w∣∣1∣∣w∣∣_1w1
​L2正则化是指权值向量www中各个元素的平方和然后再求平方根(可以看到Ridge回归的L2正则化项有平方符号),通常表示为∣∣w∣∣22∣∣w∣∣_2^2w22
一般都会在正则化项之前添加一个系数,Python的机器学习包sklearn中用α\alphaα表示,一些文章也用λ\lambdaλ表示。这个系数需要用户指定。

那添加L1和L2正则化有什么用?
L1正则化可以产生稀疏权值矩阵,即产生一个稀疏模型,可以用于特征选择
L2正则化可以防止模型过拟合(overfitting);一定程度上,L1也可以防止过拟合
————————————————
原文链接:https://zhuanlan.zhihu.com/p/29957294
https://blog.csdn.net/jinping_shi/article/details/52433975

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/346004.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

slf4j绑定器_用于ADFLogger的SLF4J绑定–缺少的部分

slf4j绑定器由于最好的原因,在我的日常工作中,我希望为ADF Logger Oracle ADF提供一个SLF4J适配器。 毫不奇怪,slf4j没有用于ADFLogger的适配器,但是由于ADFLogger只是Java Util Logging的轻巧包装,因此花了一个多小时…

核心网

在我们正式讲解之前,我想通过这张网络简图帮助大家认识一下全网的网络架构,通过对全网架构的了解,将方便您对后面每一块网络细节的理解。 这张图分为左右两部分,右边为无线侧网络架构,左边为固定侧网络架构。 无线侧…

linux服务器防端口扫描,linux下防止syn***,端口扫描和死亡之ping

http://downloads.sourceforge.net ... les-v0.0.3-3.tar.gz下载以后安装:tar zxvf arptables-v0.0.3-3.tar.gzcd arptables-v0.0.3-3/makemake install生成的命令是/usr/local/sbin/arptables、/usr/local/sbin/arptables-save、/usr/local /sbin/arptables-restor…

JDK 11:轻松取出单文件Java源代码程序

JDK 11 Early Access Builds包含与JEP 330相关的预览功能(“启动单个文件源代码程序”)。 我之前在“ Shebang即将来到Java? ”和“ 为JDK 11提议的JEP 329和JEP 330 ”,由于JDK 11 Early Access Builds,在这篇文章中…

多普勒效应、多普勒效应、网关、路由器

多普勒效应 (Doppler effect) 多普勒效应是波源和观察者有相对运动时,观察者接受到波的频率与波源发出的频率并不相同的现象。远方急驶过来的火车鸣笛声变得尖细(即频率变高,波长变短),而离我们…

瑞利、莱斯与Nakagami-m信道衰落模型

一、信道的定义与调制信道的数学模型 1.信道的定义与分类 信道(Channel)是指以传输媒质为基础的信号通道。根据新到的定义,如果信道仅是指信号的传输媒质,这种信道称为狭义信道;如果这种信道不仅是传输媒质&#xff…

linux用if语句编程序,Shell 脚本基础 - 使用 if 语句进行条件检测

Bourne Shell 的 if 语句和大部分编程语言一样 - 检测条件是否真实,如果条件为真,shell 会执行这个 if 语句指定的代码块,如果条件为假,shell 就会跳过 if 代码块,继续执行之后的代码。if 语句的语法:if[判…

java运行时间间隔_Java:安排作业按时间间隔运行

java运行时间间隔最近,我花了一些时间围绕Neo4j版本之间的滚动升级构建了一组测试,作为其中的一部分,我想记录升级过程中集群的状态。 测试的主线程会等待升级完成,因此我想每隔几秒钟登录另一个线程。 Alistair将我指向Schedule…

卫星导航定位 -- 坐标系统与时间系统

原文https://blog.csdn.net/f2157120/article/details/81210843 1 协议天球坐标系 以地球质心为坐标原点,以地球自转的轴为z轴 2 协议地球坐标系 3 WGS-84坐标系 4 CGS2000坐标系统 5 直角坐标系与大地坐标系转换 6 大地坐标系转换 7 时间系统 8 GNSS时间系统 …

linux 命令行 解密,解密Linux终端命令 学好Linux

如果你要学习Linux操作系统,你一定知道Linux系统越来越受到电脑用户的欢迎,学习linux,你可能想了解Linux终端命令,这里将介绍Linux终端命令的知识,在这里拿出来和大家分享一下。一、文件目录类1.建立目录:m…

用Jackson编写大型JSON文件

有时您需要将大量数据导出到JSON到文件中。 可能是“将所有数据导出到JSON”,或者是GDPR“可移植性权利”,您实际上需要这样做。 与任何大型数据集一样,您不能只将其全部容纳在内存中并将其写入文件。 它需要一段时间,它会从数据…

博弈论学科整体概览

一、博弈论的概念 博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行…

linux 进程组id 错乱,【Linux】终端,进程组,作业,会话及作业控制

终端概念在UNIX系统中,用用户通过终端登录系统后得到一一个Shell进程,这个终端成为Shell进程的控制终端 (Controlling Terminal),控制终端是保存在PCB中的信息,而我们知道fork会复制PCB中的信息,因此由Shell进程启动的其它进程的控制终端也是这个终端。默认情况 下(没有重定向)…

纳什均衡

纳什均衡(或者纳什平衡),Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰纳什命名。 定义 经济学定义 数学定义 纳什均衡的定义:在博弈G﹛S1,…,Sn:u1,…&#x…

linux 添加本地源,linux 添加本地yum源

1、yum repolist2、https://opsx.alibaba.com/mirror,首先下在该镜像站点中的yum,这里选择epel源epel-release-latest-7.noarch.rpm3、rpm -ivh epel-release-latest-7.noarch.rpm # 安装源4、此时看到epel源已经安装好了,如果我们不适用bas…

稳定婚姻问题:Gale–Shapley算法

(一)问题的引出 在组合数学、经济学、计算机科学中,稳定婚姻问题(英语:stable marriage problem,简称SMP)又称为稳定配对问题(stable matching problem),是指…

Linux程序设计实验项目六,《linux程序设计》实验教学大纲

《linux程序设计》实验教学大纲课程名称:Linux程序设计课程编号:408412420408436407适用专业:计算机科学与技术网络工程软件工程总 学 分:3总 学 时:48其中实验学时16一、实验课程性质、目的与任务《Linux程序设计》课…

宣布EAXY:使Java中的XML更容易

Java中的XML库是一个雷区。 操作和读取XML所需的代码量令人震惊,使用不同的库遇到类路径问题的风险很大,并且对名称空间的处理带来许多混乱和错误。 最糟糕的是,情况似乎并没有改善。 一位同事让我意识到JOOX库。 这是解决这些问题的一个很好…

奇异值分解(SVD)原理与在降维中的应用

奇异值分解 奇异值分解(Singular Value Decomposition,以下简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域。是很多机器学习算法的基石。本文就对SVD的…

嵌套类和私有方法

当您在另一个类中有一个类时,他们可以看到彼此的private方法。 在Java开发人员中并不为人所知。 面试中的许多候选人说, private是一种可见性,它使代码可以查看成员是否属于同一班级。 这实际上是对的,但是更准确地说,…