补充:特征缩放技术(归一化与标准化)与学习率的选取和特征转换符合高斯分布


文章目录

  • 前言
  • 一、特征缩放技术
    • 1. 标准化(Standardization)
    • 2. 归一化(Normalization)
    • 3 sklearn高级接口
  • 二、学习率的选取
  • 三、将特征转换为近似符合高斯分布
    • 1. 取对数变换(Log Transformation)
      • 原理
      • 为什么有效?
    • 2. 平方根变换(Square Root Transformation)
      • 原理
      • 为什么有效?
    • 3. Box-Cox变换(Box-Cox Transformation)
      • 原理
      • 为什么有效?
    • 4. 数据标准化与正态化(Standardization and Normalization)
    • 5. 代码尝试一下 --- plt.hist(x,bin=100)
      • (1)生成一个不符合高斯分布的特征数据
      • (2)幂变换(根号变换)
      • (3)对数变换
    • 总结


前言

特征缩放技术在机器学习优化过程中可以加快收敛过程,特别是在数据量差异较大的情况下。
关于学习率的选取一直都是机器学习里面的一个热点,到现在已经有部分自适应学习率的优化算法可供我们选择。但本文还是想介绍一下,自己应该怎么使用合适的学习率。

一、特征缩放技术

示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
在机器学习中,数据缩放是一个常见的预处理步骤,可以帮助提高模型的性能。常用的数据缩放方法包括:

1. 标准化(Standardization)

标准化是指将数据按其均值和标准差进行缩放,使得数据的均值为0,标准差为1。标准化的公式如下:
x standardized = x − mean ( x ) std ( x ) x_{\text{standardized}} = \frac{x - \text{mean}(x)}{\text{std}(x)} xstandardized=std(x)xmean(x)
其中, x x x 是原始数据, mean ( x ) \text{mean}(x) mean(x) 是数据的均值, std ( x ) \text{std}(x) std(x) 是数据的标准差。
【注】:标准化的目的是将数据调整到均值为0,标准差为1的分布;机器学习里面的部分算法如朴素贝叶斯分类器假设数据的每个特征都是符号正态分布的,但实际情况不一定啊(自然界大多数只要抽样次数足够多是近似为一个正态分布的),但经过我们这样强制的标准化过后我们就可以假设这个数据背后的总体分布近似为一个标准正态分布。
(机器学习的样本量是有限的,但根据概率论的知识,样本足够多就可以用样本均值代替总体均值,样本方差代替总体方差)。
因此,有的课本上直接就将标准化也解释为将数据转换成符号标准正态分布的数据。

2. 归一化(Normalization)

归一化是指将数据缩放到一个固定的范围,通常是 [ 0 , 1 ] [0, 1] [0,1] 或者 [ − 1 , 1 ] [-1, 1] [1,1]。归一化的公式如下:
x normalized = x − min ⁡ ( x ) max ⁡ ( x ) − min ⁡ ( x ) x_{\text{normalized}} = \frac{x - \min(x)}{\max(x) - \min(x)} x

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/42491.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java项目总结6

目录 1.双列集合 2.map的三种遍历方式&#xff1a; 1.键找值 2.键值对 3.lambda遍历map 3.HashMap 例子&#xff1a;统计字符出现次数 4.LinkedHashMap 5.TreeMap 6.可变参数 7.Collections: 1.双列集合 双列集合特点&#xff1a; 定义Map<String&#xff0c;St…

Linux中的管道符‘|‘以及SQL(DQL,DCL)

ls 指令 语法&#xff1a; ls [选项][目录或文件] 功能&#xff1a; 对于目录&#xff0c;该命令列出该目录下的所有子目录与文件。对于文件&#xff0c;将列出文件名以及其他信息。 常用选项&#xff1a; -a 列出目录下的所有文件&#xff0c;包括以 . 开头的隐含文件。 -…

自注意力机制和多头注意力机制区别

Ref&#xff1a;小白看得懂的 Transformer (图解) Ref&#xff1a;一文彻底搞懂 Transformer&#xff08;图解手撕&#xff09; 多头注意力机制&#xff08;Multi-Head Attention&#xff09;和自注意力机制&#xff08;Self-Attention&#xff09;是现代深度学习模型&#x…

ntp服务器地址

推荐 阿里云 ntp.aliyun.com 腾讯云 ntp.tencent.com 海康威视 time.ys7.com 苹果 time.apple.com time.asia.apple.com 尚可 NTP域名授时快速服务(www.ntp.org.cn) cn.ntp.org.cn 高通Qualcomm 位置 &#xff08;XTRA 预测卫星数据服务&#xff09; time.izatcloud.net 国家授…

昇思25天学习打卡营第19天|Pix2Pix实现图像转换

1. 学习内容复盘 Pix2Pix概述 Pix2Pix是基于条件生成对抗网络&#xff08;cGAN, Condition Generative Adversarial Networks &#xff09;实现的一种深度学习图像转换模型&#xff0c;该模型是由Phillip Isola等作者在2017年CVPR上提出的&#xff0c;可以实现语义/标签到真实…

点胶系统实战1-项目介绍

准备实战开发如下图的多轴点胶系统实战课程&#xff0c;内容设计界面开发、运动板块开发、任务管理、点胶的控制等。我们将和进入这个领域的初学者门一起进步。 有感兴趣的小伙伴&#xff0c;可以关注点赞&#xff0c;或评论区反馈你们的重点关注的内容&#xff0c;那些部分我…

Postman使用指南①网页版使用

postman官网地址&#xff1a;Postman API Platform 进入后点击右上角免费注册&#xff0c;注册后登录 登录之后即可在网页使用&#xff0c;无需下载

线上问题---反思与回顾

线上问题一&#xff1a;麦哲伦2.0 人群配置不生效 发现背景&#xff1a;产品发现三层模型部分计划个别测试计划圈选人群特征与数仓统计数据的人群不一致&#xff0c;向值班人员反馈 根因定位&#xff1a; &#xff08;1&#xff09;用户配置三层模型计划时&#xff0c;配置单…

RNN 交叉熵

RNN善于处理时序 序列数据 简单RNN 展开就是 LSTM 遗忘门f_t决定上期记忆保留多少 隐藏层 在神经网络中&#xff0c;隐藏层指的是除了输入层和输出层之外的层&#xff0c;它们的输出不会直接用于网络的最终输出&#xff0c;而是作为中间步骤用于提取和转换数据。因此&#x…

【网络安全】实验五(身份隐藏与ARP欺骗)

一、本次实验的实验目的 &#xff08;1&#xff09;了解网络攻击中常用的身份隐藏技术&#xff0c;掌握代理服务器的配置及使用方法 &#xff08;2&#xff09;通过实现ARP欺骗攻击&#xff0c;了解黑客利用协议缺陷进行网络攻击的一般方法 二、搭配环境 打开三台虚拟机&#…

SQL Server特性

一、创建表 在sql server中使用create table来创建新表。 create table Customers( id int primary key identity(1,1), name varchar(5) ) 该表名为Customers其中包含了2个字段&#xff0c;分别为id&#xff08;主键&#xff09;以及name。 1、数据类型 整数类型&#xff…

Towards Accurate and Robust Architectures via Neural Architecture Search

基于网络架构搜索的准确性与鲁棒性结构研究 论文链接&#xff1a;https://arxiv.org/abs/2405.05502 项目链接&#xff1a;未开源 Abstract 为了保护深度神经网络免受对抗性攻击&#xff0c;对抗性训练因其有效性而受到越来越多的关注。然而&#xff0c;对抗训练的准确性和鲁…

扩散模型笔记

长参数“T”决定了生成全噪声图像所需的步长。在本文中&#xff0c;该参数被设置为1000&#xff0c;这可能显得很大。我们真的需要为数据集中的每个原始图像创建1000个噪声图像吗?马尔可夫链方面被证明有助于解决这个问题。由于我们只需要上一步的图像来预测下一步&#xff0c…

如何设计一个高可用的分布式系统?

如何设计一个高可用的分布式系统&#xff1f; 大家好&#xff0c;我是微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01; 在当今互联网应用架构中&#xff0c;高可用性是至关重要的特性之一。设计一个高可用的分布式系统需要考…

vue2 webpack使用optimization.splitChunks分包,实现按需引入,进行首屏加载优化

optimization.splitChunks的具体功能和配置信息可以去网上自行查阅。 这边简单讲一下他的使用场景、作用、如何使用&#xff1a; 1、没用使用splitChunks进行分包之前&#xff0c;所有模块都揉在一个文件里&#xff0c;那么当这个文件足够大、网速又一般的时候&#xff0c;首…

1.3镜像管理

【必知必会】了解镜像的命名及导入导出镜像 1.3.1镜像的命名 一般情况下,镜像是按照如下格式命名的 服务器ip:端口/分类/镜像名:tag 如果不指明端口,默认是80,tag是latest,比如:192.168.26.101:5000,再比如hub.c.163.com/library/mysql:latest.分类也可以不写,比如d…

【C++】cout.self()函数

&#x1f4e2;博客主页&#xff1a;https://blog.csdn.net/2301_779549673 &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指正&#xff01; &#x1f4e2;本文作为 JohnKi 学习笔记&#xff0c;借鉴了部分大佬案例 &#x1f4e2;未来很长&#…

Avalonia中的Binding

文章目录 简介概念不同的绑定源绑定转换器图片路径转换简介 绑定是一个非常强大的概念,它允许绑定两个属性,这样当其中一个属性发生变化时,另一个也会发生变化。 通常,绑定从source属性到target属性——正常OneWay绑定,但也有一个TwoWay绑定可以确保两个属性同步,无论哪…

工地/矿区/电力/工厂/环卫视频智能安全监控反光衣AI检测算法的原理及场景应用

一、引言 随着科技的快速发展&#xff0c;特别是在智能交通和安全生产领域&#xff0c;对于夜间或弱光环境下的人员识别和安全监控需求日益凸显。反光衣作为一种重要的安全装备&#xff0c;被广泛应用于道路施工、工地作业、夜间巡逻、安全生产等场景&#xff0c;旨在提高人员的…

Meerkat:第一个统一视听空间和时间定位的MLLM

大型语言模型&#xff08;LLMs&#xff09;在各种自然语言处理任务中表现出色&#xff0c;达到了理解和推理能力的人类水平精度。此外&#xff0c;借助新兴的指令微调范式&#xff0c;这些语言模型可以被赋予遵循开放式自然语言指令的能力&#xff0c;甚至可以与其他模态&#…