“vanilla”是什么意思?

文章目录

  • Vanilla Gradient Descent
    • 模型定义
    • 损失函数
    • 梯度计算
    • 参数更新
  • Momentum Gradient Descent
    • 模型定义
    • 损失函数
    • 梯度计算
    • 参数更新
  • 参考

香草社
含义是原装的,不是变体,可以理解为原装T-34,不是后来魔改的版本;
下面以 gradiant descent为例来翻译翻译什么tmd叫tmd vanilla

Vanilla Gradient Descent

模型定义

y ^ = X W + b \begin{equation} \hat{y} = \mathbf{X} \mathbf{W} + b \end{equation} y^=XW+b

损失函数

J ( W , b ) = 1 m ∑ i = 1 m ( y ( i ) − y ^ ( i ) ) 2 \begin{equation} J(\mathbf{W}, b) = \frac{1}{m} \sum_{i=1}^{m} (y^{(i)} - \hat{y}^{(i)})^2 \end{equation} J(W,b)=m1i=1m(y(i)y^(i))2

梯度计算

∂ J ( W , b ) ∂ W = − 2 m X T ( y − y ^ ) \begin{equation} \frac{\partial J(\mathbf{W}, b)}{\partial \mathbf{W}} = -\frac{2}{m} \mathbf{X}^T (\mathbf{y} - \hat{y}) \end{equation} WJ(W,b)=m2XT(yy^)

∂ J ( W , b ) ∂ b = − 2 m ∑ i = 1 m ( y ( i ) − y ^ ( i ) ) \begin{equation} \frac{\partial J(\mathbf{W}, b)}{\partial b} = -\frac{2}{m} \sum_{i=1}^{m} (y^{(i)} - \hat{y}^{(i)}) \end{equation} bJ(W,b)=m2i=1m(y(i)y^(i))

参数更新

W : = W − α ∂ J ( W , b ) ∂ W \begin{equation} \mathbf{W} := \mathbf{W} - \alpha \frac{\partial J(\mathbf{W}, b)}{\partial \mathbf{W}} \end{equation} W:=WαWJ(W,b)

b : = b − α ∂ J ( W , b ) ∂ b \begin{equation} b := b - \alpha \frac{\partial J(\mathbf{W}, b)}{\partial b} \end{equation} b:=bαbJ(W,b)

Momentum Gradient Descent

模型定义

y ^ = X W + b \begin{equation} \hat{y} = \mathbf{X} \mathbf{W} + b \end{equation} y^=XW+b

损失函数

J ( W , b ) = 1 m ∑ i = 1 m ( y ( i ) − y ^ ( i ) ) 2 \begin{equation} J(\mathbf{W}, b) = \frac{1}{m} \sum_{i=1}^{m} (y^{(i)} - \hat{y}^{(i)})^2 \end{equation} J(W,b)=m1i=1m(y(i)y^(i))2

梯度计算

∂ J ( W , b ) ∂ W = − 2 m X T ( y − y ^ ) \begin{equation} \frac{\partial J(\mathbf{W}, b)}{\partial \mathbf{W}} = -\frac{2}{m} \mathbf{X}^T (\mathbf{y} - \hat{y}) \end{equation} WJ(W,b)=m2XT(yy^)

∂ J ( W , b ) ∂ b = − 2 m ∑ i = 1 m ( y ( i ) − y ^ ( i ) ) \begin{equation} \frac{\partial J(\mathbf{W}, b)}{\partial b} = -\frac{2}{m} \sum_{i=1}^{m} (y^{(i)} - \hat{y}^{(i)}) \end{equation} bJ(W,b)=m2i=1m(y(i)y^(i))

参数更新

v W = β v W + ( 1 − β ) ∂ J ( W , b ) ∂ W \begin{equation} v_{\mathbf{W}} = \beta v_{\mathbf{W}} + (1 - \beta) \frac{\partial J(\mathbf{W}, b)}{\partial \mathbf{W}} \end{equation} vW=βvW+(1β)WJ(W,b)

v b = β v b + ( 1 − β ) ∂ J ( W , b ) ∂ b \begin{equation} v_{b} = \beta v_{b} + (1 - \beta) \frac{\partial J(\mathbf{W}, b)}{\partial b} \end{equation} vb=βvb+(1β)bJ(W,b)

W : = W − α v W \begin{equation} \mathbf{W} := \mathbf{W} - \alpha v_{\mathbf{W}} \end{equation} W:=WαvW

b : = b − α v b \begin{equation} b := b - \alpha v_{b} \end{equation} b:=bαvb

总之,vanilla表示是初始的样子,可以理解为baseline,后面一堆魔改的方法喜欢和它做比较;

参考

What does “vanilla” mean?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/41421.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[单master节点k8s部署]19.监控系统构建(四)kube-state-metrics

kube-state-metrics 是一个Kubernetes的附加组件,它通过监听 Kubernetes API 服务器来收集和生成关于 Kubernetes 对象(如部署、节点和Pod等)的状态的指标。这些指标可供 Prometheus 进行抓取和存储,从而使你能够监控和分析Kubern…

软件是什么?一个软件到底是哪些部分组成的-软件到底有哪些分支呢?

https://doc.youyacao.com/117/2163 软件是什么?一个软件到底是哪些部分组成的-软件到底有哪些分支呢? 何为软件 软件定义 的本质是通过软件编程实现硬件资源的虚拟化、灵活、多样和定制化功能,以最大化系统运行效率和能量效率。它基于硬…

VirtualBox的windows server 2016设置主机和虚拟机共享文件夹

文章目录 安装步骤1. windows server 2016安装增强功能2.上述安装完成之后,需要做共享文件夹,在宿主机,新建一个test文件夹,做共享设置,如下图:3.然后打开虚拟机,设置文件共享 安装步骤 1. win…

kafka系列之消费后不提交offset情况的分析总结

概述 每当我们调用Kafka的poll()方法或者使用KafkaListener(其实底层也是poll()方法)时,它都会返回之前被写入Kafka的记录,即我们组中的消费者还没有读过的记录。 这意味着我们有一种方法可以跟踪该组消费者读取过的记录。 如前所述,Kafka的一…

Java数据结构-树的面试题

目录 一.谈谈树的种类 二.红黑树如何实现 三.二叉树的题目 1.求一个二叉树的高度,有两种方法。 2.寻找二叉搜索树当中第K大的值 3、查找与根节点距离K的节点 4.二叉树两个结点的公共最近公共祖先 本专栏全是博主自己收集的面试题,仅可参考&#xf…

如何在Qt使用uchardet库

如何在 Qt 中使用 uchardet 库 文章目录 如何在 Qt 中使用 uchardet 库一、简介二、uchardet库的下载三、在Qt中直接调用四、编译成库文件后调用4.1 编译工具下载4.2 uchardet源码编译4.3 测试编译文件4.4 Qt中使用 五、一些小问题5.1 测试文件存在的问题5.2 uchardet库相关 六…

聚合支付系统主要分账方案及API分析

1 常见分账场景介绍 分账一般分为线下场景分账和线上场景分账,分账API分为微信,支付宝或其他第三方支付公司、银行。今天我们主要探讨微信、支付宝线上和线下场景分账流程。 微信分账API分为收付通和线下服务商分账,支付宝分账分为互联网平…

JAVA设计模式-监听者模式

什么是监听者模式 监听器模式是一种观察者模式的扩展,也被称为发布-订阅模式。在监听器模式中,存在两类角色:事件源(Event Source)和监听器(Listener)。事件源负责产生事件,而监听器…

YOLOV++ 详解 | 网络结构、代码解析、YOLOV 论文阅读、初识 VID

前言 代码地址:https://github.com/YuHengsss/YOLOV 本文网络结构按 YOLOV SwinTiny 绘制,不同的模型主要差异在于 Backbone,VID 相关的部分基本相同。 Predict Input 代码基于 vid_demo。首先会读取视频中的所有帧(只能用短视频…

c++ 构造,析构,拷贝,移动构造函数

文章目录 概述1.构造函数2. 拷贝构造函数3.移动构造函数4.析构函数 例子QTUE4/5 c 小结 概述 对于c来说,最基础的是类。对于一个类来说,主要由以下函数构成。如下: 构造函数拷贝构造函数移动构造函数析构函数 当然,还有一个操作…

【简历】郑州某二本学院:JAVA实习简历指导,基本没有面试机会

注:为保证用户信息安全,姓名和学校等信息已经进行同层次变更,内容部分细节也进行了部分隐藏 简历说明 这份简历是一个25届二本同学找JAVA实习的简历,从整体来看,简历版式没有问题,非常清晰。 但是内容特…

动态规划题解

文章目录 1、题汇总2、关键字3、思路4、总结 1、题汇总 1.1、最大字段和 dp[i] nums[i] max(dp[i - 1], 0) 1.2、买卖股票最佳时机_只买卖一次 &多次 1.3、股票最多两次 & 最多K次 & 含冷冻期 & 有手续费 1.101、按摩师_隔天接订单 dp[i] max(dp[i - 1], …

数据操作10-15题(30 天 Pandas 挑战)

数据操作 1. 相关知识点1.12 分组与连表1.13 排名 2. 题目2.10 第N高的薪水2.11 第二高的薪水2.12 部门工资最高的员工2.13 分数排名2.14 删除重复的电子邮箱2.15 每个产品在不同商店的价格 1. 相关知识点 1.12 分组与连表 分组max_salaryemployee.groupby(departmentId)[sal…

搜索+动态规划

刷题刷题刷题刷题 ​​​​​​​​​​​​​​Forgery - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 思路: 需要两个数组,一个数组全部初始化为".",另一个数组输入数据,每碰到一个“.”就进行染色操作,将其周围的…

Java后端每日面试题(day3)

目录 Spring中Bean的作用域有哪些?Spring中Bean的生命周期Bean 是线程安全的吗?了解Spring Boot中的日志组件吗? Spring中Bean的作用域有哪些? Bean的作用域: singleton:单例,Spring中的bean默…

使用 express 搭建最基本服务器程序

在使用 Express.js 框架搭建 web 应用时,通常会设置一个文件夹来存放静态资源,如图片、JavaScript 文件、CSS 文件等。默认情况下,这个文件夹经常被命名为 public。 安装 Express 如果你还没有安装 Express,可以通过 npm 来安装…

已经安装deveco-studio-4.1.3.500的基础上安装deveco-studio-3.1.0.501

目录标题 1、执行exe文件后安装即可2、双击devecostudio64_3.1.0.501.exe2.1、安装Note (注意和4.1的Note放不同目录)2.2、安装ohpm (注意和4.1版本的ohpm放不同目录)2.3、安装SDK (注意和4.1版本的SDK放不同目录) 1、执行exe文件后安装即可 2、双击devecostudio64_3.1.0.501.e…

JLMPack:您的高效文件管理利器

在信息爆炸的时代,文件管理已经成为我们日常工作中不可或缺的一部分。面对日益增长的数据量,如何高效地存储、管理和保护文件,成为每个人都需要面对的问题。为此,我们隆重推出JLMPack——一款强大而高效的文件管理工具&#xff0c…

Ubuntu 22.04.4 LTS 安装 php apache LAMP 环境nginx

1 安装php-fpm apt update apt-get install php-fpm #配置php-fpm服务启动 systemctl enable php8.1-fpm systemctl start php8.1-fpm #查看服务 systemctl status php8.1-fpm #查看版本 rootiZbp1g7fmjea77vsqc5hmmZ:~# php -v PHP 8.1.2-1ubuntu2.18 (cli) (built: J…

HTML内容爬取:使用Objective-C进行网页数据提取

网页爬取简介 网页爬取,通常被称为网络爬虫或爬虫,是一种自动浏览网页并提取所需数据的技术。这些数据可以是文本、图片、链接或任何网页上的元素。爬虫通常遵循一定的规则,访问网页,解析页面内容,并存储所需信息。 …