深度学习修炼(四)——补充知识

文章目录

    • 致谢
  • 4 补充知识
    • 4.1 微积分
      • 4.1.1 导数和微分
      • 4.1.2 偏导数
      • 4.1.3 梯度
      • 4.1.4 链式求导
    • 4.2 Hub模块

致谢

导数与微分到底有什么区别? - 知乎 (zhihu.com)

4 补充知识

在这一小节的学习中,我们会对上一小节的知识点做一个补充,并且拓展一个torch的模块。

4.1 微积分

4.1.1 导数和微分

在一元函数里,可导和可微是一回事,但是其表达的内涵不同。在下面的学习中,让我们先看看什么是导数。

假设我们现在有一个函数f(a) = 3a,它是一条直线。

image-20211227170931280

如果a = 2,那么理所当然f(a) = 6,如果我对a做一个小小的增加,比如说增加0.001,小到我自己都看不出来,那么f(a)就会变为6.003,我们会发现,因变量受自变量3倍的影响,这就是导数。导数实际上就是函数的斜率。但是我们这里的函数是一条直线。在讨论曲线的导数时,我们一般是讨论某个点的导数。一个等价的导数表达式可以这样写f′(a)=ddaf(a)f'(a) = \frac{d}{da}f(a)f(a)=dadf(a)。不管你是否将𝑓(𝑎)放在上面或者放在右边都没有关系。

  1. 导数就是斜率,而曲线函数的斜率,在不同的点是不同的。
  2. 如果想知道一个函数的导数,你可以参考下面的导数公式。

拓展:导数公式

导数公式

  1. y=c(c为常数) y’=0
  2. y=xny=x^ny=xn y′=nxn−1y'=nx^{n-1}y=nxn1
  3. y=axy=a^xy=ax y′=axlnay'=a^xlnay=axlna
  4. y=exy=e^xy=ex y′=exy'=e^xy=ex
  5. y=logax y′=logae/xy'=logae/xy=logae/x
  6. y=lnx y′=1/xy'=1/xy=1/x
  7. y=sinx y′=cosxy'=cosxy=cosx
  8. y=cosx y′=−sinxy'=-sinxy=sinx
  9. y=tanx y′=1/cos2xy'=1/cos^2xy=1/cos2x
  10. y=cotx y′=−1/sin2xy'=-1/sin^2xy=1/sin2x

有时候,一个函数并不是基本的函数,而是由多个函数组合而成,这时候我们就需要一些运算法则来帮我们解决其求导的问题了。

  • 减法法则:(f(x)−g(x))′=f′(x)−g′(x)(f(x)-g(x))'=f'(x)-g'(x)(f(x)g(x))=f(x)g(x)

  • 加法法则:(f(x)+g(x))′=f′(x)+g′(x)(f(x)+g(x))'=f'(x)+g'(x)(f(x)+g(x))=f(x)+g(x)

  • 乘法法则:(f(x)g(x))′=f′(x)g(x)+f(x)g′(x)(f(x)g(x))'=f'(x)g(x)+f(x)g'(x)(f(x)g(x))=f(x)g(x)+f(x)g(x)

  • 除法法则:(g(x)/f(x))′=(g′(x)f(x)−f′(x)g(x))/(f(x))2(g(x)/f(x))'=(g'(x)f(x)-f'(x)g(x))/(f(x))^2(g(x)/f(x))=(g(x)f(x)f(x)g(x))/(f(x))2

4.1.2 偏导数

如果只是对一个变量求导,形如y=2x+1y = 2x+1y=2x+1,那么对x求导的话,实际上就是对一个变量求导,而在多元函数微分学中,我们常常会遇到多变量的情况,此时我们就要用到偏微分,也就是偏导数。

在深度学习中,函数通常依赖许多变量,所以偏导数也及其重要。

image-20211223205749746

求偏导的时候,把要求导的变量像平时那样求导,把不求导的变量看成常数即可。

4.1.3 梯度

我们把某一个多元函数对其所有变量的偏导数用向量框起来,这就是我们所说的关于该函数的梯度向量,口头上简单说成梯度。

如果说一个函数时y = ax1+bx2+...ax_1+bx_2+...ax1+bx2+...

那么该函数的梯度即为:∇xf(x)=[∂f(x)∂x1,∂f(x)∂x2,…,∂f(x)∂xn]T∇_xf(x)=[\frac{∂f(x)}{∂x1},\frac{∂f(x)}{∂x2},…,\frac{∂f(x)}{∂xn}]^Txf(x)=[x1f(x),x2f(x),,xnf(x)]T

其中∇xf(x)∇_xf(x)xf(x)通常在没有歧义时被∇f(x)∇f(x)f(x)取代

4.1.4 链式求导

多元函数通常是复合的,所以我们可能没法应用上述任何规则来微分这些函数。所以,我们需要链式法则使我们能够微分复合函数。

4.2 Hub模块

根据深度学习的发展,各类大牛在许多的论文上提出了十分优秀的神经网络模型。而这些模型大多都被收集于torch.hub之中。通过下列的代码可以查看hub中存放的模型。

torch.hub.list('pytorch/vision:v0.4.2')

其余的这里我就不做过多介绍了,因为Github上的pytorch.hub上有详细说明,甚至导入方式,返回什么都写的十分的详细。还有很多实际的例子和案例可供选择,感兴趣的小伙伴可以去试试。

试试归试试,但是在学习的阶段中,我们十分不建议去调别人的模型用于自己的使用,我们应该做的是,从0搭建,这样才体现学习的目的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/398601.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java使用POI jar包读写xls文件

主要使用poi jar来操作excel文件。代码中用到的数据库表信息见ORACLE之表。使用public ArrayList<Person> getPersonAllRecords()获得所有的记录。 1 public class PersonXLS {2 3 public static void main(String[] args) throws IOException {4 5 …

U-boot 打补丁,编译,设置环境变量,

&#xff08;1&#xff09;U-boot 的最终目的是&#xff1a; 启动内核 U-boot 从Flash上读取内核&#xff0c;把内核放到SDRAM上&#xff0c;运行内核 设置环境变量 print  显示出环境变量 set bootdelay 10 save reset  重启转载于:https://www.cnblogs.com/bkyysd/p/42…

深度学习修炼(五)——基于pytorch神经网络模型进行气温预测

文章目录5 基于pytorch神经网络模型进行气温预测5.1 实现前的知识补充5.1.1 神经网络的表示5.1.2 隐藏层5.1.3 线性模型出错5.1.4 在网络中加入隐藏层5.1.5 激活函数5.1.6 小批量随机梯度下降5.2 实现的过程5.2.1 预处理5.2.2 搭建网络模型5.3 简化实现5.4 评估模型5 基于pytor…

Android 应用程序集成FaceBook 登录及二次封装

1、首先在Facebook 开发者平台注册一个账号 https://developers.facebook.com/ 开发者后台 https://developers.facebook.com/apps 2、创建账号并且获得 APP ID 图一 图二 图三 图四 图五 3、获取app签名的Key Hashes 值&#xff08;两种方式&#xff09; 3.1方法1&#xff1…

IKAnalyzer进行中文分词和去停用词

最近学习主题模型pLSA、LDA&#xff0c;就想拿来试试中文。首先就是找文本进行切词、去停用词等预处理&#xff0c;这里我找了开源工具IKAnalyzer2012&#xff0c;下载地址&#xff1a;(&#xff1a;(注意&#xff1a;这里尽量下载最新版本&#xff0c;我这里用的IKAnalyzer201…

C++从0到1的入门级教学(六)——函数

文章目录6 函数6.1 概述6.2 函数的定义6.3 函数的调用6.4 值传递6.5 函数的常见形式6.6 函数的声明6.7 函数的分文件编写6 函数 6.1 概述 作用&#xff1a;将一段经常使用的代码封装起来&#xff0c;减少重复代码。 一个较大的程序&#xff0c;一般分为若干个程序块&#xf…

PC实用手册

为什么80%的码农都做不了架构师&#xff1f;>>> ##Win10除了Edge/IE&#xff0c;其他浏览器打开和载入速度都很慢 解决办法&#xff1a;以管理员身份运行cmd&#xff0c;输入netsh winsock reset重置winsock&#xff0c;然后重启电脑即可 转载于:https://my.oschin…

MySQL之表的约束

一 介绍 约束条件与数据类型的宽度一样&#xff0c;都是可选参数 作用&#xff1a;用于保证数据的完整性和一致性主要分为&#xff1a; PRIMARY KEY (PK) 标识该字段为该表的主键&#xff0c;可以唯一的标识记录 FOREIGN KEY (FK) 标识该字段为该表的外键 NOT NULL 标…

eclipse静态部署tomcat

转载于:https://www.cnblogs.com/sprinng/p/4223798.html

jvm fastdebug

背景 RednaxelaFX 写道agapple 写道还有一个问题&#xff0c;就是在验证一些逃逸优化时&#xff0c;有些jvm参数用不了&#xff0c;比如-XX:printInlining&#xff0c;-XX:printAssembly&#xff0c;jdk用的是1.6.11和jdk1.6.18-XX:PrintInlining在product build的Sun JDK上可以…

设计模式杂谈(一)——设计模式概述

文章目录1 设计模式概述1.1 软件设计模式的产生背景1.2 软件设计模式的概念1.3 设计模式的必要性1.4 设计模式分类1 设计模式概述 1.1 软件设计模式的产生背景 设计模式最初并不是在软件设计中&#xff0c;而是被用于建筑领域的设计中。 1977年美国著名建筑大师、加利福尼亚…

hmailserver批量添加用户

2019独角兽企业重金招聘Python工程师标准>>> 将内容复制到txt文件中后缀改为vbs 将用户名密码替换为自己的 脚本内容如下: Option Explicit On Error resume nextDim obBaseApp Dim objFSO Dim objTextFile Dim strNewAlias,iDim scrreport Dim failed Dim added fa…

云说的到底对不对,京东到底行不行?

摘要&#xff1a;马云吐槽京东被引爆以来&#xff0c;似乎就没人去关注马云说的对不对&#xff0c;有没有价值&#xff0c;大家更多的是在关注马云攻击了京东&#xff0c;京东回击了马云&#xff0c;马云被偷录了&#xff0c;再和人说话要去澡堂了…但&#xff0c;马云说的到底…

JS-随机生成的密码

randPassword(size) >{ //数组 let seed new Array(A,B,C,D,E,F,G,H,I,J,K,L,M,N,P,Q,R,S,T,U,V,W,X,Y,Z, a,b,c,d,e,f,g,h,i,j,k,m,n,p,Q,r,s,t,u,v,w,x,y,z, 2,3,4,5,6,7,8,9 ) //数组长度 seedlength seed.length; let creatPassword[]; for (i0;i<size;i) { j Mat…

数据库杂谈(九)——事务管理

文章目录9 事务管理9.1 恢复机制9.2 事务和日志9.2.1 事务9.2.2 运行记录的结构9.2.2.1 活动事务表9.2.2.2 提交事务表9.2.2.3 日志9.2.3 提交规则和先记后写规则9.2.3.1 提交规则9.2.3.2 先记后写规则9.3 更新策略以及故障后的恢复9 事务管理 9.1 恢复机制 数据对一个单位是…

CSS邮件相关

转载于:https://blog.51cto.com/8465917/1758775

MySql 错误 Err [Imp] 1153 - Got a packet bigger than 'max_allowed_packet' bytes

今天在用Navicat导入SQL文件时报错&#xff1a;MySql 错误 Err [Imp] 1153 - Got a packet bigger than max_allowed_packet bytes 查了一下&#xff0c;原来是MySQL默认读取执行的SQL文件最大为16M&#xff0c;我这个SQL文件260M&#xff0c;所以执行不过去 解决方法&#xff…

沙箱模式以及其使用到的IIFE

//沙箱//与外界隔绝的一个环境&#xff0c;外界无法修改该环境内任何信息&#xff0c;沙箱内的东西单独属于一个世界//360沙箱模式//将软件和操作系统进行隔离&#xff0c;以达到安全的目的//苹果手的app使用的就是沙箱模式去运行//隔离app的空间&#xff0c;每个app独立运行//…

C++从0到1的入门级教学(十)——类和对象

文章目录10 类和对象10.1 封装10.1.1 封装的意义10.1.2 struct和class的区别10.1.3 成员属性设置为私有10.2 对象的初始化和清理10.2.1 构造函数和析构函数10.2.2 构造函数的分类及调用10.2.3 关于拷贝构造函数调用时机10.2.4 构造函数调用规则10.2.5 深拷贝和浅拷贝10.2.6 初始…

js二级导航

js写二级导航要点 1.ul li 2.js获取元素 3.setInterval(function(),time); 代码如下 1 <style type"text/css">2 ul,li,body{margin:0;padding: 0;}3 #nav{width: 500px;margin: 10px auto;}4 ul li{list-style: none;}5 .clear{clear: both;}6 #n…