什么是微分和导数?

文章目录

  • 设立问题
  • 微分特性
    • 指数特性
    • 线性特性
    • 常数特性
  • 多项式微分
  • 导数

在机器学习领域,有多种解决最优化问题的方法,其中之一就是使用微分

通过微分,可以得知函数在某个点的斜率,也可以了解函数在瞬间的变化。

设立问题

请想象一下开车行驶在大街上的场景。设横轴为经过时间、纵轴为行驶距离,那么下面的图1应该可以表现二者的关系。

图1

图1

从图中可以看出,车辆在40 s内大约行驶了120 m,所以用下述表达式可以很快地计算出这一期间的行驶速度。

120 m 40 s = 3 m/s \frac{120 \text{ m}}{40 \text{ s}} = 3 \text{ m/s} 40 s120 m=3 m/s

不过这是平均速度,车辆并没有一直保持3 m/s的速度。从图中也可以看出,车辆在刚发动时速度较慢,缓缓前进,而在因红灯而停止时速度变为0,完全不动了。

就像这样,一般来说各个时间点的瞬时速度都取值不同。

刚才我们计算了40 s内的速度,为了求出“瞬间的变化量”,我们来渐渐缩小时间的间隔。看一下图2中10 s到20 s的情况。这一期间车辆跑了大约60 m,所以可以这样求出它的速度。

图2

图2

这与求某个区间内图形的斜率是一回事

使用同样的做法,接着求10 s和11 s之间的斜率,进而求10.0 s和10.1 s之间的斜率。逐渐缩小时间的间隔,最终就可以得出10 s那一瞬间的斜率,也就是速度像这样缩小间隔求斜率的方法正是微分

为了求得这种“瞬间的变化量”,我们设函数为f(x)、h为微小的数,那么函数f(x)在点x的斜率就可以用以下表达式表示。

d d x f ( x ) = lim ⁡ h → 0 f ( x + h ) − f ( x ) h \frac{\mathrm{d}}{\mathrm{d}x} f(x) = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h} dxdf(x)=h0limhf(x+h)f(x)

上述数学表达式解释如下:

d d x \frac{d}{dx} dxd
称为微分运算符,在表示f(x)的微分时可以写作
d f ( x ) d x \frac{df(x)}{dx} dxdf(x)

d d x f ( x ) \frac{d}{dx} f(x) dxdf(x)
此外,同样用于表示微分的符号还有撇(′), f(x)的微分也可以表示为f′(x)。用哪一种写法都没有问题,本文统一使用
d d x \frac{d}{dx} dxd

我们代入具体的数字来看看,这样有助于理解数学表达式。

比如,考虑一下刚才那个计算10.0 s和10.1 s之间的斜率的例子。在那种情况下x=10、h=0.1。假设车辆在10.0 s那个时间点行驶了40.0 m,在10.1s的时间点行驶了40.6 m,那么可以进行如下计算:

f ( 10 + 0.1 ) − f ( 10 ) 0.1 = 40.6 − 40 0.1 = 6 \frac{f(10 + 0.1) - f(10)}{0.1} = \frac{40.6 - 40}{0.1} = 6 0.1f(10+0.1)f(10)=0.140.640=6

这里的6就是斜率,在这个例子中它表示速度。本来h应当无限接近0,所以要用比0.1小得非常多的值来计算,但这里只是一个例子,姑且就用h=0.1了。

通过计算这样的表达式,可以求出函数f(x)在点x的斜率,也就是说可以微分

微分特性

实际上,直接用如下表达式也不太容易计算,但微分有一些很有用的、值得我们去记住的特性(特性感兴趣可以自己查资料推导)

d d x f ( x ) = lim ⁡ h → 0 f ( x + h ) − f ( x ) h \frac{\mathrm{d}}{\mathrm{d}x} f(x) = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h} dxdf(x)=h0limhf(x+h)f(x)

指数特性

当f(x)= x n x^n xn时,对它进行微分可以得到以下表达式。
d d x f ( x ) = n x n − 1 \frac{d}{dx} f(x) = nx^{n-1} dxdf(x)=nxn1

线性特性

若有函数f(x)和g(x),以及常数a,那么下述微分表达式成立。它们体现出来的特性被称为线性

d d x ( f ( x ) + g ( x ) ) = d f ( x ) d x + d g ( x ) d x \frac{d}{dx}(f(x) + g(x)) = \frac{df(x)}{dx} + \frac{dg(x)}{dx} dxd(f(x)+g(x))=dxdf(x)+dxdg(x)

d d x ( a f ( x ) ) = a d f ( x ) d x \frac{d}{dx}(af(x)) = a\frac{df(x)}{dx} dxd(af(x))=adxdf(x)

常数特性

与x无关的常数a的微分为0
d d x a = 0 \frac{d}{dx}a = 0 dxda=0

多项式微分

通过组合上述微分特性,即便是多项式也可以简单地进行微分。如下所示例子。

  • 使用常数特性推导
    d d x 5 = 0 \frac{d}{dx}5=0 dxd5=0

  • 使用指数特性推导
    d d x x = d d x x 1 = 1 ⋅ x 0 = 1 \frac{d}{dx}x=\frac{d}{dx}x^1=1\cdot x^0=1 dxdx=dxdx1=1x0=1

d d x x 3 = 3 x 2 \frac{d}{dx}x^3=3x^2 dxdx3=3x2

d d x x − 2 = − 2 x − 3 \frac{d}{dx}x^{-2}=-2x^{-3} dxdx2=2x3

  • 使用指数特性和线性特性推导
    d d x 10 x 4 = 10 d d x x 4 = 10 ⋅ 4 x 3 = 40 x 3 \frac{d}{dx}10x^4=10\frac{d}{dx}x^4=10\cdot 4x^3=40x^3 dxd10x4=10dxdx4=104x3=40x3

d d x ( x 5 + x 6 ) = d d x x 5 + d d x x 6 = 5 x 4 + 6 x 5 \frac{d}{dx}(x^5+x^6)=\frac{d}{dx}x^5+\frac{d}{dx}x^6=5x^4+6x^5 dxd(x5+x6)=dxdx5+dxdx6=5x4+6x5

  • 含有求和符号的表达式的微分可以像下面这样交换求和符号和微分运算符的顺序
    d d x ∑ i = 0 n x n = ∑ i = 0 n d d x x n \frac{d}{dx}\sum_{i=0}^{n}x^n = \sum_{i=0}^{n}\frac{d}{dx}x^n dxdi=0nxn=i=0ndxdxn

导数

所谓导数,就是微分后的函数求导就是进行微分后的数学函数

例如:
d d x f ( x ) \frac{d}{dx} f(x) dxdf(x)
导数就是
n x n − 1 nx^{n-1} nxn1

参考内容来源于:《白话机器学习的数学》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/32504.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HTML 教程

HTML 教程 HTML(HyperText Markup Language)是一种用于创建网页的标准标记语言。它描述了一个网站的结构骨架,使得浏览器能够展示具有特定格式的文本、链接、图片和其他内容。本教程将带你深入了解HTML的基础知识,包括其语法、常用标签以及如何构建一个基本的网页结构。 …

Tortoise 删除文件

1、右击需要删除的文件,选择Delete 2、提交

【查看显卡信息】——Ubuntu和windows

1、VMware虚拟机 VMware虚拟机上不能使用CUDA/CUDNN,也安装不了显卡驱动 查看显卡信息: lspci | grep -i vga 不会显示显卡信息,只会输出VMware SVGA II Adapter,表示这是一个虚拟机,无法安装和使用显卡驱动 使用上…

GitHub 标星 6

美国网友对这个大全给予了很高的评价:这份清单中列出的开源软件,不仅解决了硅谷大厂前员工的难处,也能为其他所有码农解除困惑。 在这套大全的指导下,任何一个工程师,都能获得类似在谷歌内部写代码的体验。xg2xg 上线…

fot循环语句

概念: 循环是一种重复执行一段代码的结构,只要满足循环的条件,会一种执行这个代码。 循环条件:在一定范围内,按照指定的次数来执行循环 循环体:在指定的次数内,执行的命令序列。只要条件满足…

骑马与砍杀-战团mod制作-基础篇-武器模型入骑砍(二)

骑马与砍杀战团mod制作-基础-武器模型入骑砍笔记(二) 资料来源 学习的资料来源: b站【三啸解说】手把手教你做【骑砍】MOD,基础篇,链接为: https://www.bilibili.com/video/BV19x411Q7No?p4&vd_sour…

模型计算量估计,训练时间预测 Scaling Laws for Neural Language Models

一、模型计算量 C ≈ 6N*D 其中C表示训练语言模型所需的总计算量,N表示模型参数量,D表示用于训练的语料总量,6表示每训练一个token所需的浮点计算量约为6N,其中前向计算2N,反向计算4N。 注意:这里的6是针…

前端小白指南:前端生成唯一设备标识的那些事儿

最近,我在使用javascript开发一个基于Chrome的插件,遇到了一个有意思的需求。插件需要生成一个授权码(code),但为了确保安全性,这个code必须与设备绑定,防止被不同的设备使用,限制一…

Python vs MATLAB: 易于学习和代码可理解性的对比

Python vs MATLAB Python vs MATLAB: 易于学习和代码可理解性**Python的易用性与代码理解****MATLAB的易用性与代码理解****哪个更易上手?****结论** Python vs MATLAB: 易于学习和代码可理解性 在科学计算、工程模拟和数据分析领域,Python和MATLAB是两…

使用 C++11 Lambda 表达式在 Qt 中连接信号与槽

在 Qt 使用 C11 引入的 lambda 表达式来简化信号与槽的连接已经成为一种不错的选择。本文将通过一个简单的例子来展示如何使用 lambda 表达式来连接 QAction 的信号与槽。 传统的连接方式 首先,看看传统的连接方式: QAction* action foo->addActi…

腾讯视频通话接口

简要描述 获取登录IM账号及签名请求URL /videocall/getImUserInfo?account=1234&appName=tv请求方式 GET参数 参数名必选类型说明account是string通话双方统一账号appName是string应用名称,区分不同类型应用如:TV,MINI返回示例 {"code": 200,"status"…

kafka 管理节点 Controller 角色分析

kafka 管理节点 Controller 角色分析 kafka controller 如何管理分区的创建、状态监测、故障切换、内容复制、如何管控分区副本的状态检测故障切换、数据同步、learder 选举?Kafka Controller 是 Kafka 集群中的一个关键组件,负责管理分区的创建、状态监测、故障切换、内容 …

document.write()方法总结

document.write()方法总结 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!document.write()方法是JavaScript中用于向HTML文档写入内容的方法之一。它允许我们在…

【团队成长】2024-25周周报-业务介绍内容创作

大家好!我们是IndustryOR 团队,致力于分享业界落地的算法技术。欢迎关注微信公众号/知乎/CSDN【运筹匠心】 。 记录人:张哲铭,某互联网大厂算法专家 【团队成长/个人成长】系列的推文会以 【工作周报】 的方式记录IndustryOR团队及…

【SpringCloud-Seata源码分析2】

文章目录 分支事务注册-客户端分支事务服务端的执行 分支事务注册-客户端 第一篇我们将全局事务启动,以及开启源码分析完成了,现在我们需要看一下分支事务注册。 我们分支事务的开始需要从PreparedStatementProxy#executeUpdate中去看。 public class…

智能物流系统堪比帝王宠信妃子,我给你类比说明一下……

导语 大家好,我是社长,老K。专注分享智能制造和智能仓储物流等内容。 新书《智能物流系统构成与技术实践》人俱乐部 让我们将智能物流系统种涉及出库入库作业完整链条的“货到人”拣选系统的工作流程与古代帝王宠信翻牌妃子的过程进行一个有趣的类比&…

【vue3|第13期】深入了解Vue3生命周期:管理组件的诞生、成长与消亡

日期:2024年6月22日 作者:Commas 签名:(ง •_•)ง 积跬步以致千里,积小流以成江海…… 注释:如果您觉得有所帮助,帮忙点个赞,也可以关注我,我们一起成长;如果有不对的地方&#xf…

神经科学原理精解【1】

文章目录 神经系统组成神经系统两类细胞脑组织基本结构参考资料 神经系统组成 神经系统由中驱神经系统和外围神经系统组成。中驱神经系统包括脑和脊髓。脑的主要功能是大脑、小脑和脑干。外围神经系统由位于脑和脊髓之外的神经和神经细胞组成。 神经系统两类细胞 神经元 感知…

基于深度学习的边缘检测

基于深度学习的边缘检测 边缘检测是计算机视觉中的一项基本任务,旨在识别图像中像素值变化显著的区域,即边缘。传统的边缘检测算法(如Sobel、Canny等)通过滤波器和梯度运算来检测边缘,而基于深度学习的方法则通过训练…

【SSM】医疗健康平台-管理端-检查组管理

技能目标 掌握新增检查组功能的实现 掌握查询检查组功能的实现 掌握编辑检查组功能的实现 掌握删除检查组功能的实现 体检的检查项种类繁多,为了方便管理和快速筛选出类别相同的检查项,医疗健康将类别相同的检查项放到同一个检查组中进行管理&#…