【机器学习】机器学习中用到的高等数学知识-3.微积分 (Calculus)

3. 微积分 (Calculus)

  • 导数和梯度:用于优化算法(如梯度下降)中计算损失函数的最小值。
  • 偏导数:在多变量函数中优化目标函数。
  • 链式法则:在反向传播算法中用于计算神经网络的梯度。

导数和梯度:用于优化算法(如梯度下降)中计算损失函数的最小值。

导数和梯度是微积分中非常重要的概念,尤其在优化和机器学习中起着关键作用。以下是对这两个概念的详细解释:

1. 导数 (Derivative)

导数是函数在某一点的瞬时变化率或斜率,描述了函数值对自变量变化的敏感程度。对于单变量函数 f(x),导数的定义如下:

  • 定义

f'(x) = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h}

  • 几何意义:导数表示曲线在某一点的切线的斜率。
  • 基本规则
    • 常数规则:如果 c 是常数,则 \frac{d}{dx}(c) = 0
    • 幂规则:如果 f(x) = x^n,则 f'(x) = nx^{n-1}
    • 和差规则\frac{d}{dx}(u + v) = \frac{du}{dx} + \frac{dv}{dx}​。
    • 乘法规则\frac{d}{dx}(uv) = u \frac{dv}{dx} + v \frac{du}{dx}​。
    • 链式法则:如果 y = f(g(x)),则 \frac{dy}{dx} = f'(g(x)) \cdot g'(x)
  • 常用的导数公式:

        以下是一些常用的导数公式,涵盖了基本的函数和一些常见的导数法则。了解这些公式有助于快速计算各种函数的导数。

       1. 基本导数公式
                常数的导数:

\frac{d}{dx}(c) = 0

                幂函数: 

\frac{d}{dx}(x^n) = nx^{n-1} \quad (n为任意实数)

                 指数函数: 

\frac{d}{dx}(e^x) = e^x

\frac{d}{dx}(a^x) = a^x \ln(a) \quad (a > 0)

                 对数函数:

\frac{d}{dx}(\ln(x)) = \frac{1}{x} \quad (x > 0)

\frac{d}{dx}(\log_a(x)) = \frac{1}{x \ln(a)} \quad (a > 0, a \neq 1)

        2. 三角函数的导数
                正弦函数

\frac{d}{dx}(\sin(x)) = \cos(x)

                余弦函数

\frac{d}{dx}(\cos(x)) = -\sin(x)

                正切函数

\frac{d}{dx}(\tan(x)) = \sec^2(x)

                余切函数

\frac{d}{dx}(\cot(x)) = -\csc^2(x)

                正割函数

\frac{d}{dx}(\sec(x)) = \sec(x) \tan(x)

                余割函数

\frac{d}{dx}(\csc(x)) = -\csc(x) \cot(x)

        3. 反三角函数的导数
                反正弦

\frac{d}{dx}(\arcsin(x)) = \frac{1}{\sqrt{1-x^2}} \quad (-1 < x < 1)

                反余弦

\frac{d}{dx}(\arccos(x)) = -\frac{1}{\sqrt{1-x^2}} \quad (-1 < x < 1)

                反正切

\frac{d}{dx}(\arctan(x)) = \frac{1}{1+x^2}

                反余切

\frac{d}{dx}(arccot(x)) = -\frac{1}{1+x^2}

                反正割

\frac{d}{dx}(arcsec(x)) = \frac{1}{|x|\sqrt{x^2-1}} \quad (|x| > 1)

                反余割

\frac{d}{dx}(arccsc(x)) = -\frac{1}{|x|\sqrt{x^2-1}} \quad (|x| > 1)

        4. 导数法则
                和差法则

\frac{d}{dx}(u + v) = \frac{du}{dx} + \frac{dv}{dx}

\frac{d}{dx}(u - v) = \frac{du}{dx} - \frac{dv}{dx}

                乘法法则

\frac{d}{dx}(uv) = u \frac{dv}{dx} + v \frac{du}{dx}

                商法则

\frac{d}{dx}\left(\frac{u}{v}\right) = \frac{v \frac{du}{dx} - u \frac{dv}{dx}}{v^2}

                链式法则

\frac{d}{dx}(f(g(x))) = f'(g(x)) \cdot g'(x)

        5. 其他常用函数的导数

                复合函数的导数

\frac{d}{dx}(f(g(x))) = f'(g(x)) \cdot g'(x)

                隐函数的导数

                        设 F(x, y) = 0,则:

\frac{dy}{dx} = -\frac{F_x}{F_y} ​​(F_x​ 和 F_y​ 为 F 对 x 和 y 的偏导数)

      掌握这些常用的导数公式和法则,可以帮助在微积分和相关的数学分析中更高效地求解问题。  

2. 梯度 (Gradient)

梯度是多变量函数的导数,表示函数在各个自变量方向上的变化率。对于多变量函数 f(x_1, x_2, \ldots, x_n),梯度是一个向量,包含了所有自变量的偏导数。

  • 定义

    \nabla f = \left( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n} \right)
  • 几何意义:梯度向量指向函数值增加最快的方向,其长度表示在该方向上的变化率。

  • 偏导数:在计算梯度时,每个分量都是对函数在特定自变量的偏导数。偏导数的定义类似于普通导数:

    \frac{\partial f}{\partial x_i} = \lim_{h \to 0} \frac{f(x_1, \ldots, x_i + h, \ldots, x_n) - f(x_1, \ldots, x_i, \ldots, x_n)}{h}

应用

  • 优化问题:在优化算法中,梯度被用来找到函数的最小值或最大值,特别是在机器学习中常用的梯度下降法中。梯度下降法通过沿着梯度的反方向更新参数,以减少损失函数。

  • 函数的性质:导数和梯度可以用于分析函数的性质,如寻找极值点、判断凹凸性等。

例子

  • 导数: 设 f(x) = x^2,则:

    f'(x) = 2x
  • 梯度: 对于函数 f(x, y) = x^2 + y^2,则梯度为:

    \nabla f = \left( \frac{\partial f}{\partial x}, \frac{\partial f}{\partial y} \right) = \left( 2x, 2y \right)

理解导数和梯度对于研究函数的行为、优化问题以及机器学习模型的训练过程至关重要。


偏导数:在多变量函数中优化目标函数。

偏导数是微积分中用于描述多变量函数变化率的重要概念。它衡量的是在保持其他变量不变的情况下,某一自变量对函数值的影响。下面是偏导数的定义、计算方法和一些相关的概念。

1. 偏导数的定义

对于一个多变量函数 f(x_1, x_2, \ldots, x_n),偏导数表示的是当改变一个自变量 x_i 时,函数 f 的变化率,同时保持其他自变量不变。

  • 偏导数的数学表示

    \frac{\partial f}{\partial x_i} = \lim_{h \to 0} \frac{f(x_1, \ldots, x_i + h, \ldots, x_n) - f(x_1, \ldots, x_i, \ldots, x_n)}{h}
  • 符号: 通常用 \frac{\partial f}{\partial x_i}​ 表示函数f 对变量 x_i 的偏导数。

2. 计算偏导数

计算偏导数的过程与计算普通导数类似,但在求导时需要将其他变量视为常数。

示例: 设有函数 f(x, y) = x^2y + \sin(xy)

  • x 的偏导数:

    \frac{\partial f}{\partial x} = \frac{\partial}{\partial x}(x^2y + \sin(xy)) = 2xy + y \cos(xy)
  • y 的偏导数:

    \frac{\partial f}{\partial y} = \frac{\partial}{\partial y}(x^2y + \sin(xy)) = x^2 + x \cos(xy)

3. 高阶偏导数

偏导数可以进行多次求导,得到高阶偏导数。高阶偏导数可以是对同一变量求多次偏导,也可以是对不同变量交替求偏导。

示例: 对函数 f(x, y) = x^2y + \sin(xy) 进行高阶偏导数计算:

  • x 求两次偏导数:

    \frac{\partial^2 f}{\partial x^2} = \frac{\partial}{\partial x}(2xy + y \cos(xy)) = 2y - y^2 \sin(xy)
  • xy 交替求偏导数:

    \frac{\partial^2 f}{\partial x \partial y} = \frac{\partial}{\partial y}(2xy + y \cos(xy)) = 2x + \cos(xy) - xy \sin(xy)

4. 偏导数的几何意义

偏导数在几何上表示在特定方向上的切线斜率:

  • \frac{\partial f}{\partial x} 表示在 x 方向上的变化率,即在 y 固定时,函数沿 x 轴的斜率。
  • \frac{\partial f}{\partial y} 表示在 y 方向上的变化率,即在 x 固定时,函数沿 y 轴的斜率。

5. 应用

偏导数在许多领域都有广泛应用:

  • 优化:在多变量优化中,偏导数用于求解极值问题。
  • 经济学:用来研究多因素对某一经济指标的影响。
  • 物理学:在描述物理现象(如热传导、流体动力学)中常用。

6. 梯度与偏导数

在多变量分析中,偏导数的集合形成了梯度向量:

\nabla f = \left( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n} \right)

梯度向量指向函数值增加最快的方向,其长度表示在该方向上的变化率。

偏导数是微积分在多变量函数中的核心概念,理解偏导数有助于深入掌握多变量分析、优化以及机器学习中的模型训练。


链式法则:在反向传播算法中用于计算神经网络的梯度。

链式法则是微积分中的一个重要法则,用于求复合函数的导数。它允许我们计算由多个函数组合而成的函数的导数。以下是链式法则的基本概念、公式及其应用。

1. 链式法则的基本概念

链式法则表明,如果一个函数 y 可以表示为另一个函数 u 的函数,即 y=f(u),并且 u 又是 x 的函数,即 u=g(x),那么 y 是 x 的复合函数,表示为 y=f(g(x))

2. 链式法则的公式

链式法则的数学表达式为:

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

其中:

  • \frac{dy}{dx}​ 是 y 关于 x 的导数。
  • \frac{dy}{du}y 关于 u 的导数。
  • \frac{du}{dx}​ 是 u 关于 x 的导数。

3. 例子

例 1:

考虑函数 y = (3x^2 + 2)^5,我们可以用链式法则求其导数。

  1. u = 3x^2 + 2,则 y = u^5
  2. \frac{dy}{du} = 5u^4
  3. \frac{du}{dx} = 6x
  4. 应用链式法则: \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} = 5u^4 \cdot 6x = 30x(3x^2 + 2)^4
例 2:

考虑函数 y = \sin(5x^3),我们可以用链式法则求其导数。

  1. u = 5x^3,则 y = \sin(u)
  2. \frac{dy}{du} = \cos(u)
  3. \frac{du}{dx} = 15x^2
  4. 应用链式法则: \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} = \cos(5x^3) \cdot 15x^2 = 15x^2 \cos(5x^3)

4. 高阶导数的链式法则

对于高阶导数,也可以使用链式法则。对于第二阶导数,假设 y = f(g(x)),则有:

\frac{d^2y}{dx^2} = \frac{d}{dx} \left( \frac{dy}{dx} \right)

可以通过链式法则和积的法则求解,但具体计算会相对复杂。

5. 应用

链式法则广泛应用于物理、工程、经济学等领域,用于解决涉及复合函数的导数问题。例如,在求解运动学中的速度和加速度,电路中的电流和电压关系,以及经济学中的成本与产量关系等问题时,链式法则都能发挥重要作用。

6. 结论

链式法则是微积分中一个非常重要的工具,能够帮助我们简化和计算复合函数的导数。掌握链式法则对于学习微积分及其应用至关重要。


拓展:各类导数的推导过程

导数公式的推导通常依赖于极限的定义、基本的微分法则以及一些重要的数学性质。以下是一些常用导数公式的推导过程,包括幂函数、三角函数和其他常见函数的导数。

1. 常数的导数

常数的导数为零,这是因为常数函数在其定义域内不发生变化。

\frac{d}{dx}(c) = 0

2. 幂函数的导数

对幂函数 f(x) = x^n 的导数推导使用极限定义:

f'(x) = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h} = \lim_{h \to 0} \frac{(x+h)^n - x^n}{h}

使用二项式定理展开:

(x+h)^n = x^n + nx^{n-1}h + \frac{n(n-1)}{2}x^{n-2}h^2 + \ldots

将其代入导数的定义:

f'(x) = \lim_{h \to 0} \frac{nx^{n-1}h + \frac{n(n-1)}{2}x^{n-2}h^2 + \ldots}{h} = \lim_{h \to 0} \left( nx^{n-1} + \frac{n(n-1)}{2}x^{n-2}h + \ldots \right)

h \to 0 时,后面的项趋近于零,因此:

f'(x) = nx^{n-1}

3. 指数函数的导数

对于 f(x) = e^x

f'(x) = \lim_{h \to 0} \frac{e^{x+h} - e^x}{h} = \lim_{h \to 0} \frac{e^x e^h - e^x}{h} = e^x \lim_{h \to 0} \frac{e^h - 1}{h}

已知 \lim_{h \to 0} \frac{e^h - 1}{h} = 1,因此:

 f'(x) = e^x

对于 f(x) = a^x,利用对数的性质:

f(x) = e^{x \ln(a)} \Rightarrow f'(x) = \ln(a) e^{x \ln(a)} = a^x \ln(a)

4. 对数函数的导数

f(x) = \ln(x) 的导数推导如下:

f'(x) = \lim_{h \to 0} \frac{\ln(x+h) - \ln(x)}{h} = \lim_{h \to 0} \frac{\ln\left(\frac{x+h}{x}\right)}{h} = \lim_{h \to 0} \frac{\ln\left(1 + \frac{h}{x}\right)}{h}

利用 \ln(1 + u) 的极限性质 \lim_{u \to 0} \frac{\ln(1+u)}{u} = 1,有:

\frac{\ln\left(1 + \frac{h}{x}\right)}{h} = \frac{1}{\frac{h}{x}} \cdot \frac{\ln\left(1 + \frac{h}{x}\right)}{\frac{h}{x}} \to \frac{1}{x} \text{ when } h \to 0

因此:

f'(x) = \frac{1}{x}

对于其他对数的情况:

f(x) = \log_a(x) = \frac{\ln(x)}{\ln(a)} \Rightarrow f'(x) = \frac{1}{x \ln(a)}

5. 三角函数的导数

\sin(x) 为例:

f'(x) = \lim_{h \to 0} \frac{\sin(x+h) - \sin(x)}{h} = \lim_{h \to 0} \frac{\sin(x)\cos(h) + \cos(x)\sin(h) - \sin(x)}{h}

利用 \lim_{h \to 0} \frac{\sin(h)}{h} = 1\cos(0) = 1,有:

f'(x) = \cos(x)

同理可以推导出余弦和其他三角函数的导数。

6. 链式法则

链式法则可以通过复合函数的极限定义推导:

y = f(g(x)),则:

\frac{dy}{dx} = \frac{dy}{dg} \cdot \frac{dg}{dx}

推导出复合函数的导数。

7. 乘法法则和商法则

这两者可以通过导数的定义直接推导:

  • 乘法法则:

f'(x) = u \cdot v' + v \cdot u'

  • 商法则:

\frac{d}{dx}\left(\frac{u}{v}\right) = \frac{v \cdot u' - u \cdot v'}{v^2}

这些公式通过极限、基本的数学性质和三角函数的基本性质推导而来。掌握这些推导过程将有助于深入理解导数的概念及其应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/59263.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[Import REC] Import REC下载及使用Import REC重建引入表Import table详细过程(附有下载文件)

前言 下载 使用夸克网盘打开链接&#xff0c;给出的是绿化版免安装 Import REC 链接&#xff1a;https://pan.quark.cn/s/552e4c1ea7d6 提取码&#xff1a;qEMM 下载之后解压得到 里面有使用更新说明 使用修复import table 演示 现在有一个程序&#xff0c;放入PEiD进行查壳…

MySQL技巧之跨服务器数据查询:高级篇-先调用A数据库的MySql存储过程再复制到B数据库的表中

MySQL技巧之跨服务器数据查询&#xff1a;高级篇-先调用A数据库的MySql存储过程再复制到B数据库的表中 基础篇已经描述&#xff1a;借用微软的SQL Server ODBC 即可实现MySQL跨服务器间的数据查询。 而且还介绍了如何获得一个在MS SQL Server 可以连接指定实例的MySQL数据库的…

AI制作表情包,每月躺赚1W+,完整流程制作多重变现教学

项目介绍 AI制作表情包项目是一个利用ai&#xff0c;快速生成表情包的副业项目。 在社交平台如微信、QQ等&#xff0c;表情包已成为日常沟通不可或缺的一部分。通过AI技术&#xff0c;我们可以轻松制作出大量表情包&#xff0c;并通过多种渠道实现变现&#xff0c;非常适合追…

excel使用

上中下旬的逾期金额 步骤&#xff1a; 1、先判断上中下旬的时间范围 2、根据城市和时间求和&#xff0c;算出对应的逾期金额 问题&#xff1a;当从左插入列时&#xff0c;列的格式与原本一致&#xff0c;当我们想看数值时&#xff0c;发现为日期 解决&#xff1a;在开始-数据格…

MySQL算数运算符基础:详解与入门

目录 背景&#xff1a; 过程&#xff1a; 1.加法与减法运算符 1.2扩展&#xff1a; 1.3运算结果得出结论 &#xff1a; 2.乘法和除法运算 ​2.1练习&#xff1a; 2.2运算结果得出结论 &#xff1a; 3.求模取余运算符 3.1练习&#xff1a; 总结&#xff1a; 背景&a…

2024年AI办公工具API:高效办公的智能选择

在2024年&#xff0c;AI技术已经深入到我们工作生活的方方面面&#xff0c;极大地提高了办公效率和质量。这些工具通过集成先进的算法和模型&#xff0c;使得日常任务自动化、数据分析智能化、内容创作高效化。以下是2024年最受欢迎的AI办公工具API&#xff0c;它们正在重新定义…

力扣 LeetCode 142. 环形链表II(Day2:链表)

解题思路&#xff1a; 使用set判断是否重复添加&#xff0c;如果set加入不进去证明之前到达过该节点&#xff0c;有环 public class Solution {public ListNode detectCycle(ListNode head) {Set<ListNode> set new HashSet<>();ListNode cur head;while (cur …

基于Spring Boot的电子商务系统设计

5 系统实现 系统实现部分就是将系统分析&#xff0c;系统设计部分的内容通过编码进行功能实现&#xff0c;以一个实际应用系统的形式展示系统分析与系统设计的结果。前面提到的系统分析&#xff0c;系统设计最主要还是进行功能&#xff0c;系统操作逻辑的设计&#xff0c;也包括…

使用 Vue 配合豆包MarsCode 实现“小恐龙酷跑“小游戏

作者&#xff1a;BLACK595 “小恐龙酷跑”&#xff0c;它是一款有趣的离线游戏&#xff0c;是Google给Chrome浏览器加的一个有趣的彩蛋。当我们浏览器断网时一只像素小恐龙便会出来提示断网。许多人认为这只是一个可爱的小图标&#xff0c; 但当我们按下空格后&#xff0c;小恐…

Attention is all you need详细解读

transformer目的是解决NLP中使用RNN不能并行计算问题。 Encoder-Decoder, Attention, Transformer 三者关系 1.基础储备 &#xff08;1&#xff09;CV基础知识 1.首先拿CV中的分类任务来说&#xff0c;训练前我们会有以下几个常见步骤&#xff1a; 2.获取图片 3.定义待分类的类…

面向对象的需求分析和设计(一)

[toc] 1. 引言 前一篇文章《我对需求分析的理解》提到了面向对象分析和设计&#xff0c;正好最近又重新有重点的读了谭云杰著的《Think in UML》&#xff0c;感觉有必要写把书中一些核心内容观点以及自己的想法整理出来&#xff0c;一是方便自己日后的复习&#xff0c;另外也…

Window下PHP安装最新sg11(php5.3-php8.3)

链接: https://pan.baidu.com/s/10yyqTJdwH_oQJnQtWcwIeA 提取码: qz8y 复制这段内容后打开百度网盘手机App&#xff0c;操作更方便哦 (链接失效联系L88467872) 1.下载后解压文件&#xff0c;将对应版本的ixed.xx.win文件放进php对应的ext目录下&#xff0c;如图所示 2.修改ph…

基于Spring Boot与Redis的令牌主动失效机制实现

目录 前言1. 项目结构和依赖配置1.1 项目依赖配置1.2 Redis连接配置 2. 令牌主动失效机制的实现流程2.1 登录成功后将令牌存储到Redis中2.2 使用拦截器验证令牌2.3 用户修改密码后删除旧令牌 3. Redis的配置与测试4. 可能的扩展与优化结语 前言 在现代Web系统中&#xff0c;用…

Linux学习笔记之组管理和权限管理

组管理 文件/目录 所有者 一般文件所有者是文件的创建者&#xff0c;谁创建了该文件&#xff0c;就自然成为该文件的所有者 ls -ahl &#xff08;查看文件的所有者&#xff09; chown 用户名 文件名 &#xff08;修改文件所有者&#xff09; 文件/目录 所在组 当某个用户…

『黄河遗韵』数字非遗馆的守护之旅

创意定位 腾讯云推出的以“守护黄河文明&#xff0c;探索数字非遗馆”为主题的创意H5作品&#xff0c;通过长卷寻宝VR展馆形式&#xff0c;描绘了黄河文明中的非物质文化遗产&#xff0c;旨在唤起公众对黄河文明的保护意识&#xff0c;并邀请大家参与互动&#xff0c;深入了解…

前端监控与埋点 全总结

一、概念 前端埋点是指在网页或者应用程序中插入特定的代码&#xff0c;用于收集用户的行为数据并发送给服务器进行分析。这些数据可以包括用户的点击、浏览、输入等操作&#xff0c;帮助开发者了解用户的在其网站中的行为&#xff0c;从而进行针对性的优化和改进。 前端埋点…

全面介绍软件安全测试分类,安全测试方法、安全防护技术、安全测试流程

一、软件系统设计开发运行安全 1、注重OpenSource组件安全检查和版本更新&#xff08;black duck&#xff09; 现在很多云、云服务器都是由开源的组件去搭成的&#xff0c;对于OpenSource组件应该去做一些安全检查和版本更新&#xff0c;尤其是版本管理&#xff0c;定期对在运…

十、文件上传和下载

文章目录 1. 文件下载2. 文件上传 1. 文件下载 使用ResponseEntity实现下载文件的功能 2. 文件上传

Springboot整合Prometheus+grafana实现系统监控

前言 Prometheus是一个开源的服务监控系统和时序数据库&#xff0c;它提供了强大的功能和灵活的架构&#xff0c;是目前主流的监控和管理应用系统的工具。 而Grafana是一个开源的数据可视化工具&#xff0c;与Prometheus集成&#xff0c;就可以可视化地监控系统的各个指标。 …

新增支持Elasticsearch数据源,支持自定义在线地图风格,DataEase开源BI工具v2.10.2 LTS发布

2024年11月11日&#xff0c;人人可用的开源BI工具DataEase正式发布v2.10.2 LTS版本。 这一版本的功能变动包括&#xff1a;数据源方面&#xff0c;新增了对Elasticsearch数据源的支持&#xff1b;图表方面&#xff0c;对地图类和表格类图表进行了功能增强和优化&#xff0c;增…