【机器学习】机器学习中用到的高等数学知识-3.微积分 (Calculus)

3. 微积分 (Calculus)

  • 导数和梯度:用于优化算法(如梯度下降)中计算损失函数的最小值。
  • 偏导数:在多变量函数中优化目标函数。
  • 链式法则:在反向传播算法中用于计算神经网络的梯度。

导数和梯度:用于优化算法(如梯度下降)中计算损失函数的最小值。

导数和梯度是微积分中非常重要的概念,尤其在优化和机器学习中起着关键作用。以下是对这两个概念的详细解释:

1. 导数 (Derivative)

导数是函数在某一点的瞬时变化率或斜率,描述了函数值对自变量变化的敏感程度。对于单变量函数 f(x),导数的定义如下:

  • 定义

f'(x) = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h}

  • 几何意义:导数表示曲线在某一点的切线的斜率。
  • 基本规则
    • 常数规则:如果 c 是常数,则 \frac{d}{dx}(c) = 0
    • 幂规则:如果 f(x) = x^n,则 f'(x) = nx^{n-1}
    • 和差规则\frac{d}{dx}(u + v) = \frac{du}{dx} + \frac{dv}{dx}​。
    • 乘法规则\frac{d}{dx}(uv) = u \frac{dv}{dx} + v \frac{du}{dx}​。
    • 链式法则:如果 y = f(g(x)),则 \frac{dy}{dx} = f'(g(x)) \cdot g'(x)
  • 常用的导数公式:

        以下是一些常用的导数公式,涵盖了基本的函数和一些常见的导数法则。了解这些公式有助于快速计算各种函数的导数。

       1. 基本导数公式
                常数的导数:

\frac{d}{dx}(c) = 0

                幂函数: 

\frac{d}{dx}(x^n) = nx^{n-1} \quad (n为任意实数)

                 指数函数: 

\frac{d}{dx}(e^x) = e^x

\frac{d}{dx}(a^x) = a^x \ln(a) \quad (a > 0)

                 对数函数:

\frac{d}{dx}(\ln(x)) = \frac{1}{x} \quad (x > 0)

\frac{d}{dx}(\log_a(x)) = \frac{1}{x \ln(a)} \quad (a > 0, a \neq 1)

        2. 三角函数的导数
                正弦函数

\frac{d}{dx}(\sin(x)) = \cos(x)

                余弦函数

\frac{d}{dx}(\cos(x)) = -\sin(x)

                正切函数

\frac{d}{dx}(\tan(x)) = \sec^2(x)

                余切函数

\frac{d}{dx}(\cot(x)) = -\csc^2(x)

                正割函数

\frac{d}{dx}(\sec(x)) = \sec(x) \tan(x)

                余割函数

\frac{d}{dx}(\csc(x)) = -\csc(x) \cot(x)

        3. 反三角函数的导数
                反正弦

\frac{d}{dx}(\arcsin(x)) = \frac{1}{\sqrt{1-x^2}} \quad (-1 < x < 1)

                反余弦

\frac{d}{dx}(\arccos(x)) = -\frac{1}{\sqrt{1-x^2}} \quad (-1 < x < 1)

                反正切

\frac{d}{dx}(\arctan(x)) = \frac{1}{1+x^2}

                反余切

\frac{d}{dx}(arccot(x)) = -\frac{1}{1+x^2}

                反正割

\frac{d}{dx}(arcsec(x)) = \frac{1}{|x|\sqrt{x^2-1}} \quad (|x| > 1)

                反余割

\frac{d}{dx}(arccsc(x)) = -\frac{1}{|x|\sqrt{x^2-1}} \quad (|x| > 1)

        4. 导数法则
                和差法则

\frac{d}{dx}(u + v) = \frac{du}{dx} + \frac{dv}{dx}

\frac{d}{dx}(u - v) = \frac{du}{dx} - \frac{dv}{dx}

                乘法法则

\frac{d}{dx}(uv) = u \frac{dv}{dx} + v \frac{du}{dx}

                商法则

\frac{d}{dx}\left(\frac{u}{v}\right) = \frac{v \frac{du}{dx} - u \frac{dv}{dx}}{v^2}

                链式法则

\frac{d}{dx}(f(g(x))) = f'(g(x)) \cdot g'(x)

        5. 其他常用函数的导数

                复合函数的导数

\frac{d}{dx}(f(g(x))) = f'(g(x)) \cdot g'(x)

                隐函数的导数

                        设 F(x, y) = 0,则:

\frac{dy}{dx} = -\frac{F_x}{F_y} ​​(F_x​ 和 F_y​ 为 F 对 x 和 y 的偏导数)

      掌握这些常用的导数公式和法则,可以帮助在微积分和相关的数学分析中更高效地求解问题。  

2. 梯度 (Gradient)

梯度是多变量函数的导数,表示函数在各个自变量方向上的变化率。对于多变量函数 f(x_1, x_2, \ldots, x_n),梯度是一个向量,包含了所有自变量的偏导数。

  • 定义

    \nabla f = \left( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n} \right)
  • 几何意义:梯度向量指向函数值增加最快的方向,其长度表示在该方向上的变化率。

  • 偏导数:在计算梯度时,每个分量都是对函数在特定自变量的偏导数。偏导数的定义类似于普通导数:

    \frac{\partial f}{\partial x_i} = \lim_{h \to 0} \frac{f(x_1, \ldots, x_i + h, \ldots, x_n) - f(x_1, \ldots, x_i, \ldots, x_n)}{h}

应用

  • 优化问题:在优化算法中,梯度被用来找到函数的最小值或最大值,特别是在机器学习中常用的梯度下降法中。梯度下降法通过沿着梯度的反方向更新参数,以减少损失函数。

  • 函数的性质:导数和梯度可以用于分析函数的性质,如寻找极值点、判断凹凸性等。

例子

  • 导数: 设 f(x) = x^2,则:

    f'(x) = 2x
  • 梯度: 对于函数 f(x, y) = x^2 + y^2,则梯度为:

    \nabla f = \left( \frac{\partial f}{\partial x}, \frac{\partial f}{\partial y} \right) = \left( 2x, 2y \right)

理解导数和梯度对于研究函数的行为、优化问题以及机器学习模型的训练过程至关重要。


偏导数:在多变量函数中优化目标函数。

偏导数是微积分中用于描述多变量函数变化率的重要概念。它衡量的是在保持其他变量不变的情况下,某一自变量对函数值的影响。下面是偏导数的定义、计算方法和一些相关的概念。

1. 偏导数的定义

对于一个多变量函数 f(x_1, x_2, \ldots, x_n),偏导数表示的是当改变一个自变量 x_i 时,函数 f 的变化率,同时保持其他自变量不变。

  • 偏导数的数学表示

    \frac{\partial f}{\partial x_i} = \lim_{h \to 0} \frac{f(x_1, \ldots, x_i + h, \ldots, x_n) - f(x_1, \ldots, x_i, \ldots, x_n)}{h}
  • 符号: 通常用 \frac{\partial f}{\partial x_i}​ 表示函数f 对变量 x_i 的偏导数。

2. 计算偏导数

计算偏导数的过程与计算普通导数类似,但在求导时需要将其他变量视为常数。

示例: 设有函数 f(x, y) = x^2y + \sin(xy)

  • x 的偏导数:

    \frac{\partial f}{\partial x} = \frac{\partial}{\partial x}(x^2y + \sin(xy)) = 2xy + y \cos(xy)
  • y 的偏导数:

    \frac{\partial f}{\partial y} = \frac{\partial}{\partial y}(x^2y + \sin(xy)) = x^2 + x \cos(xy)

3. 高阶偏导数

偏导数可以进行多次求导,得到高阶偏导数。高阶偏导数可以是对同一变量求多次偏导,也可以是对不同变量交替求偏导。

示例: 对函数 f(x, y) = x^2y + \sin(xy) 进行高阶偏导数计算:

  • x 求两次偏导数:

    \frac{\partial^2 f}{\partial x^2} = \frac{\partial}{\partial x}(2xy + y \cos(xy)) = 2y - y^2 \sin(xy)
  • xy 交替求偏导数:

    \frac{\partial^2 f}{\partial x \partial y} = \frac{\partial}{\partial y}(2xy + y \cos(xy)) = 2x + \cos(xy) - xy \sin(xy)

4. 偏导数的几何意义

偏导数在几何上表示在特定方向上的切线斜率:

  • \frac{\partial f}{\partial x} 表示在 x 方向上的变化率,即在 y 固定时,函数沿 x 轴的斜率。
  • \frac{\partial f}{\partial y} 表示在 y 方向上的变化率,即在 x 固定时,函数沿 y 轴的斜率。

5. 应用

偏导数在许多领域都有广泛应用:

  • 优化:在多变量优化中,偏导数用于求解极值问题。
  • 经济学:用来研究多因素对某一经济指标的影响。
  • 物理学:在描述物理现象(如热传导、流体动力学)中常用。

6. 梯度与偏导数

在多变量分析中,偏导数的集合形成了梯度向量:

\nabla f = \left( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n} \right)

梯度向量指向函数值增加最快的方向,其长度表示在该方向上的变化率。

偏导数是微积分在多变量函数中的核心概念,理解偏导数有助于深入掌握多变量分析、优化以及机器学习中的模型训练。


链式法则:在反向传播算法中用于计算神经网络的梯度。

链式法则是微积分中的一个重要法则,用于求复合函数的导数。它允许我们计算由多个函数组合而成的函数的导数。以下是链式法则的基本概念、公式及其应用。

1. 链式法则的基本概念

链式法则表明,如果一个函数 y 可以表示为另一个函数 u 的函数,即 y=f(u),并且 u 又是 x 的函数,即 u=g(x),那么 y 是 x 的复合函数,表示为 y=f(g(x))

2. 链式法则的公式

链式法则的数学表达式为:

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

其中:

  • \frac{dy}{dx}​ 是 y 关于 x 的导数。
  • \frac{dy}{du}y 关于 u 的导数。
  • \frac{du}{dx}​ 是 u 关于 x 的导数。

3. 例子

例 1:

考虑函数 y = (3x^2 + 2)^5,我们可以用链式法则求其导数。

  1. u = 3x^2 + 2,则 y = u^5
  2. \frac{dy}{du} = 5u^4
  3. \frac{du}{dx} = 6x
  4. 应用链式法则: \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} = 5u^4 \cdot 6x = 30x(3x^2 + 2)^4
例 2:

考虑函数 y = \sin(5x^3),我们可以用链式法则求其导数。

  1. u = 5x^3,则 y = \sin(u)
  2. \frac{dy}{du} = \cos(u)
  3. \frac{du}{dx} = 15x^2
  4. 应用链式法则: \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} = \cos(5x^3) \cdot 15x^2 = 15x^2 \cos(5x^3)

4. 高阶导数的链式法则

对于高阶导数,也可以使用链式法则。对于第二阶导数,假设 y = f(g(x)),则有:

\frac{d^2y}{dx^2} = \frac{d}{dx} \left( \frac{dy}{dx} \right)

可以通过链式法则和积的法则求解,但具体计算会相对复杂。

5. 应用

链式法则广泛应用于物理、工程、经济学等领域,用于解决涉及复合函数的导数问题。例如,在求解运动学中的速度和加速度,电路中的电流和电压关系,以及经济学中的成本与产量关系等问题时,链式法则都能发挥重要作用。

6. 结论

链式法则是微积分中一个非常重要的工具,能够帮助我们简化和计算复合函数的导数。掌握链式法则对于学习微积分及其应用至关重要。


拓展:各类导数的推导过程

导数公式的推导通常依赖于极限的定义、基本的微分法则以及一些重要的数学性质。以下是一些常用导数公式的推导过程,包括幂函数、三角函数和其他常见函数的导数。

1. 常数的导数

常数的导数为零,这是因为常数函数在其定义域内不发生变化。

\frac{d}{dx}(c) = 0

2. 幂函数的导数

对幂函数 f(x) = x^n 的导数推导使用极限定义:

f'(x) = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h} = \lim_{h \to 0} \frac{(x+h)^n - x^n}{h}

使用二项式定理展开:

(x+h)^n = x^n + nx^{n-1}h + \frac{n(n-1)}{2}x^{n-2}h^2 + \ldots

将其代入导数的定义:

f'(x) = \lim_{h \to 0} \frac{nx^{n-1}h + \frac{n(n-1)}{2}x^{n-2}h^2 + \ldots}{h} = \lim_{h \to 0} \left( nx^{n-1} + \frac{n(n-1)}{2}x^{n-2}h + \ldots \right)

h \to 0 时,后面的项趋近于零,因此:

f'(x) = nx^{n-1}

3. 指数函数的导数

对于 f(x) = e^x

f'(x) = \lim_{h \to 0} \frac{e^{x+h} - e^x}{h} = \lim_{h \to 0} \frac{e^x e^h - e^x}{h} = e^x \lim_{h \to 0} \frac{e^h - 1}{h}

已知 \lim_{h \to 0} \frac{e^h - 1}{h} = 1,因此:

 f'(x) = e^x

对于 f(x) = a^x,利用对数的性质:

f(x) = e^{x \ln(a)} \Rightarrow f'(x) = \ln(a) e^{x \ln(a)} = a^x \ln(a)

4. 对数函数的导数

f(x) = \ln(x) 的导数推导如下:

f'(x) = \lim_{h \to 0} \frac{\ln(x+h) - \ln(x)}{h} = \lim_{h \to 0} \frac{\ln\left(\frac{x+h}{x}\right)}{h} = \lim_{h \to 0} \frac{\ln\left(1 + \frac{h}{x}\right)}{h}

利用 \ln(1 + u) 的极限性质 \lim_{u \to 0} \frac{\ln(1+u)}{u} = 1,有:

\frac{\ln\left(1 + \frac{h}{x}\right)}{h} = \frac{1}{\frac{h}{x}} \cdot \frac{\ln\left(1 + \frac{h}{x}\right)}{\frac{h}{x}} \to \frac{1}{x} \text{ when } h \to 0

因此:

f'(x) = \frac{1}{x}

对于其他对数的情况:

f(x) = \log_a(x) = \frac{\ln(x)}{\ln(a)} \Rightarrow f'(x) = \frac{1}{x \ln(a)}

5. 三角函数的导数

\sin(x) 为例:

f'(x) = \lim_{h \to 0} \frac{\sin(x+h) - \sin(x)}{h} = \lim_{h \to 0} \frac{\sin(x)\cos(h) + \cos(x)\sin(h) - \sin(x)}{h}

利用 \lim_{h \to 0} \frac{\sin(h)}{h} = 1\cos(0) = 1,有:

f'(x) = \cos(x)

同理可以推导出余弦和其他三角函数的导数。

6. 链式法则

链式法则可以通过复合函数的极限定义推导:

y = f(g(x)),则:

\frac{dy}{dx} = \frac{dy}{dg} \cdot \frac{dg}{dx}

推导出复合函数的导数。

7. 乘法法则和商法则

这两者可以通过导数的定义直接推导:

  • 乘法法则:

f'(x) = u \cdot v' + v \cdot u'

  • 商法则:

\frac{d}{dx}\left(\frac{u}{v}\right) = \frac{v \cdot u' - u \cdot v'}{v^2}

这些公式通过极限、基本的数学性质和三角函数的基本性质推导而来。掌握这些推导过程将有助于深入理解导数的概念及其应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/59263.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 网络通信之 Socket 编程全解析

在当今数字化时代&#xff0c;网络通信已经成为各种应用程序不可或缺的一部分。Java 作为一种广泛应用的编程语言&#xff0c;提供了强大的网络编程能力&#xff0c;其中 Socket 编程是实现网络通信的重要手段。本文将详细介绍如何使用 Java 进行网络通信&#xff0c;重点聚焦于…

黎巴嫩和以色列的比较

现在两国战争进行的如火如荼&#xff0c;西瓜视频相关军事评论层出不穷。 ------------------------------------------ 黎巴嫩概况&#xff1a;1943年11月独立&#xff0c;国土面积10452平方公里&#xff0c;人口约607万&#xff0c;绝大多数为阿拉伯人&#xff0c;官方语言…

“Java面试必看:从基础到进阶的全方位准备指南“(2)

9. **String和StringBuffer, StringBuilder的区别有哪些&#xff1f;所有类名包含Buffer的类的内部实现原理是什么&#xff1f;有什么优势&#xff1f;** - **String**&#xff1a;String是不可变类&#xff0c;每次对字符串进行修改&#xff08;如拼接、替换等&#xff09;都会…

《EasyQuotation 与MongoDB在股市信息的奇妙融合》

《EasyQuotation 与MongoDB在股市信息的奇妙融合》 一、EasyQuotation 的强大功能二、数据存入 MongoDB&#xff08;一&#xff09;配置与连接&#xff08;二&#xff09;存储方法 三、K 线图监视股市信息&#xff08;一&#xff09;自定义性能趋势图表&#xff08;二&#xff…

Kafka新节点加入集群操作指南

一、环境准备 1. Java环境安装 # 安装JDK apt-get update apt-get install openjdk-8-jdk -y2. 下载并解压 wget https://archive.apache.org/dist/kafka/2.8.1/kafka_2.13-2.8.1.tgz tar xf kafka_2.13-2.8.1.tgz mv kafka_2.13-2.8.1 kafka二、配置环境变量 1. 创建kafka…

git配置用户信息

在 Git 中配置用户信息&#xff0c;主要是设置你的用户名和电子邮件地址&#xff0c;这些信息会被 Git 用来记录提交的作者信息。以下是配置用户信息的步骤&#xff1a; 打开命令行工具。 设置你的用户名&#xff1a; git config --global user.name "你的名字"例如…

vue3项目初始化完整流程,vue3+TypeScript+vue-router+pinia+element-plus+axios+unocss+mock

2.1项目初始化 今天来带大家从0开始搭建一个vue3版本的后台管理系统。一个项目要有统一的规范&#xff0c;需要使用eslintstylelintprettier来对我们的代码质量做检测和修复&#xff0c;需要使用husky来做commit拦截&#xff0c;需要使用commitlint来统一提交规范&#xff0c;…

[Import REC] Import REC下载及使用Import REC重建引入表Import table详细过程(附有下载文件)

前言 下载 使用夸克网盘打开链接&#xff0c;给出的是绿化版免安装 Import REC 链接&#xff1a;https://pan.quark.cn/s/552e4c1ea7d6 提取码&#xff1a;qEMM 下载之后解压得到 里面有使用更新说明 使用修复import table 演示 现在有一个程序&#xff0c;放入PEiD进行查壳…

MySQL技巧之跨服务器数据查询:高级篇-先调用A数据库的MySql存储过程再复制到B数据库的表中

MySQL技巧之跨服务器数据查询&#xff1a;高级篇-先调用A数据库的MySql存储过程再复制到B数据库的表中 基础篇已经描述&#xff1a;借用微软的SQL Server ODBC 即可实现MySQL跨服务器间的数据查询。 而且还介绍了如何获得一个在MS SQL Server 可以连接指定实例的MySQL数据库的…

AI制作表情包,每月躺赚1W+,完整流程制作多重变现教学

项目介绍 AI制作表情包项目是一个利用ai&#xff0c;快速生成表情包的副业项目。 在社交平台如微信、QQ等&#xff0c;表情包已成为日常沟通不可或缺的一部分。通过AI技术&#xff0c;我们可以轻松制作出大量表情包&#xff0c;并通过多种渠道实现变现&#xff0c;非常适合追…

入侵排查之Linux

目录 1.黑客入侵后的利用思路 2.入侵排查思路 2.1.账号安全 2.1.1.用户信息文件/etc/passwd 2.1.2.影子文件/etc/shadow 2.1.3.入侵排查 2.1.3.1.排查当前系统登录信息 2.1.4.2.查询可以远程登录的账号信息 2.2.历史命令 2.2.1.基本使用 2.2.1.1.root历史命令 2.2.…

【OceanBase 诊断调优】—— 止血良方「SQL 限流」

1. 知识点 1. 对于Oceanbase&#xff0c;限流的意思是限制其在单台主机上处理的并发度&#xff0c;因此假设对某SQL限流的并发度为1&#xff0c;该集群有N台机器可以执行该SQL&#xff0c;则实际并发度是N。 2. OceanBase 是通过在 SQL 上绑定 Outline 的方式来实现的&#x…

excel使用

上中下旬的逾期金额 步骤&#xff1a; 1、先判断上中下旬的时间范围 2、根据城市和时间求和&#xff0c;算出对应的逾期金额 问题&#xff1a;当从左插入列时&#xff0c;列的格式与原本一致&#xff0c;当我们想看数值时&#xff0c;发现为日期 解决&#xff1a;在开始-数据格…

MySQL远程连接错误解决:Host is not allowed to connect to this MySQL server

1. 异常错误 通过远程客户端访问MySQL服务器时会遇到“Host is not allowed to connect to this MySQL server”的错误提示。 2. 原因 MySQL服务器当前配置不允许来自特定主机的连接尝试。 3. 解决方法 允许远程主机访问MySQL服务器&#xff0c;按照以下步骤操作&#xff…

MySQL算数运算符基础:详解与入门

目录 背景&#xff1a; 过程&#xff1a; 1.加法与减法运算符 1.2扩展&#xff1a; 1.3运算结果得出结论 &#xff1a; 2.乘法和除法运算 ​2.1练习&#xff1a; 2.2运算结果得出结论 &#xff1a; 3.求模取余运算符 3.1练习&#xff1a; 总结&#xff1a; 背景&a…

7天用Go从零实现分布式缓存GeeCache(学习)

参考资料 前置知识 在 Go 的 HTTP 服务器开发中&#xff0c;ServeHTTP 方法的参数 w http.ResponseWriter 和 r *http.Request 用于处理 HTTP 请求和构建响应。以下是它们的详细解释&#xff1a; 1. w http.ResponseWriter w 是一个 http.ResponseWriter 类型&#xff0c;用…

[HarmonyOS]简单说一下鸿蒙架构

鸿蒙操作系统&#xff08;HarmonyOS&#xff09;是由华为公司开发的一款面向全场景的操作分布式系统。它旨在提供一个统一的操作系统平台&#xff0c;支持多种设备&#xff0c;包括智能手机、平板电脑、智能电视、可穿戴设备、智能家居等。鸿蒙架构的设计目标是实现设备之间的无…

centos7.9安装mysql5.7完整版

centos7.9安装mysql5.7完整版 1. 更新yum源 [rootlocalhost ~]# cd /etc/yum.repos.d/ [rootlocalhost yum.repos.d]# ls -lh #备份镜像源 [rootlocalhost yum.repos.d]# mv CentOS-Base.repo CentOS-Base.repo.backup #下载阿里云centos7镜像 [rootlocalhost yum.repos.d]# …

2024年AI办公工具API:高效办公的智能选择

在2024年&#xff0c;AI技术已经深入到我们工作生活的方方面面&#xff0c;极大地提高了办公效率和质量。这些工具通过集成先进的算法和模型&#xff0c;使得日常任务自动化、数据分析智能化、内容创作高效化。以下是2024年最受欢迎的AI办公工具API&#xff0c;它们正在重新定义…

[UnLua]动态创建SceneCapture2d相机,并且添加渲染目标纹理

在 Unlua 开发中&#xff0c;相机相关的操作是构建场景视觉效果的重要部分。以下我们来详细分析一段涉及相机实例化和为相机赋予纹理目标的 Unlua 代码。 -- 实例化相机local World self:GetWorld()maskCamera World:SpawnActor(UE.ASceneCapture2D)-- 给相机赋值纹理目标lo…