深度学习第一次课-数学

说明:本文是七月算法5月深度学习班第一次课听课笔记。只记录关键知识点,有些没具体展开。帮助复习用。文中使用了老师课件中的公式。

微积分


导数

定义
常用函数导数
导数法则
加法  乘法  除法  链式法则
一元函数与多元函数

一阶导   一元函数 f'(x) 
多元函数               

二阶导    一元函数f‘’(x)
    多元函数Hessian矩阵


泰勒级数

       泰勒级数公式    一元版和多元版

        

       

一级导数=0  这一点可能为 平稳点、极值点、鞍点。如果二级导数>0,是极小值点;二级导数<0,是极大值点。二级导数=0,是鞍点。注意在多元函数中二级导数>0,就是指hession矩阵>0(正定矩阵)。


梯度下降

为了找到函数最小值,首先要求一阶导数。当原函数的导数不好求,或者不可求的时候选择梯度下降。
为什么是梯度下降?
在函数已知点 (xk,f(xk)) ,走一个方向 delta。怎么才能让函数最快上升呢?根据上面的泰勒级数公式,当  delta = 梯度方向的时候, 可以取到最大值,所以函数增长会最大。
当需要求函数最小值的时候,只要沿着负梯度方向就可以了。当然这里还有一个重要的参数是步长。


概率论


随机变量

离散型 分布式函数
连续型 累计分布函数概率密度函数

高斯分布

表达式   一元版   多元函数版
中心极限定理
多个(>=4)泊松分布的和是高斯分布
独立高斯变量相加=高斯分布

贝叶斯公式

贝叶斯公式用于推断一件事情发生的可能性。

通过 公式1和公式2推出公式3,进而得到公式4,贝叶斯公式。P(A|B)是后验概率,P(B)是一个确定的事件,P(A)是先验概率,P(B|A)是似然函数。

吸毒案例学习
注意:当先验概率很低的时候,即使似然函数有很高的值,结果也可能很低。


矩阵


特征向量与特征值

A为一个矩阵 ,X为一个向量,r为一个实数。如果 AX=rX。则X是A的特征向量,r是特征值。也就是说一个向量,经过矩阵A的变换之后,仍然和原向量共线。
矩阵所有特征值不同=> 特征向量线性无关

对称矩阵特征分解


PCA

对象                          操作       结果 
X                               协方差  =  Cx
Cx                             SVD   =     U(单位特征向量)
(U转置)   X                内积   =     Y 对(X做去相关操作)
Y                               协方差   =  Cy  对角阵,对角元素是X的特征值,按照从小到大排序
                                                                  与U中的列  特征向量正好 对应,形成特征向量与特征值

U[:,:k] X                      内积    =    降维后的矩阵


凸优化


一般有约束的优化问题


KKT条件

将约束转为无约束


凸优化问题


无约束问题求解--------SGD
有约束优化问题  --------------拉格朗日乘子--------无约束问题-----------KKT 求解

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/425125.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用CUPS打印服务

目录1. 测试环境 22. CUPS介绍 32.1 CUPS的配置文件 32.1.1 cupsd.conf 32.1.2 cups-files.conf 32.1.3 printcap 32.1.4 printers.conf 32.2 SPOOL假脱机 42.3 CUPS 支持各种打印机&#xff0c;包括&#xff1a; 42.4 CUPS的beh 42.5 使用beh 52.6 安装cups&#xff0c;并激活…

深度学习第三次课-梯度下降与反向传播

梯度下降 损失函数可视化 得分函数 fW*X损失函数 cW*X-y 目标 损失函数最小 最优化过程可视化 一维二维 热力图如果损失函数是一个凸函数&#xff0c;例如SVM。凸函数 正系数加和凸函数神经网络 costfunction 非凸 因为系数有正有负。凸优化与最优化…

[Leetcode][第1025题][JAVA][除数博弈][数学][递推]

【问题描述】[中等] 【解答思路】 1. 数学证明 找规律 时间复杂度&#xff1a;O(1) 空间复杂度&#xff1a;O(1) 2. 递推 时间复杂度&#xff1a;O(N) 空间复杂度&#xff1a;O(1) class Solution {public boolean divisorGame(int N) {boolean[] f new boolean[N 5];f[1]…

《App后台开发运维与架构实践》第2章 App后台基础技术

2.1 從App業務邏輯中提煉API接口    業務邏輯思維導圖    功能-業務邏輯思維導圖    基本功能模塊關系    功能模塊接口UML&#xff08;設計出API&#xff09;    在設計稿標注API    編寫API文檔    2.2 設計API的要點    根據對象設計API  …

[Leetcode][第410题][JAVA][分割数组的最大值][动态规划][二分]

【问题描述】[中等] 【解答思路】 1. 动态规划 第 1 步&#xff1a;设计状态 令 f[i][j] 表示将数组的前 i 个数分割为 j 段所能得到的最大连续子数组和的最小值。 &#xff08; i ≥ j &#xff09; 第 2 步&#xff1a;状态转移方程 第 3 步&#xff1a;考虑初始化 f[i][…

深度学习第二课--图像识别与KNN

图像分类的难点 视角不同尺寸不同变形光影背景干扰同类内的差异 例如躺椅、座椅、 图像识别的核心 数据驱动学习。就像人看过很多猫以后&#xff0c;就知道什么是猫。把很多同一类的图片“喂给”计算机&#xff0c;让计算机自己去学习该类图片的特征。之后做出评估。KNN解决…

Vasya and Multisets CodeForces - 1051C 模拟|分类讨论

题意&#xff1a;把数组分成两个集合 每个集合中元素数量为1的个数相同&#xff08;此个数可以是0&#xff09; 分析&#xff1a; 这类问题就是要各种可能情况考虑到 然后分类讨论 完整地正确分类就AC 否则gg 如果数量为1的元素数为偶数个 对半分 如果元素数量…

centos安装多个tomcat

1.参考前文安装jdk、第一个tomcat 2.安装第二个tomcat后&#xff0c;修改/etc/profile vi /etc/profile #tomcat1  export CATALINA_BASE/opt/tomcat1  export CATALINA_HOME/opt/tomcat1  export TOMCAT_HOME/opt/tomcat1 #tomcat2  export CATALINA_BASE2/opt/tomcat…

[小技巧][Java]Arrays.fill() 初始化 二维数组

Arrays.fill()并不能提高赋值的效率&#xff0c;在函数的内部也是用for循环的方式 实现的。 fill()函数源码&#xff1a; public static void fill(Object[] a, Object val) {for (int i 0, len a.length; i < len; i)a[i] val;}for (int i 0; i < n; i) {Arrays.fil…

Grid game CodeForces - 1104C 放格子|思维|找规律

题意&#xff1a;4*4的格子中输入0放 2*1的图案输入1放1*2的图案 当摆满一行或一列后此行列图案清空 就想毛熊方块一样 分析&#xff1a;开始感觉很唬人 要搜索还是要dp啥的 后来发现原来2*1就放左下 1*2就放左上 然后来啥清空啥 就能够循环不断地放下去 然后变成了一道巨水题…

团队开发之团队介绍

团队名&#xff1a;又双叒叕队 团队口号&#xff1a;Bug不死&#xff0c;我们不休&#xff01; 团队成员&#xff1a;符满迪该团队成员拥有个人公众平台&#xff0c;对公众平台的运营有良好的实践经验。而且具有较好的编程能力&#xff0c;精通Java语言&#xff0c;对微信小程序…

数据结构与算法分析

本系列的笔记基于七月算法的《求职面试》课程以及《数据结构域算法分析-java语言描述》第2版&#xff0c;做学习笔记。 以下是这系列的目录。每个专题只做笔记&#xff0c;不求每个专题都要深入到很深很深。算法分析 表 栈 队列 并查集 哈希表 树 堆 图论 递归 深度优…

[算法][算法复杂度]常用算法复杂度速查表

复杂度通常会使用大 -O记号来表示&#xff0c;比如快速排序的平均时间复杂度是 O(nlog(n))。虽然我们应该做「理解派」&#xff0c;但是即使每个算法/数据结构都理解了&#xff0c;不时仍有可能忘记具体某个算法/数据结构的复杂度&#xff08;特别是在最好、最坏和平均情形下的…

十张伟大的科学瞬间

题图&#xff1a; 搭载 ORBCOMM OG2-M1 卫星的猎鹰 9 号运载火箭发射&#xff0c;人类一直很渺小。 ▎2019 更新 北京时间 2019 年 4 月 10 日 21 点&#xff0c;人类首张黑洞照片正式发布&#xff01; 这次的直接成像除了帮助我们直接确认了黑洞的存在&#xff0c;同时也通过模…

为什么gets如此危险?

这一段搬运自stackoverflow: Why is gets() dangerous The first internet worm (the Morris Internet Worm) escaped about 30 years ago (1988-11-02), and it used gets() and a buffer overflow as one of its methods of propagating from system to system. The basic pr…

[Leetcode][第329题][JAVA][矩阵中的最长递增路径][DFS][拓扑排序]

【问题描述】[中等] 【解答思路】 1. 记忆化深度优先搜索 复杂度 class Solution {public int[][] dirs {{-1, 0}, {1, 0}, {0, -1}, {0, 1}};public int rows, columns;public int longestIncreasingPath(int[][] matrix) {if (matrix null || matrix.length 0 || matri…

code1928: 日期差值 技巧模拟

1928: 日期差值 时间限制: 1 Sec 内存限制: 32 MB 题目描述 有两个日期&#xff0c;求两个日期之间的天数&#xff0c;如果两个日期是连续的我们规定他们之间的天数为两天。 输入 有多组数据&#xff0c;每组数据有两行&#xff0c;分别表示两个日期&#xff0c;形式为YYYYMMD…

第二十八期:阿里云VS腾讯云 谁才是中国未来的云计算之王?

阿里云早在 2009 年就已经开始布局云计算领域&#xff0c;具有先发优势。据统计&#xff0c;40% 的中国 500 强企业、近一半中国上市公司、80% 中国科技类公司是阿里云的客户。而腾讯云基于腾讯自身在游戏、视频、社交、出行等业务的强势地位&#xff0c;一路奋起直追&#xff…

[小技巧][JAVA][转换]字符数组char[]与字符串String之间互相转换

1.字符数组转为字符串 方法1&#xff1a;直接在构造String时转换。 char[] data {‘a’, ‘b’, ‘c’}; String str new String(data);方法2&#xff1a;调用String类的方法转换。 String s String.valueOf(char[] ch)2.字符串转为字符数组 情况一&#xff1a;如果是”a…

CentOS 7 Apache服务的安装与配置(转)

https://blog.51cto.com/13525470/2070375 一、Apache简介 Apache 是一个知名的开源Web服务器。早期的Apache服务器由Apache Group来维护&#xff0c;直到1999年6月Apache Group在美国德拉瓦市成立了非盈利性组织的公司&#xff0c;即Apache软件基金会&#xff08;Apache Softw…