【推荐系统】推荐算法数学基础

【大家好,我是爱干饭的猿,本文重点介绍推荐系统涉及的数学知识、推荐系统涉及的概率统计知识。
后续会继续分享其他重要知识点总结,如果喜欢这篇文章,点个赞👍,关注一下吧】

上一篇文章:《【推荐系统】了解推荐系统的生态(重点:推荐算法的主要分类)》

2. 推荐算法数学基础

本章回顾并梳理了学习算法必需的数学知识和统计学知识,帮助大家巩固基础,平滑过渡,为后面学习推荐算法做铺垫。

汗流浃背了吧老弟,全是大学高数和概率论知识!!!

2.1 推荐系统涉及的数学知识

向量

  • 既有长度又有方向
    在这里插入图片描述

向量和矩阵的关系

  • 由有限个向量组可以构成一个矩阵
  • 向量是矩阵的—部分

在这里插入图片描述

向量的和

在这里插入图片描述
在这里插入图片描述

向量和常量的乘法

在这里插入图片描述
在这里插入图片描述

向量乘积

在这里插入图片描述

矩阵与矩阵相乘

在这里插入图片描述

  • 第一个矩阵的列数必须等于第二个矩阵的行数
  • 相乘获得的矩阵行数是第一个矩阵的行数,列数是第二个矩阵的列数

矩阵

  • 方阵,单位矩阵
  • 矩阵的转置:A^T
  • 矩阵的逆矩阵:A^-1
  • 矩阵的秩

导数

  • 导数是用来分析变化的
  • 一次函数(直线)的求导,得到的是斜率
  • 二次函数(曲线)的求导,得到的是各点切线的斜率

偏导数

  • 当存在多个自变量和一个因变量
  • 假设其他自变量不变
  • 当只有一个自变量变化时,因变量也会随之变化

方向导数

  • 一个函数沿指定方向的变化率

梯度

  • 梯度是偏导向量的方向
  • 沿着偏导向量的方向导数能够取得最大值
  • 梯度就是变化最快的方向

凸函数和凹函数

在这里插入图片描述

在这里插入图片描述

2.2 推荐系统涉及的概率统计知识

均值

  • 反映一组数据集中趋势的统计量
  • 算术平均数、加权平均数、中位数

数学期望

  • 掷骰子游戏,规定掷出1点得到1元,2点得到2元,以此类推
  • 求:掷一次它的期望值
    在这里插入图片描述

方差

  • 方差是一种特殊的期望
  • 是衡量源数据和期望值相差的度量值
  • 方差是计算每一个观察值和总体均数之间的差异
    在这里插入图片描述
  • A: 40,100,120,70,30。平均成绩=72
  • B: 73,70,72,75,70。平均成绩= 72

样本标准差

  • 样本标准差=方差的算术平方根
  • 方差是数据的平方,与检测值本身相差太大,难以直观的衡量

协方差

  • 协方差是度量两个随机变量关系的统计量
    在这里插入图片描述

相关系数

  • X、Y的协方差除以X的标准差和Y的标准差的乘积
    在这里插入图片描述
    在这里插入图片描述

概率密度函数

  • 离散型变量:取值可以——列出,且总数确定

  • 连续型变量:取值无法——列出,且总数不确定

  • 概率分布:给出了所有值及其概率,只对离散型变量有意义

  • 概率函数:是对概率分布的描述,只对离散型变量有意义

  • 概率分布函数:给出了x落在某区间内的概率

  • 概率密度函数:给出了x落在某区间内的概率变化快慢

均匀分布

  • 任意相同间隔所对应的概率分布都相等
    在这里插入图片描述

正态分布(高斯分布)

在这里插入图片描述

中心极限定理

  • 正太分布为什么常见,原因是中心极限定理
  • 大量相互独立的随机变量,当采样次数足够大
  • 不管随机变量呈现什么分布,抽取样本的均值接近正太分布

置信区间

  • 标准正太分布是均值为0,标准差为1
    在这里插入图片描述

条件概率公式

  • A,B是两个事件,在B发生的条件下,A发生的概率
    在这里插入图片描述

贝叶斯公式

  • 贝叶斯公式就是建立在条件概率基础上寻找事件发生的原因
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/226853.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

R语言|分面中嵌入趋势线

简介 关于分面的推文,小编根据实际科研需求,已经分享了很多技巧。例如: 分面中添加不同表格 分面中添加不同的直线 基于分面的面积图绘制 分面中的细节调整汇总 基于分面的折线图绘制 最近科研中又遇到了与分面相关的需求:…

CF1898C Colorful Grid(构造)

题目链接 题目大意 n 行 m 列 的一个矩阵,每行有m - 1条边,每列有 n - 1 条边。 问一共走 k 条边,能不能从 (1, 1),走到(n, m),要求该路径上&am…

【一文带你掌握Java中方法定义、调用和重载的技巧】

方法的定义和调用 方法的定义 方法(method)是一段用于实现特定功能的代码块,类似于其他编程语言中的函数(function)。方法被用来定义类或类的实例的行为特征和功能实现。方法是类和对象行为特征的抽象表示。方法与面向…

十八)Stable Diffusion使用教程:艺术二维码案例

今天说说怎么样使用SD生成艺术二维码。 我们直接上图。 方式有三种,分别如下: 1)方式一:直接 contronet 的tile模型进行控制 使用QRBTF Classic生成你的二维码。 首先输入网址,选择喜欢的二维码样式(推荐第一种就行): 然后选择相应参数,这里推荐最大的容错率,定…

JieLink+智能终端操作平台存在弱口令漏洞

产品简介 捷顺JeLink智能终端操作平台(JSOTC2016 fJeLink)是捷顺历经多年行业经验积累,集智能硬件技术视频分析技术、互联网技术等多种技术融合,基于B/S架构,实现核心业务处理模型(用户中心、投权中心财务中心中心值班室、 运维中心车行客户…

《地理信息系统原理》笔记/期末复习资料(11. GIS的输出与地图可视化)

目录 11. GIS的输出与地图可视化 11.1. GIS的输出 11.1.1. 输出方式 11.1.2. GIS的图形输出设备 11.2. 地图符号 11.2.1. 地图符号的实质 11.2.2. 地图符号的分类 11.2.3. 地图符号的设计要求 11.3. 专题信息表达 11.3.1. 专题地图的基本概念 11.3.2. 专题地图的表示…

boost graph之基础

结构 属性相关 #mermaid-svg-LUDFVluXTOlnqK0d {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-LUDFVluXTOlnqK0d .error-icon{fill:#552222;}#mermaid-svg-LUDFVluXTOlnqK0d .error-text{fill:#552222;stroke:#5522…

微软自带浏览器Edge,无法关闭“保存历史记录网站的屏幕截图”解决方案

微软自带浏览器Edge,无法关闭“保存历史记录网站的屏幕截图”解决方案 吐槽1:Windows自带的Chrome内核版本的浏览器Microsofg Edge刚发布时可谓一股清流,启动速度快,占用内存较小,相信很多人也开始抛弃正代Chrome&…

【Spring】08 BeanNameAware 接口

文章目录 1. 简介2. 作用3. 使用3.1 创建并实现接口3.2 配置 Bean 信息3.3 创建启动类3.4 启动 4. 应用场景总结 Spring 框架为开发者提供了丰富的扩展点,其中之一就是 Bean 生命周期中的回调接口。本文将聚焦于其中的一个接口 BeanNameAware,介绍它的作…

Hudi 在 vivo 湖仓一体的落地实践

作者:vivo 互联网大数据团队 - Xu Yu 在增效降本的大背景下,vivo大数据基础团队引入Hudi组件为公司业务部门湖仓加速的场景进行赋能。主要应用在流批同源、实时链路优化及宽表拼接等业务场景。 一、Hudi 基础能力及相关概念介绍 1.1 流批同源能力 与H…

go学习redis的学习与使用

文章目录 一、redis的学习与使用1.Redis的基本介绍2.Redis的安装下载安装包即可3.Redis的基本使用1)Redis的启动:2)Redis的操作的三种方式3)说明:Redis安装好后,默认有16个数据库,初始默认使用0…

java导出word使用模版与自定义联合出击解决复杂表格!

1. 看一下需要导出什么样子的表格 如图所示,这里的所有数据行都是动态的,需要根据查询出来的数据循环展示。 如果只是这样的话,使用freemarker应该都可以搞定,但是他一列中内容相同的单元格,需要合并。 这对于表格样式…

conda命令克隆(复制)环境

前情介绍 最近有个需求是:根据已有的环境生成一个新的环境,也就是所需的新环境有大多数包和已有的环境都是相同的,需要改的只是部分,所以呢,克隆一个就再适合不过了! 所需命令 conda create -n B --clone…

java设计模式-工厂方法模式

1.工厂方法(FactoryMethod)模式的定义 定义一个创建产品对象的工厂接口,将产品对象的实际创建工作推迟到具体子工厂类当中。这满足创建型模式中所要求的“创建与使用相分离”的特点。 2.工厂方法模式的主要优缺点 优点: 用户只需要知道具体工厂的名称…

HPM6750系列--第九篇 GPIO详解(基本操作)

一、目的 在之前的博文中我们主要介绍了不同系统不同开发编译调试环境的配置和操作(命令行方式、Visual Studio Code、Segger Embedded Studio for RISC-V),以帮助大家准备好学习环境为目的,但是未涉及到芯片本身以及外设的讲解。…

【linux】图形界面Debian的root用户登陆

图形界面Debian默认不允许以root用户登录。这是出于安全考虑,以防止用户使用root权限执行可能损害系统的操作。 如果需要使用root用户,可以通过以下步骤进行登录: 打开终端,使用su命令切换到root用户。修改/etc/gdm3/daemon.con…

大型网站架构演进过程

架构演进 大型网站的技术挑战主要来自于庞大的用户,高并发的访问和海量的数据,任何简单的业务一旦需要处理数以P计的数据和面对数以亿计的用户,问题就会变得很棘手。大型网站架构主要就是解决这类问题。 架构选型是根据当前业务需要来的&…

时序预测 | Python实现XGBoost电力需求预测

时序预测 | Python实现XGBoost电力需求预测 目录 时序预测 | Python实现XGBoost电力需求预测预测效果基本描述程序设计参考资料预测效果 基本描述 该数据集因其每小时的用电量数据以及 TSO 对消耗和定价的相应预测而值得注意,从而可以将预期预测与当前最先进的行业预测进行比较…

JS中的String常用的实例方法

splice():分隔符 把字符串以分隔符的形式拆分为数组 const str pink,red;const arr str.split(,);console.log(arr);//Array[0,"pink";1:"red"]const str1 2022-4-8;const arr1 str1.split(-);console.log(arr1);//Array[0,"2022";1:"…