08 模型演化根本 深度学习推荐算法的五大范式

易经》“九三:君于终日乾乾;夕惕若,厉无咎”。九三是指阳爻在卦中处于第三位,已经到达中位,惕龙指这个阶段逐渐理性,德才已经显现,会引人注目;但要反思自己的不足,努力不懈,日夜警惕戒备,即使处于危境,也可无咎。

模块三我们将讲解深度学习推荐算法,这部分近年来发展迅速,我们将学习和掌握最有影响力的深度学习推荐算法及其发展脉络。

上一课时《07 | 物以类聚,基于特征的七种算法模型》,我们讲到传统机器学习组合 GDBT+LR 模型开启了特征工程化和端到端学习的开端,而深度学习的发展将继续延续了这一趋势。

神经网络的结构更加复杂和灵活多变,所以复杂的网络结构就需要更多、更丰富的样本去拟合参数,这样对算力的要求也就高了很多。但是深度学习能够全自动从原有数据中提取到有用特征,而对于处理文本、图像、语音等非结构化数据,人工筛选是基本不可能完成,所以我们说深度学习具有传统机器学习无法比拟的优势。

因此,从这一讲开始我们进入激动人心的深度学习算法部分。

进入深度学习时代后,推荐模型主要有以下两个方面的进展:

  • 与传统模型相比,深度学习模型的表达能力更强,且能够从数据中挖掘出更多隐藏的模式;

  • 深度学习模型结构非常灵活,它能够根据业务场景和数据特点灵活调整模型结构,使得模型与应用场景实现完美契合。

《道德经》中“道之在天下,犹川谷之于江海;为天下谷,常德乃足,复归于朴。朴散则为器,圣人用之,则为官长,故大制不割。”这句话主要阐述了“见素抱朴”的思想。

在光怪陆离、纷繁芜杂的世界,我们只有剥离事物的表面现象,找到事物的本质,才能把握一切事物的变化规律,并据此预测事物的发展趋势,也就是所谓的“降维”思想。

而机器学习的过程就是对世界降维理解的过程,其中用户的隐向量是对用户的降维理解,物品的隐向量是对物品的降维理解,这就是我们说的“朴”。

那么,我们应该如何找到“朴”呢?也就是如何找到事物的本质呢?

在深度学习中,通过找到一些范式方法,并将这些范式方法应用到范式模型中,我们就可以得到“朴”。

所谓的范式模型,是指其他模型基于此范式演化的基础模型。

得到的“朴”如果不够精确,我们则可以通过改进范式与范式的组合方式,来拟合反馈更加精确的“朴”,这就形成了推荐系统的深度学习体系。

这也是这一讲的重点内容,下面我们着重介绍一下。在推荐系统中,深度学习的范式模型分为多层感知器(MLP)、自编码器(AE)、受限玻尔兹曼机(RBM)、卷积神经网络(CNN)、循环神经网络(RNN)这五种,下面我们逐一说明一下。

多层感知器(MLP)—— 最通用组件

目前多层感知器(Muti-Layer Perception)在推荐领域应用甚为广泛,它是一种简单、原汁原味的神经网络,能有效地建模高阶特征之间的交互,属于深度推荐算法中最通用的组件,并且其他的各种范式都是由此演变而来。

最典型的 MLP 包括三层:输入层、一个或多个隐藏层和输出层。MLP 神经网络的不同层之间是全连接的;每个神经元上面都有一个输入权重、偏置量和激活函数。

MLP 已被证明是一种通用的函数近似方法,可以拟合复杂的函数或解决分类问题。

自编码器(AE)—— 学习隐向量表征

自编码器(AutoEncoder)是最常见的神经网络无监督模型,主要用于特征降维或特征提取。

AE 一般由编码器(Encoder)和解码器(Decoder)组成,

  • 这里可以理解为学习到输入数据的隐向量表征称为编码;

  • 用隐向量表征重构出原始输入数据称为解码。

模型目的在于,使输入和输出无限逼近。学习数据的隐向量表征由最中间层计算输出。

自编码器在推荐领域,主要用于学习用户或物品的隐向量表征,然后基于表征预测用户对物品的偏好。需要说明的是,自编码器的适用场景与其训练数据强相关,且因为属于无监督模型,无需标注,可以自动进行样本学习。

受限玻尔兹曼机(RBM)—— 评分预测

受限玻尔兹曼机(Restricted Boltzmann Machine)是一个由可见层和隐藏层组成的双层神经网络无监督模型,两层内部不存在连接,两层之间进行全连接。

RBM 与玻尔兹曼机(Boltzmann Machine)的差别在于:RBM 不存在两层内部连接,而 BM 存在两层内部连接,因为去除了同层之间的连接,从而提高了训练效率。

RBM 在推荐领域,主要用于评分预测,通过学习用户对物品的评分数据进行预测。

卷积神经网络(CNN)—— 提取隐向量表征

卷积神经网络(Convolutional Neural Network)是一种特殊的前馈神经网络,基本结构上包含以下三层:

  • 卷积层,捕捉局部特征;

  • 池化层,可大幅降低模型参数量级,并有效避免过拟合;

  • 全连接层,根据不同的场景和任务输出模型的结果。

可以看出,CNN 把大量参数降维成少量参数再做处理,简化问题域的同时,又不会影响结果。

CNN 在推荐领域,主要用于从图像、文本、音频中提取物品的隐向量表征,并结合用户的隐向量表征进行推荐。

循环神经网络(RNN)—— 序列数据建模

循环神经网络(Recurrent Neural Network)是一种含有反馈结构的神经网络,模型输出不但与当前输入相关,与之前的输入也相关,适用于对序列数据建模。

RNN 在网络各隐层之间的节点是具有连接的,可根据输入层的输出和前一时刻的隐层状态来计算当前时刻的隐层输出,从而具备对过去信息的记忆。

RNN 本身存在梯度消失和梯度爆炸的问题,经过改进网络结构后,如长短时记忆网络(LSTM)和门控循环单元(GRU)等采用了特殊的隐层结构,使得模型具备有效建模长程依赖关系的能力。

RNN 在推荐领域,主要用于对用户行为序列的建模,以及对用户或物品相关文本信息序列的建模等。

【其他范式还有哪些?】

除了上述 5 种常用范式之外,还包括神经自回归分布估计(Neural Autoregressive Distribution Estimation)、对抗网络(Adversarial Networks)等范式。

由于它们在推荐领域的应用比较有限,这一讲中我们就不一一介绍了。

此外,目前注意力机制、深度强化学习等在深度学习领域中发展迅速,在推荐领域深度模型中也有普遍化的趋势,这类模型我们将在“10 | 更深、更专注的 7 种深度推荐范式组合算法”中介绍。

【从 深度网络范式 到 深度学习推荐模型】

利用以上深度网络范式来构成深度学习推荐模型主要有以下两种方法。

1、利用深度网络范式进行用户和物品的表征或者高阶交互特征提取(双塔模型),再将隐向量表征集成到推荐系统模型当中,这里集成方式又分为以下两种。

松耦合:信息呈单向流动,将隐向量表征作为推荐模型的输入。

紧耦合:将深度学习部分作为单独的组件接入模型,再加上其他传统或者深度模型组件,同时进行学习和预测。这种情况下,隐向量表征是跟随模型学习而变化的。

2、利用深度网络范式直接拟合效用函数,这种方式直接利用一个或多个深度网络范式,产出预测结果。

以上方法我们将在后续的课程中逐步讲解。

本节小结

道德经中“道生一,一生二,二生三,三生万物”,说的是“道”的诞生,从无到有产生阴阳二气,阴阳二气相交而形成了“三”,“三”即是万物的范式,通过范式的循环往复地叠加组合产生了万物。

本节介绍了深度推荐方法中的范式,下一节开始我们将逐个介绍基于这些范式方法的深度学习模型。那么关于深度推荐算法,你了解哪些?它们的关系是什么?欢迎与我讨论。

另外,如果你觉得本专栏有价值,欢迎分享给更多好友~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/45855.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于 SSH 的任务调度系统的设计与实现

点击下载源码 基于SSH的任务调度系统的设计与实现 摘 要 随着科学技术的飞速发展和各行各业的分工愈发明细化,对于改革传统的人工任务调度方式的呼声越来越大。得益于快速发展的计算机技术,我们看到了改革的方向。本系统是针对企业或者事业单位甚至一个…

Golang | Leetcode Golang题解之第234题回文链表

题目: 题解: func reverseList(head *ListNode) *ListNode {var prev, cur *ListNode nil, headfor cur ! nil {nextTmp : cur.Nextcur.Next prevprev curcur nextTmp}return prev }func endOfFirstHalf(head *ListNode) *ListNode {fast : headslo…

camtasia怎么剪掉不用的部分 屏幕录制的视频怎么裁剪上下不要的部分 camtasia studio怎么裁剪视频时长 camtasia怎么剪辑视频教程

有时我们录制的屏幕内容,并不一定全部需要。那么,屏幕录制的视频怎么裁剪上下不要的部分?可以使用视频剪辑软件,或者微课制作工具来进行裁剪。屏幕录制的视频怎么旋转?录制视频的旋转也是一样的,均在编辑步…

万字长文之分库分表里如何优化分页查询?【后端面试题 | 中间件 | 数据库 | MySQL | 分库分表 | 分页查询】

分库分表的一般做法 一般会使用三种算法: 哈希分库分表:根据分库分表键算出一个哈希值,根据这个哈希值选择一个数据库。最常见的就是数字类型的字段作为分库分表键,然后取余。比如在订单表里,可以按照买家的ID除以8的…

字符串类中的常用方法

1 string对象的创建 静态创建 String s1  "abc";  String s2  "abc";  动态创建 String s3  new String("abc"); String s4  new String("abc"); 2string对象的不可变性 任何一个String对象在创建之后都不能对它的…

大数据环境下的房地产数据分析与预测研究的设计与实现

1绪论 1.1研究背景及意义 随着经济的快速发展和城市化进程的推进,房地产市场成为了国民经济的重要组成部分。在中国,房地产行业对经济增长、就业创造和资本投资起到了重要的支撑作用。作为中国西南地区的重要城市,昆明的房地产市场也备受关…

云备份服务端

文件使用工具和json序列化反序列化工具 //文件和json工具类的设计实现 #ifndef __UTIL__ #define __UTIL__ #include<iostream> #include<fstream> #include<string> #include <vector> #include<sys/stat.h> #include"bundle.h" #inc…

FPGA资源容量

Kintex™ 7 https://www.amd.com/zh-tw/products/adaptive-socs-and-fpgas/fpga/kintex-7.html#product-table AMD Zynq™ 7000 SoC https://www.amd.com/en/products/adaptive-socs-and-fpgas/soc/zynq-7000.html#product-table AMD Zynq™ UltraScale™ RFSoC 第一代 AMD Z…

Redis系列命令更新--Redis列表命令

Redis列表 1、Redis Blpop命令&#xff1a; &#xff08;1&#xff09;说明&#xff1a;Redis Blpop命令移出并获取列表的第一个元素&#xff1b;如果列表没有元素会阻塞列表直到等到超时或发现可弹出元素为止 &#xff08;2&#xff09;语法&#xff1a;redis 127.0.0.1:63…

提高自动化测试脚本编写效率 5大关键注意事项

提高自动化测试脚本编写效率能加速测试周期&#xff0c;减少人工错误&#xff0c;提升软件质量&#xff0c;促进项目按时交付&#xff0c;增强团队生产力和项目成功率。而自动化测试脚本编写效率低下&#xff0c;往往会导致测试周期延长&#xff0c;增加项目成本&#xff0c;延…

Python项目部署到Linux生产环境(uwsgi+python+flask+nginx服务器)

1.安装python 我这里是3.9.5版本 安装依赖&#xff1a; yum install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gcc make -y 根据自己的需要下载对应的python版本&#xff1a; cd local wget https://www.python.org/ftp…

UE5.4新功能 - MotionDesign上手简介

MotionDesign是UE中集成的运动图形功能&#xff0c;我们在游戏中经常会见到&#xff0c;例如前方漂浮于空中的若干碎石&#xff0c;当玩家走进时碎石自动吸附合并变成一条路&#xff0c;或者一些装饰性的物件做随机运动等等&#xff0c;在引擎没有集成运动图形时&#xff0c;这…

网络爬虫开发:JavaScript与Python特性的小差异

JavaScript JavaScript具有以下一些主要特点&#xff1a; 动态类型&#xff1a; JavaScript是一种动态类型语言&#xff0c;变量可以存储任意类型的数据&#xff0c;无需事先声明变量的类型。事件驱动&#xff1a;JavaScript主要用于处理用户在浏览器中的各种交互事件&#x…

什么是大数据信用?它的作用有哪些?怎么查询大数据?

在金融行业中&#xff0c;风险管理是至关重要的一环。传统的信用评估方法主要基于借款人的财务状况和信用历史&#xff0c;但这些信息往往无法全面反映借款人的信用状况。大数据信用的出现为金融风控提供了新的解决方案。 首先&#xff0c;大数据信用可以为金融机构提供更全面的…

jmeter持续学习之---控制器

IF控制器 下面这种写法jmeter不推荐有性能的问题 jmeter推荐勾选上的这种写法 使用"Interpret Condition as Variable Expression"工具的性能要好一些 循环控制器 ForEach控制器 与用户定义的变量或者正则表达式提取器配合使用,循环读取。用户定义的变量或者正则…

C语言-分支与循环(2)

目录 1、while循环 1.1 if 和 while 的对比 1.2 while 语句的执行流程 6.3 while循环简单例题 2、for 循环 2.1 语法形式 2.2 for循环与while循环对比 2.3 for循环的执行流程 2.4 for循环的简单例题 2.5 扩展&#xff1a;for循环的初始化&#xff0c;判断&#xff0c;…

django学习入门系列之第四点《图标》

文章目录 图标往期回顾 图标 图标网站&#xff1a; Font Awesome&#xff0c;一套绝佳的图标字体库和CSS框架 (dashgame.com) bootstrap提供的不多 注意&#xff0c;要用框架启动&#xff0c;但用html启动的话是用不了的&#xff08;图标启动不了&#xff09; 如何使用 如果…

DAMA学习笔记(六)-数据安全

1.引言 数据安全包括安全策略和过程的规划、建立与执行&#xff0c;为数据和信息资产提供正确的身份验证、授权、访问和审计。数据安全实践的目标是根据隐私和保密法规、合同协议和业务要求来保护信息资产。这些要求来自以下几个方面: 1&#xff09;利益相关方: 应识别利益相关…

YOLO--置信度(超详细解读)

YOLO&#xff08;You Only Look Once&#xff09;算法中的置信度&#xff08;Confidence&#xff09;是一个关键概念&#xff0c;用于评估模型对预测框内存在目标对象的信心程度以及预测框对目标对象位置的准确性。 一、置信度的定义 数值范围&#xff1a;置信度是一个介于0和…

vscode 打开远程bug vscode Failed to parse remote port from server output

vscode 打开远程bug vscode Failed to parse remote port from server output 原因如图&#xff1a; 解决&#xff1a;