推荐系统(3)-协同过滤2-矩阵分解算法

协同过滤-矩阵分解算法

  • 1.奇异值分解
  • 2.梯度下降
  • 3.矩阵分解方法的优缺点

《深度学习/推荐系统》读书笔记

(其实矩阵分解和协同过滤已经没有特别大的联系了)
2006年,在Netfilx举办的推荐算法竞赛中Netflix Prize Challenge中,以矩阵分解为主的推荐算法大放异彩,拉开了矩阵分解算法在业界流行的序幕。

Netflix 推荐场景–利用用户的行为历史,在Netflix视屏应用中为用户推荐喜欢的电影、电视剧或者纪录片。

矩阵分解算法基本思路–将用户和视频都表示成一个隐向量,计算每个用户隐藏向量和所有视频隐向量之间内积,将内积最大的topK的视屏推荐给目标用户。

m∗nm*nmn维共现矩阵RRR,分解成m∗km*kmk维用户矩阵U,和k∗nk*nkn维物品矩阵VVV
R=U∗VR=U * VR=UV

则用户uuu对物品i的重构评分为(pup_upu-U矩阵的行向量,qiq_iqi-V矩阵的列向量):
r^ui=qiTpu(2.6)\hat{r}_{ui}=q^T_ip_u\tag{2.6}r^ui=qiTpu(2.6)

  1. 迷惑点1:用户隐藏向量和所有视频隐向量之间内积,其实就是重构用户对每一部电影的品评分,推荐重构评分高的电影 是如何 实现了用户对未评分电影的预测的呢?
  2. 矩阵分解中缺失值该怎么处理呢?就是用户没有评分的项目。

矩阵分解的方法:特征值分解、奇异值分解、梯度下降
特征值分解–只能作用于方阵,不适用于分解用户-物品矩阵

1.奇异值分解

Singular Value Decomposition-SVD
M=Um∗mΣm∗nVn∗nM= U_{m*m}\Sigma_{m*n} V_{n*n}M=UmmΣmnVnn

近似分解:
M≈Um∗kΣk∗kVk∗nM\approx U_{m*k}\Sigma_{k*k} V_{k*n}MUmkΣkkVkn

缺点:不适用于大规模稀疏矩阵的分解

  1. SVD要求原始共现矩阵是稠密的,需要对缺失的元素进行填充。
  2. SVD时间复杂度高(O(mn2)O(mn^2)O(mn2))

2.梯度下降

SVD的缺点使得研究者门另求他路–梯度下降法(矩阵分解的主要方法)
基本思路–参数化qiTpuq^T_ip_uqiTpu,使其和原始评分ruir_{ui}rui的差距尽量小

正则化目标函数:
min⁡q∗,p∗∑(u,i)∈K(rui−qiTpu)2+λ(∣∣qi∣∣2+∣∣pu∣∣2)(2.8)\min_{q^*,p^*}\sum_{(u,i)\in K}(r_{ui}-q^T_ip_u)^2+\lambda(||q_i||^2+||p_u||^2)\tag{2.8}q,pmin(u,i)K(ruiqiTpu)2+λ(qi2+pu2)(2.8)

为了消除用户和物品打分的偏差,修正目标函数:
min⁡q∗,p∗∑(u,i)∈K(rui−μ−bu−bi−qiTpu)2+λ(∣∣qi∣∣2+∣∣pu∣∣2+bu2+bi2)\min_{q^*,p^*}\sum_{(u,i)\in K}(r_{ui}-\mu-b_u-b_i-q^T_ip_u)^2+\lambda(||q_i||^2+||p_u||^2+b_u^2+b_i^2)q,pmin(u,i)K(ruiμbubiqiTpu)2+λ(qi2+pu2+bu2+bi2)

其中:μ\muμ是全局偏差常数,bib_ibi是物品偏差系数(物品i收到的平均评分),bub_ubu用户偏差系数(用户u给出评分的均值)

3.矩阵分解方法的优缺点

优点:

  1. 泛化能力强–数据稀疏时的相似度也能衡量
  2. 空间复杂度低
  3. 扩展性和灵活性–用户物品隐向量,与Embedding的思想相似,可以与其他特征进行拼接。

缺点:
矩阵分解还是下共现矩阵的基础下进行的。共现矩阵缺点–一个矩阵只能表征用户和物品之间的一种作用关系(点击,购买,评分),特征表示能力弱。不便加入用户、物品的上下文相关特征。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/444729.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

leetcode141 环形链表

给定一个链表,判断链表中是否有环。 为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始)。 如果 pos 是 -1,则在该链表中没有环。 示例 1: 输入:head …

iPhoneX适配

目录(?)[-]核心代码自动化修改代码参考资料iPhoneX适配,比较搓的一种方式,在不修改分辨率(720 x 1280)的情况下适配iphone X 主屏尺寸: 5.8英寸 主屏分辨率: 2436 x 1125核心代码修改 工程目录/Classes/Un…

centos安装nginx,配置负载均衡

1、安装nginx安装教程,参照:http://mp.weixin.qq.com/s/RVaRlRpHqZRjCaXGmOlfKw 2、反向代理的配置修改部署目录下conf子目录的nginx.conf文件的内容[html]view plaincopylocation / { #设置主机头和客户端真实地…

leetcode142 环形链表II

给定一个链表,返回链表开始入环的第一个节点。 如果链表无环,则返回 null。 为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始)。 如果 pos 是 -1,则在该链表中没有…

PaperNotes(18)-VectorNet- Encoding HD Maps and Agent Dynamics from Vectorized Representation

自动驾驶论文阅读笔记11. Ployline Garph2. Global Graph3. 模型目标函数4.Related work5.Experiment5.1 实验设置5.2 消融实验5.3 模型资源消耗5.4 与其他模型的对比实验VectorNet- Encoding HD Maps and Agent Dynamics from Vectorized RepresentationVectorNet: 通过矢量化…

ubuntu的apache配置https

一、配置Apache 1、开启SSL模块a2enmod ssl 2、启用SSL站点a2ensite default-ssl 3、加入监听端口vi /etc/apache2/ports.conf #编辑Apache端口配置,加入443端口 Listen 443注:Ubuntu启用SSL站点后,缺省已经加入了 (…

vim特别好的教程

欢 迎 阅 读 《 V I M 教 程 》 —— 版本 1.7 Vim 是一个具有很多命令的功能非常强大的编辑器。限于篇幅,在本教程当中 就不详细介绍了。本教程的设计目标是讲述一些必要的基本命令,而掌握好这 些命令&#x…

jquery、javascript实现(get、post两种方式)跨域解决方法

&#xfeff;&#xfeff;jquery、javascript实现(get、post两种方式)跨域解决方法一、实现get方式跨域请求数据浏览器端<script> $(document).ready(function(){$.ajax({url: "http://www.xxx.cn/index.php",type: "get",dataType: "jsonp&quo…

推荐系统(4)-逻辑回归LR、POLY2、FM、FFM

逻辑回归LR、POLY2、FM、FFM1.逻辑回归LR2.辛普森悖论3.POLY24.FM-20105.FFM6.GBDTLR-20147.LS-PLM-2017《深度学习/推荐系统》读书笔记1.逻辑回归LR Logistic Regression – 融合多种特征&#xff0c;通过sigmoid 函数&#xff0c;预测样本的被点击的概率。样本用特征向量x[x…

leetcode125验证回文串

给定一个字符串&#xff0c;验证它是否是回文串&#xff0c;只考虑字母和数字字符&#xff0c;可以忽略字母的大小写。 说明&#xff1a;本题中&#xff0c;我们将空字符串定义为有效的回文串。 示例 1: 输入: "A man, a plan, a canal: Panama" 输出: true 示例 …

配置 Elastic Beanstalk 环境负载均衡器以终止 HTTPS

&#xfeff;&#xfeff;配置 Elastic Beanstalk 环境负载均衡器以终止 HTTPS 要更新您的 AWS Elastic Beanstalk 环境以使用 HTTPS&#xff0c;您需要为您的环境中的负载均衡器配置 HTTPS 侦听器。以下两种类型的负载均衡器支持 HTTPS 侦听器&#xff1a;传统负载均衡器和应用…

AWS 给负载均衡器配置侦听器并上传IAM证书

&#xfeff;&#xfeff;1.打开EC2的负载均衡器&#xff1a;添加侦听器&#xff0c;选择https&#xff0c;ssl证书需要有一个CA证书&#xff0c;可以去阿里云申请&#xff0c;也可以从亚马逊获取&#xff1a;注意&#xff0c;这里的ssl证书要这样写其中私有密钥不是那种xxxxxx…

PaperNotes(19)-Learning Lane Graph Representations for Motion Forecasting

Learning Lane Graph Representations for Motion Forecasting1.ActorNet2.MapNet3.FusionNet4.Prediction Header5.模型参数学习自动驾驶论文阅读笔记2 Uber–ECCV2020–论文文章代码 模型的作用&#xff1a;Motion Forecasting &#xff08;这个motion都包括什么呢&#xff…

leetcode41 缺失的第一个正数

给定一个未排序的整数数组&#xff0c;找出其中没有出现的最小的正整数。 示例 1: 输入: [1,2,0] 输出: 3 示例 2: 输入: [3,4,-1,1] 输出: 2 示例 3: 输入: [7,8,9,11,12] 输出: 1 说明: 你的算法的时间复杂度应为O(n)&#xff0c;并且只能使用常数级别的空间。 思路&am…

Linux(10)-Make编译,Configure

Make编译机制,Configure1.Make机制demo1.make编译demo2.make清理demo3:make 安装demo4:make 卸载2.configure2.1 Autoconf2.2 软件的源码安装软件发布的一些基础知识。gcc, cpp, as, ld–施工队&#xff0c;底层干活工人make --包工头&#xff0c;指挥工人工作configure–分析师…

redis排行榜之日排行周排行设计

排行榜功能是一个很普遍的需求。使用 Redis 中有序集合的特性来实现排行榜是又好又快的选择。 一般排行榜都是有实效性的,比如“用户积分榜”。如果没有实效性一直按照总榜来排,可能榜首总是几个老用户,对于新用户来说,那真是太令人沮丧了。 首先,来个“今日积分榜”吧,…

Linux(11)-Ubuntu装系统

Ubuntu18.04装系统单系统双系统启动项dell 5820进不去bios。单系统 装过好多次ubuntu系统&#xff0c;每次要重装之前总是得搜索各种教程。现在总结一份简略教程如下&#xff0c;以备哪天装系统之需。 1.官网上下载Ios文件:https://ubuntu.com/download/desktop 2.找一个U盘…

最近准备学习下mongodb(一 Windows安装篇)

1 先安装mongodb 的windows版本&#xff0c;Linux的我后期会加上的。 https://www.mongodb.com/dr/fastdl.mongodb.org/win32/mongodb-win32-x86_64-2008plus-ssl-4.0.0-signed.msi/download 2.安装php扩展插件&#xff1a; https://pecl.php.net/package/mongo 根据自己的…

leetcode139 单词拆分

给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict&#xff0c;判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词。 说明&#xff1a; 拆分时可以重复使用字典中的单词。 你可以假设字典中没有重复的单词。 示例 1&#xff1a; 输入: s "leetcode…

Linux(12)-Ubuntu装机后的基础应用

Ubuntu装机ssh服务器 sudo ps -e |grep ssh # 查看ssh 服务安装情况 ssh-agent--ssh客户端&#xff0c;连别人&#xff1b; sshd--ssh服务器&#xff0c; 被别人连 sudo apt-get update # 更新软件源 sudo apt-get install openssh-server # 安装ssh服务端ssh设置别…