推荐系统-FM模型

参考:推荐系统(三)Factorization Machines(FM)_svmmf-CSDN博客

一句话概括下FM:隐式向量特征交叉----类似embedding的思想

LR

如果利用LR做特征的二阶交叉,有:

y = w_0x_0+\sum w_ix_i+\sum\sum w_{ij}x_ix_j

但这个公式存在显著缺点:

  1. 时间段复杂度是O(N^2)。

  2. 依赖于xixj特征对的共现,如果这个特征对在训练集中没有出现,那么wij这个参数学习不到。

SVM

支持向量机的核心:低维空间下无法找到一个超平面来划分两类样本,那么可以经过一个映射,把低维空间映射成高维空间来找到一个超平面划分样本

原始公式为:

y=w^T\phi (x)+b

如果要实现特征交叉,利用核函数

k=<\phi(x_i) ,\phi(x_j)>=\phi(x_i)^T \phi(x_j)

1.线性核函数 k = <xi , xj>+1

y = w_0 + \sum w_ix_i

2. 多项式核函数

k = (<x_i,x_j>+1)^2

y = w_0 + \sqrt 2 \sum w_ix_i + \sum w_ii^2x_ii + \sqrt 2 \sum\sum w_ij^2x_ix_j

还是同LR一样有显著的缺点:
交叉项的参数是独立的,这会使得如果这个交叉特征值没有在样本里出现,这个参数是无法学到的。

总结一下,主要存在两个难点:

  • 交叉特征 xixj 的参数独立,如果交叉特征值没有出现,那么参数无法学习。

  • 时间复杂度过高,如果直接做二阶交叉,时间复杂度为O(N^2)。

FM

基本原理

FM则解决了上面两个问题,公式为:

y = w_0x_0+\sum w_ix_i+\sum\sum <v_i ,v_j>x_ix_j

将wij分解成了<vi ,vj>,通过学习每一个特征对应的隐向量(embedding向量),不再依赖于交叉特征xixj的共现信息,因为即使没有共现,对应的<vi ,vj>依然能够得到训练。

推导过程

时间复杂度由O(n^2)降到O(KN)

思想来源-MF

矩阵分解MF(matrix factorization),在推荐系统里,每个用户对每个物品的评分,可以构建出一个user-item矩阵,而矩阵分解的核心思想是用一个用户embedding矩阵和一个物品embedding矩阵的乘积来近似这个大矩阵,这两个embedding矩阵是可训练学习的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/33964.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在分布式系统中,Erlang 的错误处理和容错机制是如何实现的,又面临哪些挑战?

Erlang是一种被广泛用于构建高可用、容错性强的分布式系统的编程语言。它提供了一些内建的错误处理和容错机制来处理系统中的错误和故障。 下面是Erlang中常用的错误处理和容错机制&#xff1a; 进程监控&#xff08;Process Monitoring&#xff09;&#xff1a;Erlang的进程是…

case when 使用——mysql sql

case when的使用方法主要有两种&#xff1a; 第一种&#xff1a; UPDATE USER SET USERNAME CASE WHEN ID 1 THEN USERNAME1 WHEN ID 2 THEN USERNAME2 WHEN ID 3 THEN USERNAME3 END , PASSWORD CASE WHEN ID 1 THEN PASSWORD1 WHEN ID 2 THEN PASSWORD2 WHEN ID…

Open3D 点云的ISS关键点提取

目录 一、概述 1.1原理 1.2应用场景 1.3算法实现步骤 二、代码实现 2.1 完整代码 2.2关键函数 2.3关键点可视化 三、实现效果 3.1原始点云 3.2提取后点云 一、概述 1.1原理 ISS&#xff08;Intrinsic Shape Signatures&#xff09;关键点提取是一种常用于三维点云的…

【LLM-多模态】高效多模态大型语言模型综述

一、结论写在前面 模型规模的庞大及训练和推理成本的高昂&#xff0c;限制了MLLMs在学术界和工业界的广泛应用。因此&#xff0c;研究高效轻量级的MLLMs具有巨大潜力&#xff0c;特别是在边缘计算场景中。 论文深入探讨了高效MLLM文献的领域&#xff0c;提供了一个全面的视角…

Win10可用的VC6.0绿色版及辅助插件assist_X

VC6.0&#xff0c;作为微软的经典开发工具&#xff0c;承载着无数开发者的青春与回忆。它曾是Windows平台上软件开发的重要基石&#xff0c;为开发者们提供了稳定且强大的编程环境&#xff0c;尤其是其MFC&#xff08;Microsoft Foundation Classes&#xff09;库&#xff0c;为…

计算机网络:408考研|湖科大教书匠|原理参考系统I|学习笔记

系列目录 计算机网络总纲领 计算机网络特殊考点 目录 系列目录更新日志数据链路层(Data Link Layer)一、基本概念二、三个重要问题三、 &#x1f31f;点对点协议(PPP, Point-to-Point Protocol)四、 以太网五、802.11 无线局域网(简称Wi-Fi) 物理层(Physical Layer)一、传输方…

SSM宠物领养系统-计算机毕业设计源码08465

目 录 摘要 1 绪论 1.1课题背景及意义 1.2研究现状 1.3ssm框架介绍 1.3论文结构与章节安排 2 宠物领养系统系统分析 2.1 可行性分析 2.2 系统流程分析 2.2.1 数据流程 3.3.2 业务流程 2.3 系统功能分析 2.3.1 功能性分析 2.3.2 非功能性分析 2.4 系统用例分析 …

uni-push(2.0)常见问题,Android平台

将常用的网址一定要收藏在标签栏中&#xff0c;方便后期找&#xff0c;不然后期会很生气。 草料二维码&#xff0c;这个在线工具可以将打包生成的apk文件生成二维码&#xff0c;供测试人员测试。生成的apk只有五次下载机会&#xff0c;可点击链接后的一键上传&#xff0c;这样…

数据资产管理的艺术之道:深入探索如何在数据价值的最大化、个人隐私的严密保护以及企业持续发展的战略需求之间找到微妙的平衡

在数字化浪潮席卷全球的今天&#xff0c;数据已成为企业最宝贵的资产之一。从市场营销到产品研发&#xff0c;从客户服务到运营管理&#xff0c;数据无处不在&#xff0c;为企业提供了前所未有的洞察力和竞争力。然而&#xff0c;随着数据量的激增和数据类型的多样化&#xff0…

【Linux网络(一)初识计算机网络】

一、网络发展 1.发展背景 2.发展类型 二、网络协议 1.认识协议 2.协议分层 3.OSI七层模型 4.TCP/IP协议 三、网络传输 1.协议报头 2.局域网内的两台主机通信 3.跨网络的两台主机通信 四、网络地址 1.IP地址 2.MAC地址 一、网络发展 1.发展背景 计算机网络的发展…

500万!2024年东西湖区促进工业园区转型升级改造奖励政策申报条件、流程指南

2024年东西湖区促进工业园区转型升级改造奖励政策申报条件、流程指南如下&#xff0c;东西湖区的企业单位可以了解一下 一、总体要求和基本原则 以“创新、协调、绿色、开放、共享”新发展理念为指引&#xff0c;统筹落实产业高质量发展的总体要求&#xff0c;以“亩均论英雄…

七天速通javaSE:第三天 程序控制结构:顺序、选择、循环

文章目录 前言一、Scanner类1. hasNext()和hasNextLine()2.next()和nextLine()3. Scanner的其他用法 二、顺序结构三、选择结构1. if单选择结构2. if-else双选择结构3. if-else if多选择结构4. switch选择结构 四、循环结构1. while循环2.do while循环3. for循环&#xff08;常…

表单(forms)

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 在app1文件夹下创建一个forms.py文件&#xff0c;添加如下类代码&#xff1a; from django import forms class PersonForm(forms.Form): first_na…

NULL和nullptr的区别以及为什么要引入nullptr

在 C 中&#xff0c;NULL 和 nullptr 都表示空指针&#xff0c;但它们有一些关键的区别。nullptr 是 C11 引入的&#xff0c;目的是解决 NULL 存在的一些问题。 NULL 和 nullptr 的区别 1. 类型 NULL: 通常被定义为 0 或 ((void*)0)&#xff0c;具体定义取决于编译器和标准库…

C语言·动态内存管理

1. 为什么要有动态内存管理&#xff1f; 例1&#xff1a; //固定的向内存申请4个字节 int a 10;//申请连续的一块空间 int arr[10]; 这些数据一旦声明定义之后就会在内存中有一块空间&#xff0c;这些空间都是固定的&#xff0c;为了让内存使用更加灵活&#xff0c;这时我们…

MySQL中存储过程和函数的使用及异同

MySQL中的存储过程&#xff08;Stored Procedure&#xff09;和函数&#xff08;Stored Function&#xff09;都是预编译的SQL语句集合&#xff0c;用于执行特定任务&#xff0c;以提高代码重用性、减少网络通信量并可能提升性能。尽管它们有相似之处&#xff0c;但也存在一些关…

Debezium 同步 MySQL 实时数据并解决数据重复消费问题

我们使用 Debezium 实时同步一个 MySQL 的数据到另一个 MySQL&#xff0c;代码网上基本都有&#xff0c;都是在引入 debezium-api&#xff0c;debezium-embedded 后写 Java 代码&#xff0c;做好了基本配置后启动程序&#xff0c;Debezium 会自动读取 MySQL 的实时 binlog&…

断言提供了哪些方法

Java中的断言机制主要用于开发和测试阶段&#xff0c;以确保代码符合预期的行为。 除了assert关键字&#xff0c;Java标准库中的java.util.Objects类提供了几个实用方法&#xff0c;可以辅助实现更复杂的断言逻辑&#xff1a; Objects.requireNonNull(Object obj, String mess…

【Python机器学习】聚类算法简述

聚类的应用和评估时一个非常定性的过程&#xff0c;通常在数据分析的探索阶段很有帮助。 主要有三种聚类算法&#xff1a;k均值、DBSCAN、凝聚聚类。 这三种算法都可以控制聚类的粒度&#xff1a;k均值和凝聚聚类允许指定想要的簇的数量&#xff0c;而DBSCAN允许你用eps参数定…

SQLAlchemy:原理与使用详解

文章目录 引言SQLAlchemy的原理1. 对象关系映射&#xff08;ORM&#xff09;2. 引擎、会话和元数据3. 查询构造 SQLAlchemy的使用1. 安装SQLAlchemy2. 创建数据库连接和引擎3. 定义模型4. 创建表5. 操作数据库6. 关闭会话 结论 引言 在Python编程环境中&#xff0c;数据库操作…