Semi-decentralized Federated Ego Graph Learning for Recommendation

论文概况

本文是2023年WWW的一篇联邦推荐论文,提出了一个半去中心化的联合自我图学习框架。

Introduction

作者提出问题

  • 现有的推荐方法收集所有用户的自我图来组成一个全局图,导致隐私风险。
  • 联合推荐系统已被提出来缓解隐私问题,但在客户端设备的可扩展性和资源限制方面面临挑战。
  • SemiDFEGL 框架引入了设备到设备的协作,以提高可扩展性并降低通信成本。
  • 该框架利用预测的交互项目节点来连接孤立的自我图,从而能够以保护隐私的方式使用高阶协作信息。
  • 所提出的框架与模型无关,可以与现有的基于图神经网络的推荐方法和隐私保护技术集成。

Method

在这里插入图片描述

A.设备内局部自我图嵌入

该方法涉及利用中央服务器生成虚假的共同物品,以连接用户并创建一个本地协作子图。每个客户端首先通过图神经网络(GNN)的消息传递机制学习本地自我图的嵌入表示。
e u ( k + 1 ) = A g g F u n ( e u ( k ) , { e i ( k ) } i ∈ N ( u ) ) \mathbf{e}_u^{(k+1)}=AggFun(\mathbf{e}_u^{(k)},\{\mathbf{e}_i^{(k)}\}_{i\in\mathcal{N}_{(u)}}) eu(k+1)=AggFun(eu(k),{ei(k)}iN(u))
e u ( k + 1 ) = ∑ i ∈ N ( u ) 1 N ( u ) N ( i ) e i ( k ) e i ( k + 1 ) = ∑ u ∈ N ( i ) 1 N ( i ) N ( u ) e u ( k ) \mathbf{e}_{u}^{(k+1)}=\sum_{i\in\mathcal{N}_{(u)}}\frac{1}{\sqrt{\mathcal{N}_{(u)}}\sqrt{\mathcal{N}_{(i)}}}\mathbf{e}_{i}^{(k)}\\\mathbf{e}_{i}^{(k+1)}=\sum_{u\in\mathcal{N}_{(i)}}\frac{1}{\sqrt{\mathcal{N}_{(i)}}\sqrt{\mathcal{N}_{(u)}}}\mathbf{e}_{u}^{(k)} eu(k+1)=iN(u)N(u) N(i) 1ei(k)ei(k+1)=uN(i)N(i) N(u) 1eu(k)

在初始轮中,我们将用户嵌入作为自我图嵌入
e e g o = e u \mathbf{e}_{ego} = \mathbf{e}_{u} eego=eu
下面我们将服务器中的物品嵌入和自我图嵌入进行聚类。
J m ( P , C ) = ∑ i = 1 M + N ∑ j = 1 C ( P i j ) l d ( x i , c j ) 2 J_m(P,C)=\sum_{i=1}^{M+N}\sum_{j=1}^C\left(P_{ij}\right)^ld\left(\mathbf{x}_i,\mathbf{c}_j\right)^2 Jm(P,C)=i=1M+Nj=1C(Pij)ld(xi,cj)2
P i j = ( d ( x i , c j ) ) 2 / ( 1 − l ) / [ ∑ k = 1 c ( d ( x i , c k ) ) 2 / ( 1 − l ) ] c j = [ ∑ i = 1 M + N P i j l x i ] / [ ∑ i = 1 M + N P i j l ] P_{ij}=\left(d\left(\mathbf{x}_{i},\mathbf{c}_{j}\right)\right)^{2/(1-l)}/\left[\sum_{k=1}^{c}\left(d\left(\mathbf{x}_{i},\mathbf{c}_{k}\right)\right)^{2/(1-l)}\right]\\\mathbf{c}_{j}=\left[\sum_{i=1}^{M+N}P_{ij}^{l}\mathbf{x}_{i}\right]/\left[\sum_{i=1}^{M+N}P_{ij}^{l}\right] Pij=(d(xi,cj))2/(1l)/[k=1c(d(xi,ck))2/(1l)]cj=[i=1M+NPijlxi]/[i=1M+NPijl]
c是群的中心,d(·)为距离函数。该操作将自我图和物品进行分类。
之后,对于每个用户的成员关系,我们选择具有最大值的元素,以确保每个用户/客户机只属于一个组。对于每个项目的隶属关系,我们选择前k个最大的元素,以便同一项目可以属于多个组。
因此,分配给每个组的项目称为预测交互项目节点(也称为假公共项目),并用于连接到组内的每个用户,以形成高阶局部子图。

B.设备到设备协作

设备与设备之间进行图级别的信息传播。
首先,在局部进行用户和物品的嵌入计算。
e u = ∑ k = 0 K α k e u ( k ) ; e i = ∑ k = 0 K α k e i ( k ) \mathbf{e}_{u}=\sum_{k=0}^{K}\alpha_{k}\mathbf{e}_{u}^{(k)};\quad\mathbf{e}_{i}=\sum_{k=0}^{K}\alpha_{k}\mathbf{e}_{i}^{(k)} eu=k=0Kαkeu(k);ei=k=0Kαkei(k)
随后,利用假邻接物品进行图级别的信息传播。

C.设备到服务器协作

在本地学习节点嵌入后,我们通过从每个组中采样设备并将项目嵌入上传到中央服务器以更新全局项目嵌入表来执行设备到服务器的协作。
为了保护用户的交互数据,每个客户端采样了一些它没有交互的项目,并随机生成它们的嵌入e,具有与实际交互项目嵌入e相同的均值和方差。
此外,由于嵌入也可能泄露用户隐私,我们对上传的嵌入进行基于l1范数的阈值裁剪。
e ^ i = c l i p ( e ^ i , δ ) + L a p l a c e ( 0 , λ ) \hat{\mathbf{e}}_{i}=\mathrm{clip} (\hat{\mathbf{e}}_{i},\delta)+\mathrm{Laplace}(0,\lambda) e^i=clip(e^i,δ)+Laplace(0,λ)

D.模型预测和训练

在中央服务器上,通过计算用户上传自我图嵌入和每个条目嵌入的排名分数,生成模型预测。
y u i = e e g o T e i y_{ui}=\mathbf{e}_{ego}^T\mathbf{e}_i yui=eegoTei
L = − ∑ i ∈ N u ∑ j ∉ N u ln ⁡ σ ( y u i − y u j ) + λ ∥ e ∥ 2 \mathcal{L}=-\sum_{i\in N_{u}}\sum_{j\notin N_{u}}\ln\sigma\left(y_{ui}-y_{uj}\right)+\lambda\left\|\mathbf{e}\right\|^{2} L=iNuj/Nulnσ(yuiyuj)+λe2

E.结果

在这里插入图片描述

总结

本文介绍了一种新颖的联合推荐系统方法,可解决隐私问题和可扩展性问题,为设备上的推荐提供了一种有前途的解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/7615.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

zabbix监控方式(zabbix-trapper)

中文:zabbix采集器,即zabbix sender 。 Zabbix-Trapper 监控方式可以一次批量发送数据给Zabbix Server,与主动模式不同,Zabbix-Trapper 可以让用户控制数据的发送,而不用Zabbix-Agent进程控制,这意味着可以…

PE文件(四)FileBuffer-ImageBuffer

文件执行的总过程 当文件从硬盘中读入虚拟内存(FileBuffer)中时,文件数据会被原封不动的复制一份到虚拟内存中,然后进行拉伸对齐。此时虚拟内存中文件数据叫做文件印象或者内存印象,即ImageBuffer。此时ImageBuffer中…

42.乐理基础-拍号-看懂拍号的意义

到这必然是已经知道 X、Y的意思了: 然后带入数字: 然后念拍号的时候,在国内,百分之九十的地方是从下往上念,念作四二拍,还有百分之十的地方是和国外一样,从上往下念,念作二四拍&…

跨境支付行业研究

1. 行业基本情况 随着全球人均购买力增强、互联网普及率提升、支付渠道的进一步成熟、物流等配套设施的完善,网络购物已经成为全球兴起的消费习惯。另一方面,跨境电商对传统贸易的替代已经成为趋势。跨境电商在交易成本和便利程度上都有明显的优势 图1 …

大数据API技术分享:使用API接口采集淘宝数据(商品详情丨关键词搜索丨店铺所有商品)

使用API接口采集淘宝数据(商品详情、关键词搜索、店铺所有商品)是大数据领域常见的应用场景。以下是一些关于如何使用API接口进行这些操作的技术分享: 1. 获取API权限 首先,你需要在淘宝开放平台注册成为开发者,并创建…

想做视频号小店,为何不建议开通个体店?开店步骤+做店思路如下

我是王路飞。 如果你想在视频号开通店铺的话,那么一定不要使用个体执照开通个体店? 这是为什么呢? 原因很简单,视频号个体店是无法入驻优选联盟的,只能企业店可以入驻。 因为现阶段视频号小店的自然流量很少&#…

五一 作业

#include <iostream>using namespace std; class Num { private:int a; public:Num() {}Num(int a):a(a){}//设置a的值void set(int a){this->aa;}//1-a的和void Sum(){if(a<1){cout<<"a<1"<<endl;return;}int sum0;for(int i1;i<a;i)…

开源模型应用落地-CodeQwen模型小试-探索更多使用场景(三)

一、前言 代码专家模型是基于人工智能的先进技术&#xff0c;它能够自动分析和理解大量的代码库&#xff0c;并从中学习常见的编码模式和最佳实践。这种模型可以提供准确而高效的代码建议&#xff0c;帮助开发人员在编写代码时避免常见的错误和陷阱。 通过学习代码专家模型&…

计算机视觉——OpenCV Otsu阈值法原理及实现

算法简介 Otsu阈值法&#xff0c;也被称为大津算法&#xff0c;是一种在图像处理中广泛使用的自动阈值分割技术。这种方法由日本学者大津展之于1979年提出&#xff0c;旨在根据图像的灰度直方图来自动选择最佳全局阈值。Otsu阈值法的核心思想是最小化类内方差或最大化类间方差…

《设计一款蓝牙热敏打印机》

主控芯片用易兆威蓝牙ic&#xff0c;通讯接口&#xff1a;蓝牙、串口、usb 安卓apk用java kotlin编写、上位机用Qt编写。

【微磁学】对于现阶段微磁学仿真发展的思考1-理论篇

系列文章目录 对于现阶段微磁学仿真发展的思考1-理论篇 对于现阶段微磁学仿真发展的思考2-工具篇 文章目录 系列文章目录前言一、微磁学的数学区二、微磁学的物理区三、微磁学仿真现存的一些问题四、微磁学代码区&#xff1a;上手操作&#xff0c;理解更深入栗子1: 能量最小化…

WouoUIPagePC端实现

WouoUIPagePC端实现 WouoUIPage是一个与硬件平台无关&#xff0c;纯C语言的UI库&#xff08;目前只能应用于128*64的单色OLED屏幕上&#xff0c;后期会改进&#xff0c;支持更多尺寸&#xff09;。因此&#xff0c;我们可以在PC上实现它&#xff0c;本文就以在PC上使用 VScode…

研发效能 | Jacoco dump基于k8s的实现

问题描述 总所周知&#xff0c;jacoco的dump操作如果是使用server模式只需要使用以下命令就能获取到 exec 文件。 java -jar jacococli.jar dump --address 192.169.110.1 --port 6300 --destfile ./jacoco-demo.exec 如果是非 k8s 的集群&#xff0c;也只需要遍历执行这条命…

Python实现打砖块游戏

提供学习或者毕业设计使用&#xff0c;功能基本都有&#xff0c;不能和市场上正式游戏相提比论&#xff0c;请理性对待&#xff01; 在本文中&#xff0c;我们将使用 Pygame 和 Tkinter 创建一个简单的打砖块游戏。游戏的目标是通过控制挡板来击碎屏幕上的砖块&#xff0c;同时…

基于 OpenHarmony compress 三方件使用指南~

关于 提供了一个轻量级的图像压缩库。将允许您将大照片压缩成小 尺寸的照片&#xff0c;图像质量损失或可以忽略不计 compress 的依赖添加 为你的应用添加 compress-debug.har。将 compress-debug.har 复制到 entry\libs 目录下即可&#xff08;由于 build.gradle 中已经依赖…

【负载均衡式在线OJ项目day1】项目结构

一.功能 查看题目列表&#xff0c;在线编程&#xff0c;判题功能&#xff0c;即leetcode的部分功能 二.宏观结构 整个项目是BS模式&#xff0c;客户端是浏览器&#xff0c;和用户交互并向服务器发起请求。 服务端从功能上来说分为两个模块&#xff0c;第一个是OJServer&…

小红书餐饮推广怎么合作?纯干货

小红书作为国内领先的生活方式分享平台&#xff0c;其用户群体主要集中在一二线城市&#xff0c;年龄分布在18-35岁之间&#xff0c;其中女性用户占比高达80%。这部分用户具有较高的消费能力、审美追求和品质生活需求&#xff0c;对美食有着极高的兴趣和消费意愿&#xff0c;为…

【计算机网络】计算机网络的性能指标

计算机网络的性能指标被用来从不同方面度量计算机网络的性能。常用的八个计算机网络性能指标&#xff1a;速率、带宽、吞吐量、时延、时延带宽积、往返时间、利用率、丢包率。 一.速率 (1) 数据量 比特&#xff08;bit&#xff0c;记为小写b&#xff09;是计算机中数据量的基…

python使用mongo操作

目前有个需求&#xff0c;就是把所有sql转为mongo管道查询 知识点 在 MongoDB 中&#xff0c;allowDiskUse 选项应该作为聚合命令的一个选项&#xff0c;而不是聚合管道的一个阶段。allowDiskUse 选项用于允许聚合操作使用磁盘空间来临时存储数据&#xff08;当聚合操作的数据…

力扣顺序表思路讲解

本篇文章&#xff0c;我给大家带来的是顺序表题目讲解&#xff0c;希望大家看完有所收获&#xff0c;废话不多说&#xff0c;我们现在开始 审题 大白话&#xff1a;给了一个数组和一个目标值。如果数组里的两个元素相加 目标值&#xff0c;则返回这两个元素的下标。那么大家需…