论文概况
本文是2023年WWW的一篇联邦推荐论文,提出了一个半去中心化的联合自我图学习框架。
Introduction
作者提出问题
- 现有的推荐方法收集所有用户的自我图来组成一个全局图,导致隐私风险。
- 联合推荐系统已被提出来缓解隐私问题,但在客户端设备的可扩展性和资源限制方面面临挑战。
- SemiDFEGL 框架引入了设备到设备的协作,以提高可扩展性并降低通信成本。
- 该框架利用预测的交互项目节点来连接孤立的自我图,从而能够以保护隐私的方式使用高阶协作信息。
- 所提出的框架与模型无关,可以与现有的基于图神经网络的推荐方法和隐私保护技术集成。
Method
A.设备内局部自我图嵌入
该方法涉及利用中央服务器生成虚假的共同物品,以连接用户并创建一个本地协作子图。每个客户端首先通过图神经网络(GNN)的消息传递机制学习本地自我图的嵌入表示。
e u ( k + 1 ) = A g g F u n ( e u ( k ) , { e i ( k ) } i ∈ N ( u ) ) \mathbf{e}_u^{(k+1)}=AggFun(\mathbf{e}_u^{(k)},\{\mathbf{e}_i^{(k)}\}_{i\in\mathcal{N}_{(u)}}) eu(k+1)=AggFun(eu(k),{ei(k)}i∈N(u))
e u ( k + 1 ) = ∑ i ∈ N ( u ) 1 N ( u ) N ( i ) e i ( k ) e i ( k + 1 ) = ∑ u ∈ N ( i ) 1 N ( i ) N ( u ) e u ( k ) \mathbf{e}_{u}^{(k+1)}=\sum_{i\in\mathcal{N}_{(u)}}\frac{1}{\sqrt{\mathcal{N}_{(u)}}\sqrt{\mathcal{N}_{(i)}}}\mathbf{e}_{i}^{(k)}\\\mathbf{e}_{i}^{(k+1)}=\sum_{u\in\mathcal{N}_{(i)}}\frac{1}{\sqrt{\mathcal{N}_{(i)}}\sqrt{\mathcal{N}_{(u)}}}\mathbf{e}_{u}^{(k)} eu(k+1)=i∈N(u)∑N(u)N(i)1ei(k)ei(k+1)=u∈N(i)∑N(i)N(u)1eu(k)
在初始轮中,我们将用户嵌入作为自我图嵌入
e e g o = e u \mathbf{e}_{ego} = \mathbf{e}_{u} eego=eu
下面我们将服务器中的物品嵌入和自我图嵌入进行聚类。
J m ( P , C ) = ∑ i = 1 M + N ∑ j = 1 C ( P i j ) l d ( x i , c j ) 2 J_m(P,C)=\sum_{i=1}^{M+N}\sum_{j=1}^C\left(P_{ij}\right)^ld\left(\mathbf{x}_i,\mathbf{c}_j\right)^2 Jm(P,C)=i=1∑M+Nj=1∑C(Pij)ld(xi,cj)2
P i j = ( d ( x i , c j ) ) 2 / ( 1 − l ) / [ ∑ k = 1 c ( d ( x i , c k ) ) 2 / ( 1 − l ) ] c j = [ ∑ i = 1 M + N P i j l x i ] / [ ∑ i = 1 M + N P i j l ] P_{ij}=\left(d\left(\mathbf{x}_{i},\mathbf{c}_{j}\right)\right)^{2/(1-l)}/\left[\sum_{k=1}^{c}\left(d\left(\mathbf{x}_{i},\mathbf{c}_{k}\right)\right)^{2/(1-l)}\right]\\\mathbf{c}_{j}=\left[\sum_{i=1}^{M+N}P_{ij}^{l}\mathbf{x}_{i}\right]/\left[\sum_{i=1}^{M+N}P_{ij}^{l}\right] Pij=(d(xi,cj))2/(1−l)/[k=1∑c(d(xi,ck))2/(1−l)]cj=[i=1∑M+NPijlxi]/[i=1∑M+NPijl]
c是群的中心,d(·)为距离函数。该操作将自我图和物品进行分类。
之后,对于每个用户的成员关系,我们选择具有最大值的元素,以确保每个用户/客户机只属于一个组。对于每个项目的隶属关系,我们选择前k个最大的元素,以便同一项目可以属于多个组。
因此,分配给每个组的项目称为预测交互项目节点(也称为假公共项目),并用于连接到组内的每个用户,以形成高阶局部子图。
B.设备到设备协作
设备与设备之间进行图级别的信息传播。
首先,在局部进行用户和物品的嵌入计算。
e u = ∑ k = 0 K α k e u ( k ) ; e i = ∑ k = 0 K α k e i ( k ) \mathbf{e}_{u}=\sum_{k=0}^{K}\alpha_{k}\mathbf{e}_{u}^{(k)};\quad\mathbf{e}_{i}=\sum_{k=0}^{K}\alpha_{k}\mathbf{e}_{i}^{(k)} eu=k=0∑Kαkeu(k);ei=k=0∑Kαkei(k)
随后,利用假邻接物品进行图级别的信息传播。
C.设备到服务器协作
在本地学习节点嵌入后,我们通过从每个组中采样设备并将项目嵌入上传到中央服务器以更新全局项目嵌入表来执行设备到服务器的协作。
为了保护用户的交互数据,每个客户端采样了一些它没有交互的项目,并随机生成它们的嵌入e,具有与实际交互项目嵌入e相同的均值和方差。
此外,由于嵌入也可能泄露用户隐私,我们对上传的嵌入进行基于l1范数的阈值裁剪。
e ^ i = c l i p ( e ^ i , δ ) + L a p l a c e ( 0 , λ ) \hat{\mathbf{e}}_{i}=\mathrm{clip} (\hat{\mathbf{e}}_{i},\delta)+\mathrm{Laplace}(0,\lambda) e^i=clip(e^i,δ)+Laplace(0,λ)
D.模型预测和训练
在中央服务器上,通过计算用户上传自我图嵌入和每个条目嵌入的排名分数,生成模型预测。
y u i = e e g o T e i y_{ui}=\mathbf{e}_{ego}^T\mathbf{e}_i yui=eegoTei
L = − ∑ i ∈ N u ∑ j ∉ N u ln σ ( y u i − y u j ) + λ ∥ e ∥ 2 \mathcal{L}=-\sum_{i\in N_{u}}\sum_{j\notin N_{u}}\ln\sigma\left(y_{ui}-y_{uj}\right)+\lambda\left\|\mathbf{e}\right\|^{2} L=−i∈Nu∑j∈/Nu∑lnσ(yui−yuj)+λ∥e∥2
E.结果
总结
本文介绍了一种新颖的联合推荐系统方法,可解决隐私问题和可扩展性问题,为设备上的推荐提供了一种有前途的解决方案。