联邦学习怎样应用在推荐系统中?

76b6b0d2e65bd03120ce094f403503cb.png

来源:知乎丨羊老头

说起联邦学习,大家再熟悉不过了,由于其能在数据不移动的前提下协同训练一个全局共享的模型,迅速成为了人工智能安全领域的一个研究热点。推荐系统作为人工智能领域最振奋人心的应用之一,与联邦学习相结合的研究也越发受到工业界和学术界的关注。

最近,中国科学:信息科学 杂志最新综述《基于联邦学习的推荐系统》(以下简称“联邦推荐”)概述了一些联邦学习和推荐系统结合的研究工作,非常适合对联邦学习和推荐系统感兴趣的同学阅读。本文旨在帮助大家快速了解这篇综述,并给想入门联邦研究的同学推荐一些相关的论文。

需要说明的是,联邦推荐这一新兴方向发展迅速,作者研究方向和写作时间有限,文中难免有错误和不足之处,恳请读者和专家批评指正。

梁锋,羊恩跃,潘微科,杨强,明仲. 基于联邦学习的推荐系统综述[J]. 中国科学:信息科学, 2022, 52(5):1-29.

Feng Liang, Enyue Yang, Weike Pan, Qiang Yang and Zhong Ming. A Survey of Recommender Systems Based on Federated Learning (in Chinese) [J]. SCIENTIA SINICA Informationis, 52(5):1-29, 2022.

注:文末附有论文和幻灯片的链接。

1

引言

1.1 为什么需要联邦学习

你有没有想过,当你躺在沙发上刷抖音视频时,为什么刷到的视频大多是你喜欢的内容?当你打开淘宝的时候,为什么显示的商品大部分是你感兴趣的?好像这些APP比你自己更懂你!这正是推荐系统在其中发挥的作用。推荐系统通常会收集你的信息(例如,你在APP上注册时填写的性别、年龄和地理位置等信息),并通过你在APP上的行为(例如,你在APP上浏览的内容等)来刻画用户画像,然后通过推荐算法把一些可能感兴趣的物品推荐给你。

但是,享受个性化推荐服务的前提是你需要将自己的个人信息和历史行为记录交付给APP,即我们常说的“隐私换服务”。随着通用数据保护条例等隐私和数据保护法律法规的颁布, 以及人们隐私保护意识的提高,用户隐私安全愈发受到重视。你不禁会想,在享受个性化推荐服务的同时,能否保护用户的个人隐私?

当然!联邦学习能够让推荐系统中的用户重新获得数据的控制权。在联邦学习的训练过程中,用户的原始数据始终保留在用户(客户端)本地,服务端和用户之间通过共享加密的或不包含隐私信息的中间参数的方式,进行模型训练和参数更新,进而在保护用户隐私的前提下构建一个有效的机器学习模型。因此,联邦学习和推荐系统的结合旨在保护用户隐私和商业机密的前提下,为用户提供精准的个性化服务。

1.2 综述总览

在联邦推荐场景中,一个客户端可以是一个用户或一个组织,客户端需在不共享数据的前提下联合建模。如图 1 所示,我们可以从架构设计、系统的联邦化和隐私保护技术的应用三个角度,论述基于联邦学习的推荐系统的研究进展。

ea7758fa439cd43e32475120ade8892f.png

图1 联邦推荐系统分类

2

基于联邦学习的推荐系统

2.1 架构设计

与一般联邦学习领域的架构设计类似,在联邦推荐系统的研究中使用的架构可以分为客户端-服务端架构和去中心化架构,如图 2 所示。

  • 客户端–服务端架构的训练流程为:

  1. 服务端初始化模型参数,并将模型参数发送给各个客户端;

  2. 客户端利用本地数据以及从服务端接收到的最新的模型参数进行训练,并将中间参数发送给服务端;

  3. 服务端聚合中间参数,更新全局模型,再把模型回传给客户端;

  4. 重复步骤(2)和(3),直到模型收敛。

特点:这类架构能够利用服务端的计算资源,减少客户端的计算压力,但容易发生单点故障。同时,对于好奇的服务端,其可能根据客户端上传的中间参数推断客户端的隐私信息,从而泄露客户端的隐私。

  • 去中心化架构的训练流程为:

  1. 服务端初始化模型参数,然后将模型参数发送给各个客户端;

  2. 客户端利用本地数据进行模型训练并更新本地的模型参数;

  3. 客户端选取一些其他客户端, 发送本地的中间参数,同时接收其他客户端的中间参数,并更新本地的模型;

  4. 重复步骤(2)和(3),直到模型收敛。

特点:(1)匿名性。在模型训练过程中,客户端能以匿名的方式发送中间参数给其他客户端,从而解决客户端之间的隐私泄露问题。(2)节省服务端的资源。服务端仅需初始化模型参数,将模型参数分发给各个客户端,不需要参与模型的更新。(3)高可用性。不存在单点故障,即不会因为服务端的某一个部件出错而导致整个联邦学习系统中止训练。

两者的相同之处:客户端的原始数据不离开本地,通过服务端与客户端之间的通信或客户端与客户端之间的通信,以发送中间参数的训练方式来得到一个共享的模型。

59e0cca6e2567290792647b61e5c1671.png

图2 联邦学习的架构设计

2.2 推荐系统的联邦化

推荐模型的联邦化具有一定的共性,一个联邦推荐模型的训练框架通常适用于具有相同训练方式的其他模型。然而考虑到不同场景中的隐私保护级别可能不同以及不同模型参数可能带来的不同隐私问题,不同推荐模型在联邦化的过程中存在一定的差异。

对于模型的联邦化,可以划分为基于协同过滤的推荐算法的联邦化、基于深度学习的推荐算法的联邦化和基于元学习的推荐算法的联邦化三个类别。

在此分类下,一些经典的和前沿的推荐模型的联邦化例子及其特点如图 3 所示。

436dc3dc919a3a1250d10afac38c1907.png

图3 推荐模型的联邦化

2.3 隐私保护技术的应用

基于不同的隐私保护技术,联邦推荐算法可以分为基于同态加密的联邦推荐算法、基于差分隐私的联邦推荐算法、基于本地差分隐私的联邦推荐算法和基于安全多方计算的联邦推荐算法。图 4 总结了一些隐私保护技术在联邦推荐算法设计中的应用。

d45d50e24a0a39c24d2077867405969d.png

图4 联邦推荐中的隐私保护技术

3

未来研究展望

3.1 推荐系统的联邦化

  • 传统的推荐模型的联邦化方面的相关工作仍存在其他的隐私问题

  • 在联邦推荐模型中,通过隐私保护技术来保护隐私方面会带来通信成本增加、计算复杂度增大和推荐性能下降等新的问题

  • 联邦模型的训练方式与非联邦版本等价的同时,算法的训练效率较低

  • 在对基于深度学习的推荐算法进行联邦化方面,客户端的存储资源和计算能力通常无法与庞大的神经网络相匹配,并且客户端自身的数据量有限,难以训练出较好的深度学习模型。边缘计算和知识蒸馏是两个解决客户端资源受限的研究思路

  • 目前还没有公开发表的面向序列反馈和异构反馈建模的联邦推荐方法

3.2 联邦推荐系统的优化

  1. 模型压缩、通信策略的改进、激励机制和客户端采样等优化方法如何在联邦推荐模型中应用

  2. 如何为特定的推荐模型设计更有效的优化算法

3.3 联邦推荐场景中的隐私安全问题

  1. 如何衡量联邦场景中的隐私安全问题,并对已有工作中存在的隐私问题,设计一个更为有效的解决方法

  2. 如何在可能存在恶意的客户端和服务端或者存在一些数据质量较低的客户端的环境下,设计联邦推荐模型

  3. 客户端如何运用模型投毒防御和对抗攻击防御等防御手段来保护自己模型的安全性和有效性

4. 部分联邦推荐相关的论文(非完整列表)

  • 去中心化的分布式矩阵分解框架(DMF):Chaochao Chen, Ziqi Liu, Peilin Zhao, Jun Zhou, Xiaolong Li. Privacy preserving point-of-interest recommendation using decentralized matrix factorization [C]. In: Proceedings of the 32nd AAAI Conference on Artificial Intelligence (AAAI'18), pages 257-264, 2018. paper

  • 联邦协同过滤推荐算法(FCF):Muhammad Ammad-ud-din, Elena Ivannikova, Suleiman A. Khan, Were Oyomno, Qiang Fu, Kuan Eeik Tan, Adrian Flanagan. Federated collaborative filtering for privacy-preserving personalized recommendation system [J]. CoRR, 2019, abs/1901.09888. Paper

  • 基于隐私保护的余弦相似度算法(PPCSC):Harmanjeet Kaur, Neeraj Kumar, Mohammad S. Obaidat. Multi-party secure collaborative filtering for recommendation generation [C]. In: Proceedings of 2019 IEEE Global Communications Conference (GLOBECOM'19), pages 1-6, 2019. paper

  • 用户能调节自身隐私级别的去中心化分布式矩阵分解框架(PDMFRec):Erika Duriakova, Elias Z. Tragos, Barry Smyth, Neil Hurley, Francisco J. Pena, Panagiotis Symeonidis, James Geraci, and Aonghus Lawlor. PDMFRec: A decentralised matrix factorisation with tunable user-centric privacy [C]. In: Proceedings of the 13th ACM Conference on Recommender Systems (RecSys'19), pages 457-461, 2019. paper

  • 联邦矩阵分解算法(FederatedMF):Koustabh Dolui, Illapha Cuba Gyllensten, Dietwig Lowet, Sam Michiels, Hans Hallez, Danny Hughes. Towards Privacy-preserving Mobile Applications with Federated Learning: The Case of Matrix Factorization [C]. In: Proceedings of the 17th Annual International Conference on Mobile Systems, applications, and Services (MobiSys'19), pages 624--625, 2019. paper

  • 基于秘密共享技术的共享矩阵分解方法(SharedMF):Senci Ying. Shared MF: a privacy-preserving recommendation system [J]. CoRR, 2020, abs/2008.07759. paper

  • 基于FATE平台的在线联邦推荐系统(FedRecSys):Ben Tan, Bo Liu, Vincent W. Zheng, Qiang Yang. A federated recommender system for online services [C]. In: Proceedings of 14th ACM Conference on Recommender Systems (RecSys'20), pages 579-581, 2020. paper

  • 基于位置敏感哈希的联邦推荐算法(FRecLSH):Hongsheng Hu, Gillian Dobbie, Zoran Salcic, Meng Liu, Jianbing Zhang, Xuyun Zhang. A locality sensitive hashing based approach for federated recommender system [C]. In: Proceedings of 20th International Symposium on Cluster, Cloud and Internet Computing (CCGRID'20), pages 836-842, 2020. paper

  • 基于差分隐私技术的本地协同过滤算法(DPLCF):Chen Gao, Chao Huang, Dongsheng Lin, Depeng Jin, Yong Li. DPLCF: differentially private local collaborative filtering [C]. In: Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR'20), pages 961–970, 2020. paper

  • 安全社交推荐框架(SeSoRec):Chaochao Chen, Liang Li, Bingzhe Wu, Cheng Hong, Li Wang, Jun Zhou. Secure social recommendation based on secret sharing [C]. In: Proceedings of the 24th European Conference on Artificial Intelligence (ECAI'20), pages 506-512, 2020. paper

  • 可快速训练的联邦推荐框架(FedFast):Khalil Muhammad, Qinqin Wang, Diarmuid O'Reilly-Morgan, Elias Z. Tragos, Barry Smyth, Neil Hurley , James Geraci, Aonghus Lawlor. FedFast: going beyond average for faster training of federated recommender systems [C]. In: Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD'2020), pages 1234–1242, 2020. paper

  • 基于深度结构化语义模型的联邦多视图框架(FL-MV-DSSM):Mingkai Huang, Hao Li, Bing Bai, Chang Wang, Kun Bai, Fei Wang. A federated multi-view deep learning framework for privacy-preserving recommendations [J]. CoRR, 2020, abs/2008.10808. paper

  • 安全的联邦子模型学习框架(SFSL):Chaoyue Niu, Fan Wu, Shaojie Tang, Lifeng Hua, Rongfei Jia, Chengfei Lv, Zhihua Wu, Guihai Chen. Billion-scale federated learning on mobile clients: A submodel design with tunable privacy [C]. In: Proceedings of the 26th Annual International Conference on Mobile Computing and Networking (MobiCom'20), pages 31:1-31:14, 2020. paper

  • 联邦多视图矩阵分解算法(FED-MVMF):Adrian Flanagan, Were Oyomno, Alexander Grigorievskiy, Kuan Eeik Tan, Suleiman A. Khan, Muhammad Ammad-ud-din. Federated multi-view matrix factorization for personalized recommendations [J]. CoRR, 2020, abs/2004.04256. paper

  • 基于联邦学习的元矩阵分解框架(MetaMF):Yujie Lin, Pengjie Ren, Zhumin Chen, Zhaochun Ren, Dongxiao Yu, Jun Ma, Maarten de Rijke, Xiuzhen Cheng. Meta Matrix Factorization for Federated Rating Predictions [C]. In: Proceedings of the 43rd International ACM SIGIR conference on research and development in Information Retrieval (SIGIR'20), pages 981-990, 2020. paper

  • 隐私保护的推荐框架(PriRec):Chaochao Chen, Jun Zhou, Bingzhe Wu, Wenjing Fang, Li Wang, Yuan Qi, Xiaolin Zheng. Practical privacy preserving POI recommendation [J]. ACM Transactions on Intelligent Systems and Technology, 2020, 11(5):52:1-52:20. paper

  • 联邦新闻推荐框架(FedNewsRec):Tao Qi, Fangzhao Wu, Chuhan Wu, Yongfeng Huang, Xing Xie. Privacy-preserving news recommendation model training via federated learning [J]. CoRR, 2020, abs/2003.09592. paper

  • 面向显式反馈的无损联邦推荐算法(FedRec++):Feng Liang, Weike Pan, Zhong Ming. FedRec++: Lossless federated recommendation with explicit feedback [C]. In: Proceedings of the 35th AAAI Conference on Artificial Intelligence (AAAI'21), pages 4224-4231, 2021. paper

  • 基于同态加密技术的安全联邦矩阵分解框架(FedMF):Di Chai, Leye Wang, Kai Chen, Qiang Yang. Secure federated matrix factorization [J]. IEEE Intelligent Systems, 2021, 36(5):11-20. paper

  • 隐私保护的推荐系统框架(PPRSF):Jiangcheng Qin, Baisong Liu, Jiangbo Qian. A novel privacy-preserved recommender system framework based on federated learning [C]. In: Proceedings of the 4th International Conference on Software Engineering and Information Management (ICSIM'2021), pages 82-88, 2021. paper

  • 强隐私保护的面向隐式反馈的联邦协同过滤:Lorenzo Minto, Moritz Haller, Benjamin Livshits, Hamed Haddadi. Stronger privacy for federated collaborative filtering with implicit feedback [C]. In: Proceedings of the 15th ACM Conference on Recommender Systems (RecSys'21), pages 342–350, 2021. paper

  • 联邦序列推荐模型(DeepRec):Jialiang Han, Yun Ma, Qiaozhu Mei, Xuanzhe Liu. DeepRec: On-device deep learning for privacy-preserving sequential recommendation in mobile commerce [C]. In: Proceedings of the 30th International Conference on World Wide Web (WWW'21), pages 900–911, 2021. paper

  • GNN联邦推荐学习框架(FedGNN):Chuhan Wu, Fangzhao Wu, Yang Cao, Yongfeng Huang, Xing Xie. FedGNN: federated graph neural network for privacy-preserving recommendation [J]. CoRR, 2021, abs/2102.04925. paper

  • 基于虚假掩码和秘密共享的联邦推荐(FR-FMSS):Zhaohao Lin, Weike Pan, Zhong Ming. FR-FMSS: federated recommendation via fake marks and secret sharing [C]. In: Proceedings of the 15th ACM Conference on Recommender Systems (RecSys'21), pages 668–673, 2021. paper

论文链接:基于联邦学习的推荐系统综述 https://www.sciengine.com/publisher/scp/journal/SSI/doi/10.1360/SSI-2021-0329?slug=abstract

幻灯片链接:https://pan.baidu.com/link/zhihu/7dh0zauOh5imVRNGp2ZF1LJzN5VMp0TQQ5AT==

80ea935242e21f229849ed78fcedc1b0.png

注:幻灯片首页截图

bibtex格式引文:

中文:

% Journal
@article{Journal-CN-SSI-22-Suvery,author = {梁锋,羊恩跃,潘微科,杨强,明仲},title = {基于联邦学习的推荐系统综述},journal = {中国科学:信息科学},volume = {52},number = {5},pages = {1--29},year = {2022}
}

英文:

% Journal
@article{Journal-CN-SSI-22-Suvery,author = {Feng Liang and Enyue Yang and Weike Pan and Qiang Yang and Zhong Ming},title = {A Survey of Recommender Systems Based on Federated Learning (in Chinese)},journal = {SCIENTIA SINICA Informationis},volume = {52},number = {5},pages = {1--29},year = {2022}
}

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

5f868bc8f812a8805905a1532127e0ef.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482414.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

红帽、Docker、SUSE 在俄罗斯停服

出品:CSDN(ID:CSDNnews)整理:苏宓继 Oracle、Google、苹果等科技公司和 React 开源项目之后,如今 Linux 发行版也牵扯进俄乌之间冲突的漩涡中。其中一个是全球最大的独立开源软件公司 SUSE,一个…

spring boot 配置动态刷新

本文测试使用的spring cloud版本为: Dalston.SR1 很多朋友只知道spring cloud config可以刷新远程git的配置到内存中, 却不知道spring cloud config的客户端可以脱离服务端使用, 更不知道spring cloud config客户端结合actuator还可以刷新本地…

深度学习撞墙了

来源:机器之心早在 2016 年,Hinton 就说过,我们不用再培养放射科医生了。如今几年过去,AI 并没有取代任何一位放射科医生。问题出在哪儿?近年来,AI 在大数据、大模型的深度学习之路上一路狂奔,但…

Transformer 会接管人工智能?

来源:ScienceAI编辑:绿萝想象一下,你去当地的五金店,在货架上看到一种新的锤子。你听说过这把锤子:它比其他锤子敲得更快、更准确,在过去的几年里,它已经淘汰了许多其他锤子,至少在大…

Nat. Commun.速递:合群者有着相似的大脑活动

来源:集智俱乐部作者:郭瑞东 作者:梁金编辑:邓一雪摘要Convergent processing of the world may be a factor that contributes to social connectedness. We use neuroimaging and network analysis to investigate the associat…

桌面推演技术前沿及发展趋势

来源:蓝海长青智库作者:吕欣、蔡梦思、陈彬,国防科技大学系统工程学院摘要桌面推演通过模拟事件场景及处置过程来提高参演人员的风险感知能力、信息研判能力、指挥决策能力和协同配合能力,被广泛应用于军事作战、应急管理和教育培…

清华大学孙茂松:自然语言处理一瞥,知往鉴今瞻未来

来源:中国人工智能学会作者:孙茂松近日,清华大学人工智能研究院常务副院长孙茂松教授亲手执笔,对自然语言处理的贡献、当前境界与未来挑战进行了深入的探讨。AI科技评论编辑组深有同感,认为此文十分值得一读&#xff0…

前端基础之jQuery

jQuery jQuery的思想,实际上很简单,八个字可以概括:选取元素,对其操作。 元素选取的表达式遵循 CSS 以及 XPath 的标准。选取结果可以是一个或多个,后面的操作针对所有被选取的元素。多个连续的操作可以用“链式”实现…

美国自动驾驶监管里程碑:新法规允许自动驾驶汽车取消方向盘

来源:AI前线编译:刘燕NHTSA 表示,这一新规迈出了“历史性”的一步,确保为配备自动驾驶系统的车辆的乘客保持同样高水平的乘员碰撞保护。这可以视为美国自动驾驶监管的一个里程碑。InfoQ 3 月 11 日消息,根据路透社的报…

DataTable实现分组

有时候我们从数据库中查询出来数据之后,需要按照DataTable的某列进行分组,可以使用下面的方法实现,代码如下: using System; using System.Collections.Generic; using System.Data; using System.Linq; using System.Text; using…

城市大脑的定义与理论基础综述

本文发表于2022年2月下旬的《中国建设信息化》,作者杜青峰 刘锋 任伟阳1 前言2015以来,城市大脑的概念和定义首次提出后。随着城市大脑领域在理论研究和产业实践上的探索和进展,城市大脑已经成为前沿科技领域和智慧城市建设领域的新热点,到2022年&…

线程实现模型

线程实现模型 线程实现模型主要分为:用户级线程模型,内核级线程模型和两级线程模型。他们的区别在于线程与内核线程之间的对应关系。 以下我们将分析这三种线程实现模型的特点: 用户级线程模型 (1)多对一关系 用户级线…

逆生长!小鼠「逆龄疗法」登Nature子刊,有望用于人类

来源:机器学习研究组订阅一种新的「逆龄疗法」在小鼠身上显示出希望的曙光!最近,美国索尔克生物研究所的科学家运用细胞再生疗法,将「山中因子」注入小鼠,通过多组实验证明:仅数个月,小鼠年轻多…

消息中间件那些事--RabbitMQ

消息队列已经逐渐成为企业IT系统内部通信的核心手段。它具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能,成为异步RPC的主要手段之一。当今市面上有很多主流的消息中间件,如老牌的ActiveMQ、RabbitMQ,炙手可热的Kafka&#xf…

中国联通李福昌:探索无线连接的未来

来源:C114通信网文:李福昌无线技术在当今社会中发挥着重要的作用,特别是5G商用以来,无线技术的应用从以个人为主扩展到面向生产和社会,逐步践行“5G改变社会”的目标。展望未来,面向6G,无线连接…

听完411头猪的哼哼,他们找到了理解“猪语”的算法 | Scientific Reports

图片来源:Pixabay来源 哥本哈根大学翻译 闭诗林编辑 魏潇我们现在可以解读猪的情绪了。一个国际研究小组利用猪从出生到死亡的生命过程中收集到的数千份录音,首次在其一生各个阶段的大量场景下,将猪的呼噜声转化为了真实的情绪。这项研究由…

弄懂goroutine调度原理

goroutine简介 golang语言作者Rob Pike说,“Goroutine是一个与其他goroutines 并发运行在同一地址空间的Go函数或方法。一个运行的程序由一个或更多个goroutine组成。它与线程、协程、进程等不同。它是一个goroutine“。 goroutine通过通道来通信,而协程…

JVM-类加载原理

写在前面 我们知道我们编写的java代码,会经过编译器编译成字节码文件(class文件),再把字节码文件装载到JVM中,映射到各个内存区域中,我们的程序就可以在内存中运行了。那么字节码文件是怎样装载到JVM中的呢…

2022年斯坦福AI Index公布:中美主导跨国研究,专利、投资金额暴增

来源:学术头条当地时间 3 月 16 日,斯坦福大学以人为本人工智能研究所(StanfordHAI)正式发布了《2022 年人工智能指数报告》(Artificial Intelligence Index Report 2022)。这是该机构发布的第五份年度报告…

中国传感器规模将超7000亿元:2022最全面深入的产业分析

来源:前瞻经济学人整理:动感传感本文整理自前瞻经济学人的传感器产业报告,作为国内领先的咨询机构,前瞻经济学人的研报分析深度和数据丰富程度,都首屈一指。主要有如下几部分内容:•2022年中国传感器行业市…