【联邦学习贡献评估——联邦学习优化】

1. 模型复用

贡献评估往往需要计算不同参与方组合的数据价值, 然而模型相关的价值度量指标, 比如测试准确率, 需要基于数据重新训练并评测模型, 这导致了高昂的数据价值度量代价. 为了避免重复训练联邦模型的代价, 考虑复用全体参与方组合下训练联邦模型时各参与方的梯度更新, 避免在其他参与方子组合下训练模型时各 参与方重复的梯度计算, 大大减少模型训练相关的代价。

直接方式(不推荐):对于每个参与方子 组合, 复用相关参与方的梯度更新来完成模型的多轮次训练, 然后评测模型度量子组合数据价值. 但是因为 复用的梯度值不能代表参与方子组合数据的最优梯度方向, 经过多轮次训练后, 模型训练的累积误差大, 导 致近似价值度量不够准确.

合适的思路:评估各参与方在每轮次训练的贡献, 聚合多轮贡献来评估 参与方在联邦合作中的贡献

具体的思路:,

  1. 全体参与方合作训练联邦模型, 在每轮次中, 根据本地数据向联 邦发送梯度更新, 联邦枚举不同参与方组合梯度计算各参与方在本轮次的贡献期望, 然后, 联邦聚合所有参 与方梯度完成本轮次的全局模型更新.
  2. 基于每轮次评估参与方贡献的设定, 实现了在梯度复用的同时 , 大大 提升评估的准确性. 但是由于每轮次均需要评测模型性能, 评测次数随训练轮次线性增大, 加大了模型评测的代价.

缺陷的解决方案1:Wang 等人在每轮次评估中仅采样部分参与方进行贡献评估, 并将未被采样的参与方在该轮次的贡献视为 0. 然而, 由于模型训练的性能提升增益随训练轮次 逐渐收敛, 该方法对于未在靠前轮次中被采样到的参与方不公平.

解决方案1的补充:为了提升每轮次仅采样部分参与方进行贡献评估的公平性, 观察到多轮次不同参与方组合价值构成的矩 阵具有低秩特性, 可以将价值度量转换为采样下的低秩矩阵补全问题.

2. 模型剪枝

在联邦参与方贡献评估过程中, 从采样排列中参与方的边际价值增益、模型多轮次训练的性能提升和数 据样本这 3 个层面, 均可以进行剪枝优化.

  • 排列剪枝
    • 在贡献评估的随机采样优化中, 对于每个排列, 需要从前往后计算每个参与方加入前缀参 与方组合带来的边际贡献. 在假定所有参与方的边际贡献非负的情况下, 排列从前往后引入新参与 方的过程中, 前缀参与方组合的数据价值逐渐趋近于全体参与方组合的价值.
    • 因此, 可以设置边际增 益阈值, 当排列中参与方前缀组合的价值与全体参与方组合的价值差小于阈值时, 往后的参与方不 会带来显著边际增益, 因此可以剪枝停止计算引入剩余参与方的组合数据价值, 有效地提升参与方 数量庞大情况下的计算效率
  • 训练剪枝
    • 机器学习模型往往需要多轮次训练才能收敛, 为了降低数据估值任务中模型的训练代价, 不必像模型应用性能测评中一样, 尽可能地让模型收敛, 在模型性能提升波动小于一定程度时进行 剪枝, 提早结束模型训练. 甚至为进一步提升联邦数据评估效率, 可以根据任务复杂度适当提升模型 学习率, 仅进行单轮次模型训练
  • 数据剪枝
    • 基于局部相关特性, 联邦采用 K 近邻任务模型可实现贡献评估的数据样本剪枝。
    • K 近邻 方法价值计算仅关联到离测试样本最近的 k 条训练数据样本, 可忽略离测试样本距离过远的数据样 本, 因此可以对远距离样本剪枝来提升贡献评估效率.

3. 模型性能优化

在联邦学习实践中, 无法保证所有参与方均提供高价值无恶意的数据. 为了保证联邦学习效果 , 抵御恶意参与方攻击是联邦学习的一个重要研究议题[77]. 从优化联邦学习效果角度出发, 贡献评估技术可用于优化 联邦模型训练, 即择优选择参与方数据, 优化参与方参与程度, 减少使用低价值或恶意参与方数据, 降低恶意 参与方对模型性能的负面影响。

  • 按贡献调整联邦参与程度
    • 根据参与方的贡献大小, 调整参与方在联邦训练中的参与程度. 在经典联 邦学习中, 所有参与方在联邦合作中参与程度仅与数据量挂钩, 即基于 FedAvg, 按照各参与方数据 量加权聚合各参与方的梯度更新.
  • 设阈值移除低贡献参与方
    • 当不存在完备联邦测试集时, 可以根据参与方之间交叉验证来鉴定并移 除低贡献参与方.
  • 按贡献奖励不同任务模型.
    • 在很多联邦学习设定中, 参与方参与联邦学习的目的是获取性能更高的 任务模型, 因此, 可以通过贡献大小来奖励相应性能的任务模型来避免低价值或者恶意参与方. 实现 参与方按贡献获得不同任务模型, 需要改变经典联邦学习中每轮次训练后联邦同步最新全局模型给 每个参与方的设定.

4. 相关的论文

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/758792.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【NTN 卫星通信】 车辆物联网设备通过NTN和TN切换的应用场景

1 场景描述 对于有两个3GPP无线接入网服务的大面积农田和农场,物联网设备可以通过NTN和TN接入网同时受益于5G系统的双转向数据连接能力。   在这个用例中,我们有一个广域的农业自动化应用系统来控制农业车辆,例如,一个装有数百个…

大模型提示学习样本量有玄机,自适应调节方法好

引言:探索文本分类中的个性化示例数量 在自然语言处理(NLP)领域,预测模型已经从零开始训练演变为使用标记数据对预训练模型进行微调。这种微调的极端形式涉及到上下文学习(In-Context Learning, ICL)&…

leetcode代码记录(删除字符串中的所有相邻重复项

目录 1. 题目:2. 我的代码:小结: 1. 题目: 给出由小写字母组成的字符串 S,重复项删除操作会选择两个相邻且相同的字母,并删除它们。 在 S 上反复执行重复项删除操作,直到无法继续删除。 在完成…

LeetCode_30_困难_串联所有单词的子串

文章目录 1. 题目2. 思路及代码实现详解(Python)2.1 滑动窗口 1. 题目 给定一个字符串 s s s 和一个字符串数组 w o r d s words words。 w o r d s words words 中所有字符串 长度相同。 s s s 中的 串联子串 是指一个包含 w o r d s words words …

Leetcode 3081. Replace Question Marks in String to Minimize Its Value

Leetcode 3081. Replace Question Marks in String to Minimize Its Value 1. 解题思路2. 代码实现 题目链接:3081. Replace Question Marks in String to Minimize Its Value 1. 解题思路 这一题其实感觉还是有点难的,主要一开始确实走了弯路&#x…

Python 异步编程(Async/Await)

Python 中的异步编程是一种编程模式,它允许程序在等待 I/O 操作(如网络请求、文件读写等)的同时继续执行其他任务,而不会阻塞整个程序。这种方式可以提高程序的效率和响应性。 在 Python 中,异步编程的核心概念是使用…

数据结构:9、二叉树

在上堆中已经介绍了什么是二叉树,所以这里直接写二叉树实现。 1、二叉树的构建 二叉树的构建第一步肯定是初始化,也就是构建这棵树,这里是利用前序遍历构建的,因为这里是利用链表形式创建的二叉树,所以这里就是和之前…

在java中当main方法执行完,堆内存会自己释放内存吗?(附解释)

在Java中,堆内存中的对象由Java虚拟机(JVM)的垃圾回收器自动进行内存管理和释放。当一个对象不再被引用时,垃圾回收器会在适当的时机自动回收该对象所占用的内存空间。这意味着在main方法执行完毕后,堆内存中的对象会被…

redis常用五大数据类型

目录 Key 字符串String 常用命令 列表List 常用命令 集合Set 常用命令 Hash哈希 键值对集合 有序集合Zset Redis新数据类型 Key set key value...添加keykeys *查看当前库中所有的keyexist key该key是否存在type keykey的类型del key删除keyunlink key根据value选择非阻塞…

Tomcat的Host Manager页面403的原因和解决办法

目录 背景 原因: 解决方案 背景 一直报错 403 Access Denied You are not authorized to view this page.By default the Host Manager is only accessible from a browser running on the same machine as Tomcat. If you wish to modify this restriction, youll need to…

C++ UML类图

参考文章: (1)C UML类图详解 (2)C基础——用C实例理解UML类图 (3)C设计模式——UML类图 (4)[UML] 类图介绍 —— 程序员(灵魂画手)必备画图技能之…

自然语言处理与图像描述

自然语言处理(NLP)与图像描述是两个相互关联且互补的领域。自然语言处理主要涉及计算机和人类(自然)语言之间的相互作用,包括文本分析、理解、生成和翻译等。而图像描述则是指使用自然语言来表达图像内容的过程&#x…

剑指offer面试题40 数组中只出现一次的数字

考察点 异或运算,与运算知识点 题目 分析 本题目要求数组中只出现一次的俩个数字,并且要求O(1)时间复杂度和空间复杂度。试想一下如果只有一个数字出现一次,那么针对全部元素做异或运算就可以了,因为相同元素异或为0。现在有俩…

2 使用GPU理解并行计算

2.1 简介 本章旨在对并行程序设计的基本概念及其与GPU技术的联系做一个宽泛的介绍。本章主要面向具有串行程序设计经验,但对并行处理概念缺乏了解的读者。我们将用GPU的基本知识来讲解并行程序设计的基本概念。 2.2 传统的串行代码 绝大多数程序员是在串行程序占据…

手撕算法-二叉树的最大深度

描述:分析:求以节点root为根节点的树的最大深度。可以进行拆分:root为根节点的树的最大深度 max(左子树的最大深度, 右子树最大深度)1 截止条件是节点为空,深度为0; 代码: public int maxDep…

HarmonyOS如何创建及调用三方库

介绍 本篇主要向开发者展示了在Stage模型中,如何调用已经上架到三方库中心的社区库和项目内创建的本地库。效果图如下: 相关概念 Navigation:一般作为Page页面的根容器,通过属性设置来展示页面的标题、工具栏、菜单。Tabs&#…

Java + sa-token统一身份认证开发笔记

官网地址:Sa-Token 统一认证服务端 直接用的官网的demo,稍加改动,因为要前后端分离,加了一个H5Controller,官网也有详细介绍,这一部分不难,照着做就行了 配置文件: # Sa-Token 配…

Java反射获取类信息的方式

获取Java类信息的方式有以下几种: 通过对象实例获取类信息: 可以通过对象实例的getClass()方法获取该对象所属类的Class对象。 通过类字面值获取类信息: 可以使用类字面值来获得类的Class对象。例如:String.class。 通过Class.for…

如何注册澳大利亚公司 注册澳大利亚公司流程 注册澳大利亚公司条件

澳大利亚注册公司的优势: 1、无需注册资本,手续简单方便可直接进行注册。 2、公司注册程序简单,提供公司名称、及股份比例即可, 3、税 务机关免费上门咨询服务,贸易局提供免费的信息。 4、在澳大利亚设立公司&…

vo、po、dto、bo、pojo、entity

VO:Value Object,值对象。 通常用于业务层之间的数据传递,由new创建,由GC回收;例如:将商品信息和用户信息重新用一个对象封装起来。和PO一样也是仅仅包含数据而已,但应是抽象出的业务对象&…