第 12 课:基于隐语的VisionTransformer框架

基于之前MPC的基础知识,本讲主要内容是MPCViT基于SecretFlow的VisionTransformer框架,主要从神经网络架构,隐私推理框架和实验结果三方面介绍。

 一、MPCViT:安全且高效的MPC友好型 Vision Transformer架构

        MPCViT隐私推理总体框架中,其底层协议是基于半诚实威胁模型的 2PC的秘密分享方案,简单来说即服务器和客户端相互不能泄漏自己的信息,最终要得到神经网络正确的推理结果。在上层模型方面,VisionTransformer是一种基于Transformer编码器的视觉模型,包含了embedding层,注意力层,非线性GeLU函数等多个不同模块,总体目标是在保护数据和模型隐私的前提下,以更高的推理效率得到最终图像分类的结果。

        MPCViT的三大研究动机:ViT延迟分解(ViT在MPC中推理的延迟进行分解分析,发现在SEMI-2K和Cheetah两种协议下,注意力机制中的SoftMax以及MLP中的GeLU函数都占据了绝大部份的延迟)及通信瓶颈、不同注意力机制变体对比,对比了不同注意力的准确率和延迟(进一步分解注意力机制,可以发现求最大值、求倒数、求指数等运算都造成了一部分延迟,能否尽可能去除ViT中这样一些耗时的操作,提高隐私推理的效率,降低推理的延迟)、不是所有的注意力都同等重要(发现一些注意力机制具有很高的效率,另一些具有很好的性能,一个很自然的想法是能否去合理地融合两种不同的注意力机制,使得在隐私推理时同时具有高效性和高准确率)。

        MPCViT的整体算法流程(主要用于解决如何权衡模型准确率和推理延迟,以及融合高准确率注意力机制和低延迟注意力机制)可以分为四步:

                1、设计合适的搜索空间(三种不同的粒度)

                        分为粗粒度:Transformer层级粒度,中粒度:注意力头级粒度,细粒度:注意力行级粒度(token级)

                2、MPC感知神经架构搜索(可微分搜索)

                        对于架构搜素算法,给每个注意力都分配架构参数\alpha,在搜索过程中,自动决定应该保留哪个注意力,这种搜索算法是可微分的,搜索效率比较高,只需要通过给损失函数添加正则项即可实现。

                3、基于延迟限制的架构参数二值化(灵活适应)

                        在神经架构搜索完成之后,可以根据具体延迟的需求和限制,通过对\alpha进行排序,将具有较大\alpha注意力机制,设置成高准确率类型,对于较小的\alpha,设置成低延迟类型。

                4、重训练异构注意力ViT(借助知识蒸馏提升模型性能)

                        直接训练搜索后的异构注意力机制ViT会导致显著的准确率下降,如何有效提高异构注意力了机制ViT的准确率?可以采用多粒度自蒸馏方式,让异构ViT去学习到原始Softmax ViT的软标签,以及最后一层的特征,这种粗细粒度的蒸馏能够很大程度的帮助ViT架构的学习。

二、搭建基于SecretFlow的Vision Transformer框架

        分为以下四部分:

                1、SecretFlow Secure Processing Unit (SPU)

                        前文已经多次介绍。

                2、隐私推理协议及通信参数配置

                        隐私推理协议及节点配置,模拟网络参数配置throttle.sh,包括广域网和局域网。

                3、基于Jax的ViT模型搭建

                        采用Jax语言,其语法与Pytorch有相似之处。具体包括图像Patch Embedding搭建,注意力机制搭建,MLP模块搭建和Transformer模块搭建。

                4、ViT模型隐私推理

                        ViT Benchmark文件,包括初始化SPU环境,设置输入变量维度,模型实例化,以及密文推理过程。

                        ViT隐私推理操作流程,包括配置Python环境及安装SPU,配置并模拟通信网络环境,模拟MPC环境及协议,以及执行隐私推理。

三、MPCViT主要实验结果

        和近年的SOTA模型相比,MPCViT在不同的数据集上,不同的架构上, 都显著的降低了延迟,并且具有更高的准确率。

        在消融实验中可以看到,两种粒度的知识蒸馏对于异构ViT模型的训练都是至关重要的。        

        在搜索算法方面,在不同模型的架构上,在不同的超参数情况下,都有很好的一致性,同时可以扩展到不同规模的架构以及数据集上,具有很好的扩展性。

四、总结

        首先介绍了ViT在MPC环境下进行隐私推理的总体框架、研究动机以及算法流程。

        MPCViT借助蚂蚁的SecretFlow-SPU去搭建ViT隐私推理框架,并测试了不同模型架构的推理效率。

        介绍了SecretFlow-SPU的特点和功能,并展开讲解了基于SecretFlow和Jax的ViT框架搭建流程

        最后,呈现了该工作的主要实验结果,效果均优于基线模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/36091.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

QT中子工程的创建,以及如何在含有库的子工程项目中引用主项目中的qt资源

1、背景 在qt中创建多项目类型,如下: CustomDll表示其中的一个动态库子项目; CustomLib表示其中的一个静态库子项目; MyWidget表示主项目窗口(main函数所在项目); 2、qrc资源的共享 如何在CustomDll和CustomLib等子项目中也同样使用 MyWidget项目中的qrc资源呢??? 直…

【AI应用探讨】—决策树应用场景

目录 1 命名实体识别(NER) 2 信用评估 3 医学诊断 4 垃圾邮件过滤 5 推荐系统 6 金融欺诈检测 7 医疗领域的其他应用 8 网络行为管理系统 1 命名实体识别(NER) 应用场景:在文本处理中,决策树可以用…

【项目实训】后端逻辑完善

经测试,我们决定前端可以同时选择多个类型的岗位进行查询,以显示相应的公司岗位信息 于是,修改后端函数的逻辑: 后端 首先,因为要对checkList中的job_name进行模糊匹配查询,于是使用以下代码&#xff1a…

mybatis批量处理

批量修改 <update id"updateTaskDistributions" parameterType"java.util.List"><foreach collection"viewTaskDistributions" index"index" item"item" open"begin" close";end;" separa…

【科学计算与可视化】3. Matplotlib 绘图基础

安装 pip install matplotlib 官方文档 https://matplotlib.org/stable/api/pyplot_summary.html 主要介绍一些图片绘制的简要使用&#xff0c;更加详细和进阶需要可参考 以上官方文档。 1 绘制基础 方法名说明title()设置图表的名称xlabel()设置 x 轴名称ylabel()设置 y 轴…

双指针:比较含退格的字符串

题目链接&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; 代码看起来繁琐&#xff0c;但实际思想并不难。核心思路是&#xff1a;倒序遍历&#xff0c;遇到#就记录跳过次数&#xff0c;遇到字母就跳过记录次数&#xff0c;最后比较不用跳过时的字母是否一样。 class S…

负载组指南说明-负载柜

什么是负载组&#xff1f; 负载组是一种设备&#xff0c;旨在准确模拟电源在实际应用中看到的负载。这种负载组可以用电阻、电感或电容元件构建。它是一种电阻装置&#xff0c;以热量的形式消散一定量的能量&#xff0c;可以通过自然对流、强制空气或水冷系统去除。 为什么要使…

江协科技51单片机学习- p11 Proteus安装模拟51单片机

前言&#xff1a; 本文是根据哔哩哔哩网站上“江协科技51单片机”视频的学习笔记&#xff0c;在这里会记录下江协科技51单片机开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了江协科技51单片机教学视频和链接中的内容。 引用&#xff1a; Proteus快速入门&…

可溶性聚四氟乙烯离子交换柱PFA层析柱微柱一体成型

PFA微柱&#xff0c;也叫PFA层析柱、PFA离子交换柱等&#xff0c;主要用于地质同位素超净化、痕量、超痕量、微量元素分析实验室。 规格参考&#xff1a;1.5ml、15ml、30ml等。 其主要特性有&#xff1a; 1、PFA层析柱&#xff08;微柱&#xff09;专为离子交换设计&#xff…

SAP ERP公有云(全称 SAP S/4HANA Cloud Public Edition),赋能企业成为智能可持续的企业

在数字化浪潮中&#xff0c;每一家企业都需要应对快速的市场变化&#xff0c;不断追求降本增效&#xff0c;为创新提供资源&#xff0c;发展新的业务模式&#xff0c;安全无忧地完成关键任务系统的转型。 10年前&#xff0c;SAP进入云领域&#xff0c;用云ERP和覆盖全线业务的云…

双通道源表KEITHELY2636B详情参数吉时利2636B

Keithley的2636B是一款2600B系列双通道系统源表(SMU)仪器(0.1fA, 10A脉冲)。它是业界领先的电流/电压源和测量解决方案。这种双通道模型结合了精密电源&#xff0c;真电流源&#xff0c;6 1/2位DMM&#xff0c;任意波形发生器&#xff0c;脉冲发生器和电子负载的能力&#xff0…

锐起RDV5高性能云桌面

锐起是上海锐起信息技术有限公司旗下品牌。该公司创立于 2001 年&#xff0c;是桌面虚拟化产品和解决方案提供商&#xff0c;专注于桌面管理系统和私有云存储系统的系列软件产品研发&#xff0c;致力于简化 IT 管理、增强系统安全&#xff0c;提供简单、易用、稳定、安全的产品…

并发数据结构:ConcurrentHashMap深入分析

在Java并发编程中&#xff0c;ConcurrentHashMap是一个极其重要的类&#xff0c;它提供了比Hashtable和同步的HashMap更好的并发性能。本文将深入分析ConcurrentHashMap的内部结构、工作原理以及如何高效地使用它。 1. ConcurrentHashMap简介 ConcurrentHashMap是Java集合框架…

kubernetes Job yaml文件解析

一、yaml文件示例 apiVersion: batch/v1 kind: Job metadata:name: test-jobnamespace: mtactor spec:completions: 3parallelism: 1backoffLimit: 5activeDeadlineSeconds: 100template:spec:containers:- name: test-jobimage: centoscommand: ["echo","test…

linux创建逻辑盘再挂载

创建逻辑盘再挂载 原因&#xff1a;如果直接挂载整盘&#xff0c;后面想扩容会很麻烦。挂载逻辑卷的话就简单很多。为了以后方便。所以直接挂载逻辑卷 openEuler系统先装lvm2如果&#xff1a;-bash: pvcreate: command not found执行&#xff1a;yum install lvm2 df -hT ls…

我在高职教STM32——GPIO入门之按键输入(1)

大家好&#xff0c;我是老耿&#xff0c;高职青椒一枚&#xff0c;一直从事单片机、嵌入式、物联网等课程的教学。对于高职的学生层次&#xff0c;同行应该都懂的&#xff0c;老师在课堂上教学几乎是没什么成就感的。正因如此&#xff0c;才有了借助 CSDN 平台寻求认同感和成就…

Linux下创建虚拟磁盘

参考文档 https://blog.csdn.net/lujun9972/article/details/115762407 https://blog.csdn.net/Kiritow/article/details/118076034 1&#xff0c;创建挂载点 sudo mkdir /mnt/z //方式一&#xff0c;内存盘方式 2&#xff0c;创建内存盘 sudo mount -t ramfs -o size1G z /…

Java中的内存泄漏及其排查方法

Java中的内存泄漏及其排查方法 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01; 在Java开发中&#xff0c;内存管理通常由Java虚拟机&#xff08;JVM&#xff0…

【观察】戴尔科技+AMD:释放技术创新“乘数效应”,助力制造业打造“新质生产力”...

在今年的政府工作报告中&#xff0c;“人工智能”首次被写入报告&#xff0c;同时“大力推进现代化产业体系建设&#xff0c;加快发展新质生产力”也被列为2024年的首项政府工作任务&#xff0c;其重要性不言而喻。 尤其是最近几年&#xff0c;以人工智能、大模型、大数据、云计…

如何在Spring Boot中使用RabbitMQ实现消息队列

如何在Spring Boot中使用RabbitMQ实现消息队列 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01;在分布式系统中&#xff0c;消息队列是实现解耦、异步通信和削峰…