【隐私计算篇】全同态加密应用场景案例(隐私云计算中的大模型推理、生物识别等)

1.题外话

        最近因为奖项答辩,一直在忙材料准备,过程非常耗费时间和精力,很难有时间来分享。不过这段时间虽然很忙碌,但这期间有很多新的收获,特别是通过与领域内专家的深入交流和评审过程,对密码学和隐私计算领域有了更深层次的理解。此外,也体会到工作中严谨和科学的工作方法的重要性。

2. 全同态加密应用案例

2.1 关于全流程加密、密算云的讨论

        近期在全同态加密算法的一些实践,特别是利用GPU来加速密文的处理(可以看下前段时间分享的《替换半同态使用全同态加速计算联邦机器学习算法的实证分析》)。在此过程中,全同态加密算法进行了多方面的改进,性能效率显著优化。让我们看到全同态在联邦机器学习、联邦深度学习上的性能潜力。

        近期行业内逐步出现密算云的实践,我称之为“隐私云计算”。密算是指整个数据以密算形式流通,保障它在存储计算、运维研发全链路是安全可控的【1】。全链路密算的概念,和2022年富数科技以及腾讯、2023年蓝象智联提出的全匿踪联邦学习、全链路加密处理【2】有相似之处,都强调全流程的安全可控以及密态形式数据流转,而不再是原来追求隐私计算的片面安全性,关于隐私计算的片面安全性,可以参考阅读《隐私计算使用不当也会泄露原始数据》。

2.2 关于全同态加密算法及应用案例

2.2.1 全同态加密算法略谈

        关于全链路密算的隐私计算模式,全同态加密算法是一种可行解。 全同态加密(Fully Homomorphic Encryption, FHE)允许对加密数据进行计算,而无需解密。这种特性使得在处理敏感数据时,可以在保护数据隐私的同时,仍然能够执行必要的计算操作。

        全同态加密的工作原理是,通过对数据进行加密后,任何对这些加密数据的计算结果都可以在不泄露原始数据的情况下,得到与直接在明文上计算相同的结果。这使得它在云计算和分布式计算环境中,面向需要保护用户隐私的场景中,有很好的应用潜力。

        在全链路密算中,全同态加密能够有效解决数据传输和存储中的隐私问题。无论是在数据收集、传输还是存储阶段,数据始终保持加密状态,避免了数据在传输过程中的潜在泄露风险。此外,通过全同态加密,参与方可以在保持各自数据隐私的前提下,协同完成复杂的计算任务,实现数据共享与合作。

        全同态加密算法,目前主流和常用的主要是BFV以及CKKS。其中BFV(Brakerski/Fan-Vercauteren)方案主要面向整数向量进行密文处理。基于 CKKS(Cheon-Kim-Kim-Song)方案则是面向实数向量进行密文处理。密文处理又涉及密文 - 密文向量以及密文 - 明文向量进行逐元素的加法、减法和乘法操作, 点积和矩阵乘法等【4】。

2.2.2 全同态加密算法应用案例

        【3】中介绍了几种密算云的应用案例,感觉不错,这里做下分享。

2.2.2.1 案例1--大模型密算

        大模型(云)能够辅助完成各种任务,从训练成本和实用功能的角度来看,具有显著的数据价值,通常作为通用服务提供给用户。然而,大模型应用中一个备受关注的问题是,用户提供给模型的输入可能包含敏感信息。当用户以明文形式输入这些信息时,一方面,模型服务方(云)可能直接获取这些敏感数据;另一方面,模型可能学习到输入内容,从而导致进一步的信息泄露。关于这一点,我会在后续的大模型评估中谈到,其实模型评估的时候也会遇到类似问题,你的prompt很快就会被作为微调或者训练语料被记忆到大模型中,导致静态评估的失效。

        为了解决这一问题,可以采用全同态加密技术。用户可以将自己的输入信息进行全同态加密,然后在密文状态下执行大模型的推理计算,从而生成密文形式的回答。最终,用户可以解密该回答,获得明文内容。在整个过程中,用户的输入和输出信息都得到了有效保护,未发生泄漏。同时,模型所有方也确保了计算过程在自己的服务器上进行,避免了模型信息的泄露。

2.2.2.2 案例2--生物识别

        关于生物识别,之前我们介绍了利用MPC实现人脸识别的案例,对VGG16深度学习模型进行密态推理,可以参考《利用多方安全计算MPC实现VGG16人脸识别隐私推理》。而本案例提出基于全同态加密的方式进行处理。

        公有云平台提供人脸识别及人脸数据库管理服务,应用方(如 APP 公司)可以将用户的人脸数据库委托给公有云进行管理。云平台不仅提供数据库的查询和修改服务,还提供人脸图像的比对、定位和分析等 AI 模型服务。由于人脸数据属于个人生物信息,相关法规要求使用人脸识别技术的产品必须确保人脸数据的安全。针对这一场景,可以采用全同态加密技术,以支持在密文状态下对人脸数据库进行处理和推理。通过将人脸数据库以密文形式托管,不仅可以确保应用方用户的个人数据隐私不被公有云泄露,还能有效防止潜在黑客获取存储在公有云数据库中的敏感信息。在MPC方案中,是通过对数据进行碎片化分布式保存,也就是黑客只要没有拿到全部的碎片或者说没有达到原始数据的恢复碎片数量阈值,就不可能窃取到明文人脸数据。基于全同态加密和安全多方计算实现数据安全保护的方式还是有比较大的差异的。

2.2.2.3 案例3--医疗数据

        基因数据是现代医学研究和疾病诊断的重要组成部分,但同时也涉及到个人隐私的关键数据。在基因诊断应用中,用户需提供自己的基因数据,但必须防止数据泄漏。同时,医疗机构(云)提供的生物信息算法也是其重要资产,机构同样希望保护这些信息不被泄露。通过使用全同态加密算法,用户可以将自己的基因片段加密后发送给医疗机构(云)。医疗机构(云)在密文状态下执行生物信息算法,并将所得结果返回给用户。用户随后解密结果,便可以获得诊断信息。在这一过程中,双方的隐私得到了有效保护,同时用户所获得的诊断结果与在明文数据下的结果一致。

        同样这个模式也适用其他敏感的医疗场景隐私数据的处理,比如用户关于某种自身罕见疾病的信息查询。

3. 参考材料

【1】大模型密算平台(隐语)

【2】全匿踪联邦学习(富数、腾讯、蓝象、洞见等)

【3】全同态密码云计算平台(格物)

【4】全同态加密张量运算库解读

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/58062.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

今日头条APP移动手机端留痕脚本

这两个的脚本目的是什么呢? 很简单,就是批量访问指定用户的首页,在他人访客记录里面留下你的账户信息,可以让对方访问你的头条,概率下会关注你的头条,目的嘛,这个自己细想! 第1个是…

Python实现Android设备录屏功能及停止录屏功能

1、功能概述? 提供源码下载 之前通过ADB命令实现了实时的录屏功能。但是很遗憾,虽然通过adb命令录屏非常方便,但由于权限限制,无法在安卓系统较高的设备上使用。现选择使用另一开源工具来解决这一问题,并记录使用详细…

java jsoup爬虫如何快速获取到html页面的选择器元素

java jsoup爬虫如何快速获取到html页面的选择器元素 一、打开元素选择器二、选定元素三、定位元素位置四、右键 -> copy ->copySelector五、代码中获取 一、打开元素选择器 在java采用jsoup爬虫中,返回的是html页面而不是json字段,就需要使用jsou…

[C++11] 右值引⽤与移动语义

文章目录 左值和右值左值(Lvalue)右值(Rvalue)区别 左值引⽤和右值引⽤左值引用(Lvalue Reference)右值引用(Rvalue Reference)右值引用的特点 右值引用延长生命周期右值引⽤和移动语…

传输层UDP

再谈端口号 端口号:标识了主机上进行通信的不同的应用程序 在TCP/IP 协议中我们用“源IP”"源端口号" “目的IP”“目的端口号” “协议号”五元组来标识一个通信 用netstat -n 查看 查看网络信息,我们有两种命令查看网络通信1.用netsta…

Linux-练习3

题目: 操作过程: 1.建立用户组 shengcan,其id 为 2000 2.建立用户组 caiwu,其id 为 2001 3.建立用户组 jishu,其 id 为 2002 4.建立用户 lee,指定其主组 id 为 shengchan,附加组为 jishu 和…

多GPU训练大语言模型,DDP, ZeRO 和 FSDP

在某些时候,我们可能需要将模型训练扩展到单个 GPU 之外。当模型变得太大无法适应单个 GPU 时,需要使用多 GPU 计算策略。但即使模型适合单个 GPU,使用多个 GPU 来加速训练也是有好处的。即使您正在处理一个小模型,了解如何在多个…

在浏览器中运行 Puppeteer:解锁新能力

Puppeteer,这个强大的浏览器自动化工具,通常在Node.js环境中运行。但你有没有想过,在浏览器本身中运行Puppeteer会是什么样子?这不仅能让我们利用Puppeteer的功能完成更多任务,还能避开Node.js特定的限制。 支持的功…

【Canvas与桌面】文山甲密铺桌面壁纸 1920*1080

【成图】 不加蒙版的部分截图&#xff1a; 加上蒙版的桌面壁纸图&#xff1a; 不加蒙版的桌面壁纸图&#xff1a; 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8&qu…

ts:对象数组的简单使用

ts中对象数组的简单使用 一、主要内容说明二、例子1、源码12、源码1运行效果 三、结语四、定位日期 一、主要内容说明 平常ts创建数组的格式如下&#xff1a; let array:string[]["元素1","元素2","元素3","元素3","元素4"…

Java语言-异常

目录 1.异常的概念与体系结构 1.1 异常的概念 1.2 异常的体系结构 1.3 异常的分类 1.3.1 编译时异常(受查异常) 1.3.2 运行时异常(非受查异常) 2.异常的处理 2.1 防御式编程 2.1.1 LBYL 2.1.2 EAFP 2.2 异常的抛出 2.3 异常的捕获 2.3.1 异常声明throws 2.3.2 …

Spring IoC DI

博主主页: 码农派大星. 数据结构专栏:Java数据结构 数据库专栏:MySQL数据库 JavaEE专栏:JavaEE 关注博主带你了解更多数据结构知识 目录 1. 应用分层 1.1 如何分层: 1.2 MVC与三层架构区别联系 2. Spring 3.IoC & DI⼊⻔ 3.1 什么是IoC&#xff1f; 3.2 DI 介绍 …

ctfshow——web(持续更新)

文章目录 1、web签到题——base64编码特征2、web2——登录框测试&sqlmap使用3、web3——php伪协议 1、web签到题——base64编码特征 查看源代码&#xff1a; base64编码特征&#xff1a;大小写数字&#xff0c;偶尔最后几位是。 2、web2——登录框测试&sqlmap使用 …

合约门合同全生命周期管理系统:企业智能合同管理的新时代

合约门合同全生命周期管理系统&#xff1a;企业智能合同管理的新时代 1. 引言 随着现代企业的快速发展&#xff0c;合同管理的复杂性日益增加。无论是采购合同、销售合同还是合作协议&#xff0c;合同管理已成为企业运营中至关重要的一环。传统的手工合同管理方式往往效率低下…

解读AVL树:平衡二叉搜索树的奥秘

✨✨小新课堂开课了&#xff0c;欢迎欢迎~✨✨ &#x1f388;&#x1f388;养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; 所属专栏&#xff1a;C&#xff1a;由浅入深篇 小新的主页&#xff1a;编程版小新-CSDN博客 前言&#xff1a; 前面我们已经介绍了二叉搜…

交易逆序对的总数 ---- 分治-归并

题目链接 题目: 分析: 解法一: 暴力解法, 遍历所有的数对, 找到逆序对, 需要两重for循环, 一定会超时解法二: 归并排序的思想如果我们将数组分成两半, 我们在每一半中各找一个数字, 判断是否为逆序对, 再根据归并的思想, 再将一半数组分半, 判断是否为逆序对, 直到数组只有一…

【论文笔记】xGen-MM (BLIP-3): A Family of Open Large Multimodal Models

&#x1f34e;个人主页&#xff1a;小嗷犬的个人主页 &#x1f34a;个人网站&#xff1a;小嗷犬的技术小站 &#x1f96d;个人信条&#xff1a;为天地立心&#xff0c;为生民立命&#xff0c;为往圣继绝学&#xff0c;为万世开太平。 基本信息 标题: xGen-MM (BLIP-3): A Fami…

网络编程_day3

#1024程序员节 #三次握手四次挥手#四次挥手#udp#recvfrom#sendto#服务器模型#客户端模型#Linux IO模型#阻塞式IO#非阻塞IO#设置非阻塞的方式 目录 【0】复习 【1】三次握手四次挥手 四次挥手 四次挥手既可以由客户端发起&#xff0c;也可以由服务器发起 【2】udp 1. 通信流程 2…

实验:使用Oxygen发布大型手册到Word格式

此前&#xff0c;我曾发表过一篇文章《结构化文档发布的故事和性能调优》&#xff0c;文中讨论了在将大型DITA手册转换为PDF格式时可能遇到的性能挑战及相应的优化策略。 近日&#xff0c;有朋友咨询&#xff0c;若将同样的大型手册输出为MS Word格式&#xff0c;是否也会面临…

Linux复习-C++

参考博客&#xff1a; https://blog.csdn.net/qq_45254369/article/details/126023482?ops_request_misc%257B%2522request%255Fid%2522%253A%252277629891-A0F3-4EFC-B1AC-410093596085%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&req…