1. 隐语架构一览
1.1 隐语架构
隐语架构通常指的是一种面向隐私保护计算的软件框架或解决方案,它采用了密码学、可信执行环境(TEE)、多方安全计算(MPC)等多种隐私保护技术来实现在数据加密状态下进行计算,以保护数据隐私和安全。
在阿里云等企业研发的“隐语”隐私计算框架中,其核心特点是:
- 安全性:通过先进的密码学算法和技术确保原始数据在计算过程中不被泄露,即便数据传输给第三方,也无法还原出原始数据,保障数据主体的隐私权益。
- 高效性:采用优化的算法和架构设计,提高加密数据运算的效率,使得在保护隐私的同时能够进行大数据规模的实时计算。
- 灵活性:支持主流的隐私保护技术集成,包括但不限于多方安全计算(MPC)、可信执行环境(TEE)、同态加密(HE)、差分隐私(DP)等,可以根据业务场景灵活组合和使用。
- 开放性:提供友好的API接口和开发者工具,方便开发者快速搭建基于隐私计算的应用,同时也支持组件化的扩展和定制。
- 合规性:遵循国内外法律法规关于数据安全和隐私保护的要求,助力企业在合法合规的前提下进行数据价值挖掘。
- 模块化设计:将复杂的隐私计算功能封装成易于使用的模块,便于开发人员在构建应用程序时选取和搭配使用。
- 分层架构:通常包括应用层、服务层和基础设施层,每一层都提供特定的服务,以支持各种隐私计算任务。
- 安全协议层:内嵌了一系列实现数据加密和安全交换的协议,以确保数据在共享和计算过程中的安全性。
- 平台兼容性:支持多种硬件和云计算平台,能够在不同的计算环境下部署和运行隐私保护计算任务。
2. 隐语架构拆解
2.1 算法层
2.1.1 PSI/PIR
PSI(Private Set Intersection):PSI是一种隐私计算协议,用于在两个或多个参与方之间比较数据集的交集,而无需泄露具体的数据内容。每个参与方可以保持自己的数据集私密,并通过PSI协议计算交集,以确定它们之间共享的元素,而不会揭示其他不必要的信息。PSI常用于隐私保护的数据分析、身份验证和数据共享场景。
RIP(Secure Remote Inference Protocol):RIP是一种安全远程推断协议,用于在隐私计算环境中进行机器学习推断。它允许数据拥有者将模型和输入数据分开,并在保护数据隐私的同时,将输入数据发送给服务提供者进行推断。RIP协议使用密码学技术和隐私保护算法,确保在推断过程中不会泄露敏感信息,同时提供准确的结果
2.1.2 Data Analysis
Data Analysis - SCQL(Secure Collaborative Query Language)
一种多方安全数据分析系统,可以让互不信任的参与方在保护自己数据隐私的前提下,完成多方数据分析任务。
2.1.3 Federated Learning
联邦学习(Federated Learning)是一种分布式机器学习方法,旨在让多个参与方共同学习一个模型,同时保护数据的隐私性。与传统的集中式机器学习不同,联邦学习的核心思想是将模型的训练过程移至参与方的本地设备上,而不是将数据集集中到单个中央服务器上。
2.2 计算层
2.2.1 混合编译调度RayFed
专注于跨机构的分布式计算调度框架
2.2.2 SPU
Secure Process Unit。Secure Process Unit (SPU) 是一种安全处理单元,通常用于保护计算设备或系统中的敏感数据和操作。SPU 旨在提供硬件级别的安全性和保护,以防止未经授权的访问和攻击。
SPU 可以是一个独立的芯片或集成在处理器或其他硬件组件中。它的主要功能之一是执行安全计算,例如加密、解密、数字签名和密钥管理等。SPU 通常具有专用的安全指令集和硬件加速器,以提供高效的安全功能。
SPU 还可以提供安全隔离和容器化功能,以确保不同的软件或应用程序之间的互相隔离,防止恶意代码或攻击者从一个环境中访问另一个环境中的数据。
SPU 在安全芯片、智能卡、安全模块、安全处理器等领域得到广泛应用。它们对于保护敏感数据、执行安全验证和加密操作,以及提供安全的计算环境至关重要。
2.2.3 HEU同态加密
同态加密是一种特殊的加密技术,允许对加密数据进行计算,而无需先解密数据。这使得在加密状态下进行计算成为可能,从而保护了数据隐私。
在隐私计算领域,HEU 可能用于保护用户数据的隐私,同时允许在加密数据上进行计算,例如在云计算环境中进行数据分析或机器学习任务,而无需暴露原始数据。HEU 可以执行加法、乘法和其他操作,而不需要将数据解密,这对于保护数据隐私至关重要。
2.2.4 TEEU
“Trusted Execution Environment Unit”,即可信执行环境单元。可信执行环境是一种安全的硬件和软件组合,旨在提供受保护的执行环境,以确保敏感数据和关键代码受到保护,不受恶意软件或其他不信任的实体的干扰。
在隐私计算中,TEEU 可能用于执行关键的计算任务或保护敏感的数据处理操作。例如,在边缘计算场景中,可以使用TEEU来执行隐私保护的数据处理,以确保用户数据在处理过程中不被泄露或篡改。TEEU通常提供安全的内存隔离、加密和认证功能,以确保在执行过程中数据的机密性和完整性。
2.2.5 YACL
加密库是用于实现各种加密算法和协议的软件包。在隐私计算中,YACL 或其他类似的加密库通常用于实现各种隐私保护技术,如同态加密、安全多方计算、零知识证明等。
这些加密库提供了开发者所需的功能和工具,以便他们能够构建隐私保护的应用程序和系统。这些库通常包括各种加密算法的实现,以及其他辅助功能,如随机数生成器、密钥管理和认证协议。
YACL 或其他加密库的使用可以大大简化开发人员的工作,并提高他们构建隐私保护应用程序的效率。这些库通常是开源的,因此可以由开发人员和研究人员进行审查和改进,以确保其安全性和性能。
2.3 资源层Kuscia
Kuscia(Kubernetes-based Secure Collaborative InfrA)是一款基于 K3s 的轻量级隐私计算任务编排框架,旨在屏蔽异构基础设施和协议,并提供统一的隐私计算底座。通过 Kuscia:
- 轻量化部署:您可以用最低 1C2G 的资源完成 100W 级数据隐私求交(PSI)。
- 跨域网络安全通信:您可以实现多隐私计算任务并发执行时的端口复用(仅需一个公网端口)与安全通信。
- 统一的 API 接口:您可以使用 HTTP/GRPC API 接口集成隐私计算能力。
- 互联互通:你可以与行业内多种隐私计算系统进行互联互通。