首批!蚂蚁数科通过中国信通院面向大模型的可信执行环境产品专项测试

2024年6月17日,在中国信息通信研究院(以下简称“信通院”)组织的首批“面向大模型的增强型可信执行环境基础能力专项测试”中,蚂蚁数科摩斯顺利完成全部测试内容,成为首批完成此项测试的组织。

标准及测试介绍

《面向大模型训练与推理数据保护的可信执行环境技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合30余家企业的专家共同编制,旨在为可信执行环境产品/集群在面向大模型场景时的研发、测试、评估和验收提供参考和指引。

据此标准形成的测试方法覆盖数据工程、模型训练支持、模型推理支持、硬件加速、安全要求五大能力域,包含数据增强、模型管理、环境安全和数据安全等16个子能力域,共计57个测试项。

蚂蚁摩斯大模型隐私保护产品介绍

通用人工智能离不开高质量、大规模数据集,人工智能正在加速从“以模型为中心”向“以数据为中心”转变。当前高质量数据集普遍以孤岛形式存在,为实现可信的多方联合训练与推理,以可信执行环境、联邦学习为代表的隐私计算是可行技术解,但在大模型场景中对其可用与安全性提出更高要求。大模型具有强大的数据挖掘和推理能力,可能会造成用户个人隐私、企业数据资产等敏感信息泄露。

摩斯采用多方安全计算、可信执行环境、差分隐私、联邦大模型拆分和跨域微调、模型混淆、可信硬件等相结合的独创性设计,在原始数据不出域的情况下,实现数据输入、微调、推理全链路数据和模型隐私安全。

 

图片

 

软件层面,在原有大模型使用链路上叠加隐私计算能力,进行数据和模型双重保护,并支持大模型隐私微调和安全推理,可实现微调精度损失可控、隐私推理性能提升、密文吞吐量有效提升。支持云部署、一体机、自有算力多种部署方式,实现算力扩展。

硬件层面,蚂蚁摩斯结合适配于可信执行环境的加速硬件,可以实现隐私推理性能和密文吞吐量进一步提升,并主要基于Intel SGX和TDX、AMD SEV、海光CSV、NVIDIA CC等可信计算硬件及蚂蚁自研的机密计算底座构建起可运行大模型的隐私计算系统,满足多场景中的安全性需求。蚂蚁机密计算底座包括开放通用的 TEE 底座 HyperEnclave、易用性高的 TEE 计算引擎 Occlum、可异构互联的 TEE 服务 KuteTEE等,其核心代码通过多项产品认证,为大模型提供全生命周期的安全保护。

 

图片

应用场景

在金融领域,应用智能化服务工具可进行金融产品分析和推荐,比如针对用户理财投资咨询,可以在不向大模型泄漏用户信息的情况下,通过大模型推理反馈精准、及时的投资建议,对于金融企业,可以预测金融产品的市场表现,同时进行金融舆情分析和客户情绪管理,在节约互动成本的同时可有效改进客户服务和提升用户体验。

在医疗领域,通过应用可信执行环境进行跨机构数据联合建模,可实现隐私保护式的病理研究和智能化辅助快速诊断;在法律领域中,应用可信执行环境进行跨机构的法律模型的联合训练,从而帮助完成法定推理、法律判决、证据发展以及案例结果的预测任务,实现决策效率的有效提升。

未来规划

未来,在持续提升大模型基于可信执行环境的性能、安全和易用性同时,会增加对大模型应用支持和研究降低应用时的安全保护成本,如支持大模型检索增强生成(RAG)和大模型智能体(Agent),让大模型应用在各行各业安全探索和应用;降低大模型安全保护应用门槛,让安全方案的理解、获取、应用和维护成本逐步降低到无感知;打造基于隐私保护技术、高效训练推理技术和可信执行环境等多种安全方案的混合产品能力,为用户在大模型开发和应用等不同阶段提供多种选择和可根据需求和环境进行自动适配的能力。

图片

 

中国信通院“可信数据流通”评估测试体系自2018年起逐步构建,目前包含隐私计算、使用控制等技术的专项测试,以及数据服务、数据源、公共数据授权运营等服务及合规交易的评估测试。经过6年的发展,“可信数据流通”评估测试体系已成为数据流通领域广受行业认可的第三方评估测试品牌,成为供给侧和需求侧采购选型的风向标。

可信数据流通标准体系

图片

 

 关注我,获取更多资讯~

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/869776.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

全局唯一id

问题引出: 由于数据库的自增的id很有规律,会让人猜到后续id 由于一个单表存储的数量有限,那么就会用多个表存储,每个表的id都是自增,这样导致id不唯一的情况。 引进新的方法: 具体解决方法:使用…

MySQL--函数、约束、多表查询

函数 函数指一段可以直接被另一段程序调用的程序或代码 字符串函数、数值函数、日期函数、流程函数 字符串函数 数值函数 日期函数 datediff(date1,date2):date1-date2 流程函数 约束 概念:约束是作用于表中字段上的规则&…

ECCV:A Discriminative Feature Learning Approach for Deep Face Recognition

1 Abstract 卷积神经网络(CNNs)已广泛应用于计算机视觉领域,显著提高了计算机视觉领域的技术水平。在大多数可用的cnn中,使用软tmax损失函数作为监督信号来训练深度模型。为了增强深度学习特征的识别能力,本文提出了一…

AI自动生成PPT怎么用?5种提升演示效果的方法

随着#7月份我的同事一个个消失了#的话题热议,职场中的效率与变革再次成为焦点。 在忙碌的工作节奏中,AI自动生成PPT的软件悄然兴起,成为不少职场人的新宠。它们不仅简化了繁琐的PPT制作流程,更以高效、专业的姿态,助力…

包成功安装tiny-cuda-nn,记录安装过程中的问题解决,附带pytorch3d安装【踩坑指南】

tiny-cuda-nn安装过程中的问题解决,附带pytorch3d安装【踩坑指南】 前言tiny-cuda-nn第一种下载方法:命令行安装tiny-cuda-nn第二种下载方法:本地编译 pytorch3d安装 前言 official repo: https://github.com/NVlabs/tiny-cuda-nn 该包可以显…

Java 中的阻塞 IO 和非阻塞 IO

Java 中的阻塞 IO 和非阻塞 IO 1、阻塞 IO(Blocking IO)2、非阻塞 IO(Non-blocking IO)3、区别与应用场景4、总结 💖The Begin💖点点关注,收藏不迷路💖 IO(输入输出&…

基于Booth乘法和Wallace树的乘法器优化思想

基于Booth乘法和Wallace树的快速乘法器 为了理解Booth乘法和Wallace数如何让乘法器变得更快: 先考虑不优化的8位乘法器实现,即8个16位数字累积共进行7次加法运算,可以认为一次16位加法用到16个全加器,则共需要112个全加器件&…

【Linux操作系统-测试】第三节.Linux 系统、网络信息、用户权限命令总结

文章目录 前言一、Linux 系统相关信息命令 1.1 df 命令--查看磁盘剩余 1.2 ps 命令--查看进程 1.3 top 命令--显示进程运行状态 1.4 kill 命令说明 -- 杀死进程二、Linux 网络信息命令 2.1 ping 命令--检查网络是否连通 2.1 ifconfig--显示网络设…

(总结)编译ORB_SLAM2遇到的错误

目录 第一个错误error: ‘CV_BGR2GRAY’ was not declared in this scope 第二个错误error: ‘CV_GRAY2BGR’ was not declared in this scope 第三个错误是没有那个文件或目录 26 | #include 第四个错误是‘CV_LOAD_IMAGE_UNCHANGED’ was not declared in this scope 第…

Python实现的深度学习技术在水文水质领域应用

当前,深度学习作为人工智能的热门技术发展迅速,以其强大的非线性和不确定性处理能力在图像识别、语音识别、自然语言处理等领域取得了显著的成效。它是一种端到端的处理方法,在训练算法的指导下,深层神经网络自发地从原始数据中进…

什么是CAP理论及应用场景,为什么只能进行3选2

在理论计算机科学中,CAP定理(CAP theorem),又被称作布鲁尔定理(Brewers theorem),它指出对于一个分布式计算系统来说,不可能同时满足以下三点: 1、 一致性(C…

计算机组成原理:408考研|王道|学习笔记II

系列目录 计算机组成原理 学习笔记I 计算机组成原理 学习笔记II 目录 系列目录第四章 指令系统4.1 指令系统4.1.1 指令格式4.1.2 扩展操作码指令格式 4.2 指令的寻址方式4.2_1 指令寻址4.2_2 数据寻址 4.3 程序的机器级代码表示4.3.1 高级语言与机器级代码之间的对应4.3.2 常用…

游戏AI的创造思路-技术基础-情感计算(1)

游戏中的AI也是可以和你打情感牌的哦,不要以为NPC是没有感情的,不过,不要和NPC打过多的情感牌,你会深陷其中无法自拔的~~~~~~ 目录 1. 情感计算算法定义 2. 发展历史 3. 公式和函数 3.1. 特征提取阶段 TF-IDF(词频…

C++的异常处理机制

C的异常处理机制 (1)Why(异常处理机制的作用)(2)How(异常机制如何工作)A.抛出异常B.捕获异常C.处理异常D.传递异常 (3)抛出异常A.栈展开B.析构函数和异常C.异常对象 (4)捕获异常(4)处理异常A.构造函数的异常处理B.不抛出异常noexc…

中小学校园EasyCVR视频综合监管方案:构建安全、智能的校园环境

一、背景需求分析 随着科技的快速发展,校园安全问题日益受到社会各界的关注。尤其是在中小学校园中,学生的安全更是牵动着每一个家庭的心。为了更有效地保障学生的安全,提高校园安全管理水平,视频监控系统在中小学中的应用越来越…

伙伴活动|AI硬件大潮来袭,深圳的创客们在哪里?

「每一种硬件产品,都会被 GenAI 重新做一遍。」 分享一个社区伙伴「未来光锥」参与主办的活动。如果你同时对 AI 和硬件感兴趣,提到 maker 一词仍然会激动。推荐你参与这次活动。 AI 玩具Folotoy 的创始人、RTE 开发者社区成员王乐也将参与本次活动并分…

【C++进阶】C++中的IO流

目录 前言 1. C语言中的IO 2. 如何理解流 3. C中的IO流 3.1 C中的标准IO 3.2 C中的文件IO 4. stringstream 总结 前言 C语言中的I/O接口十分强大,但使用起来有些繁琐。好在C中的I/O方式为我们解决了这些问题,让数据的读写操作变得更加简洁和便捷; 在…

动手学深度学习(Pytorch版)代码实践 -循环神经网络-57长短期记忆网络(LSTM)

57长短期记忆网络(LSTM) 1.LSTM原理 LSTM是专为解决标准RNN的长时依赖问题而设计的。标准RNN在训练过程中,随着时间步的增加,梯度可能会消失或爆炸,导致模型难以学习和记忆长时间间隔的信息。LSTM通过引入一组称为门…

【卡尔曼滤波器】DR_CAN 2 学习笔记:_数据融合_协方差矩阵_状态空间方程_观测器问题

【卡尔曼滤波器】2_数学基础_数据融合_协方差矩阵_状态空间方程_观测器问题 非常重要1 数据融合 data fusion 有俩秤,各自有自己的正态分布:俩秤是相互独立的:俩秤都不准,但标准差都符合正态分布 正态分布又叫做高斯分布 向左、向右 都是2, 标准差是2覆盖了68.4 %的可能:…

开启HIVE中分区表支持中文字段

进入hive表: use hive; #修改hive database编码 alter database hive default character set utf8; #修改table编码 alter table PARTITIONS default character set utf8; alter table PARTITION_KEY_VALS default character set utf8; alter table SDS default cha…