2024年6月17日,在中国信息通信研究院(以下简称“信通院”)组织的首批“面向大模型的增强型可信执行环境基础能力专项测试”中,蚂蚁数科摩斯顺利完成全部测试内容,成为首批完成此项测试的组织。
标准及测试介绍
《面向大模型训练与推理数据保护的可信执行环境技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合30余家企业的专家共同编制,旨在为可信执行环境产品/集群在面向大模型场景时的研发、测试、评估和验收提供参考和指引。
据此标准形成的测试方法覆盖数据工程、模型训练支持、模型推理支持、硬件加速、安全要求五大能力域,包含数据增强、模型管理、环境安全和数据安全等16个子能力域,共计57个测试项。
蚂蚁摩斯大模型隐私保护产品介绍
通用人工智能离不开高质量、大规模数据集,人工智能正在加速从“以模型为中心”向“以数据为中心”转变。当前高质量数据集普遍以孤岛形式存在,为实现可信的多方联合训练与推理,以可信执行环境、联邦学习为代表的隐私计算是可行技术解,但在大模型场景中对其可用与安全性提出更高要求。大模型具有强大的数据挖掘和推理能力,可能会造成用户个人隐私、企业数据资产等敏感信息泄露。
摩斯采用多方安全计算、可信执行环境、差分隐私、联邦大模型拆分和跨域微调、模型混淆、可信硬件等相结合的独创性设计,在原始数据不出域的情况下,实现数据输入、微调、推理全链路数据和模型隐私安全。
软件层面,在原有大模型使用链路上叠加隐私计算能力,进行数据和模型双重保护,并支持大模型隐私微调和安全推理,可实现微调精度损失可控、隐私推理性能提升、密文吞吐量有效提升。支持云部署、一体机、自有算力多种部署方式,实现算力扩展。
硬件层面,蚂蚁摩斯结合适配于可信执行环境的加速硬件,可以实现隐私推理性能和密文吞吐量进一步提升,并主要基于Intel SGX和TDX、AMD SEV、海光CSV、NVIDIA CC等可信计算硬件及蚂蚁自研的机密计算底座构建起可运行大模型的隐私计算系统,满足多场景中的安全性需求。蚂蚁机密计算底座包括开放通用的 TEE 底座 HyperEnclave、易用性高的 TEE 计算引擎 Occlum、可异构互联的 TEE 服务 KuteTEE等,其核心代码通过多项产品认证,为大模型提供全生命周期的安全保护。
应用场景
在金融领域,应用智能化服务工具可进行金融产品分析和推荐,比如针对用户理财投资咨询,可以在不向大模型泄漏用户信息的情况下,通过大模型推理反馈精准、及时的投资建议,对于金融企业,可以预测金融产品的市场表现,同时进行金融舆情分析和客户情绪管理,在节约互动成本的同时可有效改进客户服务和提升用户体验。
在医疗领域,通过应用可信执行环境进行跨机构数据联合建模,可实现隐私保护式的病理研究和智能化辅助快速诊断;在法律领域中,应用可信执行环境进行跨机构的法律模型的联合训练,从而帮助完成法定推理、法律判决、证据发展以及案例结果的预测任务,实现决策效率的有效提升。
未来规划
未来,在持续提升大模型基于可信执行环境的性能、安全和易用性同时,会增加对大模型应用支持和研究降低应用时的安全保护成本,如支持大模型检索增强生成(RAG)和大模型智能体(Agent),让大模型应用在各行各业安全探索和应用;降低大模型安全保护应用门槛,让安全方案的理解、获取、应用和维护成本逐步降低到无感知;打造基于隐私保护技术、高效训练推理技术和可信执行环境等多种安全方案的混合产品能力,为用户在大模型开发和应用等不同阶段提供多种选择和可根据需求和环境进行自动适配的能力。
中国信通院“可信数据流通”评估测试体系自2018年起逐步构建,目前包含隐私计算、使用控制等技术的专项测试,以及数据服务、数据源、公共数据授权运营等服务及合规交易的评估测试。经过6年的发展,“可信数据流通”评估测试体系已成为数据流通领域广受行业认可的第三方评估测试品牌,成为供给侧和需求侧采购选型的风向标。
可信数据流通标准体系
关注我,获取更多资讯~