行业务实派:解锁数据价值,翼方健数全栈隐私安全计算技术

数智化时代,数据已成为最核心、最具价值的生产要素。其中,如何应用可落地的技术,共享和保护数据,促进数据要素进一步流通,释放数据价值,受到业内普遍关注。

隐私计算,被业内誉为打破“数据隐私安全与共享矛盾的唯一技术解”,是大数据、人工智能及产业创新驱动不可或缺的关键技术环节。随着数据与计算进一步融合,数字产业化加速推进。如何运用隐私计算实现数据“可用不可见”,形成业内亮眼、标杆性的应用案例,成为多领域客户的共性需求。

这个答案,或许是翼方健数。公开信息显示,翼方健数致力于打造“数据和计算互联网(IoDC)”,以多方安全计算、区块链等技术为核心,从安全、可信等技术要求出发,正帮助行业各方实现数据可用不可见,保障信息安全,挖掘数据的价值。
在这里插入图片描述
着眼实际,务实有效的数据平台究竟是怎样的?行业有哪些亟需解决的难题?在11月10日的Data X大会暨翼方健数战略发布会上,翼方健数首席科学家张霖涛归纳行业的三个痛点:

首先,优秀的数据平台必须要做到能汇聚不同源头数据,还要在数据不可见的情况下挖掘数据价值。平台需要解决的首要问题:如何保护数据隐私和安全?

其次,在IoDC场景下,资源分布在广泛的网络中,如何利用技术支持应用的数据需求?

最后,数据资产分配产生的价值如何有效分配,如何确保贡献者的长期权益?
在这里插入图片描述
从这些难题出发,张霖涛推导出优秀的数据平台应该具备的三大核心能力:

数据全生命周期管理:搭建从数据清洗、数据管理、数据标注、数据价值抽取,数据价值分配、数据交易等等的一系列工具和应用。数据真正能用、可用和好用。

坚实的隐私安全计算技术体系:围绕XDP平台的隐私安全计算能力,从单体平台到联邦平台再到IoDC,从沙箱到TEE到MPC和联邦学习,在隐私安全计算赛道建立最有竞争力的全栈解决方案。

AI驱动且可差异化应用:AI为核心,大数据驱动。在垂直行业利用数据和AI能力为行业客户获取最大化价值。

瞄准客户成功的目标,围绕“用隐私安全计算技术解锁数据价值“,张霖涛详细介绍翼方健数提出的路径——全栈技术解决方案,才能为数据平台的构建带来新启发,并为迈向数据和计算互联网打下坚实基础。

隐私安全计算平台是核心底座

平台为用,架构先行。为打造适合IoDC时代的全栈技术平台,翼方健数先推导出的是核心的XDP隐私安全计算平台架构。
在这里插入图片描述
XDP平台架构主要由四部分组成:

  1. 底层的XDP文件系统(XFS,XDP File System)用以存储数据,保证数据安全。
  2. 中间层是执行引擎XEE。
  3. 临近应用的一层支持各种计算环境,包括安全沙箱、可信执行环境、安全计算引擎和联邦学框架。
  4. 最顶层用来支持客户的需求,部署各种应用。
    张霖涛指出,底层部件XFS最为重要。如同物流仓,它决定了”数据究竟存在何处,结构是否清晰,能否支持快速调用“。

XFS专为IoDC打造,是一个分布式文件系统。XFS主要提供四大能力:首先是提供高规格安全保护,基于密钥管理系统,对数据实现强隔离、多层次的加密、细颗粒度的访问控制及可编程的生命周期管理,保证数据遵循“最小使用原则”;

其次,XFS具备全方位的计算支持,可以满足大数据和机器学习的多种需求;

此外,XFS具有卓越性能和跨平台能力,可兼容NVMe,RDMA等高性能存储技术,全面管理IoDC数据存储资源;

最后是有经济高效的使用方式,XFS支持如块存储、对象存储等,可实现数据平滑迁移。

有这样可靠的文件系统,客户可以放心汇聚、存储数据。上层的XDP DaaS Engine(XDaaS) 的应用才可进一步对数据进行发现与整合。

XDaaS提供可扩展的主数据,实现多数据源间的有效融合。XDaaS同时提供高效的数据探查能力,最后实现cell级别的来源追踪。在使用过程中,XDaaS还能对敏感数据加以保护。

数据到位后,按需调动资源,执行引擎XEE(XEE,XDP Execution Engine)开始进行运算。
XEE可使用多种底层计算基础设施,支持云和私有化部署,对硬件环境要求不高,提供多种计算模式,包括批量处理流式计算等。此外,XEE支持基于浏览器的多种交互模式。因此,XEE可做到统筹管理IoDC中的全网络计算资源。
在这里插入图片描述

如何保障计算的安全性和可扩展性?PCT层运用了多种技术、环境与框架。

不同于传统沙箱计算环境,翼数安全沙箱(XDP Secure Sandbox)满足单体平台上“软件可信,用户不可信”的安全假设。系统管理员在安全信任体系之外,能充分防范平台运维的违规操作。它为单体平台提供“零信任”的本地计算环境。

在有可信硬件情况下,翼方健数通过可信执行环境XTEE,为客户提供安全、高效、通用的端到端可信执行环境,并运用硬件完成对软件的验证。简而言之,XTEE可以加快远程证明、提供TEE运行时加密文件系统的支持。

对于上层的联邦学习技术能力,一方面,翼方健数还打造了一套联邦学习框架XFL,其从底层实际情况出发。具有丰富的自定义接口,兼具高安全性和高扩展性的特征。XFL支持海量插件,覆盖主流算法。数据不出域,也能在支持主流环境下进行安全联合建模。
在这里插入图片描述
除前期产品技术能力实现之外,翼方健数仍实时响应客户诉求,持续迭代产品功能。
由于在客户需求调研中发现,很多应用场景同步对机器学习和通用计算都有需求。为此,翼方健数开发密文计算框架XSC。
XSC框架具有高完备性、灵活部署和集成开放的跨平台特性。XSC支持高效完备的算法库,可以部署各种硬件,支持集成其他的开源隐私计算框架。张霖涛还透露,联邦学习框架XFL和密文计算框架XSC在未来都会开源。

“保姆级”的数据全生命周期管理

在这里插入图片描述
除让数据实现安全、可信计算外,隐私计算平台汇集数据后,在实际应用场景中,客户又提出了新的疑问:如何解决数据管理,数据价值分配和数据确权的问题?

翼方健数认为,区块链技术在这一板块优势明显,但同样需要和隐私安全计算技术打配合。

翼方健数通过结合隐私安全计算与区块链技术,开发Xledger为XDP联盟和IoDC提供不可篡改的数据存证与智能合约,对数据实现全生命周期管理,智能合约保障价值分配,保证数据所有者的权益。

如果客户想要更高效率地获取高质量数据,怎么办?

翼方健数自主研发数据标注工具GoldFinger,不仅支持高效率的用户标注,还可以更好服务AI应用需求。GoldFinger可以保证数据在使用时严格隔离,预标注能力还可扩展为众包模式,兼顾效率与安全。

客户在清洗数据时标准不明确,效果差,出现大量无效工作,何解?

那就响应需求,翼方健数开发数据治理工具DataWand。

传统的ETL手段费时费力且没有统一标准,清洗规则效果差,重复利用率低,也有数据泄露风险。

DataWand都可以解决以上问题,不仅可以对数据大规模标注,在保证数据安全情况下,算法还能持续迭代,为后续的数据清洗提供服务。据张霖涛介绍,DataWand目前已经在城市级别数据中取得很好的应用效果。这也为后续客户在选择时提供了更多参考依据。

数据储存在哪里?你们是技术供应商,交付后能否保证客户有完全的控制权限?

张霖涛表示,翼方健数本身并不拥有数据,数据的控制权需要由数据拥有方来做授权。换句话说,翼方健数是“零数据的大数据公司”。

赋能各行业,AI驱动的差异化应用
在这里插入图片描述
隐私安全技术可以解决安全与效率的问题。

然而在客户决策前,是否已有成功先例,仍是重要的拍板依据。

翼方健数早已在医疗、生信、政务等垂直领域完成多项AI业务挑战,储备诸多应用案例。

仅以医疗行业客户为例,翼方健数建立业界领先的,基于深度学习的诊疗合理性内核。

诊疗模型基于采集的数据,通过与库内特征比对,对疾病作出预测和预警。如做智能多点触发疾控解决方案,以此来预测传染病的发病情况和未来走势。

基于知识图谱,翼方健数辅助构建医学数据库,帮助医生/科研人员系统地从各种资料中抽取出有效信息。

诊疗合理性内核已经应用到医院端的CDSS(临床决策支持系统)和医疗质控中,进一步帮助医生提质增效降风险。相关数据在授权后,还可应用于科研院所和政策研究机构。

全栈化解决方案,是隐私计算技术落地难的最优解法

张霖涛认为,若想通过隐私计算去最大化数据价值,单一技术显然无法提供“完美”的解决方案。

如果要为各行各业创造真正的数据价值,使数据和计算资源充分流动。隐私安全计算企业或许还要考虑得更为现实且深远,全栈化解决方案或许才是隐私计算技术落地难题的最优解法。

但是,对于技术供应商而言,最优解法注定会更为艰辛。抵达星辰大海之前,一路绝非坦途。

构建IoDC(数据和计算互联网)是翼方健数的愿景与目标。若要达成这一目标,一方面,翼方健数需要不断迭代各类技术方案,为客户多想一步,适应应用场景的变化;另一方面,翼方健数还需促成行业共识,使不同的平台间数据互通,为彼此产生价值。不过,这条路径一旦走通之后,必定会撬动指数级的数字化市场份额。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/513352.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ctrl c 失效了_[安卓+PC双端]超C女仆无馬中字

这周基本啥也没发,传个小游戏吧就~点赞(150) 投币(随缘)推荐用用吉里吉里模拟器玩~应该是女仆类的游戏,我没玩过也不清楚哦链接失效我就不补了,如果点赞在今天内达标,那就今晚20:00补发,不要错…

浅谈分布式一致性:Raft 与 SOFAJRaft

简介: SOFAJRaft已开源 作者 | 家纯 来源 | 阿里技术公众号 一 分布式共识算法 (Consensus Algorithm) 1 如何理解分布式共识? 多个参与者针对某一件事达成完全一致:一件事,一个结论。 已达成一致的结论,不可推翻。 2 有哪些…

OpenKruise v0.9.0 版本发布:新增 Pod 重启、删除防护等重磅功能

简介: OpenKruise 是阿里云开源的云原生应用自动化管理套件,也是当前托管在 Cloud Native Computing Foundation (CNCF) 下的 Sandbox 项目。它来自阿里巴巴多年来容器化、云原生的技术沉淀,是阿里内部生产环境大规模应用的基于 Kubernetes 之…

00后确实卷,公司新来的卷王,我们这帮老油条真干不过.....

都说00后躺平了,但是有一说一,该卷的还是卷。这不,前段时间我们公司来了个00后,工作没两年,跳槽到我们公司起薪18K,都快接近我了。后来才知道人家是个卷王,从早干到晚就差搬张床到工位睡觉了。最…

rsa 返回值 验签 失败_解析蛋糕、面包制作失败的原因

其实这些问题的答案大多都隐藏在搅拌盘、烤炉和烤盘中掌握好这些基础知识就能告别这些常见的失误01﹏﹏﹏好的蛋糕始于搅拌盘做蛋糕的过程实质上是化学变化的过程,一系列的配料遵照严格的顺序倒入搅拌盘里混合并产生特殊效应。想做出蛋糕心松软、湿润和细腻质感的黄…

阿里云资深技术专家李克畅谈边缘云计算趋势与实践

简介: 2021年5月15日,以“相信边缘的力量”为主题的全球边缘计算大会在深圳成功召开。 阿里云资深技术专家李克,分享阿里云在边缘云计算的探索和实践,如何为行业提供广覆盖、低成本、高可靠的边缘基础设施。 2021年5月15日&#…

阿里云江岑:云原生在边缘形态下的升华

简介: 5月20-22日,第十三届中国系统架构师大会(SACC2021)在云端进行网络直播,主题为“数字转型、架构重塑”。阿里云边缘云原生技术专家江岑,分享了阿里云在边缘云原生的探索实践,并从应对技术挑…

对数据“投入”却没有“产出”?听听 Gartner 的最新分析

作者 | 宋慧出品 | CSDN云计算(ID:CSDNcloud)关于数据中台的问题,CSDN 在一年前采访了 Gartner 研究总监孙鑫,采访中,孙鑫提到 数据分析将是改变“游戏规则”的技术、企业的中台需要可组装的架构 。经过一年…

实时计算 Flink 版总体介绍

简介: 实时计算 Flink 版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica)是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由 Apache Flink 创始团队官方出品&#xff0c…

来电科技:基于Flink+Hologres的实时数仓演进之路

简介: 本文将会讲述共享充电宝开创企业来电科技如何基于FlinkHologres构建统一数据服务加速的实时数仓 作者:陈健新,来电科技数据仓库开发工程师,目前专注于负责来电科技大数据平台离线和实时架构的整合。 深圳来电科技有限公司&…

你说精通 Redis ,你看过持久化的配置吗?

作者 | 阿Q来源 | 阿Q说代码今天让我们从理论和配置两个层面来揭开Redis持久化的神秘面纱。所谓持久化可以简单理解为将内存中的数据保存到硬盘上存储的过程。持久化之后的数据在系统重启或者宕机之后依然可以进行访问,保证了数据的安全性。Redis有两种持久化方案&a…

matlab from有什么用,Matlab函数使用'fromworkspace'将向量传递给simulink

我想编写一个包含simulink块的matlab函数 . 该函数应将数据加载到simulink模型中,运行它,然后从函数返回数据 .我能想到的唯一方法就是在simulink中使用To Workspace和From Workspace块 . 问题是From Workspace块不从功能范围中获取变量,只从…

一种低延迟的超时中心实现方式

简介: 在很多产品中都存在生命周期相关的设计,时间节点到了之后需要做对应的事情。超时中心(TimeOutCenter,TOC)负责存储和调度生命周期节点上面的超时任务,当超时任务设置的超时时间到期后,超时…

浪潮云海OpenStack X版本技术贡献中国第一

10月6日,OpenStack社区发布第24个版本 Xena(简称X版本),浪潮云海在Nova、Cyborg、Cinder、Masakari、Manila等核心项目的技术贡献排名再次获得「中国第一」、全球前三,已连续4个版本荣登社区技术贡献国内榜首&#xff…

【实践案例】Databricks 数据洞察在美的暖通与楼宇的应用实践

简介: 获取更详细的 Databricks 数据洞察相关信息,可至产品详情页查看:https://www.aliyun.com/product/bigdata/spark 作者 美的暖通与楼宇事业部 先行研究中心智能技术部 美的暖通 IoT 数据平台建设背景 美的暖通与楼宇事业部&#xff0…

mysql 默认时间字段 1067,mysql替datetime类型字段设置默认值default

操作服务器环境为Linux centos5.7安装的mysql版本 MariaDB,图简单直接使用命令install上去的。在自己mac上测试数据库修改Alter语句没有问题的,ALTER TABLE XXX.XXX ADD COLUMN createtime datetime NOT NULL DEFAULT NOW() AFTER userinfo;但是在服务器…

tcp ip协议_网络通信-TCP/IP协议族简述

导读:计算机与网络设备要相互通信需要遵守同样的规则。例如,如何找到通信目标、该使用哪种语言通信、怎么结束通信等规则。不同的硬件、操作系统之间的通信都需要遵循同一种规则,这种规则也称为是协议。下面本文主要从以下三个点讨论与互联网…

网站图片全自动加密_11 个值得收藏的在线工具和资源网站

pdf.toPDF 格式免费转换工具,可将 PDF 与其他文件类型相互转换,其他文件类型可自行查看。网站还提供常用的 PDF 工具,包括压缩、修复、拆分和解锁 PDF。ilovepdf完全免费。与 pdf.to 的区别是它支持转换的文件类型少,但 PDF 工具丰…

超详攻略!Databricks 数据洞察 - 企业级全托管 Spark 大数据分析平台及案例分析

简介: 5分钟读懂 Databricks 数据洞察 ~ 更多详细信息可登录 Databricks 数据洞察 产品链接:https://www.aliyun.com/product/bigdata/spark(当前产品提供¥599首购试用活动,欢迎试用!) 开源大数…

Alluxio完成C轮5000万美元融资,新设中国区总部力拓国内市场

编辑 | 宋慧 出品 | CSDN云计算 头图 | 付费下载于 IC photo 11月17日,全球开源的云原生数据编排软件开发商Alluxio宣布完成5000万美元C轮融资,该轮融资由新投资方高瓴创投领投,战略投资方和原股东a16z, Seven Seas Partners,火…