如何基于Dataphin实现敏感数据保护

简介: 在企业的发展过程中,如果不重视敏感数据的保护,和数据安全体系的建设,那么一旦发生了敏感数据泄漏事件,轻则企业口碑受损,业务受影响;重则会直接触法律,受到主管部门的处罚和制裁。本文将以一个最常见的场景:消费者隐私数据保护,展示如何利用Dataphin的安全能力,保障企业的数据安全。

作者:龙裔

在《基于数据分类分级和敏感数据保护,保障企业数据安全》一文中,我们讲解了Dataphin中资产安全的主要应用场景和基本概念,那么如何利用Dataphin的安全能力,来保障企业的数据安全呢?

我们来看一个最常见的案例:消费者隐私数据保护。

场景介绍

近几年,随着消费者个人意识的崛起和对隐私的重视,数据安全成为了一个越来越热门的话题,国家也陆续发布了一些相关规定,来规范数据的采集和使用。在企业的发展过程中,如果不重视敏感数据的保护,不重视数据安全体系的建设,那么一旦发生了敏感数据泄漏事件,轻则企业口碑受损,业务受影响;重则会直接触法律,受到主管部门的处罚和制裁。

而在企业领域的敏感信息中,个人敏感信息是绝对的大头,包括个人的身份信息(姓名、身份证号码)、联系方式(手机、邮箱、地址)、个人财产信息、生物识别信息等等,都属于个人敏感数据。这些数据一旦泄漏,对用户的个人生活以及对企业的业务运行,都会产生非常大的损害,所以在企业的业务运转中,要对消费者的个人隐私数据进行脱敏保护。

 图片:支付宝中,对用户姓名与用户账号的脱敏保护

主要流程

首先,我们回顾一下在Dataphin上,实现敏感数据保护的主要流程:

 在Dataphin中,实现敏感数据保护,主要可以分为以下三个步骤:

1、识别敏感数据:即设定数据分类、数据分级、识别规则等内容

2、设置敏感数据保护方式:为识别的敏感数据选择合适的脱敏算法、设定脱敏规则

3、数据消费:在即席查询、开发数据写生产等场景进行数据消费时脱敏

详细步骤

接下来,我们以用户敏感信息中,最常见的用户姓名为例,展示如何一步步的首先用户姓名的识别和脱敏保护。

1、识别敏感数据

假设我们已经建立好了数据分类和数据分级(Dataphin会内置通用的分类和分级标准,支持开箱即用),我们直接进入新建识别规则的模拟步骤:

新建一个【用户姓名】的识别规则;

扫描范围选择【全部】;

扫描方式选择【内置识别】-【名字】(如果用户姓名的字段都叫【name】,也可以配置正则规则【^name$】);

数据分类选择【个人数据(C)】;

数据分级选择【机密数据(L3)】(根据自己企业的情况灵活调衡);

优先级选择【3】(中间优先级,根据自己企业的情况灵活调整);

 配置完成识别规则后,我们可以触发一次【手动规则扫描】,或者等到第二天,系统会自动执行一次全局扫描。最终敏感数据识别的结果,都可以在【识别记录】页面看到:

2、设置敏感数据保护方式

识别到敏感数据之后,下一步就是给敏感数据设置合适的保护方式,从而保证数据不泄漏。

Dataphin当前内置了多种遮盖脱敏规则(如【张三】,显示成【*三】)、哈希脱敏规则(如【张三】,显示为【615DB57AA314529AAA0FBE95B3E95BD3】),可以满足大部分业务场景下的数据保护需求,并在未来支持加解密算法和用户自定义脱敏算法。

这里建议大家根据业务需求,选择合适的算法。比如对于用户姓名,在大部分的业务场景中(如支付宝转账),都是不能显示完整的名称,但是可以显示一部分,用于身份确认,这样就可以选择内置的【中文姓名】的脱敏算法

选择好合适的脱敏算法之后,我们就可以配置动态脱敏规则了,还是以用户姓名为例:

新建一个【用户姓名脱敏】的脱敏规则;

绑定已经建好的敏感数据识别规则【用户姓名】;

应用场景选择【写开发表】、【即席查询】;

脱敏方式选择【遮盖掩码-中文姓名】;

生效范围选择【全部】

 至此,我们的敏感数据识别和保护就已经完全配置完成了,接下来在数据消费的过程中,就可以对数据进行保护了。

3、数据消费

下面已即席查询为例,展示敏感数据识别和脱敏的效果:

可以看到,我们开始往表格里写入的数据是【张三】,因为写入了敏感数据【name】字段,也就是【用户姓名】,所以在数据读取的时候,系统自动的进行了脱敏,操作的同学只能够看到【*三】,从而防止敏感数据泄漏,保护了数据安全。

 

结语

上面通过用户姓名这样一个非常很简单的案例,串讲了整个敏感数据识别和脱敏的主流程,相信能帮助您理解整个数据安全保护的机制;而在主流程之外,还有数据分类分级的制定、审核识别记录并手动修改、脱敏白名单等流程。同时,在企业实际的数据安全保护中,还有更多的系统工作要做,比如制定符合企业的数据分类分级体系、建立完整的数据识别体系等等。

原文链接
本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/512406.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

百度研究院发布2022科技趋势预测:大模型实用化、AI助力深空探测成热门

1月25日,百度研究院发布2022年科技趋势预测,这是其连续第三年发布对前沿科技趋势的展望。 今年上榜的科技趋势预测涵盖了AI核心技术、交叉学科与跨领域研究,以及AI的产业及社会价值三个层面,包括预训练大模型、AI for Science&am…

计算机操作员技术特长,计算机及应用专业自我鉴定(通用5篇)

计算机及应用专业自我鉴定(通用5篇)自我鉴定是个人在一个阶段的自我总结,自我鉴定可以总结出具体的经验,因此我们是时候写一份自我鉴定了。自我鉴定一般是怎么写的呢?以下是小编收集整理的计算机及应用专业自我鉴定(通用5篇),仅供…

5 款阿里常用代码检测工具,免费用!

简介: 5 款阿里常用代码检测工具免费体验,仅需 2 步,Cherry键盘、公仔抱回家,100%拿奖! 作者 | 喻阳 面临问题 在日常研发过程中,我们通常面临的代码资产问题主要分为两大类:代码质量问题和代…

查看topic信息_如何规划的你博客文章主题(Topic)

产品有了, 写手有了。该写哪些主题,就成问题了。这篇文章,会结合真实案例,告诉大家,该如何规划自己的博客主题。(注意这里不是标题)。以我最近的一个项目, 游泳池产品为例。关键词叫…

DataWorks功能实践速览 — 参数透传

简介: DataWorks功能实践系列,帮助您解析业务实现过程中的痛点,提高业务功能使用效率! 往期回顾: DataWorks 功能实践速览01期——数据同步解决方案:为您介绍不同场景下可选的数据同步方案。DataWorks 功能…

GPU还是IPU?IPU 芯片厂商 Graphcore 的 2021

作者 | 宋慧 出品 | CSDN 云计算&AI 科技大本营 AI 人工智能毋庸置疑是目前最火的 IT 技术领域之一,而主攻图形计算的 NVIDIA GPU(图形处理器)又是现今 AI 领域的当红炸子鸡。不过 AI 芯片领域又迎来了新的挑战者,2016 年创立…

云原生大数据架构中实时计算维表和结果表的选型实践

简介: 随着互联网技术的日渐发展、数据规模的扩大与复杂的需求场景的产生,传统的大数据架构无法承载。 作者 | 志羽 来源 | 阿里技术公众号 一 前言 传统的大数据技术起源于 Google 三架马车 GFS、MapReduce、Bigtable,以及其衍生的开源分布…

冬奥开幕在即,现场通信网络技术深度揭秘!

作者 | 小枣君来源 | 鲜枣课堂还有9天,举世瞩目的北京冬奥会就将拉开大幕。本次冬奥会,是继2008年之后,中国再一次承办这种世界最顶级体育盛会。这两年全球疫情肆虐,抗疫形势波折多变。北京冬奥能够如期举办,意义极为重…

Flink 在 58 同城的应用与实践

简介: 58 同城的实时 SQL 建设以及如何从 Storm 迁移至 Flink。 本文整理自 58 同城实时计算平台负责人冯海涛在 Flink Forward Asia 2020 分享的议题《Flink 在 58 同城应用与实践》,内容包括: 实时计算平台架构实时 SQL 建设Storm 迁移 Fli…

当云原生遇到混合云:如何实现“求变”与“求稳”的平衡

简介: 多年来,随着云计算技术的蓬勃发展和落地,越来越多的企业选择采用云计算技术来帮助自己快速完成业务数字化转型,以便能更好地适应市场变化,进而赢得更大的市场空间。 作者|郝树伟 Flexera 的《RightScale2021 云…

之前写的 JSX 的条件语句竟然存在那么多 Bug?

作者 | 零一来源 | 前端印象今天的主题是&#xff1a;关于 JSX 的条件语句&#xff0c;你不知道3件事一、&&隐藏大坑在 JSX 里写条件语句&#xff0c;&& 应该是用的最多的了&#xff0c;例如&#xff1a;function Demo () {// ...省略一些代码return (<div&…

如何高效学习 Kubernetes 知识图谱?

简介&#xff1a; Kubernetes 知识图谱遵循云原生人才学习路径搭建课程体系框架&#xff0c;及人才发展路线设置不同阶段&#xff0c;由浅入深&#xff0c;帮助云原生人才学习容器基础、Kuternetes 网络、存储、资源对象、服务发现、应用编排与管理等 Kubernetes 完整技术栈内容…

中科院信工所经验_2021中科院信息工程研究所电子信息专业考研经验指导分享...

一、在计算机如此火热的今天&#xff0c;为什么选择要读研&#xff1f;我是一个乐观主义者&#xff0c;上大学以来我一直庆幸自己在高考结束填志愿的时候选择了计算机专业&#xff0c;更庆幸报考了湖南大学信息科学与工程学院&#xff0c;高考仅仅一分的优势把我送到了最美的学…

极验创始人吴渊:恶意流量威胁新趋势,揭秘网络黑产3大核心本质

记者 | 邓晓娟出品 | CSDN云计算&#xff08;ID&#xff1a;CSDNcloud&#xff09;天下没有免费的午餐&#xff0c;更没有免费的流量。以电商为例&#xff0c;最疯狂的时候&#xff0c;某电商平台单个获客成本接近400元。作为互联网的稀缺资源&#xff0c;流量的成本不断冲击着…

如何将一棵LSM-Tree塞进NVM

简介&#xff1a; 随着非易失内存产品的商业化推广&#xff0c;我们对于其在云原生数据库中大规模推广的潜力越来越有兴趣。X-Engine是阿里云数据库产品事业部PolarDB新型存储引擎团队研发的一个LSM-tree存储引擎&#xff0c;目前在阿里云PolarDB产品上提供对外服务。我们以X-E…

再见了,我的散装研发管理平台;再见了,4台ECS!

简介&#xff1a; 目前云效全家桶的功能相对来说比较适合个人开发或者中小团队的群体&#xff0c;如果你此时正在为搭建这类管理平台做选型&#xff0c;同时预算和人力都捉襟见肘&#xff0c;那么不妨试试云效这个产品&#xff01;一起白嫖一起爽&#xff01;尤其服务器资源在阿…

15拆分成3个不同的自然数_17个数学重点知识点汇总,一篇搞定小升初

更多电子版学习资料请关注公众号&#xff1a;小学资源园地1体积和表面积三角形的面积底高2。公式 S ah2正方形的面积边长边长 公式 S a2长方形的面积长宽 公式 S ab平行四边形的面积底高 公式 S ah梯形的面积(上底下底)高2 公式 S(ab)h2内角和&#xff1a;三角形的内角和180度。…

走进统信软件,读懂国产操作系统新生态建设

回顾国际 2021 操作系统领域发展&#xff0c;有起伏有波澜&#xff1a;开源操作系统 Linux 迎来 30 岁&#xff0c;全球超级计算机 500 强和超过 70% 的智能手机都运行其上&#xff1b;CentOS 突然宣布 CentOS 8 停止维护&#xff0c;不少企业不得不面临迁移难题…… 反观国产…

Serverless 工程实践 | Serverless 应用开发观念的转变

简介&#xff1a; Serverless 架构带来的除了一种新的架构、一种新的编程范式&#xff0c;还包括思路上的转变&#xff0c;尤其是开发过程中的一些思路转变。有人说要把 Serverless 架构看成一种天然的分布式架构&#xff0c;需要用分布式架构的思路去开发 Serverless 应用。诚…

中科院计算机所硕士导师,中科院计算技术研究所研究生导师介绍:毕经平

中科院计算技术研究所研究生导师介绍&#xff1a;毕经平简历:2002年7月于中国科学院计算所获得博士学位&#xff0c;同年9月被破格提拔为计算所副研究员&#xff0c;2008年3月被任命为博士生导师&#xff0c;2009年1月获得卢嘉锡青年人才奖作者佚名次阅读2014-05-15代表论著:1)…