数据脱敏学习

数据脱敏是一种保护敏感信息的方法,它通过修改或删除数据中的敏感部分,使得数据在保持一定可用性的同时,不再直接关联到个人隐私或重要信息。

然人指可以直接或间接标识

  • 直接标识:如姓名、身份证号码、家庭住址、电话号码、电子邮件地址、护照号码、社会安全号码(或等效物)、驾驶执照号码等。    
  • 间接标识:如位置数据、在线身份识别(如IP地址)、Cookie、DNA样本、指纹等。
  • 其他因素:与个人的物理、生理、遗传、心理、经济、文化或社会身份相关的特定因素。

数据脱敏通常用于以下场景

  • 测试和开发:在开发和测试环境中使用脱敏数据,可以避免使用真实数据带来的风险。
  • 数据共享:在数据共享或数据交换时,使用脱敏数据可以保护个人隐私。
  • 数据分析:在进行数据分析时,使用脱敏数据可以保护数据的原始性不被泄露。

常见的数据脱敏技术

  • 替换法:将真实数据替换为虚假但结构相似的数据。例如,将真实姓名替换为随机生成的假名。

  • 加密法:使用加密算法对敏感数据进行加密,只有拥有密钥的用户才能解密看到原始数据。

  • 扰动法:在原始数据中加入一定的随机噪声,使得数据仍然保持统计特性,但具体数值已被改变。

  • 泛化法:将具体数据泛化为更一般的形式。例如,将具体的年龄泛化为年龄段,将具体地址泛化为城市或区域。

  • 删除法:直接删除数据中的敏感部分,这种方法简单直接,但可能会损失部分数据价值。

  • 标记化:用唯一的标记替换敏感数据,这些标记不包含原始数据的任何信息,但可以用于后续的数据处理和分析。

数据脱敏工具

  • Desensitization :这是一个基于Python的库,提供了一系列丰富的数据脱敏策略,包括替换、掩码和加密等。它旨在简化数据处理流程,使得开发人员能够快速集成到现有的数据管理系统中。
  • Hutool :Hutool是一个Java基础工具类库,提供了一行代码实现数据脱敏的功能,支持对手机号、银行卡号、身份证号和密码等敏感信息进行脱敏处理。
  • Apache ShardingSphere :这是一个分布式数据库中间件,提供了自动化和透明化的数据脱敏过程,用户无需关注数据脱敏的实现细节。
  • 腾讯云DMask :这是一款敏感数据脱敏与水印标记工具,用于对数据系统中的敏感信息进行脱敏处理,并在数据泄漏时提供追溯依据。
  • SensitiveBye :这是一款专注于数据脱敏的Java工具包,支持对接口字段、Java对象字段和JSON序列化字段进行脱敏,也支持常见日志框架的输出内容脱敏。
  • deidentify :这是一个基于Python的数据脱敏工具,支持对结构化和非结构化数据进行脱敏处理,提供了多种脱敏技术,如替换、加密和随机化等。
  • IBM InfoSphere Optim Data Privacy Solution:这是一个企业级的数据脱敏解决方案,它提供了多种脱敏技术,包括数据替换、加密和泛化等,适用于大型企业和复杂的数据环境。
  • Oracle Data Masking and Subsetting Pack:这是Oracle提供的一个工具,它允许用户对数据库中的敏感数据进行脱敏,同时保留数据的结构和关系,确保脱敏后的数据仍然适用于测试和开发环境。
  • Camouflage:Camouflage是一个专业的数据脱敏工具,它支持多种数据库和文件格式,提供了灵活的脱敏策略和方法,适用于各种规模的企业。
  • Delphix:Delphix不仅提供数据脱敏功能,还包括数据虚拟化和数据版本控制等功能。它可以帮助企业快速创建和管理脱敏后的数据副本,用于非生产环境。
  • Compuware Optimal DataMasking:这个工具专注于提供高效的数据脱敏解决方案,支持多种数据库系统,并提供了易于使用的界面和强大的脱敏功能。
  • DataSunrise Data Masking:DataSunrise提供了一个集成的数据脱敏模块,可以实时对敏感数据进行脱敏,适用于需要实时数据保护的场景。




本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/37130.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

容器:string

以下是对于string容器常用功能和函数的总结 主要包括 1、定义string 2、字符串赋值 3、字符串拼接:str.append() 4、字符串查找:str.find() / str.rfind() 5、字符串替换:str.replace() 6、字符串长度比较:str.compare…

springboot多数据源应用,A服务依赖于B服务jar包,A服务和B服务业务数据分别入自己的库如何做?

上一节我们简单阐述了springboot多数据源如何配置。在实际的业务场景中我们常常遇到A服务依赖于B服务jar包,A服务和B服务业务数据分别入自己的库中。为何要这么做呢?比如B服务是日志SDK,A服务集成B服务来实现记录日志的功能,但是日…

无人机飞行操作技巧

要想充分利用无人机,掌握其操作技巧非常关键。以下是一些基础而重要的无人机操作技巧,可以帮助你更安全、更有效地使用无人机。 扫描式拍摄:这种方法涉及慢慢地将无人机从一个点移动到另一个点,同时保持相机对准一个特定的主题。…

Java基础知识-集合类

1、HashMap 和 Hashtable 的区别? HashMap 和 Hashtable是Map接口的实现类,它们大体有一下几个区别: 1. 继承的父类不同。HashMap是继承自AbstractMap类,而HashTable是继承自Dictionary类。 2. 线程安全性不同。Hashtable 中的方…

大数据学习之分布式数据采集系统Flume学习

分布式数据采集系统Flume学习 一、Flume架构 1.1 Hadoop业务开发流程 1.2 Flume概述 flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 支持在日志系统中定制各类数据发送方,用于收集数据; 同时,Flume提供对数据进行简单处理&…

用英文介绍开罗:Cairo, Egypt‘s MEGACITY

Cairo, Egypt’s MEGACITY: Largest City in the Middle East Link: https://www.youtube.com/watch?v0tKphKvodLQ&listPLmSQiOQJmbZ7TU39cyx7gizM9i8nOuZXy&index23 Summary Summary of the Mini-Documentary on Cairo Historical and Cultural Significance Cai…

从零开始学习Linux(10)----动静态库

目录 1.制作静态库 1.编写源代码 2.编译 3.打包库 4.使用库 2.制作动态库 1.编译 2.打包库 3.总结 3.理解动态库加载 1.站在系统角度理解 2.谈谈编址,可执行程序 1.制作静态库 1.编写源代码 假设你编写了两个源代码文件mymath.c和myprintf.c以及它们对应…

乐队谱在哪里找 乐队功能谱怎么做 Guitar Pro8激活码 吉他谱软件

学习乐队谱对于音乐爱好者来说是一种极具乐趣和挑战的体验。无论是追溯经典曲目还是与其他乐手合作,乐队谱都是实现音乐梦想的必备工具。然而,要找到适合练习的乐队谱并制作出符合乐队演奏需求的功能谱并不容易,需要借助一些方法和工具。下面…

点云入门知识

点云的处理任务 场景语义分割 物体的三维表达方法(3D representations): 点云:是由物体表面上许多点数据来表征这个物体。最接近原始传感器数据,且具有丰富的几何信息。 Mesh:用三角形面片和正方形面片拼…

【安全开发】内网扫描器

文章目录 前言现实现的功能较少后序开发会逐步加入简单漏洞探探测和代理功能。 一、开发过程1.项目结构2.main.go3.core模块3.1 scanner.go3.2 service.go 4.bruteforc4.1 bruteforce.go 二、使用步骤 前言 为什么要写这个? fscna被杀的概率太高(哪天二…

十步学习法,赋能程序员

大家好,我是码农先森。 引言 最近看了《软技能:代码之外的生存指南》这本书,对其中的 “十步学习法”。 有一些感触,所以将其中的内容记录并总结了下来,分享给大家。 程序员在学习成长的过程中,除了关注…

【深度学习】单机多卡 | DataParallel将计算任务在多个 GPU 上并行执行,可以在多个 GPU 上分摊工作负载,从而加快训练速度

【深度学习】单机多卡 | DataParallel将计算任务在多个 GPU 上并行执行,可以在多个 GPU 上分摊工作负载,从而加快训练速度 写在最前面DataParallel (DP) 简介使用 DataParallel 的场景使用 DataParallel 的基本步骤 代码部分train.py简单的代码示例代码解…

可用的微信小程序抓包方式(Charles + bp)

扫码领资料 获网安教程 前言 接到对公司小程序进行渗透的任务,尝试了网上几种对小程序抓包的方式(BurpProxifier、Burp安卓模拟器等)都无法完成抓包,可能已经失效,结合不同的文章尝试了bpCharles,成功抓包…

diffusion model(十八):diffusion model中negative prompt的工作机制

info个人博客主页http://myhz0606.com/article/ncsn 前置阅读: DDPM: http://myhz0606.com/article/ddpm classifier-guided:http://myhz0606.com/article/guided classifier-free guided:http://myhz0606.com/article/classi…

如何评估CRM客户系统的功能是否满足助贷机构的需求?

评估 CRM 客户系统的功能是否满足助贷机构的需求,可以从以下几个方面入手: 1. 客户信息管理 - 检查系统能否全面、准确地记录客户的基本信息,如个人身份、财务状况、贷款需求等。 - 确认是否支持多维度的客户分类和标签功能,以…

Python:探索高效、智能的指纹识别技术(简单易懂)

目录 概括 导入库 函数一 参数: 函数二 函数三 主函数 运行结果 src: model_base 7.bmp ​编辑 总结 概括 指纹识别是一种基于人体生物特征的身份验证技术。它通过捕捉和分析手指上的独特纹路和细节特征,实现高准确度的身份识别。…

【工具测评】ONLYOFFICE8.1版本桌面编辑器测评:好用!

随着远程工作的普及和数字化办公的发展,越来越多的人开始寻找功能强大、易于使用的办公软件。在这个背景下,ONLYOFFICE 8.1应运而生,成为许多用户的新选择。ONLYOFFICE 8.1是一款办公套件软件,提供文档处理、电子表格和幻灯片制作…

动手学深度学习(Pytorch版)代码实践 -计算机视觉-41目标检测数据集

41目标检测数据集 import os import pandas as pd import torch import torchvision import matplotlib.pylab as plt from d2l import torch as d2l# 数据集下载链接 # http://d2l-data.s3-accelerate.amazonaws.com/banana-detection.zip# 读取数据集 #save def read_data_b…

右键新建没有TXT文本文档的解决办法

电脑右键新建,发现没有txt了,我查网上办法都有点复杂,诸如注册表的,但是其实很简单,重启windows资源管理器就可以了。 点击重新启动,之后新建就有txt文档了。

C++20中的Feature Test Mocros

C20定义了一组预处理器宏,用于测试各种语言和库的feature。 Feature Test Mocros(特性测试宏)是C20中引入的一种强大机制,用于应对兼容性问题。Feature Test Mocros作为预处理器指令(preprocessor directives)出现,它使你能够在编译过程中仔细…