如何删除GIT仓库中的敏感信息

1. 前言

正常Git仓库中应该尽量不包含数据库连接/AWS帐号/巨大二进制文件,否则一旦泄漏到Github,这些非常敏感信息会影响客户的信息安全已经公司的信誉。公司可能其它还有相关规定,如禁止私人邮件加入GIT仓库。如果违反这些规定,可能会面临辞退、高额罚款、或牢狱之灾等非常严厉的惩罚。


由于Git的正常操作流程,导致敏感信息一旦进入主分支,再怎么在新的Pull Request中删除,也无能为力了。其它人都能在历史记录中查询到历史记录中的配置。所以这要求对Git的签名和签入、推送要有高度的敬畏之心。


然而根据墨菲定律,可能发生的事情一定会发生。时不时,故意或失手,就会有人将这些信息写到了Git仓库中。如果代码还没有上传(git push),那可能还好说,只要将分支删除,然后重新写一下功能即可。但如果已经上传了,或功能太多太复制没办法及时删除,就会后悔莫及了。

这里我将演示一个故意写满“敏感信息”的Github仓库,然后一步一步演示怎么在历史记录中,删除“敏感信息”,以完成“脱敏”。

1.1 仓库需处理的问题说明

敏感源

敏感原因

处理方法

sdflysha@qq.com
个人邮箱
替换为“公司”邮箱
文件Program.cs
文件敏感
替换文件中的敏感信息
文件夹userSecrets
文件夹敏感
删除
Program.exe
大二进制
删除

这个演示满载“敏感”信息的代码仓库,可以从:https://github.com/sdcb/sensitive-repo-demo 这里下载。

1.2 “敏感”信息演示

  • 个人邮箱签入“公司”项目,可以通过gitk命令看到:

    640?wx_fmt=png

  • AWS Key配置写在代码中(见`Program.cs`):

    string awsAccessKey = "pwiCZSMCIcM6+q+h";	
    string awsSecretKey = "861YUaeCHqzaS5OX+OmAK1XD37kmQhA2";	
    Console.WriteLine("Hello, I Switched to correct email!")
  • 生产环境配置文件(见`appsettings.Production.json`):

    {	"ConnectionString": "Data Source=production-db.starworks.cc,32768; User Id=sensitive_user; Password=MyVeryVerlyStr0ngPassw0rd!; Initial Catalog=ProductionDB; app=Program1"	
    }
  • 敏感信息文件夹(见userSecrets文件夹)

  • 大二进制文件(见bin\Program.exe

从以上敏感信息的诚意,可见小编(周杰的DotNet骚操作)为了写这遍文章已经拼了?。

2. 如何删除敏感信息

2.1 前置条件

必须先切换到主分支(一般为master),然后获取最新代码再进行操作:

git checkout master	
git pull

如果有任何修改的对象,都会阻止提交,因此必须先签入所有未提交的本地修改。

2.2 git filter-branch-修改邮箱/用户名

该命令用于解决将个人邮箱/个人用户名签入公司项目。

该命令是Git客户端内置的,不用下载。

2.3 bfg-删除其它信息

bfg([BFG Repo-Cleaner](https://rtyley.github.io/bfg-repo-cleaner/))是个强大的工具,有如下功能:

  • 用于删除文件内敏感信息(不删文件)

  • 删除敏感文件

  • 删除敏感文件夹

  • 删除大二进制文件。

bfg基于Java,安装很繁琐,但通过choco命令,可以快速进行安装:

  1. 先在命令提示符(cmd)下执行如下脚本,安装choco([Chocolatey](https://chocolatey.org/)):

    @"%SystemRoot%\System32\WindowsPowerShell\v1.0\powershell.exe" -NoProfile -InputFormat None -ExecutionPolicy Bypass -Command "iex ((New-Object System.Net.WebClient).DownloadString('https://chocolatey.org/install.ps1'))" && SET "PATH=%PATH%;%ALLUSERSPROFILE%\chocolatey\bin"

  2. 再使用choco命令安装bfg工具(需要管理员权限):

    choco install bfg-repo-cleaner

    期间,它会自动下载JRE等组件,执行效果如下(需要按多次Y/Yes):

    640?wx_fmt=png重点:执行此命令需要以管理员权限运行cmd

3. 执行命令,删除敏感信息

3.1 删除个人邮箱签入“公司”项目

执行如下命令即可:

git filter-branch --env-filter '	OLD_EMAIL="sdflysha@qq.com"	CORRECT_NAME="sdflysha"	CORRECT_EMAIL="sdflysha@starworks.com"	if [ "$GIT_COMMITTER_EMAIL" = "$OLD_EMAIL" ]	then	export GIT_COMMITTER_NAME="$CORRECT_NAME"	export GIT_COMMITTER_EMAIL="$CORRECT_EMAIL"	fi	if [ "$GIT_AUTHOR_EMAIL" = "$OLD_EMAIL" ]	then	export GIT_AUTHOR_NAME="$CORRECT_NAME"	export GIT_AUTHOR_EMAIL="$CORRECT_EMAIL"	fi	
' --tag-name-filter cat -- --branches --tags

重点:

  • 将上述脚本中的OLD_EMAILsdflysha@qq.com替换为你的私人(错误)邮箱;

  • CORRECT_NAMECORRECT_EMAIL换成你的公司(正确)邮箱;

  • 该命令不能在命令提示符(cmd)中运行,因为cmd不支持换行命令,否则会出现如下错误:

    640?wx_fmt=png

如果执行正常,将会出现:

640?wx_fmt=png

此时,运行gitk命令将看到:

640?wx_fmt=png

可见,所有“私人邮箱”sdflysha@qq.com都正确地替换成为了“公司邮箱”sdflysha@starworks.cc了。

3.2 替换文件中的敏感信息(不删除文件)

命令:

bfg --replace-text "C:\Users\sdfly\Desktop\to-be-replaced.txt" --no-blob-protection

其中to-be-replaced.txt格式如下:

pwiCZSMCIcM6+q+h==>REPLACED	
861YUaeCHqzaS5OX+OmAK1XD37kmQhA2==>REPLACED

其中左边是需要替换的值(这里为AWS相关的key),右边为替换之后的值。

命令执行后,可以运行gitk,可以看到历史记录中,东西真的被替换了:

640?wx_fmt=png

3.3 删除敏感文件

命令:

bfg --delete-files appsettings.Production.json --no-blob-protection

将其中appsettings.Production.json文件替换成你的文件名即可。

注意:删除文件不能带路径名,只能匹配文件本身。


3.4 删除敏感文件夹

命令:

bfg --delete-folders userSecrets --no-blob-protection

userSecrets文件夹替换成你的敏感文件夹即可。

3.5 删除二进制大文件

命令:

git gc	
bfg --strip-blobs-bigger-than 150K --no-blob-protection

150K换成你的二进制文件大小即可。

注意:删除大二进制文件前,运行git gc命令是必须的,否则会报这个错:

Warning : no large blobs matching criteria found in packfiles - does the repo need to be packed?


3.6 关于--no-blob-protection

--no-blob-protection是指将历史中删除的记录,放到最新一次未签入的修改中:

PS C:\Users\sdfly\Desktop\sensitive-repo-demo> git status	
On branch master	
Your branch and 'origin/master' have diverged,	
and have 9 and 9 different commits each, respectively.	(use "git pull" to merge the remote branch into yours)	Changes to be committed:	(use "git reset HEAD <file>..." to unstage)	modified:   Program.cs	new file:   appsettings.Production.json	new file:   bin/Program.exe	deleted:    bin/Program.exe.REMOVED.git-id	new file:   userSecrets/admin-password.json	new file:   userSecrets/user-password.json

这些都是敏感信息或者大文件,根据你的实际情况,可以先备份一下,然后删除:

git reset --hard

4. 推送到远程/其他人获取代码

4.1 推送到远程

此时可以通过:

git push --set-upstream origin master --force

来推送到远程以完成(该命令可能需要你的上级帮你执行,或临时开个权限)。

注意,简单地执行git push(不带--force)是无法推送的,此时会报如下错误:

640?wx_fmt=png

4.2 其他人获取代码

组内其它成员则可以删除原先的主分支,然后重新拉一个主分支:

git fetch origin	
git checkout -b temp-branch	
git branch -D master	
git checkout origin/master	
git checkout -b master

4.3 最后的效果

原版

https://github.com/sdcb/sensitive-repo-demo

脱密版

https://github.com/sdcb/sensitive-repo-demo/tree/cleaned

5. 总结

我们签入Git时应该小心谨慎,但一旦出现问题,只要引起重视,也是可以尽早补救的。上述这些命令可能会中断其它组员的工作,因此一旦出现问题应该尽早汇报给上级,大概率要上级来配合来恢复Git的使用。

当然,提高信息安全意识才是最重要的,事后诸葛亮是费力不讨好。希望各位提高警惕,不要在Git的使用中翻车。

出处:微信公众号【DotNet骚操作】

640?wx_fmt=jpeg

觉得好看,请点这里↓↓↓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/314375.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CF896E Welcome home, Chtholly(分块/并查集/第二分块)

CF896E Welcome home, Chtholly 对于给定一个长度为n(n<1e5)的序列&#xff0c;值域范围为1e5,要求支持两类操作。 将区间[l,r]内所有大于x的数减x查询区间[l,r]内值为x的数的个数 首先由于n和值域同阶&#xff0c;所以我们应该在值域上进行操作&#xff0c;但是这个东西…

ASP.NET Core on K8S深入学习(4)你必须知道的Service

本篇已加入《.NET Core on K8S学习实践系列文章索引》&#xff0c;可以点击查看更多容器化技术相关系列文章。前面几篇文章我们都是使用的ClusterIP供集群内部访问&#xff0c;每个Pod都有一个自己的IP地址&#xff0c;那么问题来了&#xff1a;当控制器使用新的Pod替代发生故障…

输出程序运行时间

输出程序运行时间 用函数clock()返回一个时钟类型&#xff0c;本质上是一个long类型&#xff0c;然后表示从程序开始到当前经过的时钟单位&#xff0c;所以我们可以通过两个位置的差来得到一段的运行时间但是要除以一个常量CLOCKS_PER_SEC表示每秒的时钟单位&#xff0c;然后用…

P3768 简单的数学题(杜教筛)

P3768 简单的数学题 推式子 ∑i1n∑j1mijgcd(i,j)∑d1nd∑i1n∑j1mij(gcd(i,j)d)∑d1nd3∑i1nd∑j1ndij∑k∣gcd(i,j)μ(k)∑d1nd3∑k1ndk2μ(k)∑i1nkdi∑j1nkdj∑d1nd3∑k1ndk2μ(k)(⌊nkd⌋(1⌊nkd⌋)2)2我们假设tkd∑t1nt2(⌊nt⌋(1⌊nt⌋)2)2∑k∣ttkμ(k)∑t1nt2ϕ(t)(⌊…

博客园翻车启示录

开发者的日常作为一名996的开发者&#xff0c;我几乎每天只有两件事&#xff0c;制造bug和解决bug&#xff0c;这两件事&#xff0c;既替我解决了温饱问题、也替产品经理、测试工程师等一票人解决了吃穿问题。嗯&#xff0c;有人为我这种程序员评了一个等级&#xff0c;我大概是…

[2020多校A层11.25]最大K段和(反悔贪心)

[2020多校A层11.25]最大K段和 对于一个长度为n的序列&#xff0c;求解不相交的k段使得他们的总和最大&#xff0c;输出最大值。 n<1e5 对于这种问题&#xff0c;我们没有思路求解&#xff0c;可以考虑枚举&#xff0c;发现无法枚举&#xff0c;然后考虑dp&#xff0c;发现…

asp.net core 从单机到集群

asp.net core 从单机到集群Intro这篇文章主要以我的活动室预约的项目作为示例&#xff0c;看一下一个 asp.net core 应用从单机应用到集群部署需要做什么。示例项目活动室预约提供了两个版本&#xff0c;集群版和 单机版单机版方便部署&#xff0c;不依赖其他环境&#xff0c;数…

杜教筛模板(P4213 【模板】杜教筛(Sum))

P4213 【模板】杜教筛&#xff08;Sum&#xff09; 套路推式子 求s(n)∑i1nf(i)∑i1n(f∗g)(i)∑i1n∑d∣if(d)g(id)∑d1n∑i1⌊nd⌋f(i)g(d)∑d1ng(d)S(⌊nd⌋)g(1)S(n)∑d2ng(d)S(⌊nd⌋)则有g(1)S(n)∑i1n(f∗g)(i)−∑d2ng(d)S(⌊nd⌋)求s(n) \sum_{i 1} ^{n}f(i)\\ \su…

[2020多校A层12.1]树(倍增/单调栈/dfs栈)

[2020多校A层12.1]树 求解树上从u到v的最长贪心上升序列&#xff0c;也就是只要有比它大的就选择它&#xff0c;可以发现这个问题性质&#xff0c;就是每个点对应了唯一的一个第一个比它大的点&#xff0c;那么我们可以向它们之间连边&#xff0c;然后问题就转化为求解从当前点…

通过Blazor使用C#开发SPA单页面应用程序(3)

通过Blazor使用C#开发SPA单页面应用程序(1)通过Blazor使用C#开发SPA单页面应用程序(2)今天我们来看看Blazor开发的一些基本知识。Blazor中组件的基本结构可以分为3个部分&#xff0c;如下所示&#xff1a;//Counter.razor//Directives section 指令部分page "/counter&qu…

NC14250 MMSet2

MMSet2 思路 这道题目显然能够通过31051063 \times 10 ^ 5 \times 10 ^ 63105106的复杂度来暴力&#xff0c;这显然不能达到题目要求的复杂度&#xff0c;因此我们可以对题目要求我们计算的东西进行转换。 某个点到所有点集的最大距离最小&#xff0c;这就有点像是重心的求法…

[2020多校A层12.3]虚构推理(语言/二分/数据结构)

[2020多校A层12.3]虚构推理 给定n个时钟精确到秒&#xff0c;求解一个时间&#xff0c;使得它的指针和所有其他的时钟时针和分针分别的角度最大值最小。 一道毒瘤的二分题&#xff0c;看到最大值最小&#xff0c;我们很容易想到二分答案。然后我们的关键是check&#xff0c;那…

ASP.NET CORE 2.* 利用集成测试框架覆盖HttpClient相关代码

ASP.NET CORE 集成测试官方介绍我的asp.net core 项目里面大部分功能都是去调用别人的API &#xff0c;大量使用HttpClient&#xff0c;公司单元测试覆盖率要求95%以上&#xff0c;很难做到不mock HttpClient 达到这个指数。以下方法是我自己总结的在单元测试里 mock httpClien…

Expected Value Again(咕咕咕)

Expected Value Again 神题&#xff01;&#xff01;&#xff01;

[51 nod 1238] 最小公倍数之和 V3(杜教筛)

1238 最小公倍数之和 V3 推式子 ∑i1n∑j1nlcm(i,j)∑i1n∑j1nijgcd(i,j)∑d1n∑i1n∑j1nijd(gcd(i,j)d)∑d1nd∑i1nd∑j1ndij(gcd(i,j)1)∑d1nd∑i1nd∑j1ndij∑k∣gcd(i,j)μ(k)∑d1nd∑k1ndk2μ(k)∑i1ndk∑j1ndkij\sum_{i 1} ^{n} \sum_{j 1} ^{n} lcm(i, j)\\ \sum_{i…

Let's Encrypt网站推出中文版

如今很多网站都强制使用 HTTPS 加密协议访问&#xff0c;安全性有了很大的提高&#xff0c;最起码在数据传输的初始阶段数据包不会被劫持&#xff0c;保证了客户端与服务器端的通讯安全性。说到 HTTPS 加密协议&#xff0c;就不得不提 Let’s Encrypt。Let’s Encrypt 是一家不…

动态分配内存

https://www.runoob.com/cplusplus/cpp-dynamic-memory.html

[51 nod 123] 最大公约数之和 V3(杜教筛)

1237 最大公约数之和 V3 推式子 ∑i1n∑j1ngcd(i,j)∑d1nd∑i1n∑j1n(gcd(i,j)d)∑d1nd∑i1nd∑j1nd(gcd(i,j)1)∑d1nd∑i1nd∑j1nd∑k∣gcd(i,j)μ(k)∑d1nd∑k1ndμ(k)∑i1nkd∑j1nkd1套路地设tkd∑t1n(⌊nt⌋)2∑d∣tdμ(td)∑t1n(⌊nt⌋)2ϕ(t)接下来就是杜教筛求∑i1nϕ(…

使用WebDeploy部署远程IIS网站

目录 使用WebDeploy部署远程IIS网站后台服务部署服务器配置本地WebDeploy发布文件配置前端页面部署WebDeploy服务端配置WebDeploy发布文件配置使用WebDeploy部署远程网站后台服务部署服务器配置打开IIS管理器(开始->控制面板->管理工具->IIS管理器)添加网站(右键网站…

数列分块入门

文章目录数列分块入门1数列分块入门2数列分块入门3数列分块入门4数列分块入门5数列分块入门6数列分块入门7数列分块入门8数列分块入门9数列分块入门1 区间加&#xff0c;单点查询 分块后&#xff0c;维护标记&#xff0c;零散块暴力加&#xff0c;查询时输出值加标记 数列分块…