使用powershell工具,根据文件的MD5值查找多个文件夹里的重复文件,并删除重复的文件只保留文件名最长的文件。
编写运行.ps1文件
新建文本文档,输入如下内容:
# 指定文件夹路径
$folderPath = "D:\111"# 获取文件夹中的所有文件,不包括子文件夹
$files = Get-ChildItem -Path $folderPath -File -Recurse# 创建一个哈希表来存储文件MD5值和文件路径
$md5Table = @{}# 遍历文件,计算MD5值,并保存最长文件的路径
foreach ($file in $files) {$md5 = Get-FileHash -Path $file.FullName -Algorithm MD5 | Select-Object -ExpandProperty Hash$fileName = $file.Name# 如果MD5值已经在哈希表中,比较文件名长度,保留最长文件的路径if ($md5Table.ContainsKey($md5)) {$existingFileName = Get-Item $md5Table[$md5] | Select-Object -ExpandProperty Nameif ($fileName.Length -gt $existingFileName.Length) {$md5Table[$md5] = $file.FullName}} else {# 如果MD5值不在哈希表中,添加该MD5值和文件路径$md5Table[$md5] = $file.FullName}
}
# 遍历文件夹,删除除最长文件名之外的文件
foreach ($file in $files) {$md5 = Get-FileHash -Path $file.FullName -Algorithm MD5 | Select-Object -ExpandProperty Hash$longestFile = $md5Table[$md5]# 如果当前文件不是最长文件,就删除它if ($file.FullName -ne $longestFile) {Remove-Item -Path $file.FullName -ForceWrite-Output "已删除文件: $($file.FullName)"}
}
路径根据情况修改。代码保存为“.ps1”为后缀的文件,如“111.ps1”。
打开powershell,在“111.ps1”的路径下输入“ .\111.ps1”,执行该文件。
效果
查找文件夹中所有文件,包括子文件夹中的文件,按照MD5值判断是否重复,如果有重复,删除重复文件,只保留文件名最长的文件。
如果需要保留的是文件名最短的文件,只需要将
if ($fileName.Length -gt $existingFileName.Length) {
修改为
if ($fileName.Length -lt $existingFileName.Length) {
。
报错
powershell运行指令,常出现的报错及处理参见:
Windows系统powershell运行指令常见报错及处理_weixin_56337147的博客-CSDN博客
总结
编写运行.ps1文件,查找并删除重复文件