windows使用Python调用7-Zip【按大小分组】压缩文件夹中所有文件

使用Python调用7-Zip【按大小分组】压缩文件夹中所有文件

  • 问题描述:
  • 方法
    • 前提条件
    • 任务
    • 完整代码示例
      • 代码如何工作?

问题描述:

我现在想把文件夹下的所有内容上传到网盘,但是这个文件夹下的素材内容很多,使用分卷压缩的话,要一起压缩完上传。解压时得一起下载完再解压。200多G太大了。

又因为其实我用不完这个文件夹下全部的素材,有时候只下载一些就够用了,所以我希望:

能使用python 调用 7-zip,每20G压缩一个压缩包,命名后保存。直到把文件夹下所有的文件压缩完。

方法

前提条件

在动手之前,你需要准备以下工具:

  • Python:推荐使用Python 3.x版本,已安装并可运行。
  • 7-Zip:一个免费的压缩工具,点击这里下载并安装。
  • 基本环境:确保你的电脑上Python和7-Zip都能正常运行。

任务

  • 文件管理:将大文件夹拆分成小份,便于上传或存储。
  • 自动化:通过Python脚本,避免手动操作的繁琐。
  • 通用性:不仅限于视频文件,适用于任何类型文件。

完整代码示例

- `seven_zip_path`:替换为你的7zip的安装路径。
  • folder_path:替换为你的文件夹路径。
  • output_dir:设置压缩包保存位置。
  • max_size_gb:调整每组的大小(比如10GB、50GB)。
  • password:输入你的压缩包密码,或者留空(password = None)。
import os
import subprocess# 获取文件夹中的所有文件
def get_all_files(folder_path):"""遍历文件夹,返回所有文件的路径列表"""file_list = []for root, dirs, files in os.walk(folder_path):for file in files:file_path = os.path.join(root, file)file_list.append(file_path)return file_list# 按大小分组文件
def group_files_by_size(file_list, max_size_gb=25):"""将文件按指定大小(GB)分组"""max_size_bytes = max_size_gb * 1024 * 1024 * 1024  # GB转换为字节groups = []current_group = []current_size = 0for file in file_list:file_size = os.path.getsize(file)# 如果当前组加上新文件超出限制,且当前组不为空,则新建一组if current_size + file_size > max_size_bytes and current_group:groups.append(current_group)current_group = []current_size = 0current_group.append(file)current_size += file_size# 添加最后一组if current_group:groups.append(current_group)return groups# 使用7-Zip压缩一组文件
def compress_files(group, output_file, seven_zip_path, password=None):"""调用7-Zip压缩一组文件,可选设置密码"""# 检查7-Zip是否可用if not os.path.exists(seven_zip_path):print("错误:请检查7-Zip安装路径是否正确!")return# 构建7-Zip命令command = [seven_zip_path,"a",          # 添加到压缩包"-t7z",       # 使用7z格式output_file,  # 输出文件名]if password:      # 如果设置了密码command.extend(["-p{}".format(password), "-mhe=on"])  # 添加密码并加密文件名command.extend(group)  # 添加文件列表# 执行压缩try:result = subprocess.run(command, capture_output=True, text=True)if result.returncode == 0:print(f"压缩成功:{output_file}")else:print(f"压缩失败:{result.stderr}")except Exception as e:print(f"发生错误:{str(e)}")# 主函数
def main():# 配置参数seven_zip_path = r"D:\Program Files\7-Zip\7z.exe"  # 7-Zip安装路径,可根据需要修改folder_path = r"D:\MyFiles"                       # 要压缩的文件夹路径output_dir = r"D:\CompressedFiles"                # 压缩包保存目录max_size_gb = 25                                  # 每组最大大小(GB)password = "mysecret123"                          # 压缩密码(可选,留空则无密码)# 创建输出目录(如果不存在)if not os.path.exists(output_dir):os.makedirs(output_dir)# 获取文件列表files = get_all_files(folder_path)if not files:print("错误:文件夹中没有文件!")return# 分组文件file_groups = group_files_by_size(files, max_size_gb)# 压缩每组文件for i, group in enumerate(file_groups, start=1):output_file = os.path.join(output_dir, f"Part_{i}.7z")print(f"正在压缩第 {i} 组文件...")compress_files(group, output_file, seven_zip_path, password)if __name__ == "__main__":main()

代码如何工作?

  1. get_all_files

    • 使用 os.walk 遍历文件夹,收集所有文件的完整路径。
    • 适用于任何文件类型,不局限于视频。
  2. group_files_by_size

    • 根据文件大小(字节)将文件分组。
    • 每组大小不超过 max_size_gb,通过累加文件大小判断是否需要新建一组。
  3. compress_files

    • 使用 subprocess.run 调用7-Zip,执行压缩命令。
    • 支持可选密码保护,加密文件名(-mhe=on)。
  4. main

    • 设置输入文件夹、输出目录、分组大小和密码。
    • 按顺序处理每组文件,生成独立的压缩包。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/75590.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《Python星球日记》第26天:Matplotlib 可视化

名人说:路漫漫其修远兮,吾将上下而求索。—— 屈原《离骚》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 订阅专栏:《Python星球日记》 目录 一、Matplotlib 简介1. 什么是 Matplo…

第1章 对大型语言模型的介绍

人类正处在一个关键转折点。自2012年起,基于深度神经网络的人工智能系统研发进入快速通道,将这一技术推向了新高度:至2019年底,首个能够撰写与人类文章真假难辨的软件系统问世,这个名为GPT-2(生成型预训练变…

dcsdsds

我将为您在页面顶部添加欢迎内容&#xff0c;同时保持整体风格的一致性。以下是修改后的代码&#xff0c;主要修改了模板部分和对应的样式&#xff1a; vue 复制 <template><div class"main-wrapper"><!-- 新增欢迎部分 --><div class"…

学习MySQL的第八天

海到无边天作岸 山登绝顶我为峰 一、数据库的创建、修改与删除 1.1 引言 在经过前面七天对于MySQL基本知识的学习之后&#xff0c;现在我们从基本的语句命令开始进入综合性的语句的编写来实现特定的需求&#xff0c;从这里开始需要我们有一个宏观的思想&…

Linux-内核驱动-中断-key

DEV_NAME&#xff1a;设备名称。 wg&#xff1a;等待队列头&#xff0c;用于同步。 condition&#xff1a;条件变量&#xff0c;用于等待和唤醒。 中断处理函数 irq_handler&#xff1a;处理中断请求&#xff0c;设置条件变量并唤醒等待队列中的进程。 文件操作函数 open…

asm汇编源代码之按键处理相关函数

提供5个子程序: 1. 发送按键 sendkey 2. 检测是否有按键 testkey 3. 读取按键 getkey 4. 判断键盘缓冲区是否为空 bufempty 5. 判断键盘缓冲区是否已满 buffull 具体功能及参数描述如下 sendkey proc  far ; axcharcode testkey proc  far ; out: ;   zf1 buff empt…

Java Collections 类中常用方法使用

一、Collections类 java.util.Collections 类是 Java 集合框架中的一个工具类&#xff0c;提供了一系列静态方法来操作和处理各种类型的集合。这些方法简化了对集合进行排序、查找、同步控制、创建只读集合等常见操作的过程。 二、常用方法 方法类别‌‌方法签名‌‌功能‌‌需…

Linux网络编程——数据链路层详解,以太网、MAC地址、MTU、ARP、DNS、NAT、代理服务器......

目录 一、前言 二、以太网 二、以太网帧格式 三、 MAC地址 四、MTU 1、数据链路层的数据分片 2、MTU对UDP协议的影响 3、MTU对TCP协议的影响 五、ARP协议 1、什么是ARP 2、ARP的作用 3、ARP协议的工作流程 4、ARP缓存表 5、ARP请求报文 6、中间人 六、DNS&…

轻量级开源文件共享系统PicoShare本地部署并实现公网环境文件共享

&#xfeff;## 前言 本篇文章介绍&#xff0c;如何在 Linux 系统本地部署轻量级文件共享系统 PicoShare&#xff0c;并结合 Cpolar 内网穿透实现公网环境远程传输文件至本地局域网内文件共享系统。 PicoShare 是一个由 Go 开发的轻量级开源共享文件系统&#xff0c;它没有文…

基于查表法的 CRC8 / CRC16 / CRC32校验解析

在嵌入式开发中&#xff0c;CRC&#xff08;Cyclic Redundancy Check&#xff09;循环冗余校验算法广泛应用于通信数据校验、Flash 数据完整性检测、Bootloader 升级验证等场景。本文将深入剖析一套完整的 CRC8、CRC16 和 CRC32 实现&#xff0c;并通过查表法&#xff08;Table…

二战蓝桥杯所感

&#x1f334; 前言 今天是2025年4月12日&#xff0c;第十六届蓝桥杯结束&#xff0c;作为二战的老手&#xff0c;心中还是颇有不甘的。一方面&#xff0c;今年的题目比去年简单很多&#xff0c;另一方面我感觉并没有把能拿的分都拿到手&#xff0c;这是我觉得最遗憾的地方。不…

基于ueditor编辑器的功能开发之给编辑器图片增加水印功能

用户需求&#xff0c;双击编辑器中的图片的时候&#xff0c;出现弹框&#xff0c;用户可以选择水印缩放倍数、距离以及水印所放置的方位&#xff08;当然有很多水印插件&#xff0c;位置大小透明度用户都能够自定义&#xff0c;但是用户需求如此&#xff0c;就自己写了&#xf…

算法题(123):回文日期

审题&#xff1a; 本题需要我们判断以八位数确定的日期范围中是否存在回文数 思路&#xff1a; 方法一&#xff1a;枚举法 1.确定枚举对象&#xff1a; 对象1&#xff1a;八位数日期&#xff0c;所需枚举次数&#xff1a;10^8 对象2&#xff1a;年&#xff0c;所需枚举次数&…

数据库表的操作

一、数据库的搭建 如上篇文章 二、基础了解 show命令支持模糊匹配 show databases、show tables、 show databases like “” “%”、“_”通配符字符串 三、MySQL数据库表的操作 关系型数据库都是遵循SQL语法进行数据查询和管理的 3.1 SQL介绍 3.1.1 SQL的功能 结构化查询语…

在 Lua 中实现 JSON 与 Table 的相互转换的详细使用方法

在 Lua 中实现 JSON 与 Table 的相互转换是常见的数据序列化需求。以下是详细的实现方案、性能优化技巧及进阶用法&#xff1a; 在 Lua 中实现 JSON 与 Table 的相互转换的详细使用方法-目录 一、常用 JSON 库对比二、基础转换实现1. 使用 lua-cjson&#xff08;高性能 C 库&am…

dbVisitor 规则怎么用?

在数据库操作中&#xff0c;dbVisitor 是一个功能强大的工具&#xff0c;其规则的使用大大简化了 SQL 语句的编写过程。下面将详细介绍 dbVisitor 规则的使用方法并附上具体例子。 一、规则的基本调用 在 dbVisitor 中&#xff0c;SQL 语句可以通过 {...} 的形式来调用规则&a…

Kingbase 常用运维命令总结

一、数据库连接与基础操作 连接指定服务器数据库 ksql -h 主机IP -p 端口号 -U 用户名 -d 数据库名 -W # 示例&#xff1a;连接 IP 为 192.168.1.100 的数据库 ksql -h 192.168.1.100 -p 54321 -U system -d test -W 断开数据库连接 \q 或 exit 查看数据库列表及详细信息…

【数据结构与算法】LRU Cache 算法实现

文章目录 Ⅰ. 什么是 LRU CacheⅡ. LRU Cache 的实现[146. LRU 缓存](https://leetcode.cn/problems/lru-cache/) Ⅰ. 什么是 LRU Cache ​ LRU&#xff08; Least Recently Used&#xff09; 是一种淘汰策略的缩写&#xff0c;意思是 最近最少使用&#xff0c;它是一种 Cache…

网页布局汇总

1. 盒模型 容器大小 内容大小 内边距(padding) 边框大小 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0">&l…

打造海外流量矩阵,TikTok云控工具让获客更简单!

跨境获客&#xff0c;始终是无数企业主心中的一道难题。今天&#xff0c;给大家带来一款强大实用的工具——TikTok矩阵云控系统&#xff0c;帮你轻松突破流量瓶颈&#xff0c;实现高效跨境获客&#xff01; 跨国远程操控——苹果手机矩阵云控系统 在正式开始之前&#xff0c;…