用 Python 自动化处理日常任务

💖 欢迎来到我的博客! 非常高兴能在这里与您相遇。在这里,您不仅能获得有趣的技术分享,还能感受到轻松愉快的氛围。无论您是编程新手,还是资深开发者,都能在这里找到属于您的知识宝藏,学习和成长。

🔍 博客内容包括:

  • Java核心技术与微服务:涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等,帮助您全面掌握企业级开发技术。
  • 大数据技术:涵盖Hadoop(HDFS)、Hive、Spark、Flink、Kafka、Redis、ECharts、Zookeeper等相关技术。
  • 开发工具:分享常用开发工具(IDEA、Git、Mac、Alfred、Typora等)的使用技巧,提升开发效率。
  • 数据库与优化:总结MySQL及其他常用数据库技术,解决实际工作中的数据库问题。
  • Python与大数据:专注于Python编程语言的深度学习,数据分析工具(如Pandas、NumPy)和大数据处理技术,帮助您掌握数据分析、数据挖掘、机器学习等技术。
  • 数据结构与算法:总结数据结构与算法的核心知识,提升编程思维,帮助您应对大厂面试挑战。

🌟 我的目标:持续学习与总结,分享技术心得与解决方案,和您一起探索技术的无限可能!在这里,我希望能与您共同进步,互相激励,成为更好的自己。

📣 欢迎订阅本专栏,与我一起在这个知识的海洋中不断学习、分享和成长!💻🚀


📍版权声明:本博客所有内容均为原创,遵循CC 4.0 BY-SA协议,转载请注明出处。

目录

1. 自动化文件管理

1.1 批量重命名文件

1.2 自动分类文件

2. 自动化定时任务

2.1 使用 schedule 库定时执行任务

2.2 使用 APScheduler 执行复杂定时任务

3. 自动化发送邮件

4. 自动化网络爬虫

5. 自动化数据处理

5.1 使用 Pandas 库处理数据

5.2 定时备份数据库

6. 自动化图像处理

7. 自动化 Web 操作

总结


1. 自动化文件管理

1.1 批量重命名文件

假设你有一批文件,文件名需要按一定规则批量修改,可以使用 osre 库来实现。

import os
import re# 设置目录路径
directory = 'C:/path/to/your/files'# 获取文件列表
files = os.listdir(directory)# 批量重命名文件
for filename in files:new_name = re.sub(r'old_pattern', 'new_pattern', filename)  # 替换文件名中的内容os.rename(os.path.join(directory, filename), os.path.join(directory, new_name))print("文件重命名完成!")

1.2 自动分类文件

根据文件扩展名自动将文件分类到不同的文件夹中。

import os
import shutil# 设置目录路径
directory = 'C:/path/to/your/files'# 获取文件列表
files = os.listdir(directory)# 定义文件分类规则
file_types = {'images': ['.jpg', '.jpeg', '.png', '.gif'],'documents': ['.pdf', '.txt', '.docx'],'audio': ['.mp3', '.wav']
}# 创建文件夹(如果不存在)
for folder in file_types:if not os.path.exists(os.path.join(directory, folder)):os.makedirs(os.path.join(directory, folder))# 移动文件
for filename in files:file_path = os.path.join(directory, filename)if os.path.isfile(file_path):moved = Falsefor folder, extensions in file_types.items():if any(filename.endswith(ext) for ext in extensions):shutil.move(file_path, os.path.join(directory, folder, filename))moved = Truebreakif not moved:print(f"文件 {filename} 没有分类!")print("文件分类完成!")

2. 自动化定时任务

2.1 使用 schedule 库定时执行任务

schedule 是一个 Python 库,专门用于调度定时任务。你可以使用它来设置定时执行的任务。

import schedule
import time# 定义要执行的任务
def job():print("任务开始执行!")# 每隔 10 秒执行一次任务
schedule.every(10).seconds.do(job)# 持续运行任务
while True:schedule.run_pending()time.sleep(1)
2.2 使用 APScheduler 执行复杂定时任务

APScheduler 是一个功能更强大的调度任务库,支持多种调度方式。

from apscheduler.schedulers.blocking import BlockingScheduler
import datetime# 定义要执行的任务
def print_time():print(f"当前时间:{datetime.datetime.now()}")# 创建调度器
scheduler = BlockingScheduler()# 添加任务,定时每分钟执行
scheduler.add_job(print_time, 'interval', minutes=1)# 启动调度器
scheduler.start()

3. 自动化发送邮件

使用 smtplib 库,可以自动化发送邮件,比如定时向客户或团队成员发送报告。

import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipartdef send_email(subject, body, to_email):from_email = "your_email@gmail.com"password = "your_password"# 设置邮件内容msg = MIMEMultipart()msg['From'] = from_emailmsg['To'] = to_emailmsg['Subject'] = subjectmsg.attach(MIMEText(body, 'plain'))# 发送邮件try:server = smtplib.SMTP('smtp.gmail.com', 587)server.starttls()server.login(from_email, password)text = msg.as_string()server.sendmail(from_email, to_email, text)server.quit()print("邮件发送成功!")except Exception as e:print(f"邮件发送失败:{e}")# 调用函数发送邮件
send_email("自动化报告", "这是自动化发送的邮件内容", "recipient_email@example.com")

4. 自动化网络爬虫

使用 requestsBeautifulSoup 库,可以自动化爬取网页内容,并将其存储到文件中。

import requests
from bs4 import BeautifulSoup# 定义爬取目标网址
url = "https://example.com"# 发送 HTTP 请求获取网页内容
response = requests.get(url)# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')# 获取页面标题
title = soup.title.string# 打印标题
print(f"网页标题: {title}")

5. 自动化数据处理

5.1 使用 Pandas 库处理数据

如果你经常需要处理 CSV 文件或 Excel 文件,可以使用 Pandas 库来实现数据的读取、处理和导出。

import pandas as pd# 读取 CSV 文件
df = pd.read_csv('data.csv')# 进行数据处理(例如:筛选大于 100 的值)
df_filtered = df[df['column_name'] > 100]# 保存处理后的数据到新的 CSV 文件
df_filtered.to_csv('filtered_data.csv', index=False)print("数据处理完成!")
5.2 定时备份数据库

可以通过 Python 脚本定时备份数据库,减少人工干预。

import mysql.connector
import datetime
import osdef backup_database():# 数据库连接配置db = mysql.connector.connect(host="localhost",user="your_user",password="your_password",database="your_database")# 创建备份文件名backup_filename = f"backup_{datetime.datetime.now().strftime('%Y%m%d_%H%M%S')}.sql"# 使用 mysqldump 进行备份os.system(f"mysqldump -u your_user -p'your_password' your_database > {backup_filename}")print(f"数据库备份完成!备份文件: {backup_filename}")# 定时备份
backup_database()

6. 自动化图像处理

如果你需要自动处理图像文件(例如,批量调整大小、转换格式等),可以使用 Pillow 库。

from PIL import Image
import os# 设置图像目录
image_directory = 'C:/path/to/your/images'# 获取所有图像文件
files = os.listdir(image_directory)# 批量调整图像大小
for filename in files:if filename.endswith('.jpg'):image_path = os.path.join(image_directory, filename)with Image.open(image_path) as img:img = img.resize((800, 600))  # 调整大小为 800x600img.save(os.path.join(image_directory, f"resized_{filename}"))print("图像处理完成!")

7. 自动化 Web 操作

如果你需要自动化与网页的交互,可以使用 Selenium 来模拟浏览器操作。

from selenium import webdriver# 设置 WebDriver
driver = webdriver.Chrome(executable_path="path/to/chromedriver")# 打开网页
driver.get("https://example.com")# 查找并点击一个按钮
button = driver.find_element_by_xpath("//button[@id='submit']")
button.click()# 获取网页内容
page_content = driver.page_source
print(page_content)# 关闭浏览器
driver.quit()

总结

使用 Python 自动化日常任务可以极大地提高效率并减少重复性工作。通过 Python 中的各种库(如 osshutilschedulesmtplibrequestspandasPillow 等),你可以轻松实现文件管理、定时任务、邮件发送、网页爬取、数据处理等多种自动化任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/892931.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java day04-面向对象基础(内存 封装 继承 修饰符 工具类 )

1.对象内存图 1.1 Java 内存分配 1.2 堆和栈 栈:所有局部变量都会在栈内存中创建 局部变量:定义在方法中的变量或者方法声明上的变量 方法执行都会加载到栈中进行 -----------------------------------------------------------------------------------------…

Qt/C++进程间通信:QSharedMemory 使用详解(附演示Demo)

在开发跨进程应用程序时,进程间通信(IPC)是一个关键问题。Qt 框架提供了多种 IPC 技术,其中 QSharedMemory 是一种高效的共享内存方式,可以实现多个进程之间快速交换数据。本文将详细讲解 QSharedMemory 的概念、用法及…

从前端视角看设计模式之创建型模式篇

设计模式简介 "设计模式"源于GOF(四人帮)合著出版的《设计模式:可复用的面向对象软件元素》,该书第一次完整科普了软件开发中设计模式的概念,他们提出的设计模式主要是基于以下的面向对象设计原则&#xff…

深入理解 Entity、VO、QO、DTO 的区别及其在 MVC 架构中的应用

文章背景 在现代软件开发中,我们经常会接触到各种数据结构的概念,比如 Entity、VO(Value Object)、QO(Query Object)、DTO(Data Transfer Object)等。这些概念尽管看似相似&#xff…

Pandas数据合并:concat与merge

目录 一、concat方法 1. 基本语法 2. 示例 示例1:按行合并(垂直方向) 示例2:按列合并(水平方向) 示例3:使用joininner进行内连接 示例4:处理列名冲突 二、merge方法 1. 基本…

docker的数据卷与dockerfile自定义镜像

docker的数据卷与dockerfile自定义镜像 一. docker的数据卷数据卷容器 二. dockerfile自定义镜像2.1 dockerfile的命令格式镜像的操作命令add和copy的区别 容器启动的命令 2.2 run命令2.3 其它端口映射 三. 练习 一. docker的数据卷 容器于宿主机之间,或者容器和容…

Kubernetes (K8s) 入门指南

Kubernetes (K8s) 入门指南 什么是Kubernetes? Kubernetes,通常简称为 K8s(因为从 “K” 到 “s” 之间有八个字符),是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。它最初由谷歌设…

WordPress Squirrly SEO插件存在身份认证SQL注入漏洞(CVE-2025-22783)

免责声明: 本文旨在提供有关特定漏洞的深入信息,帮助用户充分了解潜在的安全风险。发布此信息的目的在于提升网络安全意识和推动技术进步,未经授权访问系统、网络或应用程序,可能会导致法律责任或严重后果。因此,作者不对读者基于本文内容所采取的任何行为承担责任。读者在…

【大数据】机器学习 -----关于data.csv数据集分析案例

打开表 import pandas as pd df2 pd.read_csv("data.csv",encoding"gbk") df2.head()查看数据属性(列标题,表形状,类型,行标题,值) print("列标题:",df2.columns)Data…

STM32 FreeRTOS消息队列

队列简介 队列是任务间通信的主要形式。 它们可以用于在任务之间以及中断和任务之间发送消息。 队列是线程安全的数据结构,任务可以通过队列在彼此之间传递数据。有以下关键特点: FIFO顺序:队列采用先进先出 (FIFO) 的顺序,即先…

开发规范

开发规范 企业项目开发有2种开发模式:前后台混合开发和前后台分离开发。 前后台混合开发 顾名思义就是前台后台代码混在一起开发,如下图所示: 这种开发模式有如下缺点: 沟通成本高:后台人员发现前端有问题&#xf…

【Mysql进阶知识】从.SQL文件中执行SQL语句

目录 方法一:使用source命令导入 方法二:使用mysql客户端导入 方法一:使用source命令导入 有时候我们需要从 SQL 文件执行一些 SQL 语句,比如要把一个数据库从一台服务器 A 复制到另一台服务器 B 上,那么可以先从服务…

C# 内存篇

C#程序在CLR上运行的时候,内存从逻辑上划分为两大块:堆(托管堆)和栈(堆栈)。 堆:堆是一块动态分配的内存区域,用于存储对象和数据,堆内存的分配和释放由CLR(公共语音运行库)管理,通过垃圾回收(G…

springMVC---resultful风格

目录 一、创建项目 pom.xml 二、配置文件 1.web.xml 2.spring-mvc.xml 三、图解 四、controller 一、创建项目 pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi…

CAPL数据库操作

CAPL数据库操作 目录 CAPL数据库操作1. 引言2. DBC文件解析与加载2.1 DBC文件简介2.2 DBC文件加载2.3 DBC文件解析3. 信号读取与写入3.1 信号读取3.2 信号写入4. 环境变量与系统变量4.1 环境变量4.2 系统变量5. 案例说明5.1 案例1:DBC文件加载与解析5.2 案例2:信号读取与写入…

RustDesk ID更新脚本

RustDesk ID更新脚本 此PowerShell脚本自动更新RustDesk ID和密码&#xff0c;并将信息安全地存储在Bitwarden中。 特点 使用以下选项更新RustDesk ID&#xff1a; 使用系统主机名生成一个随机的9位数输入自定义值 为RustDesk生成新的随机密码将RustDesk ID和密码安全地存储…

告别 Excel,拥抱 R 语言:开启数据分析新时代

在这个数据驱动的时代&#xff0c;数据分析已然成为每个行业的核心竞争力。从市场营销到金融领域&#xff0c;从医疗健康到教育行业&#xff0c;数据无处不在&#xff0c;深刻影响着每一个决策。然而&#xff0c;面对日益复杂的数据集&#xff0c;单纯依靠 Excel 进行分析&…

LabVIEW驱动电机实现样品自动搜索

利用LabVIEW控制电机驱动相机在XY平面上进行扫描&#xff0c;以检测样品位置。样品最初可能位于相机视野范围之外&#xff0c;需要实现自动搜索样品位置并完成精确定位扫描的功能。该系统需具有以下特点&#xff1a; 高效搜索&#xff1a;能够快速确定样品位置&#xff0c;缩短…

PyQt5 中按钮点击事件重复触发的原因与解决方案

问题描述原因分析解决方案1. 断开旧连接并重新连接信号和槽2. 禁用按钮防止重复点击 调试技巧总结 在使用 PyQt5 开发桌面应用时&#xff0c;我们常常会遇到按钮点击事件触发多次的问题。虽然这听起来很常见&#xff0c;但它的原因可能并不那么直观。在这篇博客中&#xff0c;我…

【C语言】_字符串拷贝函数strcpy

目录 1. 函数声明及功能 2. 使用示例 3. 注意事项 4. 模拟实现 4.1 第一版&#xff1a;基本功能判空const修饰 4.2 第二版&#xff1a;优化对于\0的单独拷贝 4.3 第三版&#xff1a;仿strcpy的char*返回值 1. 函数声明及功能 char * strcpy ( char * destination, cons…