获取数据 - 下载附件解压附件 - Python代码

一些线上化刚刚起步的部门,并不是所有的数据都是直接推送到服务器的数据库中,有些数据往往是数据中心通过邮件形式推送的,如果每天接收邮件--下载附件--解压--合并文件--导入数据库,对于数据工程师来说,这无疑是琐碎且没有技术含量的工作,任谁都不愿意在这种工作上面浪费时间。对于这样的工作,最适合用代码自动完成了。

下面就是用 Python 完成下载邮箱附件并解压的代码了,如果还需要合并文件,可以查看博客该分类下的另一篇文章。

# coding: utf-8
#!/usr/bin/env python3 
# -*- coding: utf-8 -*- 
import poplib 
import email 
import datetime 
import time # import re
from email.parser import Parser 
from email.header import decode_header 
from email.utils import parseaddr
import zipfile
import chardetpoplib._MAXLINE=204800  # 输入邮件地址, 口令和POP3服务器地址: 
email = '***************@163.com'#此处填写邮箱账号
password = '**********'#此处填写邮箱密码
pop3_server = 'pop.163.com'
today=datetime.datetime.now()
gap=datetime.timedelta(days=1)
date=today-gap
str_date=date.strftime('%m%d')
str_date2=today.strftime('%m%d')
file1="回盘业绩"
file2="_8月预催收业绩"
file3="全量账户报表"
filename2=[file1,file2,file3]def decode_str(s):#字符编码转换 value, charset = decode_header(s)[0] if charset: value = value.decode(charset) return value def get_att(msg,filename2): import email attachment_files1= [] attachment_files2= [] for part in msg.walk(): file_name = part.get_filename()#获取附件名称类型 contType = part.get_content_type() if file_name:  h = email.header.Header(file_name) dh = email.header.decode_header(h)#对附件名称进行解码 filename = dh[0][0] if dh[0][1]: filename = decode_str(str(filename,dh[0][1]))#将附件名称可读化 print(filename) #filename = filename.encode("utf-8")if (filename[3:7] in filename2) or (filename[7:11] in filename2):data = part.get_payload(decode=True)#下载附件 att_file = open(R'E:\\邮件下载\\' + "回盘业绩.xlsx", 'wb')attachment_files1.append(filename) att_file.write(data)#保存附件 att_file.close()elif filename[:6] ==filename2[2]:data = part.get_payload(decode=True)#下载附件 att_file = open(R'E:\\邮件下载\\' + filename, 'wb')attachment_files2.append(filename) att_file.write(data)#保存附件 att_file.close()return attachment_files2 # 连接到POP3服务器,有些邮箱服务器需要ssl加密,对于不需要加密的服务器可以使用poplib.POP3() 
server = poplib.POP3_SSL(pop3_server) 
server.set_debuglevel(1) 
# 打印POP3服务器的欢迎文字: 
print(server.getwelcome().decode('utf-8')) 
# 身份认证: 
server.user(email) 
server.pass_(password) 
# 返回邮件数量和占用空间: 
print('Messages: %s. Size: %s' % server.stat()) 
# list()返回所有邮件的编号: 
resp, mails, octets = server.list() 
# 可以查看返回的列表类似[b'1 82923', b'2 2184', ...] 
print(mails) 
index = len(mails) f_list2=[]
for i in range(index,0,-1): 
#倒序遍历邮件 resp, lines, octets = server.retr(i) # lines存储了邮件的原始文本的每一行, #邮件的原始文本: result=chardet.detect(lines[0])print(result)msg_content = b'\r\n'.join(lines).decode("utf-8","ignore")#"ignore"#解析邮件: msg = Parser().parsestr(msg_content) #获取邮件时间 date1 = time.strptime(msg.get("Date")[0:24],'%a, %d %b %Y %H:%M:%S') #格式化收件时间 date2 = time.strftime("%m%d", date1)#邮件时间格式转换 if date2==str_date2: f_list = get_att(msg,filename2)#获取附件f_list2.append(f_list)elif date2<str_date2:break 
print(f_list2)    for i in f_list2:if len(i)!=0:f = zipfile.ZipFile(R'E:\\邮件下载\\' + i[0],'r')for file in f.namelist():f.extract(file,R'E:\\邮件下载\\excel\\')     f.close()else:continue#print_info(msg) 
server.quit()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/475532.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

技术标书的写法

1, 背景&#xff0c;用户对什么关心&#xff0c;就说什么。即使没有软件也可以&#xff0c;用画图软件先画出来。2&#xff0c;用户招标流程&#xff0c;弄到评分标准一切就OK 了&#xff0c;比如说什么时候该上台演示&#xff0c;如果没有评分标 准&#xff0c;站在评审角度…

LeetCode 947. 移除最多的同行或同列石头(并查集)

1. 题目 我们将石头放置在二维平面中的一些整数坐标点上。每个坐标点上最多只能有一块石头。 每次 move 操作都会移除一块所在行或者列上有其他石头存在的石头。 请你设计一个算法&#xff0c;计算最多能执行多少次 move 操作&#xff1f; 示例 1&#xff1a; 输入&#xf…

因子分析模型

主成分分析和因子分析 #包载入 library(corrplot) library(psych) library(GPArotation) library(nFactors) library(gplots) library(RColorBrewer)1234567 主成分分析 主成分分析&#xff08;PCA&#xff09;是对针对大量相关变量提取获得很少的一组不相关的变量&#xff…

网络机器人开发商

http://soft.pt42.com/blog_backup_index.htm转载于:https://www.cnblogs.com/carl2380/archive/2011/09/01/2162136.html

因子分析模型 - 案例按步骤详解 - (SPSS建模)

一、SPSS中的因子分析。 步骤: &#xff08;1&#xff09;定义变量&#xff1a;x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重&#xff0c;x3-非农村人口比重&#xff0c;x4-乡村从业人员占农村人口的比重&#xff0c;x5-农业总产值占农林牧总…

MVC View 中 html 属性名与关键字冲突问题的分析与解决

在 MVC 的 View 中&#xff0c;允许使用 {} 来定义元素的属性。不过&#xff0c;HTML 中的 class 属性名与 C# 中的类 class 是冲突的&#xff0c;所以&#xff0c;在使用的时候&#xff0c;会发现不能使用 class 这个属性。解决的办法是在 class 前面加上一个 符号&#xff0…

神经网络 - 用单层感知器实现多个神经元的分类 - (Matlab建模)

训练样本矩阵&#xff1a; P [0.1 0.7 0.8 0.8 1.0 0.3 0.0 –0.3 –0.5 –1.5; 1.2 1.8 1.6 0.6 0.8 0.5 0.2 0.8 –1.5 –1.3]; 训练样本对应的分类&#xff1a; T [1 1 1 0 0 1 1 1 0 0 ;0 0 0 0 0 1 1 1 1 1]; 用MATLAB实现分类&…

LeetCode 1218. 最长定差子序列(哈希map)

1. 题目 给你一个整数数组 arr 和一个整数 difference&#xff0c;请你找出 arr 中所有相邻元素之间的差等于给定 difference 的等差子序列&#xff0c;并返回其中最长的等差子序列的长度。 示例 1&#xff1a; 输入&#xff1a;arr [1,2,3,4], difference 1 输出&#xff…

缺失值处理 - 定位空值并用空值的上一个值填充 - (Excel)

今天小助理很烦恼&#xff0c;说要处理一批汇率的数据&#xff0c;用近邻日期的汇率填充汇率为空的日期的汇率&#xff0c;这句话比较拗口&#xff0c;我们用数据解释一下。 比如下表&#xff0c;10月6日和10月8日9日的汇率没有采集到&#xff0c;那么我们就用10月5日的汇率填…

C#开发基础类库

下载地址&#xff1a;http://files.cnblogs.com/dashi/Sxmobi.rar转载于:https://www.cnblogs.com/dashi/archive/2011/09/09/2172506.html

LeetCode 1027. 最长等差数列(DP)

1. 题目 给定一个整数数组 A&#xff0c;返回 A 中最长等差子序列的长度。 回想一下&#xff0c;A 的子序列是列表 A[i_1], A[i_2], ..., A[i_k] 其中 0 < i_1 < i_2 < ... < i_k < A.length - 1。并且如果 B[i1] - B[i]( 0 < i < B.length - 1) 的值都…

因子分析模型 - 因子分析法原理与代码实现 -(Python,R)

因子分析基本思想 和主成分分析相似&#xff0c;首先从原理上说&#xff0c;主成分分析是试图寻找原有自变量的一个线性组合&#xff0c;取出对线性关系影响较大的原始数据&#xff0c;作为主要成分。 因子分析&#xff0c;是假设所有的自变量可以通过若干个因子&#xff08;中…

如何将两个DateTimePicker的日期和时间组合成一个值

有两个DateTimePicker&#xff0c;DateTimePicker1用于选择日期&#xff0c;DateTimePicker2用于选择Time&#xff0c;现在需要将两个DateTimePicker的值组合成一个DateTime使用。 方法&#xff1a; 1: DateTime dtTime Convert.ToDateTime(dateTimePicker1.Value.ToShortDate…

LeetCode 1255. 得分最高的单词集合(回溯)

1. 题目 你将会得到一份单词表 words&#xff0c;一个字母表 letters &#xff08;可能会有重复字母&#xff09;&#xff0c;以及每个字母对应的得分情况表 score。 请你帮忙计算玩家在单词拼写游戏中所能获得的「最高得分」&#xff1a;能够由 letters 里的字母拼写出的 任…

推荐几个网站 - (可视化、博客、社区、学习网站)

------------------------------------------------------------------------------------------------------------- 作者&#xff1a;Mf是个大坏蛋 原文&#xff1a;https://blog.csdn.net/destinymf/article/details/81186452 ----------------------------------------…

对Java注解(Annotation)初步的认识

----------------------android培训、java培训、期待与您交流&#xff01; ---------------------- 为注解增加属性 例如&#xff1a; import java.lang.annotation.Retention;import java.lang.annotation.RetentionPolicy;Retention(RetentionPolicy.RUNTIME)public interfac…

LeetCode 789. 逃脱阻碍者(曼哈顿距离)

1. 题目 你在进行一个简化版的吃豆人游戏。 你从 (0, 0) 点开始出发&#xff0c;你的目的地是 (target[0], target[1]) 。地图上有一些阻碍者&#xff0c;第 i 个阻碍者从 (ghosts[i][0], ghosts[i][1]) 出发。 每一回合&#xff0c;你和阻碍者们可以同时向东&#xff0c;西&…

ACDSee Photo Manager 12 中文绿色版

用WinRAR解压即玩&#xff0c;无需安装。可以拷贝到USB硬盘&#xff0c;便于携带 凭借易于使用且速度极快的特点&#xff0c;ACDSee 12提供了整理相片、优化拍摄以及与亲朋好友分享往事所需的全部功能。 幻灯片浏览 支持幻灯片浏览图片&#xff0c;并支持背景音乐和多种多样的图…

排序算法 - 6种 - 超炫的动画演示 - Python实现

1.冒泡排序 思路&#xff1a;遍历列表&#xff0c;每一轮每次比较相邻两项&#xff0c;将无序的两项交换&#xff0c;下一轮遍历比前一轮比较次数减1。 def bubble_sort(a_list):for passnum in range(len(a_list)-1, 0, -1):for i in range(passnum):if a_list[i] > a_list…

LeetCode 565. 数组嵌套

1. 题目 索引从0开始长度为N的数组A&#xff0c;包含0到N - 1的所有整数。 找到最大的集合S并返回其大小&#xff0c;其中 S[i] {A[i], A[A[i]], A[A[A[i]]], ... }且遵守以下的规则。 假设选择索引为i的元素A[i]为S的第一个元素&#xff0c;S的下一个元素应该是A[A[i]]&…