POP3和IMAP是邮件相关的协议,IMAP是比POP3更高级一点的协议,实现了了客户端和服务端的交互;邮件协议在实际工作中的应用较为广泛。
POP3
它是因特网电子邮件的第一个离线协议标准,POP3允许用户从服务器上把邮件存储到本地主机(即自己的计算机)上,POP3协议允许电子邮件客户端下载服务器上的邮件,但是在客户端的操作(如移动邮件、标记已读等),不会反馈到服务器上
SMTP
SMTP 的全称是“Simple Mail Transfer Protocol”,即简单邮件传输协议。它是一组用于从源地址到目的地址传输邮件的规范,通过它来控制邮件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。SMTP 服务器就是遵循 SMTP 协议的发送邮件服务器。
SMTP 认证,简单地说就是要求必须在提供了账户名和密码之后才可以登录 SMTP 服务器,这就使得那些垃圾邮件的散播者无可乘之机。
增加 SMTP 认证的目的是为了使用户避免受到垃圾邮件的侵扰。
IMAP
IMAP全称是Internet Mail Access Protocol,即交互式邮件存取协议,它是跟POP3类似邮件访问标准协议之一。不同的是,开启了IMAP后,您在电子邮件客户端收取的邮件仍然保留在服务器上,同时在客户端上的操作都会反馈到服务器上,如:删除邮件,标记已读等,服务器上的邮件也会做相应的动作。
在python中支持POP3协议,也支持IMAP协议,但是IMAP因为其交互性逐渐取代了POP3成为了邮件服务器与客户端的交互,下面主要使用IMAP协议来获取邮件正文、附件、移动或删除邮件。
import re
import email
from imapclient import IMAPClient
import traceback
class EmailRead(object):
"""实现读取邮件正文、读取附件功能、移动邮件、删除邮件"""
def __init__(self, user, passwd, index_file, re_list, server_adderss, port, move_file=None):
"""
:param user: 登陆用户名
:param passwd: 登陆密码
:param index_file: 需要查询的邮件文件夹
:param re_list: 需要查找的邮件主题满足的正则表达式
:param move_file: 将邮件移动到该文件夹
:param server_adderss: 邮件服务器地址
:param port: 邮件服务器IMAP协议端口
"""
self.server_address = server_adderss
self.user = user
self.password = passwd
self.index_file = index_file
self.move_file = move_file
self.re_list = re_list
self.server = None
self.port = port
self.item = None
self.file_type_list = ['image/jpeg', 'application/vnd.openxmlformats-officedocument.spreadsheetml.sheet']
def reade_email(self):
"""
查找邮件并根据附件类型下载附件
:return:
"""
self.server = IMAPClient(self.server_address, port=993, ssl=True)
self.server.login(self.user, self.password)
self.server.select_folder(self.index_file, readonly=False)
result = self.server.search(['all']) # 获取所有邮件
if result:
self.messages = self.server.fetch(result, ['BODY.PEEK[]'])
for message_id, message in self.messages.items():
e = email.message_from_string(message[b'BODY[]'].decode())
# 生成Message类型 e
try:
subject = str(email.header.make_header(
email.header.decode_header(e['SUBJECT']))) # 解码subject
except:
subject = e['SUBJECT']
"""正则匹配标题中的 MSO """
if self.subject_re(subject):
"""获取附件和正文"""
for part in e.walk():
filename = part.get_filename()
content_type = part.get_content_type()
con = part.get_payload(decode=False)
if not filename and content_type == 'text/html':
if isinstance(con, bytes):
con = part.get_payload(decode=True).decode()
elif filename and content_type in self.file_type_list:
con = part.get_payload(decode=True)
with open(filename, 'wb') as f:
f.write(con)
f.close()
else:
# list返回附件对象作用类似于e
pass
def move_email(self, *id):
"""邮件移动和删除功能:传入的move_file是None则不移动只删除"""
messages = self.server.fetch(list(id), ['BODY.PEEK[]'])
if None!= self.move_file:
self.server.copy(messages, self.move_file) # move
self.server.delete_messages(messages) # delete
self.server.expunge() # save delete
def subject_re(self, subject):
"""用于匹配主题正则表达式"""
for i in self.re_list:
mso_re = re.search(i, subject)
if mso_re:
return True
else:
pass
return False
defclose(self):
self.server.logout()
该系统也可以用于解决部分邮件验证的,可以直接从邮件获取到验证码的正文,并进一步提取。