pyqt5 + pyinstaller 制作爬虫小程序

 

环境:mac python3.7 pyqt5 pyinstaller

ps: 主要是熟悉pyqt5, 加入了单选框 输入框 文本框 文件夹选择框及日历下拉框

效果图:

 

pyqt5 主程序文件 

# -*- coding: utf-8 -*-
# @Author: Mehaei
# @Date:   2019-07-10 13:02:56
# @Last Modified by:   Mehaei
# @Last Modified time: 2019-07-15 16:43:18
import os
import uuid
import sys
import time
import json
from PyQt5.QtGui import QRegExpValidator, QIntValidator
from PyQt5.QtCore import QDate, QBasicTimer, QRegExp
from PyQt5.QtWidgets import (QWidget, QDesktopWidget, QApplication, QMessageBox, QPushButton, QLabel, QLineEdit, QGridLayout, QComboBox,QDateTimeEdit, QFileDialog, QProgressBar, QTextEdit)from worker import Workerclass Example(QWidget):def __init__(self, *args, **kwargs):super().__init__(*args, **kwargs)self.initUI()def initUI(self):# 主窗口大小self.resize(500, 400)self.center()self.cwd = os.getcwd()url = QLabel('url')proxy = QLabel("proxy")count = QLabel("count")start_time = QLabel("start_time")end_time = QLabel("end_time")data_dir = QLabel("data_dir")shop_info = QLabel("shop_info")self.shopEdit = QTextEdit()# 文件选择框self.btn_chooseDir = QPushButton(self)self.btn_chooseDir.setObjectName("btn_chooseDir")self.btn_chooseDir.setText("choose dir")self.btn_chooseDir.clicked.connect(self.slot_btn_chooseDir)# url正则验证 仅限amazonurl_regex = QRegExp(r'http[s]{0,1}://www.amazon.+')url_line_re = QRegExpValidator(self)url_line_re.setRegExp(url_regex)self.urlEdit = QLineEdit()self.urlEdit.setPlaceholderText("Please product url")self.urlEdit.setValidator(url_line_re)# 下拉框self.proxyCom = QComboBox()self.proxyCom.addItem("adsl(default)")self.proxyCom.addItem("None")self.countEdit = QLineEdit()self.countEdit.setText("100")int_limit = QIntValidator(self)int_limit.setRange(1, 50000)self.countEdit.setValidator(int_limit)self.startdateEdit = QDateTimeEdit(QDate.currentDate(), self)self.startdateEdit.setDisplayFormat("yyyy-MM-dd HH:mm:ss")self.startdateEdit.setCalendarPopup(True)self.startdateEdit.dateChanged.connect(self.get_start_date)self.enddateEdit = QDateTimeEdit(QDate.currentDate(), self)self.enddateEdit.setDisplayFormat("yyyy-MM-dd HH:mm:ss")self.enddateEdit.setCalendarPopup(True)self.enddateEdit.dateChanged.connect(self.get_end_date)self.shopbtn = QPushButton('Shop', self)# self.btn.move(40, 80)
        self.shopbtn.clicked.connect(self.get_shop)self.reviewbtn = QPushButton('Review', self)# self.btn.move(40, 80)
        self.reviewbtn.clicked.connect(self.get_review)grid = QGridLayout()grid.setSpacing(5)grid.addWidget(url, 1, 0)grid.addWidget(self.urlEdit, 1, 1, 1, 4)grid.addWidget(proxy, 2, 0)grid.addWidget(self.proxyCom, 2, 1)grid.addWidget(count, 2, 2, 1, 2)grid.addWidget(self.countEdit, 2, 4)grid.addWidget(start_time, 3, 0)grid.addWidget(self.startdateEdit, 3, 1)grid.addWidget(end_time, 3, 2, 1, 2)grid.addWidget(self.enddateEdit, 3, 4)grid.addWidget(data_dir, 4, 0)grid.addWidget(self.btn_chooseDir, 4, 1)grid.addWidget(shop_info, 5, 0)grid.addWidget(self.shopEdit, 5, 1, 5, 5)grid.addWidget(self.pbar, 10, 0, 1, 5)grid.addWidget(self.shopbtn, 11, 0, 1, 2)grid.addWidget(self.reviewbtn, 11, 3, 1, 2)self.setLayout(grid) self.setWindowTitle('Amazon Crawl')self.show()def center(self):qr = self.frameGeometry()cp = QDesktopWidget().availableGeometry().center()qr.moveCenter(cp)self.move(qr.topLeft())def get_start_date(self):dateTime = self.startdateEdit.dateTime()def get_end_date(self):dateTime = self.enddateEdit.dateTime()def slot_btn_chooseDir(self):self.dir_choose = QFileDialog.getExistingDirectory(self,"Choose data save dir",self.cwd) # 起始路径if self.dir_choose == "":return Falseself.btn_chooseDir.setText(self.dir_choose)def warning(self, title, content):QMessageBox.warning(self, title, content)def get_shop(self):try:self.dir_chooseexcept Exception:self.dir_choose = "./data/"params = {"id": str(uuid.uuid4()).replace("-", ""),"url": self.urlEdit.text(),"proxy_type": self.proxyCom.currentText(),"count": self.countEdit.text(),"start_time": self.time_to_time_stamp(self.startdateEdit.text()),"end_time": self.time_to_time_stamp(self.enddateEdit.text()),"data_save_dir": self.dir_choose}if not params["url"]:self.warning("Url is Null", "Please input product url")return Falseself.work = Worker(**params)self.shop_detail = self.work.start(shop=True, product_detail=None)self.shopEdit.setText(json.dumps(self.shop_detail, indent=4))def get_review(self):try:self.shop_detailexcept Exception as e:self.warning("Product info is Null", "Please get product info")return Falseself.work.start(shop=False, product_detail=self.shop_detail)QMessageBox.information(self,"Review done","%s review crawl done, count:%s, Save to: %s" % (self.urlEdit.text(), self.amazon.cralwer_data_num, self.amazon.file_data_pname) if self.amazon.cralwer_data_num else "%s review crawl done, count:%s" % (self.urlEdit.text(), self.amazon.cralwer_data_num))def closeEvent(self, event):reply = QMessageBox.question(self, 'Message',"Are you sure to quit?", QMessageBox.Yes |QMessageBox.No, QMessageBox.No)if reply == QMessageBox.Yes:event.accept()else:event.ignore()def time_to_time_stamp(self, time_value):time_array = time.strptime(time_value, "%Y-%m-%d %H:%M:%S")return int(time.mktime(time_array) * 1000)if __name__ == '__main__':app = QApplication(sys.argv)ex = Example()sys.exit(app.exec_())

 

仅个人学习参考, 如有疑问,欢迎交流

--------------------------------

 

 

 

 

 

转载于:https://www.cnblogs.com/mswei/p/11189916.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/448318.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

axios中出现两次请求,OPTIONS请求和GET请求

在项目中发现ajax中出现两次请求,OPTIONS请求和GET请求 查看到浏览器NetWork有两次请求,请求url一样: 查找原因是浏览器对简单跨域请求和复杂跨域请求的处理区别。 XMLHttpRequest会遵守同源策略(same-origin policy). 也即脚本只能访问相同协…

Linux 安装 配置 Maven

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 1.需要提前安装JDK,并且配置环境变量 请参考:https://blog.csdn.net/jiangyu1013/article/details/84321146 2.…

[Git高级教程 (一)] 通过 Tag 标签回退版本修复 bug

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 1 前言 本系列之所以取名”Git高级教程”,主要是教大家解决实际工作中遇到的问题,要求读者会基本的Git用法和命令…

Javascript 自定义输出

缘由 前段时间再看了一些javascript的学习资料,也写的一些demo,在输出的时候一般都用alert,但这个方法会打断函数运行,用起来不是很好.还有就是console.log这个方法,这种方法原来一直以为只能在FireFox上面才能用,现在才发现主流浏览器都支持.但我的这个插件已经写的差不多了,所…

uplift model学习笔记

一、解决的问题: 通常的 Propensity Model 和 Response Model 只是给目标用户打了个分,并没有确保模型的结果可以使得活动的提升最大化;它没有告诉市场营销人员,哪个用户最有可能提升活动响应; 因此,需要另…

设计模式之依赖倒置原则

在传统的过程式中,上层依赖于底层,当底层变化,上层也得跟着做出相应的变化。这就是面向过程的思想,弊端就是导致程序的复用性降低并且提高了开发的成本。 而面向对象的开发则很好的解决了这个问题,让用户程序依赖于抽象…

@Transactional 详解

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 Transactional 是声明式事务管理 编程中使用的注解 1 .添加位置 1)接口实现类或接口实现方法上,而不是接口类中…

LiveGBS高性能GB28181国标流媒体服务流传输模式支持UDP、TCP被动、TCP主动模式

LiveGBS国标(GB28181)流媒体服务软件: 提供用户管理及Web可视化页面管理; 提供设备状态管理,可实时查看设备是否掉线等信息; 实时流媒体处理,PS(TS)转ES; 设备状态监测、云台控制、录…

RuntimeException 和 Exception 区别、异常的子父级关系

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 1.java 将所有的错误封装为一个对象,其根本父类为Throwable, Throwable 有两个子类:Error 和 Exception。 2.Err…

C语言笔记(关键字)

gdb调试 gcc 源程序 -g;加gdb调试信息gdb可执行程序;(gdb调试)l(ist):查看源码,按一下从main开始10行以此往后l n:查看n处上下10行的源码run:运行程序b&…

C语言笔记(符号)

注释符号 几个似非而是的注释问题 例子: (A) int / * ... * /i; (B) char * s "abcdefgh //hijklmn"; (C) //Is it a \valid comment? (D) in/ * ... * /t i; 我们知道C语言里可以有两种注释方式:“/* */” 和 “ // ”。那么上面几条…

java 命令: jmap 命令使用 ( 查看内存使用、设置 )

jdk安装后会自带一些小工具,jmap命令(Java Memory Map)是其中之一。主要用于打印指定Java进程(或核心文件、远程调试服务器)的共享对象内存映射或堆内存细节。 jmap命令可以获得运行中的jvm的堆的快照,从而可以离线分析堆,以检查内存泄漏&am…

只用一套解决方案,就可解决80%的交通物流行业信息难题

行业背景 新中国成立70多年来,中国交通运输总体上已经形成了多节点、全覆盖的综合运输网络,“五纵五横”综合运输大通道基本贯通,一大批综合客运、货运枢纽站场(物流园区)投入运营,取得了一系列瞩目成果&am…

Linux 使用 jstat 命令查看 jvm 的 GC 情况

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 Options,选项,我们一般使用 -gcutil 查看gc情况 vmid,VM的进程号,即当前运行的java进程号…

Docker 方式安装 Nginx 、阿里云服务器上装 Ngnix

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 非 Docker 方式安装,直接 Linux 安装见另一文:Linux 上 安装 nginx 、阿里云服务器上安装 nginx 1. 直接从镜像仓…

C#实现A*算法

理解A*寻路算法具体过程 这两天研究了下 A* 寻路算法, 主要学习了这篇文章, 但这篇翻译得不是很好, 我花了很久才看明白文章中的各种指代. 特写此篇博客用来总结, 并写了寻路算法的代码, 觉得有用的同学可以看看. 另外因为图片制作起来比较麻烦, 所以我用的是原文里的图片. 当…

玩转数据结构——均摊复杂度和防止复杂度的震荡(笔记)

数据规模 时间复杂度 并不是所有的双层循环都是O&#xff08;n^2&#xff09;的 复杂度实验来确定复杂度 // O(N) 两倍增加 int findMax( int arr[], int n ){assert( n > 0 );int res arr[0];for( int i 1 ; i < n ; i )if( arr[i] > res )res arr[i];return res…

解决:bash: vim: command not found、docker 容器不识别 vi / vim 、docker 容器中安装 vim

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 1. 在 Docker 容器中编辑文件&#xff0c;报错如下&#xff1a; bash: vim: command not found2. 安装 vim &#xff1a; apt-get in…

怎样正确使用车灯?

当我们被对面来车明晃晃的远光灯照得意识模糊时&#xff0c;当你快速接近一辆摩托车却发现那是一辆坏了一盏尾灯的卡车时&#xff0c;或是当你前方的小车忽然亮起倒车灯却在往前行驶&#xff0c;最后意识到那只是因为刹车灯与倒车灯线路颠倒时&#xff0c;你就会发现在人们都认…

如何配置DDS以使用多个网络接口?How do I configure DDS to work with multiple network interfaces?

最近在使用OpenDDS的时候遇到一个问题&#xff1a;存在多个虚拟网卡时&#xff0c;发布&#xff08;订阅&#xff09;端重新连接时会阻塞几分钟&#xff0c;在外网找到一篇与此相关的文章。 You cannot specify which NICs DDS will use to send data. You can restrict the NI…