python收集数据程序_基于Python语言的互联网数据收集软件的设计

软件建立所需的工具及其版本

编写环境与

IDE

Python3.5.2

Windows10

PyCharm

2016.3

Sublime

Text3

第三方库与版本号

Requests

2.12.1

BeautifulSoup

4.5.1

PYQT5

5.8.1

Pyinstaller

库的作用

用于爬虫编写

用于爬虫编写

用于软件

GUI

设计

用于封装

python

程序

1.1

百度地图数据的抓取

一般我们研究区域污染状况成因时,

需要找出污染源的坐

标,

就宏观研究而言,

百度地图是一个很好的选择。经过分析,

百度地图提供一个接口:

http://map.baidu.com/?newmap=1&req⁃

flag=pcmap&biz=1&from=webmap&da_par=direct&pcevaname=

pc4.1&qt=con&from=webmap&c=233&wd={}&pn={}

。其中

wd

表的是所需的查找内容,

pn

用于翻页。需要指出的是,

如果访

问过于快速,

会出现访问不成功现象,

这时需要放慢抓取速度

与设置断点续传的功能

[3]

。抓取数据坐标是百度墨卡托坐标,

与经纬度坐标有很大出入,

需要进行坐标转换。

1.2

空气质量数据的抓取设计

本软件的空气质量数据来源于网站:

http://www.pm25.in/

在抓取中由于

PC

端的网页采取的

Ajax

所以学采用

Selenium

Phantomjs

抓取,

但是会大量占用电脑内存与

CPU

。故笔者将

Headers

设置成手机以便正常抓取。由于代码较长不在此

放出。

1.3

空间热度图与点密度图绘制的设计

可以运用

Python

的标准库

matplotlib

绘制空间的点密度,

密度图,

及将上述地图中收集的数据反应的地图中。本软件只

是应用

hexbin

函数做了简单的绘制。由于需要将

matplotlib

PyQt5

开发的窗口内代码较长,

不再给出。

2

基于

PyQt5

GUI

设计

2.1

功能的描述

运用

PyQt5

进行

GUI

设计,

将上述

6

个爬虫进行封装

[2]

。其

中空气质量按钮对应空气质量数据收集

(自动每一小时收集一

次)

。其中,

坐标转换按钮为百度地图收集的数据的坐标转换

(需要

key

2.2

界面的设计与运行情况

为了简化界面,

将界面中的菜单栏与状态栏统统删除,

留下

6

个爬虫的相关按钮并尽可能放大

,

如图

2

。为了保证界

面的美观性,

不再允许用户将界面最大化,

即固定主界面的大

小。其中空气质量数据,

气象数据,

百度地图,

高德地图的二级

界面基本一致,

输入爬取内容与保存位置点击开始即可。

对于地图绘制功能,

是本软件实现的难点内容。需要将

matplotlib

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/534918.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Mysql保存是事件驱动吗_【CHRIS RICHARDSON 微服务系列】事件驱动的数据管理-5

编者的话 |本文来自 Nginx 官方博客,是「Chris Richardson 微服务」系列的第五篇文章。第一篇文章介绍了微服务架构模式,并且讨论了使用微服务的优缺点;第二和第三篇描述了微服务架构模块间通讯的不同方面;第四篇研究了服务发现中…

chrome postman插件_收集了一些Chrome插件神器,助你快速成为老司机

刚开始开发项目的时候,我一直都在用火狐,因为它有一个fireBug插件,特别好用(目前已不支持),也不知道什么时候,就一直用起来Chrome浏览器了,可能是因为它有强大的插件作为后盾吧。开发了这么多年&#xff0c…

phpmyadmin 导出mysql,在phpmyadmin中导入/导出非常大的mysql数据库

i have a db in phpmyadmin having 3000000 records. i want to export this to another pc. now when i export this only 200000 entries exported into .sql file and that is also not imported on the other pc.解决方案Answering this for anyone else who lands here. I…

python字符串是否包含某元素_Python实现判断一个字符串是否包含子串的方法总结...

本文实例总结了Python实现判断一个字符串是否包含子串的方法。分享给大家供大家参考,具体如下: 1.使用成员操作符 in >>> snihao,shijie >>> tnihao >>> result t in s >>> print result True 2.使用string模块的f…

python怎么全选_有没有一种方法可以在Python网页上模拟“全选复制粘贴”?

我对Python相当陌生,我不知道selenium是什么,但是如果您能够找到某种模式,您应该能够执行您描述的内容。关键是找到一个模式。下面是几个示例脚本,它们可能会让您了解如何开始。在import urllib2from bs4 import BeautifulSoupf …

python当前时间怎么弄_python获取当前时间

我有的时候写程序要用到当前时间,我就想用python去取当前的时间,虽然不是很难,但是老是忘记,用一次丢一次, 为了能够更好的记住,我今天特意写下这篇文章,如果你觉的对你有用的话,可以…

window.open不重复打开同一个名称的窗口_干货满满|Ctrl键的正确打开方式

“ctrl”是键盘中一个常用的键,全名为"control",中文意为"控制",在计算机基础中称为“控制键”。那么你知道“ctrl”都能控制什么吗?难道只知道 “ctrl”C 复制、“ctrl”V 粘贴 这些?&#xff1f…

java 按位_Java中的按位运算

一、位运算符简介:1.按位与&。如果两个整形数据 a、b 对应位都是1,则结果位才为1,否则为0,(int 最大值0x7fffffff ):1 int a 0x7fffffff;2 int b 12;3 int c 0;4 int aAndB a&b; //aAndB is 125 int aAndC a&c; …

jmeter安装包_分布式执行jmeter脚本步骤(非GUI)

备注:【Linux查看服务器是32位还是64位命令】uname -mgetconf LONG_BIT1.Linux环境安装jmeter可参考https://www.cnblogs.com/surewing/p/9271886.html如需要用到3台客户机,分别在三台机器中安装,以下安装之前需安装jdk环境1)将jm…

java mapreduce程序_简单的java Hadoop MapReduce程序(计算平均成绩)从打包到提交及运行...

[TOC]简单的java Hadoop MapReduce程序(计算平均成绩)从打包到提交及运行程序源码import java.io.IOException;import java.util.Iterator;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache…

python删除列表一段元素_Python基础--list列表删除元素

列表中删除元素主要分为以下 3 种场景: 根据目标元素所在位置的索引进行删除,可以使用 del 关键字或者 pop() 方法; 根据元素本身的值进行删除,可使用列表(list类型)提供的 remove() 方法; 将列…

microbit编程_使用图形化编程实现主控板与手机蓝牙通讯(2019.3.25)

本文转自:DFRobot创客社区原文链接:[Mind]使用图形化编程实现主控板与手机蓝牙通讯-Mind论坛-DF创客社区​mc.dfrobot.com.cn本帖最后由 Forgotten 于 2019-3-25 12:58 编辑做项目时我们经常会遇到蓝牙的问题,例如使用appinventor制作一个app…

山海伏妖录java_山海伏妖录攻略大全 剧情结局加点妖兽大全

山海伏妖录是一款非常经典的ARPG游戏,其中有许多的剧情,结局,妖兽以及加点方案。Remilia为大家带来山海伏妖录攻略大全,各种攻略都能在这里查到,助您畅玩山海伏妖录!山海伏妖录人物介绍配角介绍山海伏妖录结…

spark环境搭建java_Spark MLlib 环境搭建超详细教程

1、系统及环境版本系统:Win7 旗舰版 64位 sp1JDK:1.8.0Spark:2.3.2Hadoop:2.7Scala:2.11.8文章最后,有所有版本的下载链接,不用再去折腾版本之间的问题。2、环境下载2.1 Spark 下载spark2.2 had…

python自动发邮件附件_python自动发送带附件的邮件(163邮箱,亲测可用)

1.设置发送邮件邮箱的SMTP服务 https://www.360kuai.com/pc/927b9f8da3555bb70?cota4&kuai_so1&tj_urlxz&sign360_57c3bbd1&refer_sceneso_1 设置步骤时,记住设置的邮箱的独立密码,在以下脚本中能够用到2. python脚本 import smtplib f…

java 导出bcp文件格式_使用BCP导出导入数据

bcp 实用工具可以在 Microsoft SQL Server 实例和用户指定格式的数据文件间大容量复制数据。 使用 bcp 实用工具可以将大量新行导入 SQL Server 表,或将表数据导出到数据文件。 除非与 queryout 选项一起使用,否则使用该实用工具不需要了解 Transact-SQL…

learnpythonthehardway下载_LearnPythonTheHardWay学习笔记1:学习环境搭建

觉得学习这本书应该有笔记,所以就从这里开始吧。 学习资料: 1.《笨办法学Python》(承德-至阳整理 2013/7/19) 2.《Learn Python The Hard Way,3rd Edition》 (Zed A. Shaw 2010) 一、准备学习环境 &#xf…