python天气预报官网_python 实现对天气预报官网未来一周七天的天气情况抓取

通过HTMLPaser和urlib模块对网页进行抓取并分析

实现步骤:

1、自定义MYHTMLParser类

2、实例化类并访问天气预报官网

3、抓取关键数据

4、对数据进行切片处理并输出字典

from html.parser import HTMLPaser   #处理页面模块

from urllib import request  #访问网站模块

L = []  #定义列表接受抓取的信息

class MYHTMLPaser(HTMLParser):  #自定义MYHTMLParser类重写方法

#定义三个函数

#handle_starttag:处理开始标签  attrs:标签属性 tag:标签

a_t = False #定义a_t变量为提出标签内容时的判断做准备

def handle_starttag(self,tag,attrs):

if tag == "h1" and len(attrs) == 0:  #找出不带属性的h1标签

self.a_t = True

else  tag == "p" and len(attrs) > 1: #找出属性大于1的p标签

self.a_t = True

#handle_data:处理标签内容 data:标签内容

def handle_data(self,data):

if self.a_t ==True:  #取出h1标签p标签的内容并添加到L列表中

L.append(data)

#handle_endtag:处理结束标签

def handle_endtag(self,tag):

self.a_t = False #一个标签读取完成后恢复a_t变量为下一个标签的读取判断做准备

#自定义类实例化

p = MYHTMLParser()

#访问天气预报官网

with request.urlopen("http://www.weather.com.cn/weather/101010100.shtml") as f:

data  = f.read().decode('utf-8')   #读取网页数据

#解析网页信息查找未来七天的天气情况并输出到列表中

p.feed(str(data))

p.close() #关闭资源

#对列表进行操作输出字典

L1 = list(list(L)[2:-6])[1:][::2]

L2 = list(list(L)[2:-6])[::2]

weather = dict(zip(L2,L1))

#输出天气

print(weather)

输出结果如下图:

源码如下:

# 本模块对一周天气情况进行爬虫

fromhtml.parserimportHTMLParser

fromurllibimportrequest

importre

# 自定义MYHTMLParser类

L = []

classMYHTMLParser(HTMLParser):

a_t =False

def handle_starttag(self,tag,attrs):

if tag =="h1"andlen(attrs) ==0:

self.a_t =True

elif tag =="p"andlen(attrs) >1:

self.a_t =True

def handle_data(self,data):

ifself.a_t ==True:

L.append(data)

def  handle_endtag(self,tag):

self.a_t =False

# 自自定义类实例化

p = MYHTMLParser()

# 访问天气预报官网

withrequest.urlopen("http://www.weather.com.cn/weather/101010100.shtml")asf:

data = f.read().decode('utf-8')

# 解析网页输出关键信息

p.feed(str(data))

p.close()

# 转成字典

L1 =list(list(L)[2:-6])[1:][::2]

L2 =list(list(L)[2:-6])[::2]

weather =dict(zip(L2,L1))

print(weather)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/474787.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 536. 从字符串生成二叉树(递归)

文章目录1. 题目2. 解题1. 题目 你需要从一个包括括号和整数的字符串构建一棵二叉树。 输入的字符串代表一棵二叉树。 它包括整数和随后的0,1或2对括号。 整数代表根的值,一对括号内表示同样结构的子树。 若存在左子结点,则从左子结点开始…

LeetCode 1062. 最长重复子串(二分查找)

文章目录1. 题目2. 解题1. 题目 给定字符串 S,找出最长重复子串的长度。如果不存在重复子串就返回 0。 示例 1: 输入:"abcd" 输出:0 解释:没有重复子串。示例 2: 输入:"abbaba…

测试工具的选择和使用

Parasoft白盒测试工具集 工具名支持语言环境简介JtestJava代码分析和动态类、组件测试JcontractJava实时性能监控以及分析优化C TestC,C代码分析和动态测试CodeWizardC,C代码静态分析InsureC,C实时性能监控以及分析优化.test.Net代码分析和动态测试Compuware白盒测试工具集 工具…

ios定位权限plist_iOS-info.plist 中添加定位权限

一般在项目中添加权限只需要看这一篇文章:https://www.jianshu.com/p/2a309504cec8 就够了,但是位置权限说明有点麻烦,现总结如下,方便后期使用。定位权限一般有四个:NSLocationWhenInUseUsageDescriptionNSLocationAl…

iOS 6 的5个新特性创建杀手级应用

下面是5个iOS 6 的新特性,可以根据需要集成到新的App中: 1. Sharing 一个新的Social 框架,提供了简单的接口访问用户的social media账户,如Twitter、Facebook和中国的微博服务等等。你可以手工处理,或者简单实用UIKit的…

LeetCode MySQL 1174. 即时食物配送 II

文章目录1. 题目2. 解题1. 题目 配送表: Delivery -------------------------------------- | Column Name | Type | -------------------------------------- | delivery_id | int | | customer_id | int | | o…

python的魔法_python魔法方法大全

魔法方法含义基本的魔法方法__new__(cls[, ...])1. __new__ 是在一个对象实例化的时候所调用的第一个方法2. 它的第一个参数是这个类,其他的参数是用来直接传递给 __init__ 方法3. __new__ 决定是否要使用该 __init__ 方法,因为 __new__ 可以调用其他类的…

存储过程语法

View Code 存储过程如同一门程序设计语言,同样包含了数据类型、流程控制、输入和输出和它自己的函数库。--------------------基本语法--------------------一.创建存储过程 create procedure sp_name() begin ......... end二.调用存储过程 1.基本语法&#xff1a…

LeetCode MySQL 1158. 市场分析 I

文章目录1. 题目2. 解题1. 题目 Table: Users ------------------------- | Column Name | Type | ------------------------- | user_id | int | | join_date | date | | favorite_brand | varchar | ------------------------- 此表主键是 user_i…

sqlite 数据量_向SQLite批量导入csv,txt数据

将csv或者txt格式的文件导入SQLite一般有两种方式:使用pandas.readcsv()读取后,用to_sql方法写入数据库使用SQLiteStudio创建表格,再导入数据但是这两种方法在数据量比较大的时候会非常慢,这里提供一种使用官网提供的SQLite.exe命…

ASP.NET MVC URL重写与优化(进阶篇)-继承RouteBase玩转URL(转)

http://www.cnblogs.com/John-Connor/archive/2012/05/03/2478821.html 引言-- 在初级篇中,我们介绍了如何利用基于ASP.NET MVC的Web程序中的Global文件来简单的重写路由。也介绍了它本身的局限性-依赖于路由信息中的键值对: 如果键值对中没有的值,我们无…

LeetCode MySQL 580. 统计各专业学生人数

文章目录1. 题目2. 解题1. 题目 一所大学有 2 个数据表,分别是 student 和 department ,这两个表保存着每个专业的学生数据和院系数据。 写一个查询语句,查询 department 表中每个专业的学生人数 (即使没有学生的专业也需列出&a…

python数据抓取技术与实战训练_师傅带徒弟学Python:项目实战1:网络爬虫与抓取股票数据...

本视频基于**Python 3.X版本本视频课程是第四篇第一个实战项目,内容包括网络爬虫技术、使用urllib爬取数据、使用Selenium爬取数据、使用正则表达式、使用BeautifulSoup库、MySQL数据库、Python访问数据库、Lambda表达式和多线程。目录:22.1 网络爬虫技术…

gPodder 3.4 发布,播客接收器

gPodder 3.4 修复了 Youtube 和 Vimeo 下载的问题,更新了 Flattr 集成,性能和 UI 方面的改进等。 gPodder是播客接收器,采用Python和PyGTK开发。它帮你管理播客RSS供稿,并自动下载您想要的所有的播客许多资料。如果你对某个 供稿R…

LeetCode 1522. Diameter of N-Ary Tree(递归)

文章目录1. 题目2. 解题1. 题目 Given a root of an N-ary tree, you need to compute the length of the diameter of the tree. The diameter of an N-ary tree is the length of the longest path between any two nodes in the tree. This path may or may not pass thro…

python控制条件语句_Python条件控制语句

一、条件判断语句(if语句)执行的流程if语句在执行时,会先对条件表达式进行求值判断如果为True,则执行if后的语句如果为False,则不执行语法:if 条件表达式:代码块代码块代码中保留着一组代码,同一个代码块中…

LeetCode MySQL 1355. 活动参与者(any函数)

文章目录1. 题目2. 解题1. 题目 表: Friends ------------------------ | Column Name | Type | ------------------------ | id | int | | name | varchar | | activity | varchar | ------------------------ id 是朋友的 id 和该表的主…

python zipfile教程_Python中zipfile压缩文件模块的基本使用教程

zipfilePython 中 zipfile 模块提供了对 zip 压缩文件的一系列操作。fzipfile.ZipFile("test.zip",mode"") //解压是 r , 压缩是 w 追加压缩是 amode的几种:解压:r压缩:w追加压缩:a压缩一个文件创建一个压缩文…

asp不同编码下 UTF-8 GB2312转换收集

用于gb2312下接收新浪api 的json数据utf-8转gb2312 UTF-8字符转换成GB2312 Function UTF2GB(UTFStr) For Dig1 to len(UTFStr) if mid(UTFStr,Dig,1)"%" then if len(UTFStr) > Dig8 then GBStrGBStr & ConvChinese(mid(UTFStr,Dig,9)) DigDig8 else GBStrG…

LeetCode MySQL 578. 查询回答率最高的问题

文章目录1. 题目2. 解题1. 题目 从 survey_log 表中获得回答率最高的问题, survey_log 表包含这些列:id, action, question_id, answer_id, q_num, timestamp。 id 表示用户 id; action 有以下几种值:"show"&#xff…