爬取新闻

import requests
from bs4 import BeautifulSoup
url='http://news.gzcc.cn/html/xiaoyuanxinwen/'
res=requests.get(url)
res.encoding='utf-8'
soup=BeautifulSoup(res.text,'html.parser')

1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。

for news in soup.select('li'):if len(news.select('.news-list-title'))>0:t=news.select('.news-list-title')[0].text #标题a=news.select('a')[0].attrs['href'] #链接res1=requests.get(a)res1.encoding='utf-8'soup1=BeautifulSoup(res1.text,'html.parser')d=soup1.select('#content')[0].text #正文print(t,a,d)

2. 分析字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。

for news in soup.select('li'):if len(news.select('.news-list-title'))>0:t=news.select('.news-list-title')[0].text #标题a=news.select('a')[0].attrs['href'] #链接res1=requests.get(a)res1.encoding='utf-8'soup1=BeautifulSoup(res1.text,'html.parser')info=soup1.select('.show-info')[0].textprint(info)

3. 将其中的发布时间由str转换成datetime类型。

from datetime import datetime
str = '2018-04-02 17:10:12 '
datetime.strptime(str,'%Y-%m-%d %H:%M:%S ')
print('\n',str)

转载于:https://www.cnblogs.com/BOBOWZH/p/8696625.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/369168.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

平衡二叉树的自顶向下递归和自底向上递归

没太搞懂自顶向下和自底向上的递归区别

【简记】HTML CSS 的一些要点(不定时更新)

1.td占据多行 / 列时,其挤开的 td 不写(但是包裹 td 的 tr 要写) 2. display:td 的元素中的文本默认垂直不居中(table中的td中的文本是垂直居中的) 3.th虽然定义了表头标题,但是默认不跨行(需…

通过地址访问 mysql_MySql通过ip地址进行访问的方法

1.登录mysql:mysql -u root -h 127.0.0.1 -p2.切换数据库use mysql3.授权grant all privileges on *.* to root127.0.0.1identified by 密码;将127.0.0.1换成公网的ip地址。4.检查my.ini4.1 看看是否有skip-networkingskip-networking开启该选项后就不能远程访问MyS…

幻像类型提高了编译时的安全性

介绍 使用幻像类型是一种非常简单的技术,可用于提高代码的编译时安全性。 有许多潜在的用例具有不同的复杂性级别,但是即使幻像类型的使用非常轻巧,也可以显着提高编译时的安全性。 幻像类型只是带有未使用类型参数的参数化类型。 例如&#…

NI Multisim元件库:在Multisim中创建自定义元器件

转载于: http://www.ni.com/tutorial/3173/zhs/ 概览 「在Multisim中创建自定义元器件」与「在 NI Ultiboard中创建自定义元器件」为您提供了关于如何直观、快速地学习如何创建您自己的自定义元器件的信息资源。目录 引言步骤一:输入初始元器件信息步骤二…

字符串的预处理

C isalpha、isalnum、islower、isupper用法 https://blog.csdn.net/weixin_41162823/article/details/80172379 C/C库函数(tolower/toupper)实现字母的大小写转换 https://blog.csdn.net/laozhuxinlu/article/details/51539737 字符串的逆序 https:…

2017年最新基于Bootstrap 4 的专业、多用途响应式布局的系统模板

本文分享一款2017年最新的2017年最新基于Bootstrap 4 的专业、多用途响应式布局的系统模板,该模板是一款强大并且非常灵活的后台管理系统模板:能适应绝大多数的web应用程序开发,比如:APP的管理后台,电商网站&#xff0…

apache gobblin mysql_gobblin简单使用

一、下载编译解压后查看目录下是否存在gradle/wrapper/gradle-wrapper.jar 文件使用 ./gradlew build -x findbugsMain -x test -x rat -x checkstyleMain编译项目(因网络因素可能有几次失败)编译后文件apache-gobblin-incubating-bin-0.14.0.tar.gz二、配置编写启动命令(需指定…

liunx之Centos6.8杀毒软件的安装

作者:邓聪聪 为了防止服务器中病毒,安装了类似与Windowns的杀毒软件Clanav,过程如下 首先下载clamav的软件包,官方下载地址为http://www.clamav.net/download.html 。我这里是下载好的rpm包链接:https://pan.baidu.com/s/1n052Udk…

上位机串行通讯的通用思路

先上代码: public class SerialPortServer{//字段SerialPort SP new SerialPort();int DelayTime 5000;//默认是5sstring Info "";string SendStringBuffer "";string ReceiveStringBuffer "";//构造函数public SerialPortServe…

您的日志就是您的数据:logstash + elasticsearch

今天的帖子的主题与日常的编码和开发无关,但是涵盖了一个非常重要的主题:我们的应用程序日志文件。 我们的应用程序确实会生成大量日志,如果处理正确,则非常有助于解决问题。 如果您启动并运行一个应用程序并没什么大不了&#xf…

关于C++中二维vector使用

https://blog.csdn.net/u014453443/article/details/98057251

面向对象设计与构造第一次总结作业

第一次作业——多项式计算 ---结构分析 第一次作业我只使用了两个类,正像下面的类图所表示的那样,分别是Poly和ComputePoly。Poly类是不可变的,能保存一个多项式,可以进行加、减运算。ComputePoly是程序的主类,能够读取…

想提升java知识的同学请进

这是我最近在整理的笔记,大家可以看看。 https://www.gitbook.com/book/jackal007/java_more/ 如果觉得有问题可以提出,随时修改。 这个笔记是我花了好多时间看各种书籍,博客后整理的,希望能帮助到更多的朋友。转载于:https://www…

mysql 3种报错_MySQL读取Binlog日志常见的3种错误-阿里云开发者社区

MySQL读取Binlog日志常见的3种错误mysqlbinlog: [ERROR] unknown variable default-character-setutf8mb4当我们在my.cnf中添加default-character-setutf8mb4选项,那么在mysqlbinlog查看binlog时就会报错。解决方案:.mysqlbinlog 后面添加 --no-defaults…

膨胀的JavaBeans –不要在您的API中添加“ Getters”

我已经最近在博客的想法的JavaBeans™如何可以扩展以减少在Java世界中,这被广泛接受的公约设立的膨胀。 该文章在DZone上重新发布,并在这里获得了颇具争议的反馈(例如,大多数试图将一些新想法带入Java世界的想法)。 我…

css:hover伪类的使用

&#xff1a;hover的使用&#xff0c;即当鼠标指针移入元素时&#xff0c;所做出的样式设置 示例一 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>demo01</title><style>*{margin: 0;p…

Redis内存淘汰机制

转自&#xff1a;https://my.oschina.net/andylucc/blog/741965 摘要 Redis是一款优秀的、开源的内存数据库&#xff0c;我在阅读Redis源码实现的过程中&#xff0c;时时刻刻能感受到Redis作者为更好地使用内存而费尽各种心思&#xff0c;例如最明显的是对于同一种数据结构在不…

python字符串常见操作

字符串常见操作 如有字符串mystr hello world itcast and itcastcpp&#xff0c;以下是常见的操作 <1>find 检测 str 是否包含在 mystr中&#xff0c;如果是返回开始的索引值&#xff0c;否则返回-1 mystr.find(str, start0, endlen(mystr))<2>index 跟find()方法…

mysql数据库的体系结构包括什么组件_MySQL数据库的体系结构

MySQL体系结构遵循C/S模型&#xff0c;即客户机/服务器模型&#xff0c;MySQL客户机通过原生的多种接口&#xff0c;可以与MySQL服务器进行交互。MySQL数据库是单进程多线程的架构&#xff0c;同windows平台下的Oracle数据库与全平台下的达梦数据库一样&#xff0c;采取单进程多…