python每天定时9点执行_[求助]关于twisted框架，如何每天定时执行一个scrapy爬虫...

RT，最近在学scrapy，写了一个简单的爬取网页数据的爬虫，利用CrawlProcess单次调用执行的时候没有问题，脚本如下，就是清空数据表然后爬取数据：

class updateBoardData:

def __init__(self):

self.db = connectMYSQL()

def update(self):

sql = "truncate table board_data;"

con = self.db.connect()

cursor = con.cursor()

cursor.execute(sql)

con.commit

cursor.close()

con.close()

print 'truncated'

process = CrawlerProcess(settings=get_project_settings())

process.crawl(board_spider)

process.start()

虽然单次执行没问题，但是在每日定时执行的脚本里调用这个类却出错了，每日执行的脚本如下，大意就是第一次执行爬虫后，每天凌晨0点定时执行爬虫：

SECONDS_PER_DAY = 24 * 60 * 60

upd = updateBoardData()

while True:

upd.update()

print datetime.now()

print 'n'+'n'+'n'+'n'

cur_time = datetime.now()

descTime = cur_time.replace(hour = 0, minute = 0, second = 0, microsecond = 0)

delaytime = cur_time - descTime

skipSeconds = SECONDS_PER_DAY - delaytime.total_seconds()

time.sleep(skipSeconds)

第一次调用该脚本会执行一次爬虫程序，但是等到0点的时候再次调用爬虫却报错了，报错信息为：

twisted.internet.error.ReactorNotRestartable

去查了一下twisted框架，发现在twisted中，reactor是单例模式，可能我在重复使用CrawlProcess的时候创建多个reactor实例，于是修改了一下爬虫的调用脚本测试了一下，只用单个实例来爬虫，修改后的代码如下：

class updateBoardData:

def __init__(self):

self.db = connectMYSQL()

self.process = CrawlerProcess(settings=get_project_settings())

self.process.crawl(board_spider)

def update(self):

con = self.db.connect()

cursor = con.cursor()

cursor.execute(sql)

con.commit

cursor.close()

con.close()

print 'truncated'

self.process.start()

a = updateBoardData()

a.update()

print 'pls wait 5s'

time.sleep(5)

a.update()

直接跑这个脚本，发现第一次执行函数没有问题，但是第二次执行函数的时候知识清空了数据表而爬虫程序却没有执行。执行的结果如下：

2017-01-19 15:40:47 [scrapy] INFO: Spider closed (finished)

pls wait 5s

truncated

到此，我的思路就卡住了，想不出问题处在哪里，定时执行scrapy爬虫应该是一个很常见的功能，可能是我的思路的方向错了，到底要怎样才能每天定时执行一个爬虫呢？

有没有人对Scrapy比较熟悉的，能够给一点意见吗？

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/521316.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python每天定时9点执行_[求助]关于twisted框架，如何每天定时执行一个scrapy爬虫...

相关文章

centos7 yum安装ifconfig

web前端规范

华为表示年内没有推出搭载鸿蒙操作系统手机的计划；OpenStack或被抛弃？iPhone至少还要三年可苹果自研5G调制解调器……...

获取控件enable状态_Android自定义组合控件数字加减（适用于购物车）

python os.path.splitext()的用法_Python常用模块之os.path

IPv6转换服务正式发布

【角度刁钻】如果把线程当作一个人来对待，秒懂

时间序列数据卡尔曼滤波_使用Highcharts和InfluxDB可视化时间序列数据

AI又破案！衢州城市大脑这回抓了一个抢劫犯

CentOS7 最小化安装后的必备操作

用javascript进行一个简单的机器学习小实例

梳子刻字刻什么好_校园石阶上被人刻了1700多个字？！这次网友却说好

腾讯Blade Team发现云虚拟化平台逃逸漏洞积极护航云生态安全

rust盖错了怎么拆除_细说Rust错误处理

机器学习应用中的UI个性化

zookeeper集群部署精简版本

物联网火爆，入门却太难了！

精读《手写 SQL 编译器 - 回溯》

感知器算法的基本原理和步骤_很多情况下，深度学习算法和人脑相似

打印时候复选框勾选不见了_checkbox 选中未显示对号勾选的问题