爬虫工作量由小到大的思维转变---＜第三十五章 Scrapy 的scrapyd+Gerapy 部署爬虫项目＞

爬虫工作量由小到大的思维转变---＜第三十五章 Scrapy 的scrapyd+Gerapy 部署爬虫项目＞

news/2025/4/27 15:53:07/文章来源:https://blog.csdn.net/m0_56758840/article/details/135299905

前言:

项目框架没有问题大家布好了的话,接着我们就开始部署scrapy项目(没搭好架子的话,看我上文爬虫工作量由小到大的思维转变---＜第三十四章 Scrapy 的部署scrapyd+Gerapy＞-CSDN博客)

正文:

1.创建主机:

首先gerapy的架子,就相当于部署服务器上的;所以,我们先要连接主机(用户名/密码随你填不填)

----ps:我建议你填一下子,养成习惯;别到时候布到云服务上去了,被人给扫了,那不好玩的!

这里ip就填 127.0.0.1 ,端口6800 --->就是你scrapyd的端口!

创建完成,应该会是这样的:

此时他说你的主机没连接上,为啥?

-----因为这是个基于scrapyd的可视化网页架子,你不开scrapyd服务,他基于啥给你可视化?

所以...

2.开启scrapyd服务

(本地127.0.0.1的不用调设置哈,直接开! 布云端服务器以后会另外说的)

ps:(我这里是拿个项目过来改的,以上一篇爬虫工作量由小到大的思维转变---＜第三十四章 Scrapy 的部署scrapyd+Gerapy＞-CSDN博客)里面的文件为准; 你哪里装的gerapy和scrapyd,就去那个文件夹;

成功之后,如图:

---你的状态指标,刷新一下:正常! 就是成功了~

3.创建项目文件夹(你也可以自己cmd完成,都随意! 看我原理就成):

特别注意:

log是日志文件夹,你每开启一次gerapy,他就会在里面生成一个日志文件;报错的话,你就去找对应的ERROR看去~
gerapy文件夹里也有一个projects文件夹; 他是你装gerapy文件就生成了的; 我目前的版本是gerapy= 0.9.13 ; 这个版本,是在log同级文件里,创建projects(手动创建 mkdir projects)
如果你的projects创建的层级错了,他会报:

----认真看我说的1 2 3条,还有图! 标红的是极为关键的地方(也就是你丢爬虫工程的地方),搞错了你就丢不上去爬虫工程了~

4.丢爬虫工程:

1.怎么丢爬虫工程:

-丢你scrapy的根文件,也就是那个含着"scrapy.cfg"文件的包,全部拷贝!

2.从github上/其他地方拷(后面会讲,这里只谈本地的先带着走一遍)

5.部署到XX服务器(这里是部署本机链接服务):

步骤1. 你爬虫项目丢的没问题,这个图就没问题!

步骤2: 打包如果有问题,去看log! 很有可能是坏在setting上---按我步骤,一般不会报错;你就反复去看 '4.丢爬虫工程'那个环节!

6.部署成功!

7.随便玩了

敞开了玩~~ 鼠标点点点,各种乱造...every body 造坏了再来一遍!!吼吼!!!

-----------恭喜大家,部署了自己第一个爬虫项目! 是不是瞬间感觉其他都不香了....

所以我就说嘛.爬虫没意思. 趁早散伙....

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/585805.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Ubuntu 18.04搭建RISCV和QEMU环境

Ubuntu 18.04搭建RISCV和QEMU环境

前言因为公司项目代码需要在RISCV环境下测试，因为没有硬件实体，所以在Ubuntu 18.04上搭建了riscv-gnu-toolchain QEMU模拟器环境。安装riscv-gnu-toolchain riscv-gnu-toolchain可以从GitHub上下载源码编译，地址为：https://…

阅读更多...

大华主动注册协议介绍

大华主动注册协议介绍

一、大华主动注册协议介绍前面写了一篇文章，介绍一些设备通过大华主动注册协议接入到AS-V1000的文章，很多问我关于大华主动注册协议的相关知识。由于大华主动注册协议是一种私有协议，通常不对外公开详细的协议规范和技术细节。因此…

阅读更多...

C++ Primer Plus----第十二章--类和动态内存分布

C++ Primer Plus----第十二章--类和动态内存分布

本章内容包括：对类成员使用动态内存分配；隐式和显式复制构造函数；隐式和显式重载赋值运算符；在构造函数中使用new所必须完成的工作；使用静态类成员；将定位new运算符用于对象；使用指向对象的指针…

阅读更多...

ssm基于web的志愿者管理系统的设计与实现+vue论文

ssm基于web的志愿者管理系统的设计与实现+vue论文

摘要使用旧方法对志愿者管理系统的信息进行系统化管理已经不再让人们信赖了，把现在的网络信息技术运用在志愿者管理系统的管理上面可以解决许多信息管理上面的难题，比如处理数据时间很长，数据存在错误不能及时纠正等问题。这次开发的志愿者…

阅读更多...

【常用前端框架总结】

【常用前端框架总结】

React.js React.js是由Facebook开发的一个用于构建用户界面的JavaScript库。它采用组件化的开发方式，使得构建复杂的用户界面变得更加简单和可维护。React.js使用虚拟DOM技术来高效地更新界面，并具有强大的生态系统，包括大量的第三方库和工具…

阅读更多...

main参数传递、反汇编、汇编混合编程

main参数传递、反汇编、汇编混合编程

week03 一、main参数传递二、反汇编三、汇编混合编程一、main参数传递参考 http://www.cnblogs.com/rocedu/p/6766748.html#SECCLA 在Linux下完成“求命令行传入整数参数的和” 注意C中main: int main(int argc, char *argv[]), 字符串“12” 转为12，可以调用atoi…

阅读更多...

二、C#基础语法（异常处理）

二、C#基础语法（异常处理）

在C#中，异常处理是一种处理程序运行时可能出现的错误或异常情况的重要机制。通过异常处理，我们可以捕获并处理程序中的错误，从而避免程序崩溃或产生不可预测的行为。 C#中的异常处理主要通过try-catch语句块来实现。以下是C#中异常处理的基础…

阅读更多...

两种汇编的实验

两种汇编的实验

week04 一、汇编-1二、汇编-2 一、汇编-1 1 通过输入gcc -S -o main.s main.c -m32 将下面c程序”week0401学号.c“编译成汇编代码 int g(int x){ return x3; } int f(int x){ int i 学号后两位； return g(x)i; } int main(void){ return f(8)1; } 2. 删除汇编代码…

阅读更多...

思维逻辑题3

思维逻辑题3

题目1： 如果所有A都是B，且某个对象是B，那么它一定是A吗？ 答案：不一定，尽管所有A都是B，但还有其他的对象可能也是B。题目2： 如果A和B都是真，那么以下哪个选项是真&…

阅读更多...

自身文档管理规范

自身文档管理规范

之前在这里叙述了用 sphinx 生成静态网站， 并利用静态网络托管服务 readthedocs 现在我们有了新的需求，想知道这些东西到底是什么。过程过程A ： markdown/rst -> html mkdocs sphinx相关： pandoc(不能生成整个网站的h…

阅读更多...

vue中的一个内置组件Keep-Alive的作用及使用方法介绍——缓存不活动的组件实例

vue中的一个内置组件Keep-Alive的作用及使用方法介绍——缓存不活动的组件实例

一、什么是 keep-alive 在平常开发中，有部分组件没有必要多次初始化，这时，我们需要将组件进行持久化，使组件的状态维持不变，在下一次展示时，也不会进行重新初始化组件。 Keep-Alive是Vue.js中的一个内置组…

阅读更多...

expdp到ASM 文件系统并拷贝

expdp到ASM 文件系统并拷贝

1.创建asm导出数据目录 sql>select name,total_mb,free_mb from v$asm_diskgroup; 确认集群asm磁盘组环境 asmcmd>cd DGDSDB asmcmd>mkdir dpbak asmcmd>ls -l sql>conn / as sysdba create directory expdp_asm_dir as DGDSDB/dpbak; create directory expdp_l…

阅读更多...

『番外篇六』SwiftUI 取得任意视图全局位置的三种方法

『番外篇六』SwiftUI 取得任意视图全局位置的三种方法

概览在 SwiftUI 开发中，利用描述性代码我们可以很轻松的构建各种丰富多彩的视图。我们可以设置它们的大小、位置、颜色并应用不计其数的修改器。但是，小伙伴们是否想过在 SwiftUI 中如何获取一个视图的全局位置坐标呢？在本篇博文中，您将学到如下内容：概览1. SwiftU…

阅读更多...

批处理学习笔记1_命令的语法与功能A

批处理学习笔记1_命令的语法与功能A

批处理除了可以用Windows自带的记事本编辑外，还可以在命令行中输入copy con 文件名来创建，比如：copy con a.bat，然后就可以在命令中编辑，等文件编辑完毕后，输入CTRLz，再敲回车，就可以…

阅读更多...

守护 C 盘，Python 相关库设置

守护 C 盘，Python 相关库设置

文章目录前言Python 相关查看所有 Python 安装位置查看 Python 依赖位置查看 conda 配置查看 env 列表移除指定 env创建 env进入 env删除环境位置目录添加环境位置 (将位置置顶)查看 pip 缓存位置设置 pip 缓存位置其他进入 Temp修改位置 Python技术资源分享1、Python所有方向…

阅读更多...

（001）Unit 编译 UTF8JSON

（001）Unit 编译 UTF8JSON

文章目录编译 Dll编译报错附录编译 Dll 新建工程： 注意 UnityEngineDll 的选择！2022 版本的太高了！！！ 下载包，导入unity : 3. 将 unf8json 的源码拷贝到新建的工程。 4. 编译发布版本： 编译…

阅读更多...

竞赛保研基于卷积神经网络的乳腺癌分类深度学习医学图像

竞赛保研基于卷积神经网络的乳腺癌分类深度学习医学图像

文章目录 1 前言2 前言3 数据集3.1 良性样本3.2 病变样本 4 开发环境5 代码实现5.1 实现流程5.2 部分代码实现5.2.1 导入库5.2.2 图像加载5.2.3 标记5.2.4 分组5.2.5 构建模型训练 6 分析指标6.1 精度，召回率和F1度量6.2 混淆矩阵 7 结果和结论8 最后 1 前言 &…

阅读更多...

mongoose中http server服务器解决“Access-Control-Allow-Origin mongoose”跨域问题

mongoose中http server服务器解决“Access-Control-Allow-Origin mongoose”跨域问题

问题使用mongoose做http服务器，自己构造的浏览器端jquery在访问server时，会遇到： Access to XMLHttpRequest at http://127.0.0.1:8000/ from origin null has been blocked by CORS policy: No Access-Control-Allow-Origin header is pr…

阅读更多...

python+django大自然环境保护宣传网站62r9b

python+django大自然环境保护宣传网站62r9b

本课题使用Python语言进行开发。基于web,代码层面的操作主要在PyCharm中进行，将系统所使用到的表以及数据存储到MySQL数据库中本系统由后台管理子系统，登录子系统，按登陆角色及权限划分为管理员:个人中心，用户管理，文…

阅读更多...

遇到DDOS怎么办，盾真的可以抗攻击吗

遇到DDOS怎么办，盾真的可以抗攻击吗

网络在以难以想象的速度发展，黑客们针对网络漏洞发起的攻击也从未停止，但复杂的网络环境让网络安全的维护更为艰难，如果游戏公司没有做好防御措施，黑客发起攻击只是时间问题。在网络攻击愈加多元化的今天，游戏行业可以…

阅读更多...

最新文章