计算机网络实用工具之parsero

简介

Parsero是一个用Python编写的免费脚本,它读取web服务器的robots.txt文件,探测“Disallow”的条目并返回响应状态码。

例:

200 OK          The request has succeeded.
403 Forbidden   The server understood the request, but is refusing to fulfill it.
404 Not Found   The server hasn't found anything matching the Request-URI.
302 Found       The requested resource resides temporarily under a different URI.
...

官网

GitHub - behindthefirewalls/Parsero: Parsero | Robots.txt audit tool

安装

# ubuntu 20.04
sudo apt install parsero

使用帮助

root@ubuntu:~# parsero -h
usage: parsero [-h] [-u URL] [-o] [-sb] [-f FILE]optional arguments:-h, --help  show this help message and exit-u URL      Type the URL which will be analyzed-o          Show only the "HTTP 200" status code-sb         Search in Bing indexed Disallows-f FILE     Scan a list of domains from a list

使用示例

# 查看百度声明禁止访问哪些链接
root@ubuntu:~# curl www.baidu.com/robots.txt
User-agent: Baiduspider
Disallow: /baidu
Disallow: /s?
Disallow: /ulink?
Disallow: /link?
Disallow: /home/news/data/
Disallow: /bhUser-agent: Googlebot
Disallow: /baidu
Disallow: /s?
Disallow: /shifen/
Disallow: /homepage/
Disallow: /cpro
Disallow: /ulink?# parsero针对禁止访问的链接进行探测
root@ubuntu:~# parsero -u www.baidu.com____                               |  _ \ __ _ _ __ ___  ___ _ __ ___  | |_) / _` | '__/ __|/ _ \ '__/ _ \ |  __/ (_| | |  \__ \  __/ | | (_) ||_|   \__,_|_|  |___/\___|_|  \___/ Starting Parsero v0.81 (https://github.com/behindthefirewalls/Parsero) at 12/19/23 13:31:55
Parsero scan report for www.baidu.com
http://www.baidu.com/ 200 OK
http://www.baidu.com/homepage/ 302 Found
http://www.baidu.com/baidu 302 Found
http://www.baidu.com/s? 302 Found
http://www.baidu.com/ulink? 404 Not Found
http://www.baidu.com/cpro 404 Not Found
http://www.baidu.com/bh 302 Found
http://www.baidu.com/link? 404 Not Found
http://www.baidu.com/shifen/ 200 OK
http://www.baidu.com/home/news/data/ 302 Found[+] 10 links have been analyzed and 2 of them are available!!!Finished in 0.45 seconds.

种草

本文为"计算机网络实用工具系列"的内容之一,会持续更新其它相关博文。

我的博文内容主要针对“计算机网络”、“安全”、“运维”和“云计算”方向,感兴趣朋友的请关注我,我将不定期发布新的博文并不断改进已发布博文。

后期依据大家对博文的评论,点赞及关注情况,针对大家感兴趣的内容我也会录制视频并整理出成套的学习资料免费分享给大家,期待能和大家一起交流学习。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/237127.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Py之tensorflow-addons:tensorflow-addons的简介、安装、使用方法之详细攻略

Py之tensorflow-addons:tensorflow-addons的简介、安装、使用方法之详细攻略 目录 tensorflow-addons的简介 tensorflow-addons的安装 tensorflow-addons的使用方法 1、使用 TensorFlow Addons 中的功能: tensorflow-addons的简介 TensorFlow Addon…

【SpringBoot快速入门】(4)SpringBoot项目案例代码示例

目录 1 创建工程3 配置文件4 静态资源 之前我们已经学习的Spring、SpringMVC、Mabatis、Maven,详细讲解了Spring、SpringMVC、Mabatis整合SSM的方案和案例,上一节我们学习了SpringBoot的开发步骤、工程构建方法以及工程的快速启动,从这一节开…

Python---TCP 客户端程序开发

1. 开发 TCP 客户端程序开发步骤回顾 创建客户端套接字对象和服务端套接字建立连接发送数据接收数据关闭客户端套接字 2. socket 类的介绍 导入 socket 模块 import socket 创建客户端 socket 对象 socket.socket(AddressFamily, Type) 参数说明: AddressFamily 表示IP地…

大数据爬虫技术

随着互联网的发展,各行各业都开始注重数据的分析和应用。而大数据的出现,则让这一切变得更加便捷。但是,大数据的获取过程却并不简单,需要借助于爬虫技术来实现。本文将从基础概念到实践操作,详细介绍大数据爬虫技术。…

解决Electron应用中的白屏问题的实用方法

在使用Electron构建应用程序时,一些开发者可能会面临窗口加载过程中出现的白屏问题。这种问题主要分为两个方面: Electron未加载完毕HTML: 这时Electron自身产生的白色背景可能导致用户在启动应用时看到一片空白。HTML加载渲染过程中的短暂白…

JavaScript:函数

JavaScript:函数 函数的作用函数的声明和调用函数声明函数调用函数重复声明 函数传参传参语法参数默认值与参数数量问题传参数量过多传参数量太少参数默认值 函数的返回值函数表达式匿名函数立即执行函数 函数的作用 在我们编程过程中,会出现一种情况&a…

[软件] Image2LCD v4.0

介绍 通过打开图片, 可以提取图片的像素特征, 生成.c文件, 或者二进制文件等, 提供人们根据需要选择. 16位真彩色 每一个像素点需要用16位来表示, 分别是RGB, R: 5位 G: 6位, B: 5位, 共两个字节. 配置 tftLCD180显示屏, 官方给的参考代码, 需要如下所示设置.

gateway配置

server:port: 8080 spring:application:name: test-gatewaycloud:nacos:discovery:server-addr: localhost:8848gateway:discovery:locator:enabled: false#是否开启网关enabled: trueroutes:- id: test-order-route#目标微服务的请求地址和端口uri: lb://test-orderpredicates…

【Spring Security】认证密码加密Token令牌CSRF的使用详解

🎉🎉欢迎来到我的CSDN主页!🎉🎉 🏅我是Java方文山,一个在CSDN分享笔记的博主。📚📚 🌟推荐给大家我的专栏《Spring Security》。🎯🎯 …

【如何隔离受感染主机】

以下是隔离感染主机的详细可实施步骤: 断开网络连接: 对于有线连接,直接从感染主机上拔掉网线。 对于无线连接,执行以下操作: Windows系统:点击任务栏的网络图标,然后点击“断开”。macOS系统&a…

频谱论文:RadioUNet:使用卷积神经网络的快速无线电地图估计

#频谱# R. Levie, . Yapar, G. Kutyniok and G. Caire, "RadioUNet: Fast Radio Map Estimation With Convolutional Neural Networks," in IEEE Transactions on Wireless Communications, vol. 20, no. 6, pp. 4001-4015, June 2021, doi: 10.1109/TWC.2021.305497…

Triton + HF + Qwen 推理经验总结

1. 简介 Triton介绍参考:GitHub - triton-inference-server/tutorials: This repository contains tutorials and examples for Triton Inference Server 2. 实现方案 2.1. docker部署 # 拉取docker镜像 git clone -b r23.10 https://github.com/triton-inferen…

【hadoop】解决浏览器不能访问Hadoop的50070、8088等端口?!

【hadoop】解决浏览器不能访问Hadoop的50070、8088等端口?!😎 前言🙌【hadoop】解决浏览器不能访问Hadoop的50070、8088等端口?!查看自己的配置文件:最终成功访问如图所示: 总结撒花…

10 个顶级免费 Android 数据恢复软件可帮助恢复已删除的文件

不小心删除了手机上的一些重要数据或文件?这很不幸,但不要悲伤或放弃希望,因为仍有机会恢复它们。 10 个顶级免费 Android 数据恢复软件 虽然 Android 手机没有像 Windows 那样的回收站可以自动存储您删除的数据,但是有很多功能强…

grep 命令详解

1. grep 简介 grep 是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。通常grep有三种版本grep、egrep(等同于grep -E)和fgrep。egrep为扩展的grep,fgrep则为快速grep(使用固定…

【Java中的负数取绝对值结果为什么不一定是正数?】

Java中的负数取绝对值结果为什么不一定是正数? ✅典型解析✅扩展知识仓✅整型的取值范围✅超出范围怎么办 ✅典型解析 假如,我们要用Math.abs对一个nteger取绝对值的时候,如果用如下方式: Math .abs(orderId.hashCode());得到的结果可能是个负…

在Java Web开发中,Servlet功能与jsp功能可以相互转换吗

在Java Web开发中,Servlet和JSP是两种常用的Web组件,它们可以相互协作,也可以相互转换。 具体来说,Servlet可以实现所有JSP的功能,而JSP也可以调用Servlet中的方法。Servlet可以通过Java代码生成HTML页面,而…

libp2p服务发现之 Multicast DNS(mDNS)

文章目录 libp2p服务发现之 Multicast DNS(mDNS)一、Multicast DNS(mDNS)mDNS 的工作原理Multicast DNS (mDNS) 和 DNS (Domain Name System) 区别 二、mDNS和libp2p的关系三、Kademlia Distributed Hash Table(DHT&am…

一键转换,将HTML智能转换为PDF,轻松解决文档转换需求

在数字时代,HTML网页是我们获取信息的主要来源之一。然而,有时候我们可能需要将网页内容以PDF格式保存,以便于离线阅读、打印或分享。这时,将HTML转换为PDF就变得尤为重要。 首先,我们要进入首助编辑高手主页面&#x…

JavaScript 从入门到进阶 01 :变量和声明 JavaScript的数据类型 类型转换

当您开始学习JavaScript时,了解变量和数据类型是至关重要的,因为它们是构建任何程序的基础。在本博客文章中,我们将深入研究JavaScript中的变量和数据类型,包括它们的定义、不同的数据类型以及如何进行类型转换。 变量和声明 Java…