Uscrapper:一款功能强大的网络资源爬取工具

关于Uscrapper

Uscrapper是一款功能强大的网络资源爬取工具,该工具可以帮助广大研究人员从各种网络资源中轻松高效地提取出有价值的数据,并且提供了稳定、友好且易于使用的UI界面,是安全研究人员和网络分析人员的强有力工具。

Uscrapper最大程度地释放了开源情报资源的力量,该工具能够深入挖掘广阔互联网中的各类资源,并解锁了新级别的数据提取能力,能够探索互联网中的未知领域,支持使用关键字提取模型精确发现隐藏的数据。

除此之外,Uscrapper还支持通过超链接或非超链接的形式获取丰富的目标用户数据,并利用多线程和先进的功能模块完成复杂的反数据爬取绕过,最终生成全面的数据报告来对提取到的数据进行组织和分析,将原始数据转换为可直接利用的有价值信息。

支持提取的数据

当前版本的Uscrapper支持从目标站点中提取出下列信息:

1、电子邮件地址:显示目标站点中发现的电子邮件地址;

2、社交媒体链接:显示从目标站点发现的各类社交媒体平台链接;

3、作者名称:显示跟目标站点相关的作者名称;

4、地理位置信息:显示跟目标站点相关的地理位置信息;

5、非超链接详情:显示在目标站点上找到的非超链接详细信息,包括电子邮件地址、电话号码和用户名;

6、基于关键字提取:通过指定属于或关键字列表提取和显示相关数据;

7、深网支持:支持处理.onion站点并提取关键信息;

工具安装-Unix/Linux

由于该工具基于Python开发,因此我们首先需要在本地设备上安装并配置好Python环境。

接下来,广大研究人员可以直接使用下列命令将该项目源码克隆至本地:

git clone https://github.com/z0m31en7/Uscrapper.git

然后切换到项目目录中,给工具安装脚本提供可执行权限,并执行安装脚本:

cd Uscrapper/install/chmod +x ./install.sh && ./install.sh      

工具使用

我们可以按照下列命令格式运行Uscrapper:

python Uscrapper-vanta.py [-h] [-u URL] [-O] [-ns] [-c CRAWL] [-t THREADS] [-k KEYWORDS [KEYWORDS ...]] [-f FILE]

命令参数

-u URL, --url URL:目标站点的URL地址;-O, --generate-report:生成报告;-ns, --nonstrict:显示非严格的用户名(可能结果会不准确);-c CRAWL, --crawl:指定在同一范围内爬网和抓取的最大链接数;-t THREADS, --threads THREADS:要使用的爬取线程数量,默认为4;-k KEYWORDS [KEYWORDS ...], --keywords KEYWORDS [KEYWORDS ...]:要查询的关键字(空格间隔参数);-f FILE, --file FILE:包含关键字的文本文件路径;

工具运行截图

许可证协议

本项目的开发与发布遵循MIT开源许可证协议。

项目地址

Uscrapper:【GitHub传送门】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/763163.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

漫谈5种注册中心

01 注册中心基本概念 1.1 什么是注册中心? 注册中心主要有三种角色: 服务提供者(RPC Server):在启动时,向 Registry 注册自身服务,并向 Registry 定期发送心跳汇报存活状态。 服务消费者&…

哈希、散列表和Rabin-Karp算法

字典 现有一个抽象数据类型(ADT)如下: 包括了一组元素,每个元素都有一个键key。假设没有元素拥有相同的key,如果有相同的key,则覆盖掉原有key的元素。 -insert(item) -delete(item) -search(key):根据给定的key,返…

JetBrains全家桶激活,分享 GoLand 2024 激活的方案

大家好,欢迎来到金榜探云手! GoLand 公司简介 JetBrains 是一家专注于开发工具的软件公司,总部位于捷克。他们以提供强大的集成开发环境(IDE)而闻名,如 IntelliJ IDEA、PyCharm、和 GoLand等。这些工具被…

第4周 Python程序流程控制刷题(循环结构)

单击题目,直接跳转到页面刷题,一周后公布答案。 P5722:数列求和B2054:求平均年龄B2059:奇数求和B2064:斐波那契数列B2077:角谷猜想B2098:整数去重B2128:素数个数 1. P5…

力扣每日练习(3.20)补

322. 零钱兑换 想象你有一堆不同面值的硬币,现在的任务是用这些硬币凑出一个指定的金额,比如说11元,而且要求用的硬币数量尽可能少。 准备工作:首先,我们做了一张表(叫dp),这张表记…

前端开发的第三方库

base64.js 地址:https://github.com/dankogai/js-base64 Base64.js 库提供了一个简单的 API,用于将数据转换为 Base64 编码,以及将 Base64 编码的数据解码回原始数据 Base64.js 是一个 JavaScript 库,用于将数据转换为 Base64 编…

LVGL:拓展部件——键盘 lv_keyboard

一、概述 此控件特点: 特殊Button矩阵:lv_keyboard 本质上是一个经过定制的按钮矩阵控件。每个按钮都可以独立触发事件或响应。预定义的键映射:lv_keyboard 自带了一套预设的按键布局和对应的字符映射表,开发者可以根据需要选择…

Vue 性能不给力?这些优化技巧帮你轻松搞定!

结合lighthouse查看各项数据,不断进行性能优化,可以从代码、项目打包、项目部署这三个层面来优化 代码层面 1、v-if和v-show区分使用 v-if(惰性的)用的条件判断,是惰性的,false的话初始不会渲染&#xf…

oracle迁移至gbase,sql问题总结(完善中)

最近再做国产化适配,需要把oracle里面的数据迁移至gbase 8a库中,这边把迁移过程中遇到的sql问题,记录下,现在仅迁移了一部分,后续会继续完善 1.ORACLE里面的NVL2函数在8a中不支持,可换成DECODE函数 2.表别…

二鼠打洞问题

文章目录 二鼠打洞问题测试说明Python求解 二鼠打洞问题 《九章算术》的“盈不足篇”里有一个很有意思的老鼠打洞问题。原文是这么说的:今有垣厚十尺,两鼠对穿。大鼠日一尺,小鼠亦一尺。大鼠日自倍,小鼠日自半。问:何…

此站点正在尝试打开 ,chrome/edge 允许http网站打开url schema

正常https链接会有首次允许选项 但http没有,每次都会弹出,非常烦人。 Chrome / Edge 配置 地址栏输入 chrome://flags/搜索Insecure origins treated as secure, 配置允许网站,需要协议和端口再次跳转会显示始终允许选项

关于5.x版本的Neo4j与py2neo的访问技巧

先说结果。 Neo4j是可以使用py2neo来操作的。而且网上搜到的教程和方法里,首推的http连接方法可能并不是最好的,应该用 bolt 方法可能更好。 对于大多数使用 py2neo 与 Neo4j 数据库进行交互的应用程序来说,建议使用 Bolt 协议(即…

kafka面试篇

消息队列的作用:异步、削峰填谷、解耦 高可用,几乎所有相关的开源软件都支持,满足大多数的应用场景,尤其是大数据和流计算领域, kafka高效,可伸缩,消息持久化。支持分区、副本和容错。 对批处理…

C# 属性

C# 属性 访问器(Accessors) using System; using System.Collections.Generic; using System.Diagnostics; using System.IO; using System.Linq; using System.Text; using System.Threading.Tasks;namespace ConsoleApp2 {class Student{private str…

Linux 常用命令 chgrp

Linux 常用命令 chgrp 作用 用于更改文件或目录的所属用户组。只有文件的所有者或超级用户(root)可以使用 chgrp 命令来更改文件的所属用户组。在使用 chgrp 命令时需要谨慎操作,确保对文件和目录进行正确的用户组更改,以避免意…

linux C/C++ 捕获 SIGSEGV 段错误信号

程序运行遇到core dumped崩溃是常见现象,有时候,我们希望程序在崩溃的时候,先做点其他操作再崩溃,比如记录崩溃时刻的堆栈信息,或是提前释放一些硬件资源等等,那么就需要让程序捕获错误信号 下面是一个捕获…

第十五届蓝桥杯模拟考试III_物联网设计与开发官方代码分析

目录 前言:显示界面部分:页面切换:数值的轮回调整:传递数据: 前言: 这次模拟的效果很不好。85分,4h的限时我花了两天完成,这个时间是远远超出要求的,而且最后还只拿到56分&#xff0…

基于electron29版本桌面应用app开发例子

基于electron29版本桌面应用app开发例子 htmljsnode.js 开发模式 生成package.json文件: yarn init --yes 或 npm init --yes 运行打包 yarn dev yarn build # electron与electron-builder版本不兼容问题处理办法: 在package.json中scripts中添加 “…

解决在 yolov8 训练自己的数据集时,matplotlib 中文乱码问题【woodwhales.cn】

为了更好的阅读体验,建议移步至笔者的博客阅读:解决在 yolov8 训练自己的数据集时,matplotlib 中文乱码问题 在 yolov8 训练自己的数据集时,如果 class 字典使用了中文,则在训练过程中会出现形如下面的警告&#xff1a…

面试官:(...)扩展运算符是深拷贝吗?

一、情景再现 金三银四,最近找工作的小伙伴是扑面而来,这其中少不了我的好朋友张某某同学,我们‘相依为命’,我经常开导他,这不最近的一次面试中他就遇到这样一个考题: 面试官:(...&…