浅析工具dirpro v1.2源码

文章目录

    • 前言
    • 源码分析
      • dirpro.py
      • start.py
      • backup.py
      • rely.py
      • results.py
      • end.py

前言

工具简介

dirpro 是一款由 python 编写的目录扫描器专业版,操作简单,功能强大,高度自动化
自动根据返回状态码和返回长度,对扫描结果进行二次整理和判断,准确性非常高

项目地址

项目已在github开源,求个star嘻嘻嘻

https://github.com/coleak2021/dirpro

已实现功能

  • 可自定义扫描线程
  • 导入url文件进行批量扫描并分别保存结果
  • 状态码429检测,自动退出程序并提示设置更小的线程
  • 每扫描10%自动显示扫描进度
  • 可自定义扫描字典文件
  • 可自定义代理流量
  • 自动使用随机的User-Agent
  • 自动规范输入的目标url格式,根据输入的url动态生成敏感目录
  • 强大的默认字典top10000
  • 自动根据返回状态码和返回长度对扫描结果进行二次整理和判断
  • 扫描结果自动生成 域名+时间 格式的防同名文件名 并保存到scan_result目录中

扫描参数

options:-h, --help  show this help message and exit-u U        url-t T        thread:default=30-w W        dirfile path-a A        proxy,such as 127.0.0.1:7890-f F        urlfile,urls in the file-b          fastly to find backup files and sensitive files

源码分析

目录结构

在这里插入图片描述

dirpro.py

项目入口,接受传入的参数,并调用函数进行后续操作

    if not args.f:rooturl = args.u.strip('/')(time1,ret)=__start(args,rooturl)__end(rooturl,time1,ret)else:urlfile=open(args.f, 'r')urls = urlfile.read().splitlines()for rooturl in urls:rooturl = rooturl.strip('/')(time1,ret) = __start(args, rooturl)__end(rooturl,time1,ret)

判断是否传入url文件,初始化处理掉url末尾的/,调用__start(args,rooturl)返回(time1,ret),然后调用__end(rooturl,time1,ret)对扫描结果进行处理

start.py

    sem = threading.Semaphore(args.t)urlList = []urlList.extend(searchFiles(rooturl))

限制线程的最大数,清空urlList(防止多url文件扫描时前面生成的urllist影响后续url扫描),调用searchFiles(rooturl)生成敏感目录并将结果加入到urllist中

    if args.a:proxies['http'] = f"http://{args.a}"proxies['https'] = f"http://{args.a}"

判断是否加入代理

    if args.b:sem = threading.Semaphore(5)searchdir(urlList,sem,rooturl)else:if not args.w:defaultword = './wordlist/default'else:defaultword = args.wf = open(defaultword, 'r')files = f.read().splitlines()for file in files:urlList.append(f'{rooturl}/{file}')f.close()searchdir(urlList,sem,rooturl)return (time_1,ret)

判断扫描方式是快速扫描还是普通扫描,快速扫描需要设置小的线程(快速扫描自带的字典比较小),普通扫描判断是否传入字典文件,将字典中的dir加载到url中,调用 searchdir(urlList,sem,rooturl),最后返回(time_1,ret)

backup.py

searchFiles(rooturl)生成敏感目录并将结果加入到urllist中

    for file in FILE_LIST:urlList.append(f'{rootUrl}/{file}')urlList.append(f'{rootUrl}/{file}.bak')urlList.append(f'{rootUrl}/{file}~')urlList.append(f'{rootUrl}/{file}.swp')urlList.append(f'{rootUrl}/.{file}.swp')urlList.append(f'{rootUrl}/.{file}.un~')

加入备份文件目录

    SOURCE_LIST = ['.svn', '.svn/wc.db', '.svn/entries', # svn'.git/', '.git/HEAD', '.git/index', '.git/config', '.git/description', '.gitignore' # git'.hg/', # hg'CVS/', 'CVS/Root', 'CVS/Entries', # cvs'.bzr', # bzr'WEB-INF/web.xml', 'WEB-INF/src/', 'WEB-INF/classes', 'WEB-INF/lib', 'WEB-INF/database.propertie', # java'.DS_Store', # macos'README', 'README.md', 'README.MD', # readme'_viminfo', '.viminfo', # vim'.bash_history','.htaccess']for source in SOURCE_LIST:urlList.append(f'{rootUrl}/{source}')

加入源代码文件目录

    suffixList = ['.rar','.zip','.tar','.tar.gz', '.7z']keyList = ['www','wwwroot','site','web','website','backup','data','mdb','WWW','新建文件夹','ceshi','databak','db','database','sql','bf','备份','1','2','11','111','a','123','test','admin','app','bbs','htdocs','wangzhan']num1 = rootUrl.find('.')num2 = rootUrl.find('.', num1 + 1)keyList.append(rootUrl[num1 + 1:num2])for key in keyList:for suff in suffixList:urlList.append(f'{rootUrl}/{key}{suff}')

加入压缩文件目录

rely.py

扫描功能集中在这个文件

def __random_agent():user_agent_list = [{'User-Agent': 'Mozilla/4.0 (Mozilla/4.0; MSIE 7.0; Windows NT 5.1; FDM; SV1; .NET CLR 3.0.04506.30)'},{'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'},
......]return random.choice(user_agent_list)

使用随机user_agent

def searchdir(urlList,sem,rooturl):global dglobal _semglobal _listd=0_sem=semthread_array = []n=len(urlList)k=int (n/10)for i in range(1,10):_list.append(k*i)print(f"[*]开始扫描{rooturl}")for i in urlList:t = Thread(target= __get,args=(i,))thread_array.append(t)t.start()for t in thread_array:t.join()

_list存放进度条信息,for循环将调用get方法加入线程列表,通过t.join()设置除非子线程全部运行完毕,否则主线程一直挂起

def __get(url):count = 0global dwith _sem:while count < 3:try:r = requests.get(url,headers=__random_agent(),proxies=proxies)except:count += 1continuebreak#判断请求是否成功if count >= 3:print(f'visit failed:{url}')returnl=len(r.text)if r.status_code != 404 and r.status_code != 429:log = f'{r.status_code:<6}{l:<7}{url}'print(log)elif r.status_code == 429:print('Too Many Requests 429 so that Request terminated,please Set up smaller threads')os._exit(0)d += 1if d in _list:print(f"[*]已经扫描{(_list.index(d)+1)*10}%")# 添加到retret.append({'status_code': r.status_code,'length': l,'url': url})

with _sem相当于 sem.acquire(), sem.release()

锁定信号的变量sem在线程内阻塞,等待前面的线程执行结束。就是说实际上有多少任务就会开多少线程,只是超过限制的部分线程在线程内阻塞

os._exit(0)

这里判断返回码出现429则退出整个程序,如果用exit()则只能退出子线程

results.py

对扫描结果进行二次整理和判断

    t=f"./scan_result/{rooturl.split('//')[1].replace(':', '')}{int (time.time())}"try:f = open(t, 'w',encoding="utf-8")except:f = open(f"{int (time.time())}", 'w',encoding="utf-8")

设置保存扫描结果的文件名

    for result in ret:statusCode = result['status_code']length = result['length']statusCodeMap[statusCode] = statusCodeMap.get(statusCode, 0) + 1lenMap[length] = lenMap.get(length, 0) + 1

统计返回长度和状态码的个数

    for result in ret:if result['length'] != maxLength:__log(f'{result["status_code"]:<6}{result["length"]:<7}{result["url"]}')f.close()return t

打印异常的状态码和长度对于的url

end.py

    result = __Results(rooturl,ret)time2 = time.time()print("总共花费: ", time2 - time1, "秒,", f"结果保存在{result}")ret.clear()

将ret清空以免影响后续的扫描

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/87068.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VLAN聚合简介

定义 VLAN聚合&#xff08;VLAN Aggregation&#xff0c;也称Super VLAN&#xff09;指在一个物理网络内&#xff0c;用多个VLAN&#xff08;称为Sub-VLAN&#xff09;隔离广播域&#xff0c;并将这些Sub-VLAN聚合成一个逻辑的VLAN&#xff08;称为Super-VLAN&#xff09;&…

【linux进程(一)】深入理解进程概念--什么是进程?PCB的底层是什么?

&#x1f493;博主CSDN主页:杭电码农-NEO&#x1f493;   ⏩专栏分类:Linux从入门到精通⏪   &#x1f69a;代码仓库:NEO的学习日记&#x1f69a;   &#x1f339;关注我&#x1faf5;带你学更多操作系统知识   &#x1f51d;&#x1f51d; Linux进程 1. 前言2. PCB初认…

一文读懂Llama 2(从原理到实战)

简介 Llama 2&#xff0c;是Meta AI正式发布的最新一代开源大模型。 Llama 2训练所用的token翻了一倍至2万亿&#xff0c;同时对于使用大模型最重要的上下文长度限制&#xff0c;Llama 2也翻了一倍。Llama 2包含了70亿、130亿和700亿参数的模型。Meta宣布将与微软Azure进行合…

iOS16新特性:实时活动-在锁屏界面实时更新APP消息 | 京东云技术团队

简介 之前在 《iOS16新特性:灵动岛适配开发与到家业务场景结合的探索实践》 里介绍了iOS16新的特性&#xff1a;实时更新&#xff08;Live Activity&#xff09;中灵动岛的适配流程&#xff0c;但其实除了灵动岛的展示样式&#xff0c;Live Activity还有一种非常实用的应用场景…

【Vue2.0源码学习】生命周期篇-模板编译阶段(template)

文章目录 1. 前言2. 模板编译阶段分析2.1 两种$mount方法对比2.2 完整版的vm.$mount方法分析 3. 总结 1. 前言 前几篇文章中我们介绍了生命周期的初始化阶段&#xff0c;我们知道&#xff0c;在初始化阶段各项工作做完之后调用了vm.$mount方法&#xff0c;该方法的调用标志着初…

【跟小嘉学习区块链】二、Hyperledger Fabric 架构详解

系列文章目录 【跟小嘉学习区块链】一、区块链基础知识与关键技术解析 【跟小嘉学习区块链】一、区块链基础知识与关键技术解析 文章目录 系列文章目录[TOC](文章目录) 前言一、Hyperledger 社区1.1、Hyperledger(面向企业的分布式账本)1.2、Hyperledger社区组织结构 二、Hype…

UML六大关系总结

UML六大关系有&#xff1a;继承、关系、聚合、组合、实现、依赖。分为通过图和代码总结这些关系。 1、继承 继承&#xff08;Inheritance&#xff09;&#xff1a;表示类之间的继承关系&#xff0c;子类继承父类的属性和方法&#xff0c;并可以添加自己的扩展。 继承&#x…

【Spring Boot】Spring Boot源码解读与原理剖析

这里写目录标题 前言精进Spring Boot首选读物“小册”变“大书”&#xff0c;彻底弄懂Spring Boot全方位配套资源&#xff0c;学不会来找我&#xff01;技术新赛道&#xff0c;2023领先抢跑 前言 承载着作者的厚望&#xff0c;掘金爆火小册同名读物《Spring Boot源码解读与原理…

Windows11 手把手教授开放端口

首先在控制面板点击“系统与安全”&#xff0c;找到防火墙 然后点击“windows defender”打开防火墙 点击左侧目录栏中“高级设置” 点击“入站规则”&#xff0c;再点击新建入站规则&#xff08;开放端口有开放入站端口与开放出站端口之分&#xff0c;这里讲入站端口的开放…

老胡的周刊(第109期)

老胡的信息周刊[1]&#xff0c;记录这周我看到的有价值的信息&#xff0c;主要针对计算机领域&#xff0c;内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。 &#x1f3af; 项目 lobe-chat[2] LobeChat 是一个开源的、可扩展…

Redis 缓存雪崩、缓存穿透、缓存击穿

Redis 是一种常用的内存缓存工具&#xff0c;但在某些情况下&#xff0c;它可能会遭受缓存雪崩、缓存穿透和缓存击穿等问题。下面是一些预防这些问题的建议&#xff1a; 1、缓存雪崩 缓存雪崩指的是在某个时间点上&#xff0c;大量的缓存数据同时失效或过期&#xff0c;导致大…

华为云云耀云服务器L实例评测|华为云上安装kafka

文章目录 华为云云耀云服务器L实例评测&#xff5c;华为云上安装kafka一、kafka介绍二、华为云主机准备三、kafka安装1. 安装什么版本java2. 安装zookeeper服务3. 使用systemctl 管理启动ZooKeeper服务4. 修改kafka配置5. 使用systemctl 管理启动kafka服务6. 创建一个测试 topi…

前端JavaScript中的 == 和 ===区别,以及他们的应用场景,快来看看吧,积累一点知识。

&#x1f3ac; 江城开朗的豌豆&#xff1a;个人主页 &#x1f525; 个人专栏 :《 VUE 》 《 javaScript 》 ⛺️ 生活的理想&#xff0c;就是为了理想的生活 ! 目录 一、等于操作符 二、全等操作符 三、区别 小结 一、等于操作符 等于操作符用两个等于号&#xff08; &am…

map的一些测试-string键的查找

主要区别在于声明map的时候多了一个less<> #define _CRT_SECURE_NO_WARNINGS #include <iostream> #include <string> #include <map> #include <chrono> using namespace std; class spender { public:spender(string strfun) :strfun(strfun…

SAP 操作:怎么设定屏幕前台字段显示/编辑

文章目录 前言一、步骤设定方式 前言 SAP将字段放进群组&#xff0c;通过对群组进行控制。 一、步骤 后勤常规-物料主数据-字段选择 设定方式 点击后面绿色按钮2.

WPF 类库 使用handycontrol 配置

在学习wpf发现了一个非常好用的UI库 handycontrol 但是很多地方讲的都是WPF应用程序怎么用&#xff0c;很少有讲类库那么引用的问题&#xff0c;所以在这里自己总结一下&#xff0c;希望能帮助到大家&#xff1a; 1.添加 handycontrol 的引用&#xff1b;安装&#xff0c;我已…

前端面试题记录

vue2响应式原理 vue2主要是采用了数据劫持结合发布者-订阅者模式来实现数据的响应式&#xff0c;vue在初始化的时候&#xff0c;会遍历data中的数据&#xff0c;使用object.defineProperty为data中的每一个数据绑定setter和getter&#xff0c;当获取数据的时候会触发getter&am…

“构建完善的用户认证与数据交互系统“

目录 引言1.ElementUI完成登录注册1. 登录页面设计与实现2. 注册页面设计与实现 2.axios之get请求3.axios之post请求4.跨域问题的解决方案5.总结 引言 在现代Web应用程序开发中&#xff0c;用户认证和数据交互是至关重要的功能。本文将介绍如何使用ElementUI、axios和解决跨域…

C语言每日一题(8):有序序列合并

文章主题&#xff1a;有序序列合并&#x1f525;&#x1f525;&#x1f525;所属专栏&#xff1a;C语言每日一题&#x1f4d7;作者简介&#xff1a;每天不定时更新C语言的小白一枚&#xff0c;记录分享自己每天的所思所想&#x1f604;&#x1f3b6;个人主页&#xff1a;[₽]的…