使用B2M 算法批量将可执行文件转为灰度图像

参考论文

基于二进制文件的 C 语言编译器特征提取及识别

本实验使用 B2M 算法将可执行文件转为灰度图像,可执行文件转为灰度图的流程如图 4-3 所示。将 可执行文件每 8 位读取为一个无符号的的整型常量,一个可执行文件得到一个一维向量, 之后按照固定的宽和高将一维向量转成一个二维向量。该二维向量中每个元素的取值范围都在 0-255 ,正好对应灰度图像的一个像素点,将该二维数组可视化为一张灰度图像, 其中 0 表示黑色, 255 表示白色。

这个使用B2M 算法将可执行文件转为灰度图像的步骤主要视为了进行之后提取 GLCM 特征和 LBP 特征。

其中,生成图像的宽度会因不同文件的大小有最优宽度

 示例:

我的exe文件大小事135kb所以宽度就设置成384了。

import numpy as np
import matplotlib.pyplot as plt# 读取二进制文件
def read_binary_file(filename):with open(filename, 'rb') as f:data = f.read()return data# 将数据转换为无符号整型数组
def binary_to_uint8_array(data):return np.frombuffer(data, dtype=np.uint8)# 将一维数组转换为二维矩阵
def array_to_2d_matrix(array, width):# 计算高度height = int(np.ceil(len(array) / width))# 如果数组长度不是宽度的整数倍,填充数组padded_length = height * widthpadded_array = np.pad(array, (0, padded_length - len(array)), 'constant', constant_values=0)# 转换为二维矩阵matrix = padded_array.reshape((height, width))return matrix# 保存灰度图像
def save_gray_image(matrix, save_path):plt.imshow(matrix, cmap='gray', vmin=0, vmax=255)plt.title("Gray Image")plt.axis('off')  # 隐藏坐标轴plt.savefig(save_path, bbox_inches='tight', pad_inches=0)plt.close()print(f"Image saved at {save_path}")# 主函数
def binary_to_image(filename, save_path, width):data = read_binary_file(filename)uint8_array = binary_to_uint8_array(data)matrix = array_to_2d_matrix(uint8_array, width)save_gray_image(matrix, save_path)# 调用主函数并传入二进制文件名、保存路径和宽度
binary_to_image('math1111.exe', 'test2.png', width=384)

生成的图像:

5.21

本来的程序是处理单张图片,现在需要处理比较多,所以把程序拓展到了处理整个文件夹中的exe文件,并把处理后的图片以原exe文件+ 特殊备注(看个人需求)放到同一文件夹。同时根据原来exe文件的大小设置图片的宽度。

 

import os
import numpy as np
import matplotlib.pyplot as plt# 读取二进制文件
def read_binary_file(filename):with open(filename, 'rb') as f:data = f.read()return data# 将数据转换为无符号整型数组
def binary_to_uint8_array(data):return np.frombuffer(data, dtype=np.uint8)# 将一维数组转换为二维矩阵
def array_to_2d_matrix(array, width):# 计算高度height = int(np.ceil(len(array) / width))# 如果数组长度不是宽度的整数倍,填充数组padded_length = height * widthpadded_array = np.pad(array, (0, padded_length - len(array)), 'constant', constant_values=0)# 转换为二维矩阵matrix = padded_array.reshape((height, width))return matrix# 保存灰度图像
def save_gray_image(matrix, save_path):plt.imshow(matrix, cmap='gray', vmin=0, vmax=255)plt.title("Gray Image")plt.axis('off')  # 隐藏坐标轴plt.savefig(save_path, bbox_inches='tight', pad_inches=0)plt.close()print(f"Image saved at {save_path}")# 处理单个文件并保存图像
def binary_to_image(filename, save_path, width):data = read_binary_file(filename)uint8_array = binary_to_uint8_array(data)matrix = array_to_2d_matrix(uint8_array, width)save_gray_image(matrix, save_path)# 根据文件大小确定图像宽度
def determine_width(file_size):if file_size < 10 * 1024:return 32elif file_size < 30 * 1024:return 64elif file_size < 60 * 1024:return 128elif file_size < 100 * 1024:return 256elif file_size < 200 * 1024:return 384elif file_size < 500 * 1024:return 512elif file_size < 1000 * 1024:return 768else:return 1024# 处理文件夹中的所有文件
def process_folder(folder_path, save_dir):if not os.path.exists(save_dir):os.makedirs(save_dir)for filename in os.listdir(folder_path):file_path = os.path.join(folder_path, filename)if os.path.isfile(file_path):  # 只处理文件,忽略子目录file_size = os.path.getsize(file_path)width = determine_width(file_size)base_name = os.path.splitext(os.path.basename(file_path))[0]new_name = f"{base_name}_10.3.0.png"save_path = os.path.join(save_dir, new_name)binary_to_image(file_path, save_path, width)# 文件夹路径
folder_path = r'C:\Users\19427\Desktop\5.1.0'
save_directory = r'C:\Users\19427\Desktop\5.1.0\output_images'# 调用函数处理文件夹
process_folder(folder_path, save_directory)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/16775.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于51单片机多功能太阳能充电器设计

1 绪论1.1 本课题研究背景及现状 当代社会随着一些不可再生资源如煤炭&#xff0c;石油等日益减少&#xff0c;使得各国社会经济越来越受能源问题的约制&#xff0c;因此许多国家开始逐渐的实行“阳光计划”&#xff0c;开发洁净的能源如太阳能&#xff0c;用以成为本国经济发…

ANOVA方差分析是什么?优思学院教你如何正确使用

ANOVA&#xff08;方差分析&#xff09;是一种统计方法&#xff0c;用来研究三个或三个以上样本平均数的差异是否显著。它可以帮助研究者判断不同组间的均值是否存在统计学上的显著差异。简单来说&#xff0c;如果我们想比较多个不同处理或条件对某个变量的影响&#xff0c;ANO…

【网络层】网络攻击 ARP 欺骗

文章目录 ARP 欺骗原理实战体验 ARP 欺骗原理 ARP&#xff08;地址解析协议&#xff09;欺骗是一种网络攻击技术&#xff0c;它利用了ARP协议的工作机制来欺骗网络中的主机。ARP协议用于将IP地址转换为物理MAC地址&#xff0c;以便在局域网内部进行数据包的传输。ARP欺骗的基本…

微信小程序毕业设计-跑腿系统项目开发实战(附源码+演示视频+LW)

大家好&#xff01;我是程序猿老A&#xff0c;感谢您阅读本文&#xff0c;欢迎一键三连哦。 &#x1f49e;当前专栏&#xff1a;微信小程序毕业设计 精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f380; Python毕业设计…

可监测的到手价范围

在品牌进行电商价格监测时&#xff0c;对优惠信息范围的关注至关重要。优惠促销的形式多样&#xff0c;会直接影响到消费者最终的到手价。因此&#xff0c;为了更准确地计算到手价&#xff0c;品牌需要确保监测的促销信息尽可能全面。 不同的电商平台&#xff0c;其优惠形式可…

揭秘APP广告变现的高效秘诀:如何让你的APP更赚钱?

在数字化时代&#xff0c;APP已成为人们获取信息、娱乐休闲的重要平台。对于许多内容创作者来说&#xff0c;如何通过APP实现盈利&#xff0c;是一个亟待解决的问题。而APP广告变现项目&#xff0c;正是其中一种备受关注的盈利模式。那么&#xff0c;如何有效地利用APP广告变现…

python数据分析:爬取某东商城商品评论数据并做词云展示(含完整源码及详细注解)

python数据分析,爬取某东商城商品评论数据并做词云展示。 一、明确爬取的网页及结构 找到要爬取的网页地址,发现有一个获取json格式评论数据的接口: url = "https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=217…

基于图鸟UI的圈子商圈:一个全栈前端模板的探索与应用

摘要&#xff1a; 本文介绍了一个基于图鸟UI的纯前端模板——圈子商圈&#xff0c;它支持微信小程序、APP和H5等多平台开发。该模板不仅包含丰富的UI组件和页面模板&#xff0c;还提供了详尽的使用文档&#xff0c;旨在帮助开发者快速构建出酷炫且功能齐全的前端应用。本文将从…

MySQL 8窗口函数详解:高效数据处理的必备技能

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 MySQL 8窗口函数详解&#xff1a;高效数据处理的必备技能 前言窗口函数概述窗口函数的基本语法常用窗口函数类型窗口帧的定义与使用性能优化与注意事项 前言 你是否曾经遇到过需要对数据进行复杂统计…

windows Oracle 11g服务器端和客户端安装 SQLark连接ORACLE

1 从ORACLE官网下载数据库安装包 https://edelivery.oracle.com/osdc/faces/SoftwareDelivery 2:安装数据库 注意&#xff1a;在加载组件的这一步&#xff0c;如果你的电脑里面有杀毒软件&#xff0c;首先把安装目录加入白名单&#xff0c;要不然可能会一直加载组件失败。…

使用fme把gis数据保存为gdb格式的,然后用arcgis map落图查看

1先启动fme workbench工具&#xff0c;然后按照图中的标注选择好两个对应文件目录或者数据库 2比如我选择的gis(空间属性数据)的来源是Oracle数据库下的某个库下的某张表 3然后选择保存为这种gdb格式的数据以及某个目录下&#xff0c;注意format是选择带api格式的&#xff0c;d…

搞到了阿里云大佬的docker笔记,实战总结一步到位,建议收藏

Docker 是一个开源的应用容器引擎&#xff0c;让开发者可以打包他们的应用以及依赖包到一个可移植的容器中&#xff0c;然后发布到任何流行的 Linux 机器上&#xff0c;也可以实现虚拟化。容器是完全使用沙箱机制&#xff0c;相互之间不会有任何接口。 Docker在今天已经算是明星…

项目文章 |NC揭示真菌中A-to-I mRNA编辑机制及其调控和演化

A-to-I mRNA编辑是一种重要的基因表达调控方式&#xff0c;它通过将mRNA中的腺苷(A)转变为肌苷(I)&#xff0c;从而可能改变蛋白质的编码信息。在动物中&#xff0c;这一过程由ADAR家族酶介导&#xff0c;然而在真菌中&#xff0c;由于缺乏ADARs的同源物&#xff0c;其背后的机…

windows11下,使用工具验证下载的iso文件完整性

windows11下&#xff0c;要验证下载的iso文件是否正常&#xff0c;可以使用工具生成md5值&#xff0c;再与下载源提供的md5值进行比较&#xff0c;相同&#xff0c;说明下载的正常。 命令如下&#xff1a; certutil -hashfile iso文件名 md5 如下面的例子&#xff0c;生成d…

如何解决IT运维不给力

运维不给力&#xff0c;是很多企业IT部门面临的头疼问题&#xff0c;其背后的原因错综复杂&#xff0c;可能涉及到资金投入不足、团队积极性不高、或是缺乏科学的运维管理体系。要解决这些问题&#xff0c;引入IT运维管理和利用先进的ITILDESK平台&#xff0c;可以作为破局的关…

【408真题】2009-19

“接”是针对题目进行必要的分析&#xff0c;比较简略&#xff1b; “化”是对题目中所涉及到的知识点进行详细解释&#xff1b; “发”是对此题型的解题套路总结&#xff0c;并结合历年真题或者典型例题进行运用。 涉及到的知识全部来源于王道各科教材&#xff08;2025版&…

buuctf_equation

神秘的Javascript混淆法&#xff0c;从前有个程序员大神&#xff0c; 运用了javascript的语法特性创造了一个js混淆方法&#xff0c;这个名字在日本叫做“jjfucker”..没错&#xff0c;大神都不知道这个玩意儿怎么做的&#xff0c;很烦恼就取名了f**k。 后面还有很长一大串。 …

基于深度学习和opencv的车牌识别系统

免费获取方式↓↓↓ 项目介绍028&#xff1a; 基于深度学习和opencv的车牌识别系统 同时利用对图片每一帧图像加入视频分析模块 图片分析模块可以依据界面按钮提示进行相应功能 视频分析模块可以根据按钮提示进行对视频的分析 &#xff08;视频模块的视频追踪处理时间较长&…

天气的雪碧图标(晴天,雨天,雪天,阴天,雾天,多云等)(2024-05-27)

天气的预览图标&#xff0c;可以自行下载&#xff0c;或者在资源中下载高清的

基于单片机和蓝牙控制的智能小车设计

摘要 &#xff1a; 本文设计了一种以智能手机为平台控制小车的控制系统&#xff0c;该系统以蓝牙为通信模块&#xff0c;手机通过蓝牙发送信号给小 车上的蓝牙模块&#xff0c;从而驱动电机实现小车各种运动&#xff0c;提供了一种无线遥控小车的新思路。设计了该系统的硬件与软…