在.NetCore中使用Myrmec检测文件真实格式

Myrmec 是什么?

Myrmec 是一个用于检测文件格式的库,Myrmec不同于其它库或者手写检测代码,Myrmec不依赖文件扩展名(在实际使用中,你的用户很可能使用虚假的扩展名欺骗你的应用程序),Myrmec会检测文件的二进制头,并在其元数据库中匹配来获得文件的格式。

例如Jpg图片的二进制头是 "FF D8 FF DB" 那么Myrmec会匹配到这个文件头,并获得两个结果--"jpg"和"jpeg"。

如何使用

首先安装 nuget 包

 Install-Package Myrmec

或者通过 DotnetCli

 dotnet add package Myrmec 

编写匹配代码

// 创建嗅探器

Sniffer sniffer = new Sniffer();


// 使用元数据填充嗅探器

sniffer.Populate(FileTypes.CommonFileTypes);


// 获取要匹配文件的文件头,一般20个字节就够了,有的格式可能需要更长

byte[] fileHead = ReadFileHead();


// 匹配并获取结果

List<string> results = sniffer.Match(fileHead)

为什么结果是List<String>?

许多时候一个文件格式会对应多个扩展名,比如jpg。还有的时候多种文件格式都是一种文件格式,比如 zip、apk、pptx 它们都是zip achive ,所以当你匹配了一个zip文件,那么你最少会获得3个扩展名。当结果是空时,说明没有匹配到结果。

 

查询多个结果或者一个

会有这样的情况:文件格式A 的文件头是 "ff,11,22" ,文件格式B 的 文件头是“ff,11,22,33”,这时候你要匹配的文件头是"ff,11,22,33,44",那么它最多会匹配到这两个结果,并返回他们包含的所有扩展名

// 这会在匹配到第一个结果时就返回

// default is false

List<string> results = sniffer.Match(fileHead,false);


// 这会匹配到所有的结果

List<string> results = sniffer.Match(fileHead,true);

添加自定义的文件头

也许你创建了一种文件格式,或者你所使用的文件格式不在元数据中,这时你可以使用下面的代码将其加入元数据:

var data = new byte[]

{

    0x11,

    0x22,

    0x33

};

sniffer.Add(data, new[] { "what", "file", "type" });

注意这个新添加的格式拥有3个扩展名。

获取MimeType

1 List<string> result = sniffer.Match(head);2 string mimeType = MimeTypes.GetMimeType(result.First());

 

或者

1 string mimeType = MimeTypes.GetMimeType("png");

 

在下一个版本中,获取MimeType将会被替换成string 的扩展方法。

 

元数据来源

元数据来自维基百科 List of file signatures.

RoadMap

接下来要做的事就是支持 带有偏移量的 文件格式,例如

 ff,11,ff 起始偏移10字节

以及  11,ff,??,??,??,11,??,fd 这种含有跳跃的文件格式。

不过事实上他们两个是一种形式,预计下一个版本就会发布对其的支持。

支持 .net standard.现在是.net core 2,在未来会调整到.net standard

github地址:https://github.com/rocketRobin/myrmec

nuget地址:https://www.nuget.org/packages/Myrmec/

欢迎大家试用,提出意见与建议

 

为什么github仓库是英文的?

作为一个中文开发者,我没有在github仓库中使用中文,因为我希望能够长久的开发这个项目,并希望世界各地的开发者都能使用这个库,或者参与开发,为了此目的,我在github上使用的是英文。


原文地址: https://www.cnblogs.com/rocketRobin/p/8446273.html


.NET社区新闻,深度好文,欢迎访问公众号文章汇总 http://www.csharpkit.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/322088.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jzoj3736-[NOI2014模拟7.11]数学题(math)【计算几何】

正题 题目大意 给定两个向量a(x1,y1),b(x2,y2)a(x_1,y_1),b(x_2,y_2)a(x1​,y1​),b(x2​,y2​)&#xff0c;然后求∣λ1aλ2b∣|\lambda _1a\lambda _2b|∣λ1​aλ2​b∣的最小值&#xff0c;要求λ1,λ2\lambda_1,\lambda _2λ1​,λ2​不同时为0。 解题思路 我们先考虑若…

SpringCloud Zuul(七)之POST Filter

一、POST Filter 后置过滤器一般使用来转换响应数据的格式&#xff0c;截取请求响应数据进行流量录制等操作。 Zuul已定义的后置过滤器SendResponseFilter&#xff0c;将代理请求的响应写入当前响应。 二、自定义后置过滤器 本文自定义后置过滤器用来截取响应体的快照文本发…

Orleans之EventSourcing

引入:如果没有意外,我再这篇文章中用ES代替EventSourcing,如果碰到"事件回溯","事件溯源","事溯"等词语,都一般代表Eventsourcing.如果引入Orleans而不用es的话,那就只用了Orleans一半的优点,多线程编程的逻辑\排错的简化以及可分布式.下面我聊聊…

jzoj3737-[NOI2014模拟7.11]挖宝藏(treasure)【斯坦纳树,SPFA,状压】

正题 题目大意 hhh层&#xff0c;每层n∗mn*mn∗m个石头&#xff0c;挖开不同位置的石头有不同的消耗&#xff0c;只能从高层下到低层。有一些宝藏&#xff0c;求拿到所有宝藏的最小代价。 解题思路 先考虑只有111层的情况&#xff0c;因为挖开的不用再挖 &#xff0c;我们可以…

SpringCloud Zuul(八)之ERROR Filter

一、ERROR Filter 错误过滤器用来处理zuul异常&#xff0c;一般使作为打印异常堆栈、跳转异常页面、转换异常信息格式返回等操作。 Zuul已定义的错误过滤器SendErrorFilter&#xff0c;如果RequestContext.getThrowable()不为null&#xff0c;则转发到/error&#xff08;默认…

Alex: 2018年对混合现实MR的展望

原文作者&#xff1a;Alex Kipman&#xff0c; 微软操作系统工程院技术院士 Hello 大家好&#xff01;难以置信我们已经走过了2018年的头两个月了。每年一月份我都会去巴西省亲&#xff0c;和我的家人欢聚一堂&#xff0c;度过一个美好的假日。在我省亲的同时&#xff0c;我想了…

jzoj3738-[NOI2014模拟7.11]理想城市(city)【树,模型转换】

正题 题目大意 一个理想城市有nnn个块构成&#xff0c;有以下性质 任意两个块之间可以通过其他块到达任意两个块之间可以不通过其他块(通过空位)到达 然后求每个块之间的距离之和。 解题思路 我们将横竖的距离分开计算。 假设现在我们考虑计算竖向的边的距离&#xff0c;我…

SpringCloud Ribbon(二)之自定义负载均衡策略IRule

一、Ribbon负载均衡策略 一个服务对应一个LoadBalancer&#xff0c;一个LoadBalancer只有一个Rule&#xff0c;LoadBalancer记录服务的注册地址&#xff0c;Rule提供从服务的注册地址中找出一个地址的规则。 Ribbon提供七种负载均衡策略&#xff0c;默认的负载均衡策略是轮训策…

欢乐纪中A组赛【2019.8.10】

前言 昨天&#xff1a; MdMdMd今天还真爆零了 顺便%%%ZZYRank1\%\%\%ZZY\ Rank1%%%ZZY Rank1 成绩 JJJ表示初中&#xff0c;HHH表示高中后面加的是几年级 RankRankRankPersonPersonPersonScoreScoreScoreAAABBBCCC111(H−1)ZZY(H-1)ZZY(H−1)ZZY1501501502020203030301001001…

Blazor正式成为Microsoft官方.NET 和WebAssembly项目

Microsoft从Blazor的开发者Steve Sanderson手中接手了这款应用程序&#xff0c;自此&#xff0c;将.NET在浏览器运行的计划又更进了一步。由此&#xff0c;Microsoft又进一步扩充了自己的WebAssembly/.NET栈&#xff0c;更进一步帮助.NET开发人员搭建基于浏览器的应用程序。在一…

SpringCloud Ribbon(一)之自定义负载均衡器ILoadBalancer

一、Ribbon负载均衡 一个服务对应一个LoadBalancer&#xff0c;一个LoadBalancer只有一个Rule&#xff0c;LoadBalancer记录服务的注册地址&#xff0c;提供更新服务的注册地址&#xff0c;Rule提供从服务的注册地址中找出一个地址的规则。 二、 自定义负载均衡 本文自定义负…

bzoj4403-序列统计【Lucas,组合数学】

正题 题目链接:https://www.lydsy.com/JudgeOnline/problem.php?id4403 题目大意 求有多少个长度为nnn的单调不升序列&#xff0c;且对于每个元素都∈[L,R]\in[L,R]∈[L,R] 解题思路 我们让mR−L1mR-L1mR−L1&#xff0c;因为序列的要求起始起始不会影响结果 然后我们开始考…

.NET Core 2.1路线图

Microsoft的Scott Hunter发布了Microsoft .NET Core 2.1版本的路线图。Hunter宣布Microsoft .NET Core每天约有五十万开发人员的使用量。根据Microsoft所收集的数据&#xff0c;在2017年9月.NET Core 2的使用量已经超过了.NET Core 1.X。有了之前成功的发布经验&#xff0c;Mic…

SpringCloud Ribbon(三)之IPing机制

一、IPing机制 IPing是一个主动探测服务节点存活的机制&#xff0c;通过判断服务节点的当前状态&#xff0c;设置节点的可用状态。只有当节点为可用时候才会作为负载均衡器的选取节点。 IPing有以下几种模式: DummyPing&#xff1a;默认返回true&#xff0c;即认为所有节点都…

.NET Core使用swagger进行API接口文档管理

一、问题背景随着技术的发展&#xff0c;现在的开发模式已经更多的转向了前后端分离的模式&#xff0c;在前后端开发的过程中&#xff0c;联系的方式也变成了API接口&#xff0c;但是目前项目中对于API的管理很多时候还是通过手工编写文档&#xff0c;每次的需求变更只要涉及到…

CF451E-Devu and Flowers【组合计数,容斥】

正题 题目链接:https://www.luogu.org/problem/CF451E 题目大意 长度为nnn的序列aia_iai​&#xff0c;有如下要求 ai∈[0...xi]a_i\in[0...x_i]ai​∈[0...xi​]∑i1nais\sum_{i1}^na_is∑i1n​ai​s 求序列个数。 解题思路 考虑容斥&#xff0c;这样我们就可以将条件转换…

SpringCloud Ribbon(四)之全局配置与服务配置

一、Ribbon全局配置 RibbonClients注解配置导入全局Ribbon客户端默认设置 public class GlobalRibbonConfig {//负载均衡策略Beanpublic IRule rule() {return new MicroServiceLoadBalanceRule();}//负载均衡器Beanpublic <E extends Server> ILoadBalancer loadBalan…

.NET下使用socket.io随笔记录

一、问题背景目前公司在互联网产品上需要程序与前端部分要进行一个实时交互&#xff0c;在进行一定程度上的选型后&#xff0c;决定使用socket.io框架进行一个实践&#xff0c;算是公司的一个新的 尝试&#xff0c;也算是给自己增加增长见闻&#xff0c;由于我是做后端以及桌面…

bzoj2111,P2606-[ZJOI2010]排列计数【Lucas,组合计数,dp】

正题 题目链接: https://www.lydsy.com/JudgeOnline/problem.php?id2111 https://www.luogu.org/problem/P2606 题目大意 长为nnn的序列PPP&#xff0c;然后要求Pi>P⌊i2⌋P_i>P_{\lfloor \frac{i}{2}\rfloor}Pi​>P⌊2i​⌋​。求排列个数。 解题思路 若用iii连向…

SpringCloud Ribbon(五)之服务实例列表ServerList

一、服务实例列表ServerList 服务实例列表&#xff08;ServerList&#xff09;为负载均衡器&#xff08;Loadbalancer&#xff09;提供服务的可用实例列表。 负载均衡器&#xff08;Loadbalancer&#xff09;通过服务实例列表&#xff08;ServerList&#xff09;从注册中心&a…