在.NetCore中使用Myrmec检测文件真实格式

Myrmec 是什么?

Myrmec 是一个用于检测文件格式的库,Myrmec不同于其它库或者手写检测代码,Myrmec不依赖文件扩展名(在实际使用中,你的用户很可能使用虚假的扩展名欺骗你的应用程序),Myrmec会检测文件的二进制头,并在其元数据库中匹配来获得文件的格式。

例如Jpg图片的二进制头是 "FF D8 FF DB" 那么Myrmec会匹配到这个文件头,并获得两个结果--"jpg"和"jpeg"。

如何使用

首先安装 nuget 包

 Install-Package Myrmec

或者通过 DotnetCli

 dotnet add package Myrmec 

编写匹配代码

// 创建嗅探器

Sniffer sniffer = new Sniffer();


// 使用元数据填充嗅探器

sniffer.Populate(FileTypes.CommonFileTypes);


// 获取要匹配文件的文件头,一般20个字节就够了,有的格式可能需要更长

byte[] fileHead = ReadFileHead();


// 匹配并获取结果

List<string> results = sniffer.Match(fileHead)

为什么结果是List<String>?

许多时候一个文件格式会对应多个扩展名,比如jpg。还有的时候多种文件格式都是一种文件格式,比如 zip、apk、pptx 它们都是zip achive ,所以当你匹配了一个zip文件,那么你最少会获得3个扩展名。当结果是空时,说明没有匹配到结果。

 

查询多个结果或者一个

会有这样的情况:文件格式A 的文件头是 "ff,11,22" ,文件格式B 的 文件头是“ff,11,22,33”,这时候你要匹配的文件头是"ff,11,22,33,44",那么它最多会匹配到这两个结果,并返回他们包含的所有扩展名

// 这会在匹配到第一个结果时就返回

// default is false

List<string> results = sniffer.Match(fileHead,false);


// 这会匹配到所有的结果

List<string> results = sniffer.Match(fileHead,true);

添加自定义的文件头

也许你创建了一种文件格式,或者你所使用的文件格式不在元数据中,这时你可以使用下面的代码将其加入元数据:

var data = new byte[]

{

    0x11,

    0x22,

    0x33

};

sniffer.Add(data, new[] { "what", "file", "type" });

注意这个新添加的格式拥有3个扩展名。

获取MimeType

1 List<string> result = sniffer.Match(head);2 string mimeType = MimeTypes.GetMimeType(result.First());

 

或者

1 string mimeType = MimeTypes.GetMimeType("png");

 

在下一个版本中,获取MimeType将会被替换成string 的扩展方法。

 

元数据来源

元数据来自维基百科 List of file signatures.

RoadMap

接下来要做的事就是支持 带有偏移量的 文件格式,例如

 ff,11,ff 起始偏移10字节

以及  11,ff,??,??,??,11,??,fd 这种含有跳跃的文件格式。

不过事实上他们两个是一种形式,预计下一个版本就会发布对其的支持。

支持 .net standard.现在是.net core 2,在未来会调整到.net standard

github地址:https://github.com/rocketRobin/myrmec

nuget地址:https://www.nuget.org/packages/Myrmec/

欢迎大家试用,提出意见与建议

 

为什么github仓库是英文的?

作为一个中文开发者,我没有在github仓库中使用中文,因为我希望能够长久的开发这个项目,并希望世界各地的开发者都能使用这个库,或者参与开发,为了此目的,我在github上使用的是英文。


原文地址: https://www.cnblogs.com/rocketRobin/p/8446273.html


.NET社区新闻,深度好文,欢迎访问公众号文章汇总 http://www.csharpkit.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/322088.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jzoj3736-[NOI2014模拟7.11]数学题(math)【计算几何】

正题 题目大意 给定两个向量a(x1,y1),b(x2,y2)a(x_1,y_1),b(x_2,y_2)a(x1​,y1​),b(x2​,y2​)&#xff0c;然后求∣λ1aλ2b∣|\lambda _1a\lambda _2b|∣λ1​aλ2​b∣的最小值&#xff0c;要求λ1,λ2\lambda_1,\lambda _2λ1​,λ2​不同时为0。 解题思路 我们先考虑若…

Orleans之EventSourcing

引入:如果没有意外,我再这篇文章中用ES代替EventSourcing,如果碰到"事件回溯","事件溯源","事溯"等词语,都一般代表Eventsourcing.如果引入Orleans而不用es的话,那就只用了Orleans一半的优点,多线程编程的逻辑\排错的简化以及可分布式.下面我聊聊…

Alex: 2018年对混合现实MR的展望

原文作者&#xff1a;Alex Kipman&#xff0c; 微软操作系统工程院技术院士 Hello 大家好&#xff01;难以置信我们已经走过了2018年的头两个月了。每年一月份我都会去巴西省亲&#xff0c;和我的家人欢聚一堂&#xff0c;度过一个美好的假日。在我省亲的同时&#xff0c;我想了…

jzoj3738-[NOI2014模拟7.11]理想城市(city)【树,模型转换】

正题 题目大意 一个理想城市有nnn个块构成&#xff0c;有以下性质 任意两个块之间可以通过其他块到达任意两个块之间可以不通过其他块(通过空位)到达 然后求每个块之间的距离之和。 解题思路 我们将横竖的距离分开计算。 假设现在我们考虑计算竖向的边的距离&#xff0c;我…

SpringCloud Ribbon(二)之自定义负载均衡策略IRule

一、Ribbon负载均衡策略 一个服务对应一个LoadBalancer&#xff0c;一个LoadBalancer只有一个Rule&#xff0c;LoadBalancer记录服务的注册地址&#xff0c;Rule提供从服务的注册地址中找出一个地址的规则。 Ribbon提供七种负载均衡策略&#xff0c;默认的负载均衡策略是轮训策…

欢乐纪中A组赛【2019.8.10】

前言 昨天&#xff1a; MdMdMd今天还真爆零了 顺便%%%ZZYRank1\%\%\%ZZY\ Rank1%%%ZZY Rank1 成绩 JJJ表示初中&#xff0c;HHH表示高中后面加的是几年级 RankRankRankPersonPersonPersonScoreScoreScoreAAABBBCCC111(H−1)ZZY(H-1)ZZY(H−1)ZZY1501501502020203030301001001…

Blazor正式成为Microsoft官方.NET 和WebAssembly项目

Microsoft从Blazor的开发者Steve Sanderson手中接手了这款应用程序&#xff0c;自此&#xff0c;将.NET在浏览器运行的计划又更进了一步。由此&#xff0c;Microsoft又进一步扩充了自己的WebAssembly/.NET栈&#xff0c;更进一步帮助.NET开发人员搭建基于浏览器的应用程序。在一…

SpringCloud Ribbon(一)之自定义负载均衡器ILoadBalancer

一、Ribbon负载均衡 一个服务对应一个LoadBalancer&#xff0c;一个LoadBalancer只有一个Rule&#xff0c;LoadBalancer记录服务的注册地址&#xff0c;提供更新服务的注册地址&#xff0c;Rule提供从服务的注册地址中找出一个地址的规则。 二、 自定义负载均衡 本文自定义负…

.NET Core 2.1路线图

Microsoft的Scott Hunter发布了Microsoft .NET Core 2.1版本的路线图。Hunter宣布Microsoft .NET Core每天约有五十万开发人员的使用量。根据Microsoft所收集的数据&#xff0c;在2017年9月.NET Core 2的使用量已经超过了.NET Core 1.X。有了之前成功的发布经验&#xff0c;Mic…

SpringCloud Ribbon(三)之IPing机制

一、IPing机制 IPing是一个主动探测服务节点存活的机制&#xff0c;通过判断服务节点的当前状态&#xff0c;设置节点的可用状态。只有当节点为可用时候才会作为负载均衡器的选取节点。 IPing有以下几种模式: DummyPing&#xff1a;默认返回true&#xff0c;即认为所有节点都…

.NET Core使用swagger进行API接口文档管理

一、问题背景随着技术的发展&#xff0c;现在的开发模式已经更多的转向了前后端分离的模式&#xff0c;在前后端开发的过程中&#xff0c;联系的方式也变成了API接口&#xff0c;但是目前项目中对于API的管理很多时候还是通过手工编写文档&#xff0c;每次的需求变更只要涉及到…

.NET下使用socket.io随笔记录

一、问题背景目前公司在互联网产品上需要程序与前端部分要进行一个实时交互&#xff0c;在进行一定程度上的选型后&#xff0c;决定使用socket.io框架进行一个实践&#xff0c;算是公司的一个新的 尝试&#xff0c;也算是给自己增加增长见闻&#xff0c;由于我是做后端以及桌面…

SpringCloud Ribbon(五)之服务实例列表ServerList

一、服务实例列表ServerList 服务实例列表&#xff08;ServerList&#xff09;为负载均衡器&#xff08;Loadbalancer&#xff09;提供服务的可用实例列表。 负载均衡器&#xff08;Loadbalancer&#xff09;通过服务实例列表&#xff08;ServerList&#xff09;从注册中心&a…

超级简便的容器化部署工具(使用 ASP.NET Core 演示)

Docker 改变了我们部署网站的方式&#xff0c;从原先的手动编译打包上传&#xff0c;到现在的构建镜像然后推送部署&#xff0c;让我们在配置环境上所花费的时间大大减少了。不仅如此&#xff0c;通过一系列相关的工具配合&#xff0c;可以很轻松的实现 CI、CD。本文即将介绍的…

学习手记(2019/7/05~2019/8/31)——快乐暑假

文章目录二分答案的作用堆和区间很糙ddp线段树合并网络流结论の1树上莫队对角线与GCD区间与扫描线与方案数欧拉欧拉*1斯坦纳树切比雪夫距离二分匹配结论の1min-max容斥计算几何の -1二分答案的作用 求最大值最小ororor最小值最大将求值问题转换为判断问题在判断问题之间相互转…

SpringCloud Ribbon(六)之服务实例过滤器ServerListFilter

一、服务实例过滤器ServerListFilter 服务实例过滤器&#xff08;ServerListFilter&#xff09;为负载均衡器&#xff08;Loadbalancer&#xff09;提供从服务实例列表&#xff08;ServerList&#xff09;获取的服务实例过滤出符合要求的服务实例。 负载均衡器&#xff08;Lo…

听说你开发.NET还在用VS,小哥哥给你推荐全平台的Rider

前言.NET平台的开发一直都只能使用Visual Studio来开发&#xff0c;自从dotnet core 发布后不久&#xff0c;jetbrains 发布了Rider预览版&#xff0c;到目前为止的正式版2017.3.1。博主都使用过&#xff0c;因为博主的主力开发语言是C#&#xff0c;所以一直以来被捆绑到Window…

给Ocelot做一个Docker 镜像

写在前面在微服务架构中&#xff0c;ApiGateway起到了承前启后&#xff0c;不仅可以根据客户端进行分类&#xff0c;也可以根据功能业务进行分类&#xff0c;而且对于服务调用服务也起到了很好的接口作用。目前在各个云端中&#xff0c;基本上都提供了ApiGateway的功能&#xf…

.NET Core UI框架Avalonia

.NET Core UI框架Avalonia&#xff0c;Avalonia是一个基于WPF XAML的跨平台UI框架&#xff0c;并支持多种操作系统&#xff1a;Windows&#xff08;.NET Framework&#xff0c;.NET Core&#xff09;&#xff0c;Linux&#xff08;GTK&#xff09;&#xff0c;MacOS&#xff0c…

揽货最短路径解决方案算法 - C# 蚁群优化算法实现

需求为&#xff08;自己编的&#xff0c;非实际项目&#xff09;&#xff1a;某配送中心进行揽货&#xff0c;目标客户数为50个客户&#xff0c;配送中心目前的运力资源如下&#xff1a;现有车辆5台单台运力最大行驶距离200千米单台运力最大载重公斤1吨问&#xff1a;运力怎样走…