隐藏画质代码_优秀的模糊测试代码是如何炼成的?

199e5e1837fb5b5110643d027c083932.gif

所谓模糊测试,是指一种通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法,它经过了近 20 年的发展,早已在程序员圈中成为一种主流漏洞挖掘技术。基于此,开发者们该如何编写良好的模糊测试代码?

cdf320f62c38184bbed69a18f6d2adbb.png

作者 | John Regehr

译者 | 弯月,责编 | 屠敏

出品 | CSDN(ID:CSDNnews)

以下为译文:

模糊测试(Fuzzing)是发掘漏洞和其他软件缺陷的强力手段,但通常开发者都是利用这种方式来深入发掘已部署代码中的问题。实际上,我们应该尽早完成模糊测试,而且开发人员应该花点时间来编写更易于开展模糊测试的代码。

在这篇文章中,我想介绍一些方法,告诉你如何编写更方便模糊测试的代码。但这些方法并不全面,而且各个方法之间也可能有重叠。纵观本文,我会使用“模糊器”来指代所有类型的随机测试用例生成器,无论是基于突变的(afl、libFuzzer等)还是生成的(jsfunfuzz、Csmith等)生成器。注意,本文提出的建议并非适用所有情况,但其中很多都是合理的软件工程建议。我会用粗体标明一些我认为特别重要的观点。

24c69ddae52d9620bfb71d2b2c4ecd26.png

在测试预言上下功夫

测试预言(test oracle)决定了测试用例是否会触发bug。在默认情况下,afl等模糊器唯一可以使用的预言就是操作系统的页面保护机制。换句话说,它只能检测系统的崩溃。但是我们能做到远不止于此。

断言和由编译器插入的sanitizer检查是另一种类型的预言。在模糊测试中,你应该尽可能多地使用这种类型的检查。除了这些简单的预言之外,还有很多其他的预言,例如:

  • 函数与反函数:解析与输出的闭环、压缩与解压缩的闭环、加密与解密的闭环及其他类似的代码是否会按预期正常工作?

  • 差异:两个不同的实现或同一个实现的两种不同的模式是否表现出相同的行为?

  • 变形:如果在保证语义的情况下修改测试用例,系统是否会表现出的行为,例如在表达式中再添加一层括号?

  • 资源:处理输入时,系统消耗的时间、内存等是否合理?

  • 特定领域:例如,一个因压缩而导致画质受损的图像在视觉上是否与未压缩的图像一致? 

我们值得花时间和精力建立强大的预言,因为它们往往能够发现应用程序级的逻辑错误,而通常我们通过查找数组越界等方式只能捕获低级的错误。

几年前,我撰写过一篇有关于该话题的文章(https://blog.regehr.org/archives/856)。有一个Twitter用户建议:“在测试解析器的时候,你必须检查它返回的对象,而不仅仅是检查解析这个动作的执行。”这是一个很好的建议。

ad09b1f0a5c5c86477e2f019ac4ac065.png

干预I/O与状态

无状态代码更方便展开模糊测试。但除此之外,你还需要API来控制状态和干预I/O。例如,如果程序需要从操作系统中获取核心数、当前日期或剩余磁盘空间量等信息,那么你应该提供一种设置这些值的方法并写在文档中。我并不是说,我们需要随时改变核心数量,而是我们可能在单核模式下针对代码展开模糊测试,然后还需要在128核模式下再进行一次模糊测试。有些控制状态和I/O的方法非常重要,比如简化重置状态(为了支持持久模式的模糊测试),并避免会导致非确定性执行的隐藏输入等。在针对代码进行模糊测试时,我们希望拥有尽可能多的确定性。

d9a3bcf75c35290d5d587800bf623d96.png

避免或控制模糊测试的阻碍

模糊测试的阻碍就是那些无法模糊化的东西。典型的模糊测试阻碍是包含在输入中某处的校验和:基于突变的模糊器随机修改输入会导致校验和不合法,从而降低代码覆盖率。这个问题基本上有两种解决方案。第一种,在模糊测试构建中关闭校验和验证;第二种,确保模糊器能够生成带有合法校验和的输出。基于生成的模糊器自带这种功能;如果使用基于突变的模糊器,那么我们需要编写一个小工具,在生成测试用例后,我们需要赶在测试用例传递给模糊测试程序前,给测试用例加上有效的校验和。alf支持这种方法。

除了校验和之外,难以满足的输入验证属性也是一个严重的问题。例如,如果你要针对强类型编程语言的编译器进行模糊测试,那么盲目地修改编译器的输入很难获得有效的编译器输入。我喜欢将有效性的约束分为软约束(无效输入除了浪费时间外,并没有其他害处)和硬约束(系统在处理无效输入时可能会暴走,因此必须避免无效输入,否则完全无法进行模糊测试)。如果我们通过针对C++编译器开展模糊测试来寻找错误代码中的bug,就会面临硬有效性约束,因为会导致未定义行为的编译器输入看上去很像是代码中有bug。对于这类问题,我们没有简单的通用解决方案,只能通过一系列技巧来考虑有效性属性。有一个最简单的解决方案(但往往不是正确的解决方案),那就是自己编写一个模糊器。但问题在于,如果自己编写模糊器,就无法再利用现代覆盖驱动的模糊测试技术——这种技术非常了不起的。为了匹配覆盖率驱动的模糊测试框架,你有以下几种选择:首先,编写一个能够满足有效性约束的自定义变异器;其次,采用了解结构的模糊,意思是说从模糊器中获取修改后的数据,并将其转换为模糊测试程序所需要的内容。关于如何让覆盖驱动的模糊器在有效性约束下依然良好地运行,且不需要大量的手动工作,我们还有大量的研究工作需要展开。这其中涉及很多细节,改日再深入介绍。一般来说,在模糊器中加入类似SAT的求解器并不能解决这个问题,其原因首先是,有的有效性约束(比如校验和)对于求解器来说难度特别大;其次是因为有些有效性约束(如C++程序中的未定义行为)是隐含的,我们无法从系统中推断,甚至从原理上也不可能。

一般来说,你无法通过为公共API提供输入的方式,来针对系统的大部分代码进行模糊测试,因为这些访问会被系统中的其他代码阻止。例如,如果你使用自定义的内存分配器实现或自定义的哈希表实现,那么应用程序级别的模糊测试可能无法针对分配器或哈希表进行有效的模糊测试。这些API应该直接暴露给模糊测试。单元测试和模糊测试有强烈的联系:如果其中一个可行且可取,那么另一个也应该差不多。通常你应该同时兼顾两者。

通常,Sanitizer和模糊器需要对构建过程进行调整,甚至是重大的改动。为了简化这一过程,请尽可能简化构建过程。确保可以轻松切换编译器以及修改编译器选项。尽量减少对特定工具(以及工具版本)的依赖。定期利用多个编译器构建和测试代码。构建系统的特殊依赖都需要记录下来。

最后,有些模糊测试的阻碍有点傻而且很容易避免。如果你的代码存在泄漏内存的问题,或者过深的调用栈会导致进程终止,那么使用持久模式的模糊测试是一件痛苦的事情,所以请尽量避免这些问题。尽量不要处理SIGSEGV信号,如果无法避免的话,那么应当有办法在模糊器构建中禁用相应的信号处理程序。如果你的代码无法与ASan或UBSan兼容,那么这些非常有用的预言就很难善加利用了。特别是,如果你的代码使用自定义的内存分配器,那么你应该考虑在模糊测试构建中将其关闭,或者经过调整后与ASan一起使用,否则就有可能漏掉重大bug。

5c3e041d9e20d84f28fc38f5ae926eff.png

为覆盖驱动的模糊器排除障碍

由于覆盖驱动的模糊器的主要精力放在了测试未覆盖的分支上,因此可能会被特殊的方式阻碍。例如,如果覆盖驱动的模糊器遇到了太多未覆盖的分支,它就会在这些分支上花费大量时间,导致覆盖程序其他分支的可能性降低。例如,有一次我比较了一个程序在使用和不使用UBSan两种情况下的afl覆盖率,结果发现(在我设定的时间限制下)sanitized程序的覆盖率要比没有sanitized的程序低得多。但另一方面,我们也希望模糊器能找到sanitizer的错误。我的建议是有sanitized和没有sanitized的程序都进行模糊测试。我不知道应该如何为这些模糊测试活动分配资源,也不知道是否有人在研究这个问题。也许这个问题并不重要,因为模糊测试本来就是过度测试。

有时候,你的程序在执行前期调用的代码会包含大量分支且会被过度模糊的代码。例如,可能你需要在处理输入之前对输入进行解压缩或解密。这很可能会影响基于覆盖的模糊器,导致模糊器花费大量时间去模糊测试加密库或压缩库。如果你不是希望这样,那么就应该提供一种方法,在模糊测试过程中禁用加密或压缩。

程序中的解释器都可能会给基于覆盖的模糊器造成困难,因为相关的程序执行路径是在解释器数据中编码的,而对于模糊器而言,一般情况下数据是不透明的。如果你想让基于覆盖的模糊器发挥最大作用,那么就应该考虑避免编写解释器,或者至少大力简化解释器。解决嵌入式解释器有一个很明好的方法(我相信肯定有人尝试过,不过我不知道)就是提供一个API,告诉模糊器该如何观察被解释语言的覆盖率。

3a259a43913798be1b0bfd6668294a24.png

支持高吞吐量的模糊测试

模糊测试对于高吞吐量的系统最有效,特别是对于基于反馈的模糊器而言,这种模糊器需要一定时间来学习怎样才能测试难以覆盖的目标。有关吞吐量的一个简单技巧是:提供禁用慢速代码(例如详细日志)的方法。类似地,干预I/O可以让我们不需要借助运行速度技巧,比如在内存盘上运行模糊器等方法。

dbaf458b0ded3a4230830186b3cbed28.png

“但我希望模糊我的代码变得更难,而不是更容易”

我不太赞同这个观点。我们不应该期待模糊代码来保证安全,而应该采用以下方法:

  • 尽早、尽可能彻底地实施模糊测试,在将代码发布到外部之前消除模糊测试能够发现的缺陷。

  • 通过人见人爱的强类型系统的编程语言编写代码——这可以静态地消除由于错误的编程习惯造成的问题,例如可以防止我们将错误的东西放入哈希映射。

  • 积极地使用断言和sanitizer来动态检查类型系统无法静态强制执行的属性。

  • 反模糊技术的确存在,但我不认为它代表软件朝着更好的方向发展。

5dfcbed6a5ed5c62b9caace4ab94cbd5.png

总结

随机测试非常强大,我们理应善加利用:如果你不针对你的代码展开模糊测试,那么别人也会。本文向软件开发人员介绍了一些实施模糊测试的好方法。当然还有很多其他方面本文未能提及,比如选择一个优秀的语料库以及编写一个良好的模糊驱动程序。

原文:https://blog.regehr.org/archives/1687

本文为 CSDN 翻译,转载请注明来源出处。

【END】

2712cc06836d4b30bd4720f9b87df72f.png

 热 文 推 荐 

☞顶配 12699 元、没有 5G,“浴霸三摄”的 iPhone 到底长什么样?☞Mate 30 不预装任何谷歌应用;阿里巴巴发布新“六脉神剑”;VS Code 1.38 发布 | 极客头条☞超 60 万 GPS 定位服务被曝漏洞,用户信息或将暴露!☞2亿日活,日均千万级视频上传,快手推荐系统如何应对技术挑战?☞Docker容器化部署Python应用☞给面试官讲明白:一致性Hash的原理和实践☞预警,CSW的50万枚尘封BTC即将重返市场?☞她说:行!没事别嫁程序员!

e35eddd33279c5ea966231884bdb89fa.gif

d1067ce3215f0f63a7f687baa932885e.png你点的每个“在看”,我都认真当成了喜欢

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/506947.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机网络学习笔记(六)——网络层、虚电路和数据报交换、路由(距离矢量、链路状态算法)、IP编址、网络拥塞控制、网络互联

文章目录前言概念一、网络层相关概述(一)三大核心功能(二)通信两大阵营二、交换技术(一)交换技术的分类(二)电路交换和分组交换(三)虚电路与数据报三、路由&a…

计算机网络学习笔记(七)——传输层、TCP三次握手、四次挥手、TCP流量控制、大总结

文章目录前言概念一、传输层概述二、传输层问题三、端到端寻址四、TCP三次握手和四次挥手(一)三次握手建立连接(二)四次挥手拆除连接五、带拥塞的TCP流量控制六、传输层实例计网大总结思维导图参考资料前言 笔者系电子科技大学20…

开发接口文档_更优更稳更好,看文档驱动开发模式在AIMS中的优势

​【摘要】程序员常会说:我最讨厌别人写的代码没有文档,我也最讨厌自己需要写文档。有一个很老的梗: 我最讨厌别人写的代码没有文档,我也最讨厌自己需要写文档。有这种想法的程序员应该算是一个老鸟了,对于大多数程序员来说&#…

人声处理_人声美化:人声后期处理方法

最近在整理美声方面的相关资料,主要是EQ方法的搜集和归纳。声音的压限(压缩处理)、均衡、混响是做好人声处理的关键。[1]1Ultrafunk fx: Equalizer R3(均衡)声音过暗会感觉吐词含糊不清,声音过亮…

计算机网络项目——最小网元设计(阶段二)

目录阶段目标设计描述1、帧结构2、帧定位3、差错检测4、差错控制5、流量控制6、长帧传输——分片测试情况其他想说的话阶段目标 用链路层例程代码(LnkTester.sln)设计实现链路层上点到点之间的通信过程,具体包括:两点之间帧同步、…

计算机网络项目——最小网元设计(阶段三)

目录阶段目标设计描述1、帧结构2、按目的转发3、反向地址学习4、未知广播测试情况其他想说的话阶段目标 本阶段主要完成链路层交换机的功能实现:单播目的地址判收、支持广播、有端口地址表、反向地址学习,并在含交换机的多网元情况下完成测试。 设计描…

计算机网络项目——最小网元设计(阶段四)

目录阶段目标设计描述1、实体编址2、路由表设计3、路由配置4、路由器的存储转发5、端到端的图片传输测试情况其他想说的话阶段目标 本阶段需要对实体进行编址,实现NET层的IP地址到MAC层地址的映射,解决各层实体的标定区分和数据投递,同时网络…

扫一扫 移动端_移动端手机APP 身份证识别 手机扫一扫离线识别

证件识别是指能实现拍照自动输入身份信息,让用户完全告别手动输入身份证、驾驶证、行驶证等证件信息。它支持Android、 iOS 、Java、Linux等多终端形式接入,电 一山一,领九九,六八九八菱还能通过多样化的结果输出,满足…

figma应用——面向用户的咖啡点单APP的设计过程记录

目录概述设计阶段1、Brainstorm2、用户分析(1)用户画像(2)竞品分析(3)用户旅程地图(4)用户需求分析3、点单APP的demo设计(1)整体布局逻辑概览(2&a…

打docker镜像_使用docker构建自己的镜像

在docker中,我们使用docker build构建一个新的镜像,构建镜像之前需要去编写Dockerfile这个文件才能否建一个新的镜像。官方文档:https://docs.docker.com/engine/reference/builder/#fromFROM:用于指定基础镜像RUN:构建…

3d打印主要的切片参数类型_3D打印混凝土工艺参数对成型精度的影响

3D打印混凝土技术作为新兴技术,由于其不需要模板,节省大量劳动力和可打印复杂造型的特点,得到了大家的关注。但是,利用3D打印技术建造想要的结构,成型精度是必须考虑的一个问题。成型精度受材料性能、打印设备及打印工…

web中hasmoreelements_Web开发模式【Mode I 和Mode II的介绍、应用案例】

开发模式的介绍在Web开发模式中,有两个主要的开发结构,称为模式一(Mode I)和模式二(Mode II).首先我们来理清一些概念吧:DAO(Data Access Object):主要对数据的操作,增加、修改、删除等原子性操作。Web层:界…

网络传输大端序_大端、小端与网络字节序

大端(Big-Endian),小端(Little-Endian)以及网络字节序的概念在编程中经常会遇到,网络字节序(Network Byte Order)一般是指大端(Big-Endian,对大部分网络传输协议而言)传输,大端小端的概念是面向多字节数据类型的存储方式定义的&am…

cupload怎么保存图片_原生js的图片上传插件cupload

插件描述:支持图片预览、像素限制、大小限制、多图上传、更新模式下页面初始化加载图片更新时间:2020-09-25 00:23:49更新说明:添加 删除时,同时删除服务器图片的功能,文档提供php实例。添加参数Url参数更新 {ele: &q…

mysql 半同步_mysql 主从同步 与 半同步

mysql主从同步复制定义主从同步使得数据可以从一个数据库服务器复制到其他服务器上,在复制数据时,一个服务器充当主服务器(master),其余的服务器充当从服务器(slave)。通过配置文件,可以指定复制所有的数据库,某个数据…

java mysql jsp分页代码_JAVA/JSP学习系列之六(MySQL翻页例子)

JAVA/JSP学习系列之六(MySQL翻页例子)更新时间:2006年10月13日 00:00:00 作者:一、运行前准备下载了mysql的jdbc驱动(一个jar文件)并加载在CLASSPATH(方法见《JAVA/JSP学习系列之一(JDK安装) 》)(如果找不到,请从本站下载)建一个MySQL数据库…

gcn代码pytorch_GCN的简单实现(pytorch)

import torch import torch.nn as nn import torch.nn.functional as Fimport networkx as nxdef normalize(A , symmetricTrue):# A AIA A torch.eye(A.size(0))# 所有节点的度d A.sum(1)if symmetric:#D D^-1/2D torch.diag(torch.pow(d , -0.5))return D.mm(A).mm(D)e…

当电压放大电路的开路增益和输出电阻固定后_放大器的设计基础

放大器是电子电路(尤其是模拟电路)中的主要构件之一,使用放大器,它们会提高信号电平。放大器是一个术语,用于描述增加输入信号强度的电路。放大器广泛用于从音频应用到射频应用的各个领域中。但是,对于所有放大器,无论…

mysql数据库 auto_increment_mysql数据库 auto_increment

MySQL内核月报 2014.09-MySQL 捉虫动态auto_increment背景:Innodb引擎使用B_tree结构保存表数据,这样就需要一个唯一键表示每一行记录(比如二级索引记录引用)。Innodb表定义中处理主键的逻辑是:1.如果表定义了主键,就使用主键唯一…

linux 嵌入式 快照_Linux 系统之Systemd

标签:子贡问为仁。子曰:“工欲善其事,必先利其器。居是邦也,事其大夫之贤者,友其士之仁者。”——孔子(春秋)《论语卫灵公》【工欲善其事,必先利其器】掌握一门技术,知道其发展历程是非常重要的…