论文阅读-EMS: History-Driven Mutation for Coverage-based Fuzzing（2022）模糊测试

一、背景

        本文研究了基于覆盖率的模糊测试中的历史驱动变异技术。之前的研究主要采用自适应变异策略或集成约束求解技术来探索触发独特路径和崩溃的测试用例，但它们缺乏对模糊测试历史的细粒度重用，即它们在不同的模糊测试试验之间很大程度上未能正确利用模糊测试历史。

        本文提出了一种轻量级且高效的概率字节定向模型（PBOM），以捕获来自试验历史的字节级变异策略，并因此有效地触发独特路径和崩溃。

        本文还提出了一种新的历史驱动变异框架EMS，用于加速基于覆盖率的模糊测试中的路径和漏洞发现。它将PBOM作为变异算子之一（包括 intra-PBOM和inter-PBOM），根据输入字节值概率性地提供所需的变异字节值。即EMS将PBOM作为附加变异操作符，根据输入字节值和长度概率性地提供所需变异字节值和类型。

PBOM是为了实现下面的目的：

「从内部和内部历史中捕获触发独特路径和崩溃的突变策略。换句话说，给定来自种子测试用例的输入字节值，学习到的突变策略模型应该能够输出相应的突变值和导致测试用例触发今天唯一路径或崩溃的突变类型。」

实验结果表明，EMS在9个真实世界程序上比AFL、QSYM、MO PT、MO PT-dict、EcoFuzz和AFL++等最先进的模糊测试工具发现了多达4.91倍的独特漏洞，并在大多数程序上发现了更多的覆盖。

本文的创新动机在于：利用模糊测试历史来加速发现新的路径和崩溃。

二. INTRODUCTION

A. Mutation-based Fuzzing

变异测试的流程包括：1）准备初始种子集并构建队列；2）从队列中选择种子测试用例并随机变异；3）使用变异后的测试用例测试目标程序，并将触发新执行路径或异常行为的有趣测试用例添加到种子队列中；4）回到步骤2）继续模糊测试。

大多数变异测试工具使用简单的逻辑来变异测试用例，如AFL使用三个阶段的变异操作：

确定性阶段：AFL利用位或字节级突变操作符，例如位翻转、字节翻转和字节插入，来改变种子测试用例的每个位或字节
混沌阶段：AFL多次随机选择操作符，并在种子测试用例的随机位置使用所有操作符进行突变
拼接阶段：AFL首先将两个种子测试用例的部分剪接在一起，生成一个新的用例，然后进入破坏阶段，使用进一步的突变算子

传统的基于突变的 fuzzers没有分析如何解决路径约束，而是利用随机突变的测试用例来测试程序，盲目地探索新的执行路径。由于逻辑直接，基于突变的 fuzzers的执行速度很快，导致了有效的漏洞探索。但是，直接的逻辑无法解决复杂的路径约束，限制了模糊的效率。因此，大量的工作集中在提高路径覆盖上，并在基于突变的模糊之上发展基于覆盖的模糊。

B. Coverage-based Fuzzing

为了解决上述基于突变的模糊测试的局限性，研究人员提出利用覆盖率信息作为反馈来指导模糊测试过程，以提高模糊测试的性能。

法一：一些工作采用自适应策略来改进基于覆盖率的模糊测试

例如AFLFast和EcoFuzz，它们分别使用马尔可夫链模型和对抗多臂老虎机模型来评估每个测试用例触发唯一分支行为的潜力，然后分配更多时间来变异有潜力的测试用例。

MOPT提出突变算子的最优选择概率分布在不同的目标程序上是不同的。提出了一种迭代调度策略，根据发现唯一路径和崩溃的效率自适应调整每个变异操作符的选择概率分布。

法二：将基于突变的模糊与约束求解技术(如 concolic execution)相结合

为了解决路径约束，这些技术应该首先利用强大的仪器来编译程序来跟踪和收集路径约束。然后，约束求解技术需要执行昂贵的过程，包括模拟路径约束，跟踪影响目标约束的数据字段，以及计算可以触发约束不同状态的数据字段的数值区间。因此，约束的收集和求解都可能是昂贵的。使用约束求解技术来求解路径约束通常需要大量的计算成本和时间，这可能会降低模糊的性能。为了克服这些挑战，一些研究通过选择性地将困难路径分配给concolic执行来提高模糊性能

这一部分介绍了基于覆盖率的模糊测试的发展方向。一种方向是将变异模糊测试与约束求解技术相结合，以解决路径约束问题。另一种方向是利用机器学习技术发现种子测试用例中有价值的字节位置。然而，现有的模糊测试工具缺乏充分利用试验内部和试验间的历史信息来指导有效的模糊测试。因此，本文提出了一种利用历史信息指导模糊测试的方法。

三.DESIGN OF EMS

EMS框架和提出的概率字节方向模型（PBOM）的设计。PBOM旨在提高EMS的性能。

A. Why Intra- and Inter-Trial History Matters

为什么程序的内部历史(定义：当前模糊过程中的历史 )很重要：现有的fuzzers包含了自适应策略。然而，它们主要集中在从历史内获得的高层次启发式来指导种子选择和生成过程，缺乏对所采用的突变策略的细粒度重用，从而有效地触发唯一路径或崩溃。并且程序的不同执行路径可能在路径约束中具有相同的特定值，同一程序的模糊测试历史可以指导解决已解决的路径约束。

为什么程序的外部历史 (定义；来自先前模糊过程的历史，可以来自相同或不同的程序）很重要：首先，同一程序的审间模糊历史对审内历史有类似的贡献。然后，它可以指导模糊解决已经解决的同一程序的路径约束，例如，具有更好的路径覆盖的初始种子集可以提高模糊性能。此外，来自不同程序的试验间模糊历史也可能有用。因为为了提高程序开发的质量和效率，许多软件平台提供了统一的开发框架和底层库，同样由于共享库的存在，在不同的程序中可能存在相同的路径约束。

B. Framework of EMS

EMS构建了内部和外部PBOM来学习和利用内部和外部测试历史。

EMS通过上图中的Inter-PBOM Initialization构建外部PBOM，通过PBOM Operator来变异测试用例，通过Operator Analysis和Data Collection来收集内部测试历史，并定期调用Intra-PBOM Update来更新内部PBOM。

C. Probabilistic Byte Orientation Model （概率字节方向模型PBOM）

这一部分描述了PBOM的数据结构和概率算法。为了防止fuzzer的执行速度下降，我们使用两个哈希映射构建了inter-PBOM和intra-PBOM。

（下图中第一排蓝色的）输入索引节点的定义：利用输入字节值的唯一哈希作为哈希映射的索引。

（每一个蓝色的输入索引节点竖着看）作者为每个唯一输入索引节点构建一个链表：用于存储相应的输出变异策略T。链表中的每个变异节点存储了：一个唯一的变异操作符（包含输出字节值和变异类型）以及变异操作符（out，type）在该输入下的频率F和选择概率P。为了添加新的变异节点，EMS定位相应输入的索引节点，并将新的变异节点添加到该输入的链表的末尾。

为了构建inter-PBOM，EMS首先使用常规fuzzer（如AFL和MOPT）收集inter-trial历史。然后，EMS构建了如图4所示的数据结构，并更新了每个节点在输入的链表中的选择概率P。根据每个（out，type，F，P）∈T的频率F，以下公式计算了概率分布P，其中p是计算P的（out，type）的权重。

根据公式 1,inter-PBOM赋予 频率 f较少 的 (out, type)较高的选择概率 P，然后构建 MO的选择概率分布 P，该选择概率分布更频繁地选择较少的 (out, type)来覆盖、删除或插入种子测试用例。

Q :为什么赋予 频率 f较少 的 (out, type)较高的选择概率 P

因为：

由于在收集 试验间历史 时，有效的突变策略是由普通fuzzers的传统突变算子触发的，因此其中许多是由简单的算子生成的，例如翻转一个位，或者在一个字节的值上增加 1。而且，突变策略可以从多个不同的程序中收集，并且可以长时间收集。综上所述，收集到的突变策略数量可以很大，而且大多数策略都是由简单的操作符触发的，所以简单的突变操作符被大量使用。（即频率高）

因此， (out, type)的频率 F越高，基于突变的 fuzzers就越容易在试验间历史中使用传统的突变算子从 in生成 (out,type)。相反，低频 (out, type)则可以通过罕见的突变算子来构造，例如，将特定的字节值插入到种子测试用例中。如果 inter-PBOM总是再现简单的操作符，那么它就不那么有用了。因此， inter-PBOM将更多的选择概率 P分配给出现频率较低的 (out, type)。

四.IMPLEMENTATION OF EMS

介绍了一种基于MO PT构建的测试用例生成工具EMS，它在确定性和混沌阶段中实现了PBOM算子以利用高效的变异策略。EMS使用InterPBOM初始化来构建Inter-PBOM并更新每个唯一输入的选择概率分布（利用上图中的公式1）。EMS在确定性阶段和混沌阶段中分别调用PBOM算子，以便在不同的方式中使用学习到的变异策略。EMS还记录使用的变异策略，并在触发新的唯一路径或崩溃时将其存储在训练集中以更新Intra-PBOM。

EMS的具体实现包括三个步骤：

（1）计算哈希映射的索引

（2）搜索匹配的节点并添加新节点、更新选择概率

（3）继续模糊测试。

五.EVALUATION

EMS设计中，模糊测试历史主要用于提取有效的变异策略来变异种子测试用例。同时，变异位置也可以由模糊测试历史来指导。作者利用历史信息来概率性地选择记录的位置，以产生有趣的测试用例。根据过去的模糊测试结果，可以分析变异位置对某些特定分支行为的影响，从而得出更细粒度的变异位置信息。

六.CONCLUSION

本文发现了内部和跨试验模糊历史都包含了关键变异策略的丰富知识，这些变异策略隐含着部分路径约束解决方案，可以用于加速发现具有相似部分路径约束的新路径或崩溃。基于这一洞见，提出了轻量级高效的PBOM模型，用于捕捉从内部和跨试验历史中触发独特路径和崩溃的变异策略。提出了一种新的基于历史的变异框架EMS，其中PBOM是变异操作符之一，根据输入的字节值和变异类型以概率方式提供所需的变异字节值和变异类型。在9个真实世界程序上评估EMS与AFL、QSYM、MO PT、MO PT-dict、EcoFuzz和AFL++的性能。结果表明，EMS在大多数程序上发现了更多的独特漏洞，并具有更高的行覆盖率。EMS在标准化基准FuzzBench上也实现了优越的覆盖性能，并在发现不同类型的漏洞时具有不同的初始种子集。此外，进行了进一步的分析，证明了EMS的有效性和低开销。EMS在不同的跨PBOMs上的性能表现，展示了跨同一供应商的不同程序对跨试验模糊历史的贡献。总体而言，EMS可以作为改进基于变异的模糊器的覆盖率和漏洞发现的新方向。