Fuzz4All: 利用大语言模型实现通用模糊测试

Fuzz4All: 开创通用模糊测试新纪元

模糊测试(Fuzzing)作为一种自动化软件测试技术,在发现软件系统中的bug和漏洞方面取得了巨大成功。然而,传统的模糊测试工具通常只针对特定的编程语言或语言特性,难以灵活应用于其他语言或同一语言的不同版本。为了解决这一问题,研究人员提出了一种创新的通用模糊测试工具——Fuzz4All,它能够针对多种不同的输入语言和语言特性进行模糊测试。

Fuzz4All的核心理念

Fuzz4All的核心思想是利用大语言模型(Large Language Models, LLMs)作为输入生成和变异引擎。这种方法使得Fuzz4All能够为任何实际相关的编程语言产生多样化且真实的输入。为了实现这一潜力,研究人员提出了两项关键技术:

自动提示技术(Autoprompting Technique): 该技术能够创建适合模糊测试的LLM提示。
LLM驱动的模糊测试循环: 这种新颖的循环机制能够迭代更新提示,从而创建新的模糊测试输入。

Fuzz4All工作流程

Fuzz4All的主要特点

通用性: Fuzz4All是首个能够针对多种输入语言和语言特性进行模糊测试的工具。
灵活性: 通过利用LLMs,Fuzz4All可以适应不同的编程语言和语言版本,无需针对每种语言进行特定的定制。
高效性: 自动提示技术和LLM驱动的模糊测试循环使得Fuzz4All能够快速生成有效的测试输入。
创新性: Fuzz4All结合了最新的人工智能技术和传统的软件测试方法,开创了模糊测试的新范式。

Fuzz4All的实现与评估

研究团队对Fuzz4All进行了全面的评估,测试对象包括9个系统,涉及6种不同的编程语言(C、C++、Go、SMT2、Java和Python)。评估结果表明,Fuzz4All在所有6种语言中都实现了比现有语言特定模糊测试工具更高的代码覆盖率。

更令人瞩目的是,Fuzz4All在广泛使用的系统中发现了98个bug,其中包括GCC、Clang、Z3、CVC5、OpenJDK和Qiskit量子计算平台等。这些bug中有64个已经得到开发者确认为之前未知的问题。这些结果充分证明了Fuzz4All在实际应用中的有效性和价值。

Fuzz4All的使用方法

使用Fuzz4All进行模糊测试相对简单,主要步骤包括:

环境配置:
- 创建conda环境并安装必要的包
- 设置环境变量,如批处理大小、模型名称和设备类型
- 配置OpenAI API密钥(如果使用GPT-4进行自动提示)
运行模糊测试:
- 通过配置文件控制模糊测试的各个方面
- 使用命令行运行Fuzz4All,指定配置文件、输出文件夹、批处理大小、模型名称和目标二进制文件
结果分析:
- 在输出目录中查看生成的模糊测试程序
- 检查日志文件以获取模糊测试过程的详细信息和潜在的bug