Project Icon

gigahorse-toolchain

开源智能合约反编译和分析框架

Gigahorse是一个开源的以太坊智能合约反编译和分析工具链。它将低级EVM代码转换为类似LLVM IR的高级三地址表示。该工具提供多种上下文敏感性配置,支持函数内联,可与各类客户端分析工具集成。Gigahorse为智能合约研究和安全分析奠定了基础,已在多个学术项目和实时分析平台中得到应用。

注意:由于此代码库包含子模块,因此在克隆时需要使用 --recursive 标志,例如:git clone git@github.com:nevillegrech/gigahorse-toolchain.git --recursive

Gigahorse 二进制提升器和工具链 推文

一个从低级 EVM 代码到高级基于函数的三地址表示的二进制提升器(及相关框架),类似于 LLVM IR 或 Jimple。

快速入门

从本地克隆运行/安装 Gigahorse(需要 souffle

首先确保你的系统上安装了以下内容:

  • Boost 库(可以在 Debian 上使用 apt install libboost-all-dev 安装)

  • Python 3.8(参考标准文档)

  • Souffle 2.3 或 2.4(我们仅使用发布版本进行测试,较新的开发版本可能可用但未经我们测试。参考 Souffle 文档。最简单的安装方法是使用 https://github.com/souffle-lang/souffle/releases/tag/2.3 的发布版本)

现在安装 Souffle 自定义函数:

cd souffle-addon && make            # 构建所有内容,将 libfunctors.so 设置为 libsoufflenum.so 的链接

现在你应该可以运行 Gigahorse 了。

通过 docker 安装 Gigahorse

或者,你可以使用我们预构建的 docker 镜像,按照以下说明使用 Gigahorse:

  1. 对于 amd64:

    curl -s -L https://raw.githubusercontent.com/nevillegrech/gigahorse-toolchain/master/scripts/docker/install/install_amd64 | bash
    

    对于 arm64/m1(未积极测试):

    curl -s -L https://raw.githubusercontent.com/nevillegrech/gigahorse-toolchain/master/scripts/docker/install/install_arm64 | bash
    
  2. 然后 source ~/.bashrc

  3. 使用 gigahorse --help 检查 gigahorse 是否可用

运行 Gigahorse

gigahorse.py 脚本可以单独在一个合约上运行,也可以在指定目录中的一系列合约字节码文件上运行。它将对每个合约运行 logic/main.dl 中实现的二进制提升器,然后可选地运行用户使用 -C 标志指定的任何其他客户端分析。

默认管道首先尝试使用事务性上下文敏感配置反编译合约。如果超时,它会使用可扩展回退配置(使用混合精确上下文敏感算法,针对可扩展性进行调优)进行第二次尝试。此外,如果默认配置成功但产生不精确的输出,则使用精确回退配置(当前与 --early_cloning 配置相同)尝试消除这种不精确性。如果需要,可以使用 --disable_scalable_fallback--disable_precise_fallback 标志分别禁用这两种回退配置。

Gigahorse 管道还包括几轮小函数内联,以帮助后续客户端库获得更高级的推断。可以使用 --disable_inline 禁用内联功能。

每个合约的预期文件格式为 .hex 格式。

示例(单个合约):

./gigahorse.py examples/long_running.hex

(对于某些 Souffle 版本,在首次编译期间,你会收到关于 libsoufflenum.so 动态库的错误消息。你可以忽略这个,重新运行后 gigahorse.py 应该可以正常工作。)

分析时间过长的合约将在可配置的超时后被跳过。

反编译结果放置在 .temp 目录中,而有关执行的元数据(如指标)放置在 results.json 文件中,以三元组列表的形式:

[文件名, 属性, 标志]

这里,属性 是文件名中检测到的合约问题列表, datalog 文件中任何非空的输出关系的关系名称都将放在这个列表中。 标志 是一个表示辅助或异常信息的列表。它可能包括 "ERROR""TIMEOUT",这些是不言自明的。

使用 gigahorse.py --help 获取调用说明。

示例(带客户端分析):

./gigahorse.py  -j <作业数> -C clients/visualizeout.py <合约>

(跟在"-C"标志后面的客户端可以是以逗号分隔的列表,不含空格,包含可通过路径访问或完全限定的文件名。)

Gigahorse 还可以在"批量分析"模式下使用,方法是将 替换为装满合约的目录。

有关调整 Gigahorse 框架的其他说明,请参阅 Advanced.md

提升后 IR 的文本表示

客户端分析工具 clients/visualizeout.py 可用于提供 Gigahorse 生成的 IR 的美化打印文本表示。 美化打印的文本文件命名为 contract.tac,将放置在每个分析合约的 out/ 文件夹中。 例如,./gigahorse.py -C clients/visualizeout.py examples/long_running.hex 的输出将被放置在 .temp/long_running/out/contract.tac 中。

contract.tac 中可视化的块看起来像这样:

    Begin block 0x3e
    prev=[0xb], succ=[0x10ee, 0x49]
    =================================
    0x3f: v3f(0xf42fdfb) = CONST 
    0x44: v44 = EQ v3f(0xf42fdfb), v32
    0x10c7: v10c7(0x10ee) = CONST 
    0x10c8: JUMPI v10c7(0x10ee), v44

请注意,美化打印的变量标识符与底层 datalog 事实中的标识符不对应。

编写客户端分析

客户端分析可以用任何语言编写,通过读取反编译步骤(main.dl)写入的关系文件。然而,该框架为用 Datalog 编写的客户端提供了优先处理。Gigahorse 框架最著名的客户端分析示例是 MadMax。它使用了 clientlib 下的几个"分析客户端库"。这些库包括可定制的数据流分析、内存建模、数据结构重构等。

反编译字节码的客户端分析常用模板是创建包含 clientlib/decompiler_imports.dl 的 souffle datalog 文件,例如:

#include "clientlib/decompiler_imports.dl"

.output ...

Gigahorse 的用途

Gigahorse 工具链最初发表为:

  • Grech, N., Brent, L., Scholz, B., Smaragdakis, Y. (2019),Gigahorse:智能合约的全面、声明式反编译。第 41 届 ACM/IEEE 国际软件工程会议。

原始发布后 Gigahorse 的几项新发展已发表为:

  • Grech, N., Lagouvardos, S., Tsatiris, I., Smaragdakis, Y. (2022),Elipmoc:以太坊智能合约的高级反编译 ACM 编程语言论文集(OOPSLA)。

此外,其他研究工具也在 Gigahorse 的基础上开发,包括:

  • Grech, N., Kong, M., Jurisevic, A., Brent, L., Scholz, B., Smaragdakis, Y. (2018),MadMax:在以太坊智能合约中应对 Out-of-Gas 情况。ACM 编程语言论文集(OOPSLA)。

  • Brent, L., Grech, N., Lagouvardos, S., Scholz, B., Smaragdakis, Y. (2020),Ethainter:复合漏洞的智能合约安全分析器。 第 41 届 ACM SIGPLAN 编程语言设计与实现会议。

  • Lagouvardos, S., Grech, N., Tsatiris, I., Smaragdakis, Y. (2020) 以太坊"内存"的精确静态建模。ACM 编程语言论文集(OOPSLA)。

  • Grech, N., Kong, M., Jurisevic, A., Brent, L., Scholz, B., Smaragdakis, Y. (2020),分析智能合约的 Out-of-Gas 世界。ACM 通讯。

  • Smaragdakis, Y., Grech, N., Lagouvardos, S., Triantafyllou, K., Tsatiris, I. (2021),符号值流静态分析:以太坊智能合约的深度、精确、完整建模。ACM 编程语言论文集(OOPSLA)。

Gigahorse 框架还支撑着 contract-library.com 的实时反编译器和分析工具。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号