项目介绍
Gepetto 是一个 Python 插件,专用于 IDA Pro(7.4 版本及以上)的反编译功能。这个工具使用多种大型语言模型(LLM),为反编译的函数提供易于理解的解释,并能自动重命名函数中的变量。其特点是能够在极短的时间内提供结果。
通过大型语言模型的支持,Gepetto 能够识别和分析反编译代码中的功能,从而为用户提供清晰的解释。这大大提高了反编译代码的可读性,并提升了分析效率。
设置
要使用 Gepetto,只需将 gepetto.py
脚本和 gepetto/
文件夹放入 IDA 的插件目录中。在 Windows 系统中,默认路径为 %AppData%\Hex-Rays\IDA Pro\plugins
。如果路径不存在,可以手动创建。
另外,需要在 IDA 的 Python 环境中安装必要的包。首先,通过 Windows 注册表查看 IDA 使用的 Python 解释器。在相应的解释器中运行以下命令,安装所需包:
[/path/to/python] -m pip install -r requirements.txt
此外,用户需要编辑配置文件 gepetto/config.ini
,并添加自己的 API 密钥。以 OpenAI 为例,可以在 API 密钥页面上获取密钥。请注意,使用 API 可能产生费用,需自行设定支付方式。
支持的模型
Gepetto 支持多种语言模型:
- OpenAI
- gpt-3.5-turbo-0125
- gpt-4-turbo
- gpt-4o(推荐给初学者)
- Groq
- llama3-70b-8192
- Together
- mistralai/Mixtral-8x22B-Instruct-v0.1(不支持变量重命名)
- Ollama
- 通过 Ollama 暴露的任何本地模型(如果 Ollama 未运行,则不会显示)
如果想要添加对其他模型的支持,可以查看 gepetto/models
文件夹中的示例,或通过开 issue 获取帮助。
使用方法
安装好插件后,可以在 IDA 伪代码窗口的右键菜单中调用 Gepetto。用户可以通过 IDA 的菜单(Edit > Gepetto)在不同的语言模型之间切换。
此外,Gepetto 提供了命令行界面,用户可以直接在 IDA 中向 LLM 提问题。请在输入栏中选择 Gepetto
。
快捷键
Gepetto 提供以下快捷键:
- 请求模型解释函数:
Ctrl
+Alt
+H
- 请求更好的变量名:
Ctrl
+Alt
+R
初步测试显示,先请求函数的解释再请求重命名变量,效果更佳。这是因为模型会根据其注释提供更准确的建议。AI 的回答具有随机性,如果初次结果不满意,可以重复该命令。
限制
- 需要 Hex-Rays 反编译器配合使用。
- 所有支持的 LLM 为通用模型,可能会出错,对结果需保持批判态度。
翻译
用户可以通过编辑配置文件中的语言选项更改 Gepetto 的使用语言。例如,使用法语:
[Gepetto]
LANGUAGE = "fr_FR"
所选语言需与 gepetto/locales
中的文件夹名匹配。如果项目中没有所需语言,用户可以自行贡献。只需为所需语言创建新的文件夹,并提交包含已编辑内容的 .po
文件。
鸣谢
项目感谢以下组织和个人的支持:
- OpenAI,提供了出色的模型
- Hex Rays,提供快速的支持
- Kaspersky,项目的初始资助者
- HarfangLab,现有支持者
- @vanhauser-thc,在其 fork 中提供了有关支持额外模块和供应商的建议
- 各位翻译贡献者:@seifreed, @kot-igor, @ruzgarkanar, @orangetw