相关项目
LLM4Decompile
LLM4Decompile是一款创新的开源大型语言模型,专注于二进制代码反编译。该模型能将Linux x86_64二进制文件转换为可读的C源代码,覆盖GCC的O0至O3优化级别。项目提供多个参数规模的模型版本,从1.3B到33B不等。其中,最新的22B-V2版本在HumanEval-Decompile基准测试中实现了63.6%的重新执行率。LLM4Decompile不仅可直接反编译二进制文件,还能优化Ghidra等工具生成的伪代码,为二进制分析和逆向工程领域提供了新的可能性。
llm4decompile-6.7b-v1.5
LLM4Decompile-6.7b-v1.5是一个基于机器学习的x86汇编反编译系统,通过15B tokens规模的训练数据和4096 token的处理能力,实现汇编代码到C语言的自动转换。在HumanEval-Decompile基准测试的O0优化级别下,转换准确率达到68.05%,整体性能较前代提升显著。该项目开源且采用MIT许可证,为软件开发和逆向工程提供了实用的代码分析工具。