#执行反馈
相关项目
AutoIF
AutoIF是一种创新的大语言模型指令遵循能力提升方法。它通过代码执行反馈自动生成和验证指令数据,结合指令增强、验证函数生成和交叉验证等技术合成高质量训练样本。实验结果显示,AutoIF能有效提升不同规模模型的指令遵循表现,为大语言模型指令微调提供了新的研究思路。
OpenCodeInterpreter
OpenCodeInterpreter是一套开源代码生成系统,通过集成执行和迭代优化功能,提高了代码生成能力。该项目提供多个模型系列,展示了执行反馈对提升代码解释和执行性能的影响。项目还开源了Code-Feedback数据集,包含68K多轮交互,并提供本地演示系统。
OpenCodeInterpreter-DS-6.7B
OpenCodeInterpreter-DS-6.7B是一个结合代码生成和执行精炼的开源系统,基于deepseek-coder-6.7b-base模型。该项目在HumanEval和MBPP等基准测试中表现优异,通过执行反馈和人类反馈不断优化性能,为复杂代码任务提供高效且准确的解决方案。