#ML-Bench

ML-Bench - 评测大型语言模型和代理在代码库级机器学习任务上的效果

ML-Bench机器学习任务大语言模型GitHub仓库代码评估Github开源项目

本文详细说明了如何在代码库级别评估大型语言模型和代理的表现，包括环境设置、数据准备、模型微调和API调用等内容。提供了相关脚本和工具，帮助研究者复现实验结果，适用于机器学习和模型评估领域的专业人员和研究者。

相关文章

Article Cover

ML-Bench: 评估大型语言模型和智能体在仓库级代码机器学习任务中的表现

2024年08月31日

Article Cover

ML-Bench入门学习资料汇总 - 评估大型语言模型和代理在代码级机器学习任务中的性能

2024年09月10日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号