热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#ML-Bench
ML-Bench - 评测大型语言模型和代理在代码库级机器学习任务上的效果
Github
开源项目
大语言模型
ML-Bench
机器学习任务
GitHub仓库
代码评估
本文详细说明了如何在代码库级别评估大型语言模型和代理的表现,包括环境设置、数据准备、模型微调和API调用等内容。提供了相关脚本和工具,帮助研究者复现实验结果,适用于机器学习和模型评估领域的专业人员和研究者。
1
1
相关文章
ML-Bench: 评估大型语言模型和智能体在仓库级代码机器学习任务中的表现
3 个月前
ML-Bench入门学习资料汇总 - 评估大型语言模型和代理在代码级机器学习任务中的性能
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号