热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#任务集
OLMo-Eval - 开源语言模型评估框架 多任务性能测试解决方案
OLMo-Eval
语言模型评估
AI2-Tango
任务集
评估管道
Github
开源项目
OLMo-Eval是一个评估开放语言模型的框架,支持多个NLP任务的评估流程。通过task_sets和示例配置,可以评估多个模型在各种任务上的表现。项目基于ai2-tango和ai2-catwalk构建,提供快速入门指南、标准基准测试和PALOMA项目集成,是一个全面的语言模型评估工具。
1
1
相关文章
OLMo-Eval: 一个开放性语言模型评估套件
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号