#AI2-Tango

OLMo-Eval: 一个开放性语言模型评估套件

3 个月前

3 个月前

相关项目

OLMo-Eval

OLMo-Eval是一个评估开放语言模型的框架，支持多个NLP任务的评估流程。通过task_sets和示例配置，可以评估多个模型在各种任务上的表现。项目基于ai2-tango和ai2-catwalk构建，提供快速入门指南、标准基准测试和PALOMA项目集成，是一个全面的语言模型评估工具。

投诉举报邮箱: service@vectorlightyear.com