#Flan-T5

instruct-eval入门指南 - 评估指令微调语言模型的系统化工具包

2 个月前

InstructEval LLM Flan-T5 Alpaca IMPACT Github 开源项目

2 个月前

相关项目

instruct-eval

InstructEval项目专注于全面评估和比较指令调优的大型语言模型（如Flan-T5和Alpaca），并提供简便的基准测试库和排行榜。该项目支持多种模型和任务，使研究者能够轻松直观地在学术基准（如MMLU和BBH）上比较模型表现。此外，InstructEval发布了用于评估LLM写作能力的IMPACT数据集和安全评估基准Red-Eval，为用户提供多样的测试工具和资源。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com