热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#InstructEval
instruct-eval - 指令调优的大型语言模型的评估和比较
InstructEval
LLM
Flan-T5
Alpaca
IMPACT
Github
开源项目
InstructEval项目专注于全面评估和比较指令调优的大型语言模型(如Flan-T5和Alpaca),并提供简便的基准测试库和排行榜。该项目支持多种模型和任务,使研究者能够轻松直观地在学术基准(如MMLU和BBH)上比较模型表现。此外,InstructEval发布了用于评估LLM写作能力的IMPACT数据集和安全评估基准Red-Eval,为用户提供多样的测试工具和资源。
1
1
相关文章
instruct-eval入门指南 - 评估指令微调语言模型的系统化工具包
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号