热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#评估报告
evalverse - 开源大语言模型评估工具集
Evalverse
LLM评估
开源项目
评估报告
AI研究
Github
Evalverse是一个开源的大语言模型评估工具集,提供统一、标准化的评估解决方案。支持多种评估方法,可无代码进行评估并生成报告。通过子模块扩展评估能力,集成lm-evaluation-harness和FastChat等框架。生成的详细报告包含分数、排名和可视化,便于比较不同模型性能。适用于AI研究人员及LLM领域新手。
1
1
相关文章
Evalverse: 革新大型语言模型评估的开源项目
2024年09月05日
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号