热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#EvalScope
EvalScope: 一个简化高效的大型模型评估与性能基准测试框架
2 个月前
EvalScope是由ModelScope团队开发的开源框架,旨在为大型模型(包括大型语言模型和多模态大型语言模型)提供全面、客观的评估。它集成了多种评估数据集、评估指标和自动化评估工具,支持多种评估模式,并可生成可视化报告,是研究人员和开发者进行模型评估的有力工具。
EvalScope
大语言模型
评估框架
模型集成
可视化
Github
开源项目
2 个月前
相关项目
evalscope
EvalScope是一个全面的大语言模型评估框架,集成了多种基准数据集和评估指标。该框架提供模型集成、自动评估和报告生成功能,并支持Arena模式和可视化分析。通过整合OpenCompass和VLMEvalKit评估后端,EvalScope实现了多模态评估能力。此外,它能与ModelScope SWIFT平台无缝对接,支持大模型的端到端开发流程。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号