#大模型评估

Awesome-LLM-Eval - 集成了评估工具、数据集、演示与论文资源的平台

大模型评估评估工具评估数据集LLM应用LLM技术边界Github开源项目

Awesome-LLM-Eval 包罗万象，集成了评估工具、数据集、演示与论文资源，深入探讨大型语言模型的评估技术和方法。该平台支撑学术探索与实际应用，并致力于提升语言模型的透明度及可信度。

opencompass - 开源大型语言模型评估平台

OpenCompass大模型评估CompassKitCompassHubCompassRankGithub开源项目

OpenCompass 2.0集成CompassKit、CompassHub和CompassRank三大关键组件，致力于实现大型语言模型评估的全面性、开放性和可复现性。平台特色包括全面的模型和数据集支持、高效的分布式评估系统、多样化的评估方法以及高度可扩展的模块化结构。

相关文章

Article Cover

Awesome-LLM-Eval: 大型语言模型评测工具与基准的全面指南

Article Cover

OpenCompass: 全面评估大语言模型的开源平台

Article Cover

Awesome-LLM-Eval学习资料汇总 - 大语言模型评估工具与基准的精选列表

Article Cover

OpenCompass入门学习资料汇总 - 一站式大模型评测平台

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号