#大模型评估
Awesome-LLM-Eval - 集成了评估工具、数据集、演示与论文资源的平台
大模型评估评估工具评估数据集LLM应用LLM技术边界Github开源项目
Awesome-LLM-Eval 包罗万象,集成了评估工具、数据集、演示与论文资源,深入探讨大型语言模型的评估技术和方法。该平台支撑学术探索与实际应用,并致力于提升语言模型的透明度及可信度。
opencompass - 开源大型语言模型评估平台
OpenCompass大模型评估CompassKitCompassHubCompassRankGithub开源项目
OpenCompass 2.0集成CompassKit、CompassHub和CompassRank三大关键组件,致力于实现大型语言模型评估的全面性、开放性和可复现性。平台特色包括全面的模型和数据集支持、高效的分布式评估系统、多样化的评估方法以及高度可扩展的模块化结构。
相关文章