#BIG-bench

BIG-bench: 探索大规模语言模型的极限

3 个月前

BIG-bench 语言模型基准测试任务创建模型评估 Github 开源项目

3 个月前

相关项目

BIG-bench

BIG-bench是一个开放的基准测试项目，致力于评估大型语言模型的能力并预测其未来发展。该项目包含200多个多样化任务，涉及算术、推理等多个领域。研究人员可通过JSON或编程方式贡献新任务，并利用公开模型进行评估。BIG-bench Lite作为24个精选任务的子集，提供了高效的模型性能评估方法。这一平台为深入研究语言模型能力提供了宝贵资源。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com