热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#任务创建
BIG-bench - 评估大型语言模型能力的开放基准
BIG-bench
语言模型
基准测试
任务创建
模型评估
Github
开源项目
BIG-bench是一个开放的基准测试项目,致力于评估大型语言模型的能力并预测其未来发展。该项目包含200多个多样化任务,涉及算术、推理等多个领域。研究人员可通过JSON或编程方式贡献新任务,并利用公开模型进行评估。BIG-bench Lite作为24个精选任务的子集,提供了高效的模型性能评估方法。这一平台为深入研究语言模型能力提供了宝贵资源。
1
1
相关文章
BIG-bench: 探索大规模语言模型的极限
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号