热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#多选题
ceval - 全面评估中文大语言模型能力的基准测试
Github
开源项目
基础模型
C-Eval
中文评测
多选题
学科分类
C-Eval是一个综合性中文基础模型评估套件,涵盖52个学科和4个难度级别的13948道多选题。该项目通过零样本和少样本评估,展示了主流模型在STEM、社会科学和人文学科等领域的表现。C-Eval旨在帮助开发者追踪模型进展并分析其优缺点。研究者可通过官方网站或相关论文获取详细信息,并利用提供的数据和方法评估自己的模型。
1
1
相关文章
C-Eval: 一个全面的中文基础模型评估套件
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号