#多选题

C-Eval: 一个全面的中文基础模型评估套件

3 个月前

C-Eval 基础模型中文评测多选题学科分类 Github 开源项目

3 个月前

相关项目

ceval

C-Eval是一个综合性中文基础模型评估套件，涵盖52个学科和4个难度级别的13948道多选题。该项目通过零样本和少样本评估，展示了主流模型在STEM、社会科学和人文学科等领域的表现。C-Eval旨在帮助开发者追踪模型进展并分析其优缺点。研究者可通过官方网站或相关论文获取详细信息，并利用提供的数据和方法评估自己的模型。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com