热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#评测榜单
Chinese LLM Benchmark: 全面评测中文大语言模型能力
2 个月前
本文详细介绍了一个名为CLiB(Chinese LLM Benchmark)的中文大语言模型评测基准,该基准对115个中文大模型进行了全面评测,涵盖了分类、信息抽取、阅读理解等多个能力维度,为用户选择和了解中文大模型提供了重要参考。
CLiB
中文大模型
评测榜单
能力排行
开源模型
Github
开源项目
2 个月前
相关项目
chinese-llm-benchmark
项目持续更新,目前已评测113个中文大模型,包括GPT-4、文心一言、通义千问等商用模型和百川、Qwen、GLM等开源模型。评测维度全面,涵盖分类、信息抽取、阅读理解、数据分析、中文编码效率等。提供综合能力和细分能力排行榜,并开放原始评测数据。为选择和研究中文大模型提供客观依据。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号