#CLiB

Chinese LLM Benchmark: 全面评测中文大语言模型能力

3 个月前

3 个月前

相关项目

chinese-llm-benchmark

项目持续更新,目前已评测113个中文大模型,包括GPT-4、文心一言、通义千问等商用模型和百川、Qwen、GLM等开源模型。评测维度全面,涵盖分类、信息抽取、阅读理解、数据分析、中文编码效率等。提供综合能力和细分能力排行榜,并开放原始评测数据。为选择和研究中文大模型提供客观依据。

投诉举报邮箱: service@vectorlightyear.com