#简单评估库

OpenAI的Simple-Evals项目：简单而强大的语言模型评估工具

3 个月前

language models 评估简单评估库 OpenAI API Github 开源项目

3 个月前

相关项目

simple-evals

simple-evals是一个开源的轻量级语言模型评估库，用于展示AI模型的准确性数据。该库采用零样本链式思维方法，包含MMLU、MATH、GPQA等评估任务，并支持OpenAI和Claude等API接口。simple-evals为研究人员和开发者提供了评估和比较不同语言模型性能的工具，反映模型在实际应用中的表现。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com