热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#continuous-eval
continuous-eval - 优化LLM应用的数据驱动评估工具
continuous-eval
LLM评估
开源
数据驱动
评估指标
Github
开源项目
continuous-eval是一个开源软件包,旨在为LLM驱动的应用提供全面的数据驱动评估。项目特点包括模块化评估系统,全面的度量指标库,可结合用户反馈进行评估,且支持生成大规模合成数据集以验证应用性能,适用于多种LLM应用场景的定制化评估。
1
1
相关文章
Continuous-Eval: 数据驱动的LLM应用评估框架
3 个月前
continuous-eval学习资源汇总 - 基于数据驱动的LLM应用评估工具
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号