#Eval Suite

UHGEval: 一个全面评估中文大语言模型幻觉问题的基准测试

2 个月前

2 个月前

相关项目

UHGEval

UHGEval是一个评估中文大语言模型在无约束生成任务中幻觉现象的基准。该项目基于文本生成和幻觉收集，融合自动标注与人工审核。UHGEval提供判别式、生成式和选择式等多种评估方法。项目还包含Eval Suite评估框架，支持多个幻觉评估基准，可全面评估单个大语言模型的表现。

投诉举报邮箱: service@vectorlightyear.com