热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#UHGEval
UHGEval - 中文大语言模型无约束生成幻觉评估基准
UHGEval
大语言模型
幻觉评估
中文评估基准
Eval Suite
Github
开源项目
UHGEval是一个评估中文大语言模型在无约束生成任务中幻觉现象的基准。该项目基于文本生成和幻觉收集,融合自动标注与人工审核。UHGEval提供判别式、生成式和选择式等多种评估方法。项目还包含Eval Suite评估框架,支持多个幻觉评估基准,可全面评估单个大语言模型的表现。
1
1
相关文章
UHGEval: 一个全面评估中文大语言模型幻觉问题的基准测试
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号