热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#SAFE
long-form-factuality - 大型语言模型长篇文本事实性评估工具集
长篇事实性
大语言模型
LongFact
SAFE
F1@K
Github
开源项目
Long-form-factuality项目提供了一套完整的工具和方法来评估大型语言模型生成长篇文本的事实准确性。项目包括LongFact提示集、SAFE评估器和F1@K指标。研究人员可以利用这些工具对OpenAI和Anthropic等模型进行基准测试,深入探究语言模型在长篇事实性文本生成方面的表现。项目代码开源,便于复现实验结果和进行further研究。
1
1
相关文章
长文本事实性评估:探索大型语言模型的真实性能力
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号