#问答任务

HalluQA - 中文大语言模型幻觉评估基准

HalluQA大型语言模型中文幻觉评估基准问答任务Github开源项目

HalluQA是一个评估中文大语言模型幻觉问题的基准测试。该项目包含450个涵盖多领域的对抗性问题，考虑中国特色文化因素。HalluQA提供数据集、评估脚本和多选任务，采用GPT-4评估非幻觉率。研究结果揭示不同模型在处理误导性和知识性问题的表现，为中文大语言模型的改进提供参考。

xlm-roberta-longformer-base-4096 - 支持超长序列处理的多语言Transformer模型

开源项目WikiText-103低资源语言问答任务模型HuggingfaceXLM-R Longformer长序列处理Github

该项目结合XLM-R与Longformer模型，提升了对多达4096个标记的处理能力，以提高低资源语言的处理效果。模型在WikiText-103语料库上进行预训练，适用于多语言问答任务。推荐使用NVIDIA Apex和大容量GPU以确保模型性能和效率。项目由Peltarion完成，提供相关代码和训练脚本供开发者参考。

相关文章

Article Cover

HalluQA: 评估中文大语言模型的幻觉现象

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号