llm-hallucination-survey
该项目全面调查了大语言模型中的幻觉问题,涵盖评估方法、成因分析和缓解策略。研究包括输入冲突、上下文冲突和事实冲突等多种幻觉类型,并汇总了相关学术文献。项目成果有助于提升大语言模型在实际应用中的可靠性,为该领域的研究和开发提供重要参考。
unieval-fact
unieval-fact是EMNLP 2022论文提出的预训练评估器,专注于事实一致性检测。该项目旨在统一多维度文本生成评估,弥补自动评估与人工评估的差距。它超越传统相似度指标,为自然语言生成系统提供更全面、细粒度的评估方法,尤其适用于评估先进生成模型的表现。