#EMNLP
llm-data-creation - 大型语言模型驱动的自动数据生成框架
大语言模型数据创建微调评估EMNLPGithub开源项目
llm-data-creation是一个基于大型语言模型的数据生成框架。该项目仅需一个格式示例即可创建多种问答任务的合成数据,通过迭代过程生成更多相同格式的数据。这一方法特别适用于缺乏人工标注数据的场景。项目提供完整的数据创建、模型微调和评估流程,在10个公开基准数据集上的评估显示出优秀的跨域性能。
MultiHopKG - 多跳知识图谱推理的强化学习框架
知识图谱推理强化学习奖励塑造多跳推理EMNLPGithub开源项目
MultiHopKG是一个多跳知识图谱推理框架,采用强化学习方法优化推理路径。该项目通过奖励塑造技术提高了复杂查询的准确性,支持UMLS、Kinship、FB15k-237等多个知识图谱数据集。框架提供Docker环境和脚本,方便进行数据处理、模型训练和评估。MultiHopKG为知识图谱推理研究提供了实用的开源工具。