#指令数据集

InstructionWild - 大规模用户生成指令数据集助力AI对话能力提升
InstructWild指令数据集ChatGPTAI训练大语言模型Github开源项目
InstructionWild项目汇集11万余条高质量用户生成指令,类型丰富,标签完善。该数据集致力于增强AI模型在生成、开放问答和头脑风暴等领域的对话表现。项目展示了完整的数据收集流程、评估分析和后续规划,为AI研究与应用领域贡献重要资源。
ShenNong-TCM-LLM - 基于LlaMA的中医药大规模语言模型 推动传统医学智能化
中医药大模型ShenNong-TCM-LLM自然语言处理指令数据集知识图谱Github开源项目
ShenNong-TCM-LLM是基于LlaMA的中医药大规模语言模型,采用实体为中心的自指令方法和中医药知识图谱生成指令数据。该模型旨在提升人工智能在中医药领域的知识和回答能力,推动大模型在传统医学中的应用。ShenNong-TCM-LLM能回答中医药问题,提供中医诊断和治疗建议,在中医药领域展现出优秀性能。
T-lite-instruct-0.1 - 优化指令模型,提升生成质量与安全性
开源项目模型Github指令数据集T-lite-instruct-0.1偏好调整Huggingface基准测试奖励建模
T-lite-instruct-0.1是一种经过bf16格式训练的AI模型,专注于安全性和生成的高质量。它使用多样化的数据集,包括翻译后的英语开源数据集,避免低质量翻译。通过强模型生成的上下文进行训练,在MT-Bench和Arena基准测试中表现优秀,适合高标准工业应用。