#指令数据集

InstructionWild - 大规模用户生成指令数据集助力AI对话能力提升

InstructWild指令数据集ChatGPTAI训练大语言模型Github开源项目

InstructionWild项目汇集11万余条高质量用户生成指令，类型丰富，标签完善。该数据集致力于增强AI模型在生成、开放问答和头脑风暴等领域的对话表现。项目展示了完整的数据收集流程、评估分析和后续规划，为AI研究与应用领域贡献重要资源。

ShenNong-TCM-LLM - 基于LlaMA的中医药大规模语言模型推动传统医学智能化

中医药大模型ShenNong-TCM-LLM自然语言处理指令数据集知识图谱Github开源项目

ShenNong-TCM-LLM是基于LlaMA的中医药大规模语言模型，采用实体为中心的自指令方法和中医药知识图谱生成指令数据。该模型旨在提升人工智能在中医药领域的知识和回答能力，推动大模型在传统医学中的应用。ShenNong-TCM-LLM能回答中医药问题，提供中医诊断和治疗建议，在中医药领域展现出优秀性能。

T-lite-instruct-0.1 - 优化指令模型，提升生成质量与安全性

开源项目模型Github指令数据集T-lite-instruct-0.1偏好调整Huggingface基准测试奖励建模

T-lite-instruct-0.1是一种经过bf16格式训练的AI模型，专注于安全性和生成的高质量。它使用多样化的数据集，包括翻译后的英语开源数据集，避免低质量翻译。通过强模型生成的上下文进行训练，在MT-Bench和Arena基准测试中表现优秀，适合高标准工业应用。

相关文章

Article Cover

ShenNong-TCM：首个中医药领域大规模语言模型的诞生与发展

Article Cover

InstructionWild: 打造更大更多样的指令数据集

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号