#alpaca
alpaca-chinese-dataset - 中文指令微调数据集生成与清洗方法
alpaca中文指令数据集机器翻译self-instructGithub开源项目
此数据集通过机器翻译与self-instruct方法生成,并进行关键词清洗,提供高质量的中文指令微调数据。用户可以详细了解数据生成和清洗方法,并查看多个实际示例,以提升模型性能。
Awesome-instruction-tuning - 介绍开源指令调优数据集和模型的精选资源库
instruction tuning datasetsLLMsalpacamultilingual toolsHelsinki-NLPGithub开源项目
此页面汇总了开源的指令调优数据集、模型、相关论文和资源库的精选列表。涵盖传统NLP任务修改的数据集、大型语言模型生成的数据,还包括跨语言翻译工具和研究论文链接。对于研究和应用指令调优技术的研究人员、开发者和数据科学家,这是一个重要的参考资源。
相关文章