相关项目
Linly
该项目提供中文对话和基础模型,包括Linly-ChatFlow、Chinese-LLaMA和Chinese-Falcon模型及其训练数据。通过扩充LLaMA和Falcon的中文词表,使用中英文语料进行预训练,提升了模型在中文语境中的表现。项目还包括Linly-OpenLLaMA模型,支持量化和边缘设备推理。最新的Linly-Chinese-LLaMA-2模型通过混合语料预训练并定期更新,用户可以在线体验和在本地环境中进行训练和评估。
chat-dataset-baseline
chat-dataset-baseline项目整合Hugging Face平台优质数据集,为中文对话模型训练提供全面资源。采用PDCA循环迭代,涵盖数据选择、模型训练、测试和优化。项目提供详细指南,适合数据科学家和AI爱好者快速上手,用于训练高质量中文基础模型,为特定行业应用打下基础。