#Chinese-Tiny-LLM

Chinese Tiny LLM: 开创中文大语言模型新纪元

2024年09月05日

Chinese-Tiny-LLM 语言模型预训练中文语料库自然语言处理 Github 开源项目

2024年09月05日

相关项目

Chinese-Tiny-LLM

Chinese-Tiny-LLM项目提供完整的中文网络语料清洗流程和预训练代码，包含MAP-CC（8000亿中文token预训练数据集）、CHC-Bench（中文难例指令理解基准测试）和CT-LLM（2B参数中文中心语言模型）。该项目突破了传统依赖英语语料库的LLM训练方法，为构建更具包容性和适应性的语言模型奠定基础。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com