热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#训练数据管理
data_management_LLM - 大型语言模型训练数据管理资源汇总
大语言模型
训练数据管理
预训练
监督微调
数据质量
Github
开源项目
该项目汇总了大型语言模型训练数据管理的相关资源。内容涵盖预训练和监督微调阶段,探讨领域组成、数据数量和质量等关键方面。项目还收录了数据去重、毒性过滤等技术,以及不同因素间的关系研究。这些资源为优化LLM训练数据管理提供了全面参考。
1
1
相关文章
大型语言模型的数据管理:提升AI性能的关键
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号