#Web数据

数据选择技术在语言模型训练中的应用与发展

3 个月前

3 个月前

相关项目

data-selection-survey

这个项目全面梳理了语言模型数据选择的各个环节,涵盖预训练、指令微调和偏好对齐等阶段。内容包括语言过滤、启发式方法、数据质量评估和去重等核心技术,还探讨了多语言和特定领域模型的专门选择策略。项目汇集了众多相关研究文献,为语言模型开发提供了系统的参考资源。

投诉举报邮箱: service@vectorlightyear.com