ESFT
ESFT项目提出专家专门化微调方法,针对Mixture-of-Experts架构的大语言模型进行高效定制。通过仅调整任务相关部分,该方法提高了模型效率和性能,同时降低资源消耗。项目开源了训练代码和评估脚本,方便研究人员应用于自有模型和数据集。这一技术为大规模语言模型的个性化和优化提供了新思路。