#SlimPajama

LLaMA-MoE学习资料汇总 - 基于LLaMA的轻量级混合专家模型

1 个月前

本文汇总了LLaMA-MoE项目的相关学习资料,包括项目介绍、安装指南、快速入门、模型性能等,帮助读者快速了解和上手这个轻量级的混合专家模型。

1 个月前

2 个月前

本文介绍了一种新型的大规模语言模型LLaMA-MoE,它基于LLaMA模型构建了混合专家(Mixture-of-Experts)架构,通过持续预训练进一步提升了模型性能,在保持较小参数量的同时实现了优秀的语言理解和生成能力。

2 个月前

投诉举报邮箱: service@vectorlightyear.com