#MoE架构

DeepSeek-MoE: 革新混合专家语言模型架构,实现专家终极专门化

3 个月前
Cover of DeepSeek-MoE: 革新混合专家语言模型架构,实现专家终极专门化