#专家混合

Mixture-of-Experts: 提升深度学习模型性能的强大技术

3 个月前

PyTorch 神经网络机器学习专家混合深度学习 Github 开源项目

3 个月前

Soft MoE - PyTorch：Brain's Vision团队提出的专家混合模型的实现

3 个月前

Soft MoE Pytorch 专家混合深度学习神经网络 Github 开源项目

3 个月前

ESFT: 专家特化微调技术提升大语言模型性能

3 个月前

ESFT 大语言模型模型微调专家混合效率提升 Github 开源项目

3 个月前

相关项目

ESFT

ESFT项目提出专家专门化微调方法，针对Mixture-of-Experts架构的大语言模型进行高效定制。通过仅调整任务相关部分，该方法提高了模型效率和性能，同时降低资源消耗。项目开源了训练代码和评估脚本，方便研究人员应用于自有模型和数据集。这一技术为大规模语言模型的个性化和优化提供了新思路。

soft-moe-pytorch

soft-moe-pytorch 项目实现了基于 PyTorch 的软专家混合 (Soft MoE) 模型。该模型支持非自回归编码器，可用于文本到图像等任务。项目特点包括灵活设置专家数量、动态分配插槽，以及与 Transformer 架构兼容。这一工具为深度学习研究和开发提供了高效、可扩展的 MoE 模型实现，有助于提升模型性能。

mixture-of-experts

mixture-of-experts项目提供PyTorch版本的稀疏门控专家混合层实现，基于'Outrageously Large Neural Networks'论文。该实现支持自定义专家数量和输入输出维度，并提供训练和评估示例。项目包含CIFAR-10数据集应用实例，展示实际性能。作为深度学习工具，它有助于构建大规模高效的神经网络模型。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com