热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#稀疏组合专家
PowerMoE-3b - 创新型AI模型提升文本生成精准度
Github
开源项目
文本生成
模型
transformers
Huggingface
PowerMoE-3B
稀疏组合专家
PowerMoE-3B是一种稀疏Mixture-of-Experts语言模型,优化于多任务文本生成精度。模型利用Power学习率调度器,每个token激活800M参数,在自然语言、多重选择、代码生成和数学推理任务上表现出色。适用于不同数据集的混合训练,提供高效的文本生成方案。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号