热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#MPT-1b-RedPajama-200b
mpt-1b-redpajama-200b - 适应性强的1.3B参数解码器模型
Github
开源项目
模型架构
模型
Huggingface
训练数据
变压器
RedPajama
MPT-1b-RedPajama-200b
MPT-1b-RedPajama-200b是一个1.3B参数的解码器模型,由MosaicML在2023年4月使用RedPajama数据集训练。该模型采用改良的解码器架构,使用ALiBi和QK LayerNorm提升训练效率,不依赖位置嵌入。训练中使用了67% Common Crawl和15% C4数据,目标是复刻Llama系列的训练集。部署模型时需要启用信任远程代码,并支持优化的FlashAttention实现,助力自然语言处理研究的发展。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号