热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#AMD-Llama-135m
AMD-Llama-135m - 轻量级语言模型实现高效推理加速
语言模型
神经网络
Huggingface
预训练
AMD-Llama-135m
Github
模型
开源项目
机器学习
AMD-Llama-135m是一个基于LLama2架构的135M参数语言模型,在AMD Instinct MI250加速器上训练。该模型与huggingface transformers兼容,并使用LLama2相同的分词器。模型可独立使用,也可作为LLama2和CodeLlama的推理加速辅助模型。经SlimPajama和Project Gutenberg数据集预训练,以及StarCoder Python代码数据集微调后,模型在多项NLP基准测试中表现优异。通过推理加速技术,吞吐量可提升至3.88倍。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号