热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#EET
EET - Transformer模型推理加速引擎
EET
Transformer
推理
AI模型
性能优化
Github
开源项目
EET是一个专注于Transformer模型的PyTorch推理加速引擎。它支持百川、LLaMA等大规模语言模型,提供int8量化功能,可在单GPU上高效运行超大模型。EET通过CUDA内核优化和量化算法显著提升多模态及NLP任务的推理性能,为Transformers和Fairseq提供开箱即用的加速方案。使用EET只需几行代码即可实现模型的高效部署与推理。
1
1
相关文章
EET: 高效便捷的Transformer推理解决方案
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号