热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#gpt-fast
gpt-fast - PyTorch原生高效文本生成项目
gpt-fast
PyTorch
性能优化
模型量化
文本生成
Github
开源项目
gpt-fast是一个基于PyTorch的高效Transformer文本生成项目,代码精简(<1000行Python),仅依赖PyTorch和sentencepiece。项目特点包括极低延迟、int8/int4量化、推测解码和张量并行,支持NVIDIA和AMD GPU。gpt-fast不是框架或库,而是展示原生PyTorch性能的示例。它支持LLaMA系列和Mixtral 8x7B等模型,提供详细基准测试和多种优化技术。该项目实现了高效的文本生成,展现了PyTorch在AI领域的强大性能。
1
1
相关文章
GPT-Fast: 高性能原生PyTorch文本生成的简洁实现
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号