热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Text Generation Inference
text-generation-inference - 生产级高性能文本生成推理工具
Text Generation Inference
Hugging Face
大语言模型
分布式追踪
量化
Github
开源项目
Text Generation Inference (TGI) 是一个部署和服务大型语言模型的工具包。它支持Llama、Falcon、StarCoder、BLOOM、GPT-NeoX等流行的开源模型,提供简便的启动器、分布式追踪、张量并行、多GPU推理加速、令牌流等特性。TGI还支持权重量化和安全张量加载,具备自定义提示生成和微调功能,兼容Nvidia、AMD、Inferentia、Intel GPU、Gaudi和Google TPU等硬件平台。
1
1
相关文章
深入解析Hugging Face的Text Generation Inference工具包:为大型语言模型赋能
2024年08月30日
Text Generation Inference入门指南 - 高性能大语言模型推理服务
2024年09月10日
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号