#Text Generation Inference

Text Generation Inference入门指南 - 高性能大语言模型推理服务

2 个月前

Text Generation Inference Hugging Face 大语言模型分布式追踪量化 Github 开源项目

2 个月前

深入解析Hugging Face的Text Generation Inference工具包:为大型语言模型赋能

3 个月前

Text Generation Inference Hugging Face 大语言模型分布式追踪量化 Github 开源项目

3 个月前

相关项目

text-generation-inference

Text Generation Inference (TGI) 是一个部署和服务大型语言模型的工具包。它支持Llama、Falcon、StarCoder、BLOOM、GPT-NeoX等流行的开源模型，提供简便的启动器、分布式追踪、张量并行、多GPU推理加速、令牌流等特性。TGI还支持权重量化和安全张量加载，具备自定义提示生成和微调功能，兼容Nvidia、AMD、Inferentia、Intel GPU、Gaudi和Google TPU等硬件平台。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com