#Xeon

xFasterTransformer:高性能大语言模型推理引擎 - 学习资料与资源汇总

2 个月前

xFasterTransformer 大语言模型 Xeon 高性能 Python API Github 开源项目

2 个月前

xFasterTransformer: 英特尔X86平台上的高性能大语言模型推理解决方案

3 个月前

xFasterTransformer 大语言模型 Xeon 高性能 Python API Github 开源项目

3 个月前

相关项目

xFasterTransformer

xFasterTransformer是一个为X86平台优化的大规模语言模型（LLM）推理解决方案，支持多插槽和节点的分布式运行，适用于大型模型推理。它提供C++和Python API，支持例如ChatGLM、Llama、Baichuan等流行的LLM模型，并可通过PyPI、Docker或从源代码进行安装。项目附带详细文档、API使用示例、基准测试代码和Web演示，确保用户能充分利用其高性能和高扩展性。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com