热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#LLM推理优化
ktransformers - 体验前沿LLM推理优化的灵活框架
KTransformers
LLM推理优化
大型语言模型
深度学习框架
GPU加速
Github
开源项目
KTransformers是一个灵活的Python框架,通过高级内核优化和并行策略增强Transformers性能。框架支持单行代码注入优化模块,提供Transformers兼容接口、OpenAI和Ollama标准RESTful API及简化的ChatGPT风格Web UI。专注本地部署和异构计算优化,KTransformers集成Llamafile和Marlin内核,为LLM推理优化实验提供灵活平台。
1
1
相关文章
KTransformers: 灵活高效的大语言模型推理优化框架
2024年09月05日
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号