#LLM支持
OpenNMT-py - 开源的神经机器翻译与大型语言模型框架
OpenNMT-pyEoleNeural Machine TranslationPyTorchLLM支持Github开源项目
OpenNMT-py是基于PyTorch的开源神经机器翻译和语言模型框架,适用于研究和生产。支持大语言模型转换、量化以及多GPU并行。提供教程、文档和社区支持,适合翻译、总结等多种NLP任务。最新版本引入了多查询注意力机制和线性去偏等新功能。
open-assistant-api - 开源智能助理API
Open Assistant APIOpenAI智能助理开源LLM支持Github开源项目
Open Assistant API是一个开源和自托管的AI智能助手API,与官方OpenAI接口兼容。它允许与官方OpenAI客户端集成,方便构建多模型语言应用,支持简便的RAG引擎、互联网搜索以及个性化功能的实现。此外,该API支持本地部署,可通过Docker快速启动。
deepsparse - 优化CPU上深度学习推理的高效稀疏性使用
DeepSparseCPU推理稀疏性模型量化LLM支持Github开源项目
DeepSparse是一个专为CPU优化的深度学习推理运行时,通过使用稀疏性显著加快模型推理速度。结合SparseML优化库,DeepSparse支持模型剪枝和量化,在CPU上实现卓越性能。支持各种计算机视觉和自然语言处理模型,包括BERT、ViT、ResNet、YOLOv5/8等。此外,DeepSparse现已支持高效的LLM推理,对稀疏量化模型实现多倍加速。可通过PyPI安装,并提供多种API便于部署。
相关文章