#LLM支持

OpenNMT-py - 开源的神经机器翻译与大型语言模型框架

OpenNMT-pyEoleNeural Machine TranslationPyTorchLLM支持Github开源项目

OpenNMT-py是基于PyTorch的开源神经机器翻译和语言模型框架，适用于研究和生产。支持大语言模型转换、量化以及多GPU并行。提供教程、文档和社区支持，适合翻译、总结等多种NLP任务。最新版本引入了多查询注意力机制和线性去偏等新功能。

open-assistant-api - 开源智能助理API

Open Assistant APIOpenAI智能助理开源LLM支持Github开源项目

Open Assistant API是一个开源和自托管的AI智能助手API，与官方OpenAI接口兼容。它允许与官方OpenAI客户端集成，方便构建多模型语言应用，支持简便的RAG引擎、互联网搜索以及个性化功能的实现。此外，该API支持本地部署，可通过Docker快速启动。

deepsparse - 优化CPU上深度学习推理的高效稀疏性使用

DeepSparseCPU推理稀疏性模型量化LLM支持Github开源项目

DeepSparse是一个专为CPU优化的深度学习推理运行时，通过使用稀疏性显著加快模型推理速度。结合SparseML优化库，DeepSparse支持模型剪枝和量化，在CPU上实现卓越性能。支持各种计算机视觉和自然语言处理模型，包括BERT、ViT、ResNet、YOLOv5/8等。此外，DeepSparse现已支持高效的LLM推理，对稀疏量化模型实现多倍加速。可通过PyPI安装，并提供多种API便于部署。

相关文章

Article Cover

OpenNMT-py: 开源神经机器翻译和大型语言模型框架

Article Cover

Open Assistant API: 开源智能助手框架的革新之作

Article Cover

OpenNMT-py入门指南 - 开源神经机器翻译框架

Article Cover

Open Assistant API学习资料汇总 - 开源自托管的AI智能助手API框架

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号