#OpenLLM
OpenLLM - 一键部署开源LLM,支持企业级云部署和OpenAI兼容API
Github开源项目OpenLLM自托管LLMOpenAI兼容API云部署量化模型热门
OpenLLM为开发者提供一键部署各种开源大型语言模型(LLM)到企业级云环境的解决方案,支持OpenAI兼容的API端点。该项目集成最新的加速解码技术,并提供内置的ChatGPT界面,能够快速实现模型的互动和部署。用户只需简单的命令,即可本地运行或部署到云端,轻松管理和使用各种顶尖LLM,如Llama 3.1、Mistral和Qwen2等。
Phi-3-medium-128k-instruct-quantized.w4a16 - Phi-3量化优化文本生成模型,支持多场景应用
Github开源项目OpenLLM模型量化HuggingfacePhi-3神经魔法llmcompressor
Phi-3中型量化模型专注于优化英语文本生成,适用于商业与研究领域。通过INT4权重量化,减少存储与内存消耗,提高了部署效率。支持GPTQ算法下的量化,并可在vLLM与Transformers框架中高效运行,于OpenLLM基准测试中展现优异表现,适合用于多种对话场景。
Meta-Llama-3-8B-Instruct-quantized.w8a16 - 智能LLM量化技术实现50%体积压缩并完整保留性能
人工智能Github开源项目模型量化OpenLLM模型Huggingface权重优化Meta-Llama-3
Meta-Llama-3-8B-Instruct模型经INT8量化优化后,参数位数从16位降至8位,减少约50%磁盘空间和GPU内存占用。在OpenLLM基准测试中,量化模型平均得分68.69,与原版68.54分相当。模型支持vLLM和transformers框架部署,适用于英语环境中商业和研究领域的AI助手应用。