#DeepSeek-Coder-V2-Lite-Instruct-FP8

DeepSeek-Coder-V2-Lite-Instruct-FP8 - FP8量化模型优化提高大语言模型部署效率

vLLMGithub开源项目文本生成DeepSeek-Coder-V2-Lite-Instruct-FP8量化FP8Huggingface模型

DeepSeek-Coder-V2-Lite-Instruct-FP8是一种经过FP8量化优化的模型，旨在提升商业与研究中英文聊天助手的效率。此优化通过减少参数位数，有效降低内存和存储器需求，达到了79.60的HumanEval+基准测试得分。在vLLM 0.5.2及以上版本中实现高效部署。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号