热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#DeepSpeed-MII
DeepSpeed-MII - 开源低延迟模型推理库
DeepSpeed-MII
高吞吐量
低延迟
模型支持
优化技术
Github
开源项目
DeepSpeed-MII是一款开源Python库,专注于高吞吐量、低延迟和成本效益的模型推理。支持的技术包括块状KV缓存、连续批处理、高性能CUDA内核等,适用于37000多个模型,如Llama-2、Mixtral和Phi-2。v0.2版本提升了性能和功能,吞吐量提高至2.5倍。适用于语言模型及图像生成任务。
1
1
相关文章
DeepSpeed-MII: 高吞吐低延迟的模型推理利器
2024年09月04日
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号