Logo

#AI加速

深度学习模型压缩与加速技术综述

2 个月前
Cover of 深度学习模型压缩与加速技术综述

Olive:微软开源的简化机器学习模型优化工具

2 个月前
Cover of Olive:微软开源的简化机器学习模型优化工具

Aphrodite Engine: 为大规模语言模型推理提供高性能解决方案

2 个月前
Cover of Aphrodite Engine: 为大规模语言模型推理提供高性能解决方案

相关项目

Project Cover
ColossalAI
Colossal-AI致力于使大型AI模型的训练更加经济、快速且易于获取。通过支持多种并行策略,包括数据并行、流水线并行、张量并行和序列并行,Colossal-AI可以大幅提高大规模模型训练的速度。此外,还集成了异构训练和零冗余优化器技术,使得在多GPU集群上的训练过程更加高效和灵活。Colossal-AI通过这些先进的功能,已被广泛应用于生产和研究场景,显著推动了AI技术的进步和应用。
Project Cover
Olive
Olive是一个开源的硬件感知型AI模型优化工具,整合了先进的模型压缩、优化和编译技术。它能根据特定模型和目标硬件自动选择最适合的优化方法,在保证精度和延迟的同时,为云端和边缘设备生成高效推理模型。Olive通过简化开发流程和统一优化框架,支持多种硬件平台,有效提升AI模型部署效率。
Project Cover
aphrodite-engine
Aphrodite是一个开源的语言模型推理引擎,采用vLLM的分页注意力机制实现高效推理。它支持连续批处理、多种量化方法和分布式推理,可为大规模用户提供快速服务。该引擎还具备多种采样方法和8位KV缓存,能够处理更长的上下文并提高吞吐量。Aphrodite目前作为PygmalionAI的官方后端引擎使用。
Project Cover
awesome-ml-model-compression
本项目汇总了机器学习模型压缩和加速领域的优质资源,包括研究论文、技术文章、教程和工具库等。涵盖量化、剪枝、知识蒸馏和轻量级网络设计等多种技术方法。为研究人员和工程师提供了优化深度学习模型性能和效率的重要参考。项目内容持续更新,欢迎提交新的相关资源。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号