#大规模训练
DeepSpeed
DeepSpeed是一个先进的深度学习优化工具库,专门设计用于简化和增强分布式训练。通过一系列创新技术,如ZeRO、3D并行处理、MoE和ZeRO-Infinity,DeepSpeed能大幅提高训练速度,同时降低成本。这些技术支持在数千GPU上扩展模型训练,并实现低延迟和高吞吐量的推理性能。DeepSpeed同时提供了先进的模型压缩技术,优化模型存储与推理效率,是大规模AI模型训练和推理的优选方案。
PULSE
PULSE是一款专注于中文医疗领域的大语言模型,经过约400万个医学和通用数据的微调训练。它支持多种自然语言处理任务,如健康教育、医师考试、报告解读和医疗记录结构化等。模型提供7B和20B参数版本供下载。注意,虽然模型可生成疾病诊断和治疗建议,但不能替代专业医生的意见。PULSE通过多项数据集及私有数据集的Elo Rating tournament方法验证,性能表现优异。
recommenders-addons
TensorFlow Recommenders Addons通过引入动态嵌入技术,使TensorFlow更适合搜索、推荐和广告模型的训练,全面兼容TensorFlow优化器和CheckPoint功能,支持GPU上的训练和推理。项目增强了推荐系统性能,解决了哈希冲突问题,并提供多种动态嵌入存储选项(如cuckoohash_map和Redis)。支持TF serving和Triton Inference Server,以便在大规模环境中部署和评估复杂推荐模型。
streaming
streaming是一款针对大规模分布式机器学习训练优化的数据加载工具。它支持从主流云存储平台流式读取图像、文本、视频等多种数据类型。该工具具备确定性、快速恢复、高吞吐等特点,可轻松集成到PyTorch训练流程中。streaming还提供数据混合、随机访问等功能,适用于大规模机器学习训练场景。
PERSIA
PERSIA代表'并行推荐训练系统与混合加速',是一个创新的开源框架,专为训练超大规模深度学习推荐模型而设计。该系统能够处理高达100万亿参数的模型,在效率和可扩展性方面表现卓越。PERSIA不仅在公共数据集上展现出优势,还在大型商业应用中得到实际验证。作为首个公开的PyTorch基础推荐训练系统,PERSIA为推荐算法的研究和应用开辟了新的可能性。