#XLA
相关项目
alpa
Alpa系统旨在简化大规模神经网络的训练与服务,能够将用户的单设备代码自动并行化到分布式集群。其主要特点包括自动并行化、卓越性能以及与现有机器学习生态系统的紧密集成。虽然目前不再积极维护,Alpa的核心算法已并入XLA并继续得到支持。通过Alpa,用户可以实现数据并行、操作并行和流水线并行,从而在线性扩展分布式集群上训练数十亿参数的模型。
axlearn
AXLearn是一个基于JAX和XLA的深度学习库,支持大规模模型的构建、迭代和维护。该库允许用户通过配置系统从可重用模块中组合模型,并兼容Flax和Hugging Face transformers等库。AXLearn能够高效地在众多加速器上训练数百亿参数的模型,涵盖自然语言处理、计算机视觉和语音识别等领域,还支持在公共云上运行并提供作业和数据管理工具。了解更多详情,请参阅其核心组件和设计文档。
jax
JAX是一个专为高性能数值计算和大规模机器学习设计的Python库。它利用XLA编译器实现加速器导向的数组计算和程序转换,支持自动微分、GPU和TPU加速。JAX提供jit、vmap和pmap等函数转换工具,让研究人员能够方便地表达复杂算法并获得出色性能,同时保持Python的灵活性。