#TPU

MaxText入门指南 - 高性能可扩展的JAX LLM框架

2 个月前

MaxText TPU GPU Jax LLM Github 开源项目

2 个月前

Ring Attention: 突破Transformer模型的上下文长度限制

3 个月前

Ring Attention Blockwise Transformers GPU TPU Jax Github 开源项目

3 个月前

Uncertainty Baselines: Google推出深度学习不确定性和鲁棒性基准

3 个月前

Uncertainty Baselines TensorFlow TPU 模型数据集 Github 开源项目

3 个月前

XLA: 加速机器学习的强大编译器

3 个月前

PyTorch/XLA TPU 深度学习分布式计算 Google Cloud Github 开源项目

3 个月前

MaxText: Google的高性能可扩展大语言模型框架

3 个月前

MaxText TPU GPU Jax LLM Github 开源项目

3 个月前

相关项目

maxtext

MaxText是一个高性能、可扩展的开源大模型，采用纯Python和Jax编写，专为Google Cloud的TPUs和GPUs设计。支持训练和推理，能够从单个主机扩展到大型集群，且无需复杂优化。MaxText适用于研究和生产中的大型语言模型项目，支持Llama2、Mistral和Gemma模型，并提供详细的入门指南和性能测试结果。

EasyLM

EasyLM提供了一站式解决方案，用于在JAX/Flax中预训练、微调、评估和部署大规模语言模型。通过JAX的pjit功能，可以扩展到数百个TPU/GPU加速器。基于Hugginface的transformers和datasets，EasyLM代码库易于使用和定制。支持Google Cloud TPU Pods上的多TPU/GPU和多主机训练，兼容LLaMA系列模型。推荐加入非官方的Discord社区，了解更多关于Koala聊天机器人和OpenLLaMA的详细信息及安装指南。

uncertainty-baselines

Uncertainty Baselines提供高质量的不确定性和鲁棒性标准模板，作为研究人员新想法和应用的起点，促进技术交流。项目高效实施关键任务，减少对代码库其他文件的依赖，便于独立使用。建议不确定性和鲁棒性评估的最佳实践，帮助研究人员快速原型化和基准比较。支持TensorFlow开发，可在TPUs和GPUs上运行，提升实验灵活性和重复性。

xla

PyTorch/XLA 是一个将 PyTorch 深度学习框架与 XLA 编译器及 Cloud TPUs 连接的 Python 包，提供高效的训练和推理解决方案。用户可以通过 Kaggle 免费试用，并安装支持 TPU 和 GPU 的插件包。项目提供详细的文档和教程，包括使用指南、性能调优方法和 Docker 镜像使用说明。鼓励用户通过 issue 提交反馈和建议，欢迎开源贡献。

ringattention

ringattention项目实现Ring Attention和Blockwise Transformers技术，显著提升Transformer模型上下文处理能力。通过跨设备分布式计算和通信重叠，模型可处理长达数千万个token的序列，无需增加开销。该技术支持causal block和cache index，为大规模语言模型训练提供高效解决方案，特别适用于超长上下文处理场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com