arena
Arena 是一个命令行工具,帮助数据科学家简化机器学习训练作业的运行和监控。支持独立和分布式的TensorFlow训练,基于Kubernetes、Helm和Kubeflow,降低数据科学家对Kubernetes知识的依赖。此外,Arena 提供 `top` 命令可检查 Kubernetes 集群中的 GPU 资源,让数据科学家在单一机器上享受 GPU 集群的强大性能。