nos
nos是一个开源模块,专门优化Kubernetes上的AI工作负载运行。它通过动态GPU分区和弹性资源配额管理,提高GPU利用率,降低基础设施成本,并增强工作负载性能。该模块支持GPU资源的精细化分配,提高资源利用效率,并允许命名空间之间灵活借用资源配额,最大化提升集群运行能力。