#资源利用
AcmeTrace - 大规模语言模型工作负载数据集
Acme TraceAI实验室工作负载数据集资源利用Github开源项目
AcmeTrace是一个来自上海人工智能实验室的大规模语言模型工作负载数据集,涵盖2023年3月至8月期间的数据。该数据集包含880,740个作业记录,其中470,497个为GPU作业,来自两个独立的GPU集群。这些数据为研究人员提供了分析大规模语言模型在数据中心开发特征的宝贵资源,支持相关学术研究。
psutil - 功能强大的跨平台系统和进程监控库
psutil系统监控进程管理资源利用跨平台Github开源项目
psutil是一款功能丰富的跨平台Python库,专门用于获取运行进程和系统资源使用情况信息。该库支持Linux、Windows、macOS等多种操作系统,提供CPU、内存、磁盘、网络等系统资源的监控功能,并具备进程管理能力。psutil实现了众多UNIX命令行工具的功能,适用于系统监控、性能分析和资源限制等应用场景。兼容Python 2.7和3.6+版本,是系统管理和监控任务的有力工具。