wandb 教程
wandb 是一个用于记录机器学习训练过程数据的免费工具。它包括用户管理、团队管理和项目管理等功能。
0. 环境设置
- Ubuntu 或 Red Hat
- tmux
- Python3
pip install -r requirements.txt
1. 基本用法
有关本节的详细教程,请参阅:wandb 使用教程(第 1 部分):基本用法
- 显示训练曲线的示例:test_curves.sh
- 显示图像的示例:test_images.sh
- 显示视频的示例:test_videos.sh
- 显示 matplotlib 图表的示例:test_matplot.sh
- 显示表格的示例:test_tables.sh
- 显示多进程组的示例:test_multi_process.sh
- 显示 HTML 的示例:test_html.sh
- PyTorch 集成示例:test_pytorch.sh
2. 超参数搜索
有关本节的详细教程,请参阅:wandb 使用教程(第 2 部分):使用 Launchpad 进行分布式超参数搜索
在机器学习任务中,我们经常遇到许多需要调整的超参数。wandb 提供了超参数搜索功能。然而,wandb 主要关注超参数搜索调度和可视化,并不具备内在的分布式能力。因此,本节描述了一种结合 Launchpad 和 wandb 进行并行(或分布式)超参数搜索的方法。
注意:由于 Launchpad 不提供多机分布式功能,如果您想进行多机并行超参数搜索,可以考虑使用 TLaunch。
- 基本示例:test_sweep.sh,此示例提供了结合 wandb 和 Launchpad 的最小设置。
- 在 CNN 分类任务中搜索 dropout 超参数:test_sweep.sh,此示例基于 MNIST 分类任务,专注于搜索最佳的 dropout 参数。
3. 数据和模型管理
wandb 还提供数据和模型备份管理功能。有关本节的详细教程,请参阅:wandb 使用教程(第 3 部分):数据和模型管理
- 基本示例:test_artifact.sh,此示例提供了一种备份 MNIST 训练数据的方法。
4. wandb 的本地部署
wandb 还提供本地服务器部署功能。有关本节的详细教程,请参阅:wandb 使用教程(第 4 部分):wandb 的本地部署
引用 wandb_tutorial
如果您在工作中使用了 wandb_tutorial,请引用我们:
@article{huangshiyu2022wandb,
title={wandb Tutorial},
author={Shiyu Huang},
year={2022},
howpublished={\url{https://github.com/huangshiyu13/wandb_tutorial}},
}