项目介绍:asl-ml-immersion
项目概述
asl-ml-immersion 是一个由谷歌云的高级解决方案实验室(Advanced Solutions Lab, ASL)团队维护的 GitHub 代码库。这个代码库包含一系列设计用于在谷歌云平台上的 Vertex AI 上运行的 Jupyter 笔记本。这些资料旨在帮助一名没有机器学习背景的软件工程师掌握高级水平的机器学习技能。
在该代码库中,包含的笔记本涵盖了各种模型架构(如 DNN、CNN、RNN、transformers 和 SNGP 等),针对多种数据形式(表格、图像、文本、时间序列),这些模型主要通过 TensorFlow 和 Keras 实现。此外,该代码库还介绍了如何利用谷歌云的 Vertex AI 工具大规模操作 TensorFlow、Scikit-learn 和 PyTorch 模型,包括 Vertex 的训练、调优、服务,TFX 和 Kubeflow 流水线等。
代码库结构
所有的笔记本都存储在 notebooks 文件夹中,并按不同的机器学习主题进行组织。每个主题都有一个 labs
文件夹和一个 solutions
文件夹。labs
文件夹中的笔记本用于测试编程技能,用户需填充指定的 TODOs 任务。而 solutions
文件夹提供正确解答供参考。
代码库主要分为三个文件夹:
├── kernels - 包含 labs 文件夹中某些笔记本所需的核心脚本
├── notebooks - 按主题组织的 labs 和 solutions 笔记本
│ ├── bigquery
│ ├── building_production_ml_systems
│ ├── docker_and_kubernetes
│ ├── . . .
├── scripts - 包含在 Vertex AI 上启用和设置服务的脚本
环境配置(Vertex AI)
要设置环境,首先需要打开 CloudShell,并执行以下指令:
git clone https://github.com/GoogleCloudPlatform/asl-ml-immersion.git
cd asl-ml-immersion
./scripts/setup_on_cloudshell.sh
接下来,请按照 官方文档 的指引,在 Vertex AI Workbench Instance 上配置一个 JupyterLab 实例。
注意:大多数实验室课程不需要加速器(GPU/TPU),但建议在某些笔记本中使用。
在创建 Vertex Workbench 实例之后,打开 JupyterLab 实例中的终端,并运行下面的命令:
git clone https://github.com/GoogleCloudPlatform/asl-ml-immersion.git
cd asl-ml-immersion
export PATH=$PATH:~/.local/bin
make install
注意:有些笔记本可能需要附加设置,请参照特定笔记本中的说明。
执行以上命令后,即可在基础“Python 3”内核中打开并执行笔记本。
项目贡献
目前,该代码库仅接收谷歌员工的贡献。如需了解更多有关贡献的工作流程,请参阅 CONTRIBUTING.md。
免责声明
该代码库并非谷歌正式支持的产品。使用谷歌云产品将产生费用,详情请查阅定价页面。
许可协议
此代码库中的所有代码均根据 Apache License 2.0 版(“许可证”)获得许可。如需了解许可证,您可以自行获取许可证副本。