项目介绍
简介
ml-workspace 是一个集成化的、基于网络的开发环境,专门用于机器学习和数据科学。它可以轻松部署,让用户能够快速地在个人设备上搭建和开发机器学习解决方案。这个环境预装了多种流行的数据科学库(例如 Tensorflow, PyTorch, Keras, Sklearn)和开发工具(例如 Jupyter, VS Code, Tensorboard),并进行了良好的配置、优化和集成,是开发者的终极工具。
主要特点
- 提供基于网络的 Jupyter, JupyterLab 和 Visual Studio Code 开发环境。
- 预装了许多流行的数据科学库和工具。
- 通过网络浏览器可以访问完整的 Linux 桌面图形用户界面。
- 无缝集成了针对笔记本的 Git 功能。
- 通过 Tensorboard 和 Netdata 进行硬件和训练监控。
- 可以通过 Web, SSH 或 VNC 在单一端口进行访问,方便从任何地方连接。
- 可以通过 SSH 作为远程内核(Jupyter)或远程机器(VS Code)使用。
- 可通过 Docker 在 Mac, Linux 和 Windows 上轻松部署。
快速开始
前提条件
要使用 ml-workspace,您的机器上需要安装 Docker。
启动单个实例
可以使用以下命令轻松启动一个工作空间实例:
docker run -p 8080:8080 mltooling/ml-workspace:0.13.2
运行后,您可以通过 http://localhost:8080
访问工作空间。
配置选项
工作空间提供了通过环境变量配置的多种选项,例如启用 SSL、设置认证、限制内存和 CPU 使用等。
数据持久化
如果希望在容器重启后数据仍然存在,可以将一个 volume 挂载到 /workspace
目录。
各种风味
除了主工作空间镜像(mltooling/ml-workspace
),该项目还提供其他镜像版本以支持多种使用场景,例如最小化版本、R 版本、Spark 版本和 GPU 版本。
多用户设置
ml-workspace 主要设计为单用户开发环境。对于多用户场景,推荐使用 ML Hub,该工具基于 JupyterHub, 适用于多个用户的管理。
支持与联系
该项目由 Benjamin Räthlein、Lukas Masuch 和 Jan Kalkan 维护。为了让更多人受益,项目建议所有支持请求和问题通过公开的渠道讨论。
功能展示
ml-workspace 提供了一系列顶级的开源开发工具以帮助机器学习工作流程,包括但不限于 Jupyter、桌面 GUI、Visual Studio Code、JupyterLab、Git 集成、文件共享、端口访问、Tensorboard、硬件监控和 SSH 访问。用户可以在工作空间内具有完全的 root 和 sudo 权限,以便于通过终端安装所需的库或工具。
在 Jupyter 中,用户可以通过 Open Tool 菜单来使用这些工具,并在工作空间中找到各种第三方扩展以提高工作效率。