项目介绍:Amazon SageMaker Examples
Amazon SageMaker Examples项目致力于为机器学习从业者提供一系列如何使用Amazon SageMaker构建、训练和部署机器学习模型的示例。这些示例展示了如何充分利用SageMaker提供的广泛功能,是学习和使用Amazon SageMaker的绝佳资源。
SageMaker-Core简介
SageMaker-Core是一个新发布的Python SDK,为开发者提供了一种面向对象的接口来与SageMaker资源进行交互,如TrainingJob、Model和Endpoint。它引入了资源链特性,让开发者可以以更简便的方式传递资源对象作为参数,简化了代码管理。SageMaker-Core不仅全面实现了SageMaker API的功能,还通过自动代码补全、详细的文档及类型提示等使开发者的使用体验得到提升。这个SDK专为希望对AWS基础元素进行全方位定制的机器学习从业者而设计。
示例存储库
Amazon SageMaker的示例分为两个主要存储库:
-
SageMaker示例笔记本:这是官方存储库,集中展示了SageMaker的各项功能,由Amazon SageMaker团队直接维护。
-
Sagemaker社区示例存储库:该存储库由AWS的工程师和解决方案架构师社区维护,除了官方存储库展示的示例外,还包含了更多的参考解决方案和示例。
如何使用示例笔记本
这些示例笔记本会自动加载到SageMaker Notebook实例中,用户可以通过Jupyter中的SageMaker Examples标签或者JupyterLab中的SageMaker图标来访问。尽管大多数示例使用的是Amazon SageMaker的关键功能,如分布式管理训练或实时托管终端,这些笔记本可以在对IAM角色定义和必要库进行少量修改后在非SageMaker Notebook环境中运行。
示例笔记本类别
-
端到端机器学习生命周期:提供构建、训练和部署机器学习模型的全流程笔记本,适合初学者以及有经验的从业者。
-
数据准备:展示SageMaker在数据收集、预处理和组织以适应机器学习算法学习的过程中所具备的能力。
-
构建和训练模型:帮助用户有效地构建和训练广泛的机器学习模型,处理与设置和管理基础设施相关的繁杂任务。
-
部署和监控:提供多种推理选项,如实时端点、无服务器端点及异步端点,以便管理和监控模型部署与推理。
-
生成式AI:展示SageMaker在生成文本、图像、音频和视频等合成数据方面的能力。
-
机器学习运维(MLOps):帮助在生产环境中实施机器学习模型,改善交付时间和数据科学的生产力。
-
负责任的AI:帮助检测潜在的偏见和解释模型的预测,提升模型开发、验证和使用的可视性。
贡献与许可
尽管项目团队非常期待来自社区的贡献,但对于外部资源的示例引入机制仍在完善中。在贡献之前,建议查看我们的贡献指南。该项目使用Apache 2.0 许可协议进行许可。