aqueduct - 支持使用Python定义和部署机器学习和LLM任务的开源MLOps框架

Aqueduct 项目介绍

Aqueduct 是一个开源的 MLOps 框架，设计旨在使用户能够在任何云基础设施上定义和部署机器学习（ML）和大型语言模型（LLM）任务。无论是经验丰富的工程师还是刚接触这一领域的新手，Aqueduct 的目标都是提供一站式简化解决方案，使得用户可以在不干扰现有工具的情况下，轻松便捷地部署和管理机器学习项目。

项目背景

在当今的技术环境中，要成功地运行机器学习任务，团队往往需要管理多种不同的云基础设施工具，这些工具之间的 API 不统一，难以协作。Aqueduct 出现在这个复杂环境中，解决了多工具的整合问题，提供了一个统一的接口，以便用户可以在已有的云基础设施上轻松运行机器学习任务。

项目亮点

Python 原生 API：Aqueduct 允许用户使用普通的 Python 代码定义机器学习任务。无需学习复杂的领域特定语言（DSL）或配置文件（如 YAML），让代码更快地投入生产。
与基础设施无缝集成：Aqueduct 的工作流可以在用户常用的云基础设施上运行，如 Kubernetes、Spark、Airflow、AWS Lambda 等。这样用户可以在现有工具的基础上，享受到 Aqueduct 带来的优势。
集中透明化管理：在生成环境中，Aqueduct 提供对代码、数据、指标和元数据的可视化管理，帮助用户及时了解工作流的运行状态，确保管道按预期工作，并即时发现问题。
安全运行：作为完全开源的软件，Aqueduct 可以在任何 Unix 环境中运行。用户的数据和代码完全在自己的云中操作，确保安全性。