AI-Gateway 项目介绍
项目简介
AI-Gateway 项目旨在通过一系列实验性实验室探索“AI Gateway”模式。此项目主要围绕 Azure API 管理的 GenAI Gateway 功能,对 AI 服务 API 进行管理,包括安全性、可靠性、性能和成本控制等方面,并提供整体运营效率支持。
项目重点考虑的对象包括 Azure OpenAI,这为大规模语言模型(LLM)树立了标准参考。然而,这种核心原则和设计模式同样可以应用于任何 LLM。
新功能
AI-Gateway 添加了多个新功能以增强实验室配置的灵活性:
- 内容过滤和提示屏蔽实验室。
- 模型路由实验室,基于 OpenAI 模型的路由。
- 利用 Azure AI Studio 的提示流实验室,与 Azure API 管理一起使用。
- 后端池负载平衡实验室中增加了
priority
和weight
参数。 - 流式处理工具,用于测试 OpenAI 与 Azure API 管理的流式处理。
- 追踪工具,利用 Azure API 管理追踪能力进行 API 调试和问题解决。
- 图像处理加入到 GPT-4o 推理实验室中。
- 函数调用实验室,带有 Azure 函数上的示例 API。
实验室
AI-Gateway 实验室利用 Jupyter Notebook 制作,以 Python 脚本、Bicep 文件和 Azure API 管理策略为基础的步骤指导进行实验,紧跟 AI 领域的快速进展。
- 后端池负载平衡:试用 Azure API 管理内置的负载平衡功能。
- 访问控制:利用身份提供者进行更精细的访问控制。
- 响应流式传输:探索响应流式传输的优缺点。
- 内置日志记录:使用 Azure API 管理内置日志功能跟踪请求。
- 模型推理:针对新的多模态模型 GPT-4o 进行试验。
起步指南
为便于新用户快速上手,项目包含详细的起步指南和先决条件说明。主要步骤包括:
- 克隆项目代码,并配置本地环境。
- 选择合适的实验室并运行。
- 根据需要自定义实验。
工具和框架
该项目附带一些便捷工具,比如 AI-Gateway Mock 服务器,用于模拟 OpenAI API 的行为,还有追踪和流媒体处理工具。
项目按 Azure Well-Architected Framework 框架设计,可优化使用者的负载质量,通过实验提升整体架构质量。
其他资源
项目提供了其他多种资源和参考架构,实现更加全面的解决方案。包括 AI Hub Gateway 着陆区、GenAI Gateway 指南等。用户可根据自身需求,利用这些资源来丰富项目实践。