RAG 模式使企业能够使用 LLM 的推理功能,利用其现有模型基于新数据处理和生成响应。RAG 便于定期数据更新,无需微调,从而简化了 LLM 在企业中的集成。
企业 RAG 解决方案加速器(GPT-RAG)提供了一个为企业级 RAG 模式部署量身定制的强大架构。它确保了基于真实数据的响应,并建立在零信任安全和负责任的人工智能基础上,确保可用性、可扩展性和可审计性。非常适合从探索和 PoC 阶段过渡到全面生产和 MVP 的组织。
企业 RAG 社区
- Discord 频道 企业 RAG - 连接社区
组件
GPT-RAG 采用模块化方法,由三个具有特定功能的组件组成。
概念
如果你想了解更多关于 RAG 模式和 GPT-RAG 架构的知识,请参阅以下内容。
入门指南
此指南将引导你完成企业 RAG 的部署过程。提供两种部署选项,基础架构和零信任架构。开始部署之前,请确保你已准备好 先决条件 部分列出的所有必要工具和服务。
先决条件
- Azure 开发者 CLI:下载 Windows 版 azd ,其他操作系统版本。
- Powershell 7+ 和 AZ 模块(仅 Windows):Powershell,AZ 模块
- Git:下载 Git
- Node.js 16+ windows/mac linux/wsl
- Python 3.11:下载 Python
- 启动 Azure AI 服务创建 并同意负责任的 AI 条款 **
如果你之前在订阅中没有创建过 Azure AI 服务资源 注意: 如果你实施了下面描述的零信任架构,则在过程的第二部分只需要 Node.js 和 Python ,这部分将在部署该架构过程中创建的 VM 上执行。
基础架构部署
对于无需网络隔离要求的快速演示或概念验证项目,你可以使用基础架构部署加速器。
部署过程非常简单,只需安装先决条件并按照以下四个步骤使用 Azure 开发者 CLI (azd) 在终端中进行操作:
1 下载仓库:
azd init -t azure/gpt-rag
2 登录到 Azure:
2.a Azure 开发者 CLI:
azd auth login
2.b Azure CLI:
az login
3 开始构建基础设施和组件部署:
azd up
4 将源文档添加到对象存储
将你的文档上传到存储账户中的 'documents' 文件夹。该账户的名称应以 'strag' 开头。这是默认存储账户,如下示例图所示。
零信任架构部署
对于更安全和隔离的部署,你可以选择零信任架构。这种架构非常适合对网络隔离和严格安全措施高度重视的生产环境。
零信任架构的部署过程与基础架构部署类似,但包括一些额外步骤。请参考以下说明以获取详细的部署指南:
1 下载仓库
azd init -t azure/gpt-rag
2 启用网络隔离
azd env set AZURE_NETWORK_ISOLATION true
3 登录到 Azure:
2.a Azure 开发者 CLI:
azd auth login
2.b Azure CLI:
az login
4 开始构建基础设施和组件部署:
azd provision
5 接下来,你将使用在第 4 步创建的 Bastion 连接的虚拟机继续部署。
使用用户名 gptrag 登录到创建的虚拟机,并使用存储在 KeyVault 中的密码进行身份验证,如下图所示:
6 访问 Windows 后,安装 Powershell,因为其他先决条件已经在虚拟机上安装。
7 打开命令提示符,运行以下命令以更新 azd 到最新版本:
choco upgrade azd
更新 azd 后,只需关闭并重新打开终端。
8 创建一个新目录,例如 deploy
,然后进入该目录。
mkdir deploy
cd deploy
要完成部署过程,请在命令提示符中执行以下命令:
azd init -t azure/gpt-rag
azd auth login
azd env refresh
azd package
azd deploy
注意:在运行
azd init ...
和azd env refresh
时,使用与初始基础设施配置相同的环境名称、订阅和地区。
完成!零信任部署已完成。
自定义你的部署
入门指南中概述的部署过程设置了 Azure 资源,并以标准配置部署了加速器组件。对于那些希望根据特定需求更紧密地定制部署的人,请参考自定义部署部分以获取更多自定义可能性。
与其他数据源集成
如果你希望通过添加新数据源来扩展你的数据检索能力,可以考虑集成 Bing 自定义搜索,SQL 服务器和 Teradata。有关更多信息,请参阅AI 集成中心页面。
其他资源
故障排除
如果在部署过程中遇到错误,请查看故障排除页面。
评估
查询对话历史
价格估算
治理
贡献
该项目欢迎贡献和建议。大多数贡献需要你同意一份贡献者许可协议 (CLA),声明你有权并且确实授予我们使用你的贡献的权利。有关详细信息,请访问 https://cla.opensource.microsoft.com。
当你提交拉请求时,CLA 机器人将自动确定你是否需要提供 CLA 并适当装饰 PR(例如状态检查、评论)。只需按照机器人提供的说明进行操作。你只需在所有使用我们 CLA 的存储库中执行一次此操作。
此项目采用了微软开源行为准则。 有关更多信息,请参阅行为准则常见问题或联系 opencode@microsoft.com 了解任何其他问题或评论。
商标
该项目可能包含项目、产品或服务的商标或徽标。授权使用微软商标或徽标必须遵循并符合微软商标和品牌指南。 使用此项目修改版本中的微软商标或徽标不得引起混淆或暗示微软赞助。 任何使用第三方商标或徽标的行为均须遵守这些第三方的政策。