信息助手加速器

[!重要]
自2023年11月15日起，Azure 认知搜索已更名为 Azure AI 搜索。Azure 认知服务也已更名为 Azure AI 服务。

这个行业加速器展示了 Azure 与 OpenAI 大型语言模型之间的集成。它利用 Azure AI 搜索进行数据检索和 ChatGPT 风格的问答互动。使用检索增强生成（RAG）设计模式和 Azure OpenAI 的 GPT 模型，它提供了自然语言交互来发现用户查询的相关响应。Azure AI 搜索简化了数据摄取、转换、索引和多语言翻译。

加速器根据模型类型调整提示以提高性能。用户可以自定义温度和角色等设置，实现个性化 AI 互动。它提供了可解释的思考过程、可引用的引文和直接内容验证等功能。

请观看此视频了解使用此加速器可能实现的用例。

响应生成方法

工作（有依据）

它使用检索增强生成（RAG）模式生成基于特定数据源的响应。通过结合相关信息的检索和生成能力，它可以产生不仅上下文相关，而且基于验证数据的响应。RAG 管道在生成响应之前访问您的数据集以检索相关信息，确保准确性和可靠性。此外，每个响应都包含对源自答案的文档块的引用，提供透明度并允许用户验证来源。这种方法在精确性和事实性至关重要的领域特别有优势。用户可以信任生成的响应是基于可靠的数据源，从而提高应用程序的可信度和实用性。有关我们的有依据（RAG）的具体信息，请参阅 RAG

无依据

它利用大型语言模型（LLM）的能力以无依据的方式生成响应，不依赖外部数据源或检索增强生成技术。LLM 经过大量文本数据的训练，使其能够仅基于提供的输入生成连贯且上下文相关的响应。这种方法允许开放式和创造性的生成，适用于构思、头脑风暴和探索假设场景等任务。需要注意的是，生成的响应并非基于特定事实数据，应该进行批判性评估，尤其是在准确性和可验证性至关重要的领域。

工作和网络

它提供3种响应选项：一种通过我们的检索增强生成（RAG）管道生成，另一种基于直接来自网络的内容。当用户选择 RAG 响应时，他们会收到一个基于您数据的有依据答案，并附有文档块引用以提供透明度和验证。相反，选择网络响应可以访问更广泛的来源，可能提供更多样化的视角。每个网络响应都基于网络内容，并附有网络链接引用，允许用户探索原始来源以获取更多上下文和验证。根据请求，它还可以生成一个比较和对比两种响应的最终答复。这种比较分析允许用户根据信息的可靠性、相关性和上下文做出明智的决定。有关我们的有依据和网络的具体信息，请参阅网络

助手

它通过使用 LLM 作为推理引擎来生成响应。其关键优势在于代理能够自主推理任务、将其分解为步骤，并确定适当的工具和数据源，而无需预定义任务定义或严格的工作流程。这种方法允许动态和自适应的响应生成过程，无需预定义一组任务。它利用 LLM 的能力来理解自然语言查询并生成针对特定任务的响应。这些代理正在以预览模式发布，我们继续评估和缓解与自主推理相关的潜在风险，如外部工具的滥用、透明度不足、偏见输出、隐私问题和远程代码执行漏洞。在未来的版本中，我们计划努力提高这些自主推理能力的安全性和健壮性。有关我们预览代理的具体信息，请参阅助手。

功能

IA 加速器包含多项功能，其中许多都有自己的文档。

自定义检索增强生成（RAG）、提示工程和文档预处理的示例
Azure AI 搜索集成，包括文本文档和图像的文本搜索
定制和个性化，实现增强的 AI 交互
自主代理的预览

详细信息请参阅我们的功能页面。

工作（有依据）、无依据以及工作和网络的流程

聊天流程

助手流程

Azure 账户要求

**重要：**为了部署和运行此示例，您需要：

Azure 账户。如果您是 Azure 新用户，获取免费 Azure 账户，您将获得一些免费 Azure 信用额度以开始使用。
已启用 Azure OpenAI 服务访问权限的 Azure 订阅。您可以使用此表单申请访问权限。
- 访问以下 Azure OpenAI 模型之一：
  
  模型名称支持的版本
  gpt-35-turbo 当前版本
  gpt-35-turbo-16k 当前版本
  gpt-4 当前版本
  gpt-4-32k 当前版本
  
  **重要：**推荐使用 gpt-35-turbo-16k (0613)。GPT 4 模型可能会在 IA 加速器中获得更好的结果。
- （可选）访问以下用于嵌入的 Azure OpenAI 模型。某些开源嵌入模型可能更适合您的特定数据或用例。对于 Information Assistant 测试的用例和数据，我们推荐使用以下 Azure OpenAI 嵌入模型。
  
  模型名称支持的版本
  text-embedding-ada-002 当前版本
Azure 账户权限：
- 您的 Azure 账户必须具有 Microsoft.Authorization/roleAssignments/write 权限，如基于角色的访问控制管理员、用户访问管理员或所有者。
- 您的 Azure 账户还需要订阅级别的 Microsoft.Resources/deployments/write 权限。
- 您的 Azure 账户还需要 microsoft.directory/applications/create 和 microsoft.directory/servicePrincipals/create 权限，如 Entra 内置角色中的应用程序管理员。
为您的订阅接受 Azure AI 服务负责任 AI 声明。如果您尚未手动接受此声明，请按照我们的指南接受 Azure AI 服务负责任 AI 声明进行操作。
（可选）在您的开发机器上安装 Visual Studio Code。如果您的 Azure 租户和订阅有条件访问策略或设备策略要求，您可能需要在 VS Code 中打开 GitHub Codespaces 以满足所需策略。

模型名称	支持的版本
gpt-35-turbo	当前版本
gpt-35-turbo-16k	当前版本
gpt-4	当前版本
gpt-4-32k	当前版本

模型名称	支持的版本
text-embedding-ada-002	当前版本

部署

请按照部署指南中的说明在您的 Azure 订阅中安装 IA 加速器。

完成后，按照首次使用 IA 加速器的说明进行操作。

您可以选择**查看部署和使用点击指南**以查看实际步骤。这些视频可能有助于澄清说明中的具体步骤或操作。

负责任的 AI

信息助手（IA）加速器和微软致力于推进以道德原则为先的 AI 发展，将人置于首位。

透明度声明

阅读我们的透明度声明

通过微软的负责任的 AI 资源了解更多信息

内容安全

内容安全通过 Azure OpenAI 服务提供。Azure OpenAI 服务包括一个与核心 AI 模型并行运行的内容过滤系统。该系统使用一组分类模型来检测四类潜在有害内容（暴力、仇恨、性和自残）的四个严重程度级别（安全、低、中、高）。这4个类别可能不足以满足所有用例，特别是对于未成年人。请阅读我们的透明度声明

默认情况下，内容过滤器设置为过滤掉被检测为中等或高严重程度的提示和完成内容。被标记为低或安全严重程度的内容不会被过滤。

还有可选的二进制分类器/过滤器，可以检测越狱风险（试图绕过过滤器）以及从公共存储库提取的现有文本或代码。这些默认是关闭的，但某些场景可能需要启用公共内容检测模型以保持客户版权承诺的覆盖范围。

过滤配置可以在资源级别自定义，允许客户分别为提示和完成内容调整每个危害类别的过滤严重程度阈值。

这为 Azure 客户提供了控制，以根据需要定制内容过滤行为，同时旨在防止潜在有害的生成内容和公共内容的任何版权侵犯。

有关如何通过 Azure OpenAI Studio 配置内容过滤器的说明，可以在此处找到 https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/content-filters#configuring-content-filters-via-azure-openai-studio-preview

数据收集声明

该软件可能会收集有关您和您使用软件情况的信息，并将其发送给微软。微软可能会使用这些信息来提供服务并改进我们的产品和服务。您可以按照存储库中的说明关闭遥测功能。软件中还有一些功能可能使您和微软能够从您的应用程序用户那里收集数据。如果您使用这些功能，您必须遵守适用法律，包括向您的应用程序用户提供适当的通知以及微软隐私声明的副本。我们的隐私声明位于https://go.microsoft.com/fwlink/?LinkID=824704。您可以在帮助文档和我们的隐私声明中了解更多关于数据收集和使用的信息。您使用该软件即表示您同意这些做法。

关于数据收集

本存储库中软件的数据收集仅供微软用于帮助证明为客户构建和维护此加速器的团队所做的努力。您可以选择保持启用或禁用数据收集。

数据收集是通过在部署时在环境变量中存在跟踪GUID来实现的。GUID与安装脚本部署的每个Azure资源相关联。微软使用此GUID来跟踪此开源解决方案产生的Azure消耗。

如何禁用数据收集

要禁用数据收集，请在部署之前按照配置ENV文件部分中关于ENABLE_CUSTOMER_USAGE_ATTRIBUTION变量的说明进行操作。

资源

导航源代码

该项目具有以下结构：

文件/文件夹	描述
.devcontainer/	Dockerfile、devcontainer配置和支持脚本，用于启用GitHub Codespaces和本地DevContainers。
app/backend/	IA网站的中间件部分，包含提示工程并为客户端代码提供API层，用于与各种Azure服务通信。这些代码基于Python，并作为Flask应用程序托管。
app/enrichment/	基于文本的文件丰富过程，处理语言翻译、嵌入文本块，并将文本块插入Azure AI Search混合索引。这些代码基于Python，并作为订阅Azure存储队列的Flask应用程序托管。
app/frontend/	IA网站的用户体验层。这些代码基于TypeScript，作为Vite应用程序托管，并使用npm编译。
azure_search/	在部署脚本中应用的Azure Search混合索引配置。
docs/adoption_workshop/	与讨论中的采用研讨会视频相匹配的PPT文件。
docs/deployment/	关于如何部署和开始使用Information Assistant的详细文档。
docs/features/	Information Assistant特定功能和开发级配置的详细文档。
docs/	其他支持文档，主要从其他markdown文件链接。
functions/	处理文档提取和分块以及自定义CosmosDB日志记录的Azure Functions管道。
infra/	部署整个IA加速器的Terraform脚本。整个加速器通过`main.tf`文件进行编排，但大多数资源部署都在core文件夹下模块化。
pipelines/	可用于启用加速器CI/CD部署的Azure DevOps管道。
scripts/environments/	部署配置文件。这是设置所有外部配置值的地方。
scripts/	执行各种部署任务的支持脚本，如基础设施部署、Azure WebApp和Function部署、构建webapp和functions源代码等。这些脚本与`Makefile`中的可用命令一致。
tests/	用于验证已部署的Information Assistant文档处理管道是否按预期工作的功能测试脚本。
Makefile	部署命令定义和配置。您可以使用`make help`获取有关可用命令的更多详细信息。
README.md	本存储库的起点。它涵盖了加速器、负责任的AI、环境、部署和使用加速器的概述。