Project Icon

PubSec-Info-Assistant

基于Azure和OpenAI的企业智能助手系统

该项目整合Azure AI Search和OpenAI语言模型,打造智能助手系统。采用检索增强生成技术,实现基于企业数据的自然语言交互。功能包括数据检索、多语言翻译、个性化设置、思考过程解释和引用验证。系统为企业提供数据智能管理和高级人机对话能力,适用于各类信息查询和决策支持场景。

信息助手加速器

[!重要]
自2023年11月15日起,Azure 认知搜索已更名为 Azure AI 搜索。Azure 认知服务也已更名为 Azure AI 服务。

目录

在 GitHub Codespaces 中打开

这个行业加速器展示了 Azure 与 OpenAI 大型语言模型之间的集成。它利用 Azure AI 搜索进行数据检索和 ChatGPT 风格的问答互动。使用检索增强生成(RAG)设计模式和 Azure OpenAI 的 GPT 模型,它提供了自然语言交互来发现用户查询的相关响应。Azure AI 搜索简化了数据摄取、转换、索引和多语言翻译。

加速器根据模型类型调整提示以提高性能。用户可以自定义温度和角色等设置,实现个性化 AI 互动。它提供了可解释的思考过程、可引用的引文和直接内容验证等功能。

观看此视频了解使用此加速器可能实现的用例。

响应生成方法

工作(有依据)

它使用检索增强生成(RAG)模式生成基于特定数据源的响应。通过结合相关信息的检索和生成能力,它可以产生不仅上下文相关,而且基于验证数据的响应。RAG 管道在生成响应之前访问您的数据集以检索相关信息,确保准确性和可靠性。此外,每个响应都包含对源自答案的文档块的引用,提供透明度并允许用户验证来源。这种方法在精确性和事实性至关重要的领域特别有优势。用户可以信任生成的响应是基于可靠的数据源,从而提高应用程序的可信度和实用性。有关我们的有依据(RAG)的具体信息,请参阅 RAG

无依据

它利用大型语言模型(LLM)的能力以无依据的方式生成响应,不依赖外部数据源或检索增强生成技术。LLM 经过大量文本数据的训练,使其能够仅基于提供的输入生成连贯且上下文相关的响应。这种方法允许开放式和创造性的生成,适用于构思、头脑风暴和探索假设场景等任务。需要注意的是,生成的响应并非基于特定事实数据,应该进行批判性评估,尤其是在准确性和可验证性至关重要的领域。

工作和网络

它提供3种响应选项:一种通过我们的检索增强生成(RAG)管道生成,另一种基于直接来自网络的内容。当用户选择 RAG 响应时,他们会收到一个基于您数据的有依据答案,并附有文档块引用以提供透明度和验证。相反,选择网络响应可以访问更广泛的来源,可能提供更多样化的视角。每个网络响应都基于网络内容,并附有网络链接引用,允许用户探索原始来源以获取更多上下文和验证。根据请求,它还可以生成一个比较和对比两种响应的最终答复。这种比较分析允许用户根据信息的可靠性、相关性和上下文做出明智的决定。 有关我们的有依据和网络的具体信息,请参阅 网络

助手

它通过使用 LLM 作为推理引擎来生成响应。其关键优势在于代理能够自主推理任务、将其分解为步骤,并确定适当的工具和数据源,而无需预定义任务定义或严格的工作流程。这种方法允许动态和自适应的响应生成过程,无需预定义一组任务。它利用 LLM 的能力来理解自然语言查询并生成针对特定任务的响应。这些代理正在以预览模式发布,我们继续评估和缓解与自主推理相关的潜在风险,如外部工具的滥用、透明度不足、偏见输出、隐私问题和远程代码执行漏洞。在未来的版本中,我们计划努力提高这些自主推理能力的安全性和健壮性。有关我们预览代理的具体信息,请参阅 助手

功能

IA 加速器包含多项功能,其中许多都有自己的文档。

  • 自定义检索增强生成(RAG)、提示工程和文档预处理的示例
  • Azure AI 搜索集成,包括文本文档和图像的文本搜索
  • 定制和个性化,实现增强的 AI 交互
  • 自主代理的预览

详细信息请参阅我们的功能页面。

工作(有依据)、无依据以及工作和网络的流程

聊天流程

助手流程

助手流程

Azure 账户要求

**重要:**为了部署和运行此示例,您需要:

  • Azure 账户。如果您是 Azure 新用户,获取免费 Azure 账户,您将获得一些免费 Azure 信用额度以开始使用。
  • 已启用 Azure OpenAI 服务访问权限的 Azure 订阅。您可以使用此表单申请访问权限。
    • 访问以下 Azure OpenAI 模型之一

      模型名称支持的版本
      gpt-35-turbo当前版本
      gpt-35-turbo-16k当前版本
      gpt-4当前版本
      gpt-4-32k当前版本

      **重要:**推荐使用 gpt-35-turbo-16k (0613)。GPT 4 模型可能会在 IA 加速器中获得更好的结果。

    • (可选)访问以下用于嵌入的 Azure OpenAI 模型。某些开源嵌入模型可能更适合您的特定数据或用例。对于 Information Assistant 测试的用例和数据,我们推荐使用以下 Azure OpenAI 嵌入模型。

      模型名称支持的版本
      text-embedding-ada-002当前版本
  • Azure 账户权限
    • 您的 Azure 账户必须具有 Microsoft.Authorization/roleAssignments/write 权限,如基于角色的访问控制管理员用户访问管理员所有者
    • 您的 Azure 账户还需要订阅级别的 Microsoft.Resources/deployments/write 权限。
    • 您的 Azure 账户还需要 microsoft.directory/applications/createmicrosoft.directory/servicePrincipals/create 权限,如 Entra 内置角色中的应用程序管理员
  • 为您的订阅接受 Azure AI 服务负责任 AI 声明。如果您尚未手动接受此声明,请按照我们的指南接受 Azure AI 服务负责任 AI 声明进行操作。
  • (可选)在您的开发机器上安装 Visual Studio Code。如果您的 Azure 租户和订阅有条件访问策略或设备策略要求,您可能需要在 VS Code 中打开 GitHub Codespaces 以满足所需策略。

部署

请按照部署指南中的说明在您的 Azure 订阅中安装 IA 加速器。

完成后,按照首次使用 IA 加速器的说明进行操作。

您可以选择**查看部署和使用点击指南**以查看实际步骤。这些视频可能有助于澄清说明中的具体步骤或操作。

负责任的 AI

信息助手(IA)加速器和微软致力于推进以道德原则为先的 AI 发展,将人置于首位。

透明度声明

阅读我们的透明度声明

通过微软的负责任的 AI 资源了解更多信息

内容安全

内容安全通过 Azure OpenAI 服务提供。Azure OpenAI 服务包括一个与核心 AI 模型并行运行的内容过滤系统。该系统使用一组分类模型来检测四类潜在有害内容(暴力、仇恨、性和自残)的四个严重程度级别(安全、低、中、高)。这4个类别可能不足以满足所有用例,特别是对于未成年人。请阅读我们的透明度声明

默认情况下,内容过滤器设置为过滤掉被检测为中等或高严重程度的提示和完成内容。被标记为低或安全严重程度的内容不会被过滤。

还有可选的二进制分类器/过滤器,可以检测越狱风险(试图绕过过滤器)以及从公共存储库提取的现有文本或代码。这些默认是关闭的,但某些场景可能需要启用公共内容检测模型以保持客户版权承诺的覆盖范围。

过滤配置可以在资源级别自定义,允许客户分别为提示和完成内容调整每个危害类别的过滤严重程度阈值。

这为 Azure 客户提供了控制,以根据需要定制内容过滤行为,同时旨在防止潜在有害的生成内容和公共内容的任何版权侵犯。

有关如何通过 Azure OpenAI Studio 配置内容过滤器的说明,可以在此处找到 https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/content-filters#configuring-content-filters-via-azure-openai-studio-preview

数据收集声明

该软件可能会收集有关您和您使用软件情况的信息,并将其发送给微软。微软可能会使用这些信息来提供服务并改进我们的产品和服务。您可以按照存储库中的说明关闭遥测功能。软件中还有一些功能可能使您和微软能够从您的应用程序用户那里收集数据。如果您使用这些功能,您必须遵守适用法律,包括向您的应用程序用户提供适当的通知以及微软隐私声明的副本。我们的隐私声明位于https://go.microsoft.com/fwlink/?LinkID=824704。您可以在帮助文档和我们的隐私声明中了解更多关于数据收集和使用的信息。您使用该软件即表示您同意这些做法。

关于数据收集

本存储库中软件的数据收集仅供微软用于帮助证明为客户构建和维护此加速器的团队所做的努力。您可以选择保持启用或禁用数据收集。

数据收集是通过在部署时在环境变量中存在跟踪GUID来实现的。GUID与安装脚本部署的每个Azure资源相关联。微软使用此GUID来跟踪此开源解决方案产生的Azure消耗。

如何禁用数据收集

要禁用数据收集,请在部署之前按照配置ENV文件部分中关于ENABLE_CUSTOMER_USAGE_ATTRIBUTION变量的说明进行操作。

资源

导航源代码

该项目具有以下结构:

文件/文件夹描述
.devcontainer/Dockerfile、devcontainer配置和支持脚本,用于启用GitHub Codespaces和本地DevContainers。
app/backend/IA网站的中间件部分,包含提示工程并为客户端代码提供API层,用于与各种Azure服务通信。这些代码基于Python,并作为Flask应用程序托管。
app/enrichment/基于文本的文件丰富过程,处理语言翻译、嵌入文本块,并将文本块插入Azure AI Search混合索引。这些代码基于Python,并作为订阅Azure存储队列的Flask应用程序托管。
app/frontend/IA网站的用户体验层。这些代码基于TypeScript,作为Vite应用程序托管,并使用npm编译。
azure_search/在部署脚本中应用的Azure Search混合索引配置。
docs/adoption_workshop/与讨论中的采用研讨会视频相匹配的PPT文件。
docs/deployment/关于如何部署和开始使用Information Assistant的详细文档。
docs/features/Information Assistant特定功能和开发级配置的详细文档。
docs/其他支持文档,主要从其他markdown文件链接。
functions/处理文档提取和分块以及自定义CosmosDB日志记录的Azure Functions管道。
infra/部署整个IA加速器的Terraform脚本。整个加速器通过main.tf文件进行编排,但大多数资源部署都在core文件夹下模块化。
pipelines/可用于启用加速器CI/CD部署的Azure DevOps管道。
scripts/environments/部署配置文件。这是设置所有外部配置值的地方。
scripts/执行各种部署任务的支持脚本,如基础设施部署、Azure WebApp和Function部署、构建webapp和functions源代码等。这些脚本与Makefile中的可用命令一致。
tests/用于验证已部署的Information Assistant文档处理管道是否按预期工作的功能测试脚本。
Makefile部署命令定义和配置。您可以使用make help获取有关可用命令的更多详细信息。
README.md本存储库的起点。它涵盖了加速器、负责任的AI、环境、部署和使用加速器的概述。

参考资料

商标

本项目可能包含项目、产品或服务的商标或标志。微软商标或标志的授权使用必须遵循微软商标和品牌指南。在修改版本的本项目中使用微软商标或标志不得造成混淆或暗示微软赞助。任何第三方商标或标志的使用都受这些第三方的政策约束。

行为准则

本项目采用了微软开源行为准则。有关更多信息,请参阅行为准则常见问题解答或联系opencode@microsoft.com提出任何其他问题或意见。

报告安全问题

对于安全问题,请参阅安全指南

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号