[!重要]
自2023年11月15日起,Azure 认知搜索已更名为 Azure AI 搜索。Azure 认知服务也已更名为 Azure AI 服务。
这个行业加速器展示了 Azure 与 OpenAI 大型语言模型之间的集成。它利用 Azure AI 搜索进行数据检索和 ChatGPT 风格的问答互动。使用检索增强生成(RAG)设计模式和 Azure OpenAI 的 GPT 模型,它提供了自然语言交互来发现用户查询的相关响应。Azure AI 搜索简化了数据摄取、转换、索引和多语言翻译。
加速器根据模型类型调整提示以提高性能。用户可以自定义温度和角色等设置,实现个性化 AI 互动。它提供了可解释的思考过程、可引用的引文和直接内容验证等功能。
请观看此视频了解使用此加速器可能实现的用例。
它使用检索增强生成(RAG)模式生成基于特定数据源的响应。通过结合相关信息的检索和生成能力,它可以产生不仅上下文相关,而且基于验证数据的响应。RAG 管道在生成响应之前访问您的数据集以检索相关信息,确保准确性和可靠性。此外,每个响应都包含对源自答案的文档块 的引用,提供透明度并允许用户验证来源。这种方法在精确性和事实性至关重要的领域特别有优势。用户可以信任生成的响应是基于可靠的数据源,从而提高应用程序的可信度和实用性。有关我们的有依据(RAG)的具体信息,请参阅 RAG
它利用大型语言模型(LLM)的能力以无依据的方式生成响应,不依赖外部数据源或检索增强生成技术。LLM 经过大量文本数据的训练,使其能够仅基于提供的输入生成连贯且上下文相关的响应。这种方法允许开放式和创造性的生成,适用于构思、头脑风暴和探索假设场景等任务。需要注意的是,生成的响应并非基于特定事实数据,应该进行批判性评估,尤其是在准确性和可验证性至关重要的领域。
它提供3种响应选项:一种通过我们的检索增强生成(RAG)管道生成,另一种基于直接来自网络的内容。当用户选择 RAG 响应时,他们会收到一个基于您数据的有依据答案,并附有文档块引用以提供透明度和验证。相反,选择网络响应可以访问更广泛的来源,可能提供更多样化的视角。每个网络响应都基于网络内容,并附有网络链接引用,允许用户探索原始来源以获取更多上下文和验证。根据请求,它还可以生成一个比较和对比两种响应的最终答复。这种比较分析允许用户根据信息的可靠性、相关性和上下文做出明智的决定。 有关我们的有依据和网络的具体信息,请参阅 网络
它通过使用 LLM 作为推理引擎来生成响应。其关键优势在于代理能够自主推理任务、将其分解为步骤,并确定适当的工具和数据源, 而无需预定义任务定义或严格的工作流程。这种方法允许动态和自适应的响应生成过程,无需预定义一组任务。它利用 LLM 的能力来理解自然语言查询并生成针对特定任务的响应。这些代理正在以预览模式发布,我们继续评估和缓解与自主推理相关的潜在风险,如外部工具的滥用、透明度不足、偏见输出、隐私问题和远程代码执行漏洞。在未来的版本中,我们计划努力提高这些自主推理能力的安全性和健壮性。有关我们预览代理的具体信息,请参阅 助手。
IA 加速器包含多项功能,其中许多都有自己的文档。
详细信息请参阅我们的功能页面。
**重要:**为了部署和运行此示例,您需要:
访问以下 Azure OpenAI 模型之一:
模型名称 | 支持的版本 |
---|---|
gpt-35-turbo | 当前版本 |
gpt-35-turbo-16k | 当前版本 |
gpt-4 | 当前版本 |
gpt-4-32k | 当前版本 |
**重要:**推荐使用 gpt-35-turbo-16k (0613)。GPT 4 模型可能会在 IA 加速器中获得更好的结果。
(可选)访问以下用于嵌入的 Azure OpenAI 模型。某些开源嵌入模型可能更适合您的特定数据或用例。对于 Information Assistant 测试的用例和数据,我们推荐使用以下 Azure OpenAI 嵌入模型。
模型名称 | 支持的版本 |
---|---|
text-embedding-ada-002 | 当前版本 |
Microsoft.Authorization/roleAssignments/write
权限,如基于角色的访问控制管理员、用户访问管理员或所有者。Microsoft.Resources/deployments/write
权限。microsoft.directory/applications/create
和 microsoft.directory/servicePrincipals/create
权限,如 Entra 内置角色中的应用程序管理员。请按照部署指南中的说明在您的 Azure 订阅中安装 IA 加速器。
完成后,按照首次使用 IA 加速器的说明进行操作。
您可以选择**查看部署和使用点击指南**以查看实际步骤。这些视频可能有助于澄清说明中的具体步骤或操作。
信息助手(IA)加速器和微软致力于推进以道德原则为先的 AI 发展,将人置于首位。
阅读我们的透明度声明
通过微软的负责任的 AI 资源了解更多信息
内容安全通过 Azure OpenAI 服务提供。Azure OpenAI 服务包括一个与核心 AI 模型并行运行的内容过滤系统。该系统使用一组分类模型来检测四类潜在有害内容(暴力、仇恨、性和自残)的四个严重程度级别(安全、低、中、高)。这4个类别可能不足以满足所有用例,特别是对于未成年人。请阅读我们的透明度声明
默认情况下,内容过滤器设置为过滤掉被检测为中等或高严重程度的提示和完成内容。被标记为低或安全严重程度的内容不会被过滤。
还有可选的二进制分类器/过滤器,可以检测越狱风险(试图绕过过滤器)以及从公共存储库提取的现有文本或代码。这些默认是关闭的,但某些场景可能需要启用公共内容检测模型以保持客户版权承诺的覆盖范围。
过滤配置可以在资源级别自定义,允许客户分别为提示和完成内容调整每个危害类别的过滤严重程度阈值。
这为 Azure 客户提供了控制,以根据需要定制内容过滤行为,同时旨在防止潜在有害的生成内容和公共内容的任何版权侵犯。
有关如何通过 Azure OpenAI Studio 配置内容过滤器的说明,可以在此处找到 https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/content-filters#configuring-content-filters-via-azure-openai-studio-preview
该软件可能会收集有关您和您使用软件情况的信息,并将其发送给微软。微软可能会使用这些信息来提供服务并改进我们的产品和服务。您可以按照存储库中的说明关闭遥测功能。软件中还有一些功能可能使您和微软能够从您的应用程序用户那里收集数据。如果您使用这些功能,您必须遵守适用法律,包括向您的应用程序用户提供适当的通知以及微软隐私声明的副本。我们的隐私声明位于https://go.microsoft.com/fwlink/?LinkID=824704。您可以在帮助文档和我们的隐私声明中了解更多关于数据收集和使用的信息。您使用该软件即表示您同意这些做法。
本存储库中软件的数据收集仅供微软用于帮助证明为客户构建和维护此加速器的团队所做的努力。您可以 选择保持启用或禁用数据收集。
数据收集是通过在部署时在环境变量中存在跟踪GUID来实现的。GUID与安装脚本部署的每个Azure资源相关联。微软使用此GUID来跟踪此开源解决方案产生的Azure消耗。
要禁用数据收集,请在部署之前按照配置ENV文件部分中关于ENABLE_CUSTOMER_USAGE_ATTRIBUTION
变量的说明进行操作。
该项目具有以下结构:
文件/文件夹 | 描述 |
---|---|
.devcontainer/ | Dockerfile、devcontainer配置和支持脚本,用于启用GitHub Codespaces和本地DevContainers。 |
app/backend/ | IA网站的中间件部分,包含提示工程并为客户端代码提供API层,用于与各种Azure服务通信。这些代码基于Python,并作为Flask应用程序托管。 |
app/enrichment/ | 基于文本的文件丰富过程,处理语言翻译、嵌入文本块,并将文本块插入Azure AI Search混合索引。这些代码基于Python,并作为订阅Azure存储队列的Flask应用程序托管。 |
app/frontend/ | IA网站的用户体验层。这些代码基于TypeScript,作为Vite应用程序托管,并使用npm编译。 |
azure_search/ | 在部署脚本中应用的Azure Search混合索引配置。 |
docs/adoption_workshop/ | 与讨论中的采用研讨会视频相匹配的PPT文件。 |
docs/deployment/ | 关于如何部署和开始使用Information Assistant的详细文档。 |
docs/features/ | Information Assistant特定功能和开发级配置的详细文档。 |
docs/ | 其他支持文档,主要从其他markdown文件链接。 |
functions/ | 处理文档提取和分块以及自定 义CosmosDB日志记录的Azure Functions管道。 |
infra/ | 部署整个IA加速器的Terraform脚本。整个加速器通过main.tf 文件进行编排,但大多数资源部署都在core文件夹下模块化。 |
pipelines/ | 可用于启用加速器CI/CD部署的Azure DevOps管道。 |
scripts/environments/ | 部署配置文件。这是设置所有外部配置值的地方。 |
scripts/ | 执行各种部署任务的支持脚本,如基础设施部署、Azure WebApp和Function部署、构建webapp和functions源代码等。这些脚本与Makefile 中的可用命令一致。 |
tests/ | 用于验证已部署的Information Assistant文档处理管道是否按预期工作的功能测试脚本。 |
Makefile | 部署命令定义和配置。您可以使用make help 获取有关可用命令的更多详细信息。 |
README.md | 本存储库的起点。它涵盖了加速器、负责任的AI、环境、部署和使用加速器的概述。 |
本项目可能包含项目、产品或服务的商标或标志。微软商标或标志的授权使用必须遵循微软商标和品牌指南。在修改版本的本项目中使用微软商标或标志不得造成混淆或暗示微软赞助。任何第三方商标或标志的使用都受这些第三方的政策约束。
本项目采用了微软开源行为准则。有关更多信息,请参阅行为准则常见问题解答或联系opencode@microsoft.com提出任何其他问题或意见。
对于安全问题,请参阅安全指南
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助 用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
AI助力,做PPT更简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。
openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。
高分辨率纹理 3D 资产生成
Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。
一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。
3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号