Project Icon

rag-stack

基于RAG技术的企业级智能问答平台

RAGstack是一个基于检索增强生成(RAG)技术的企业级智能问答平台。该项目支持Llama 2、Falcon和GPT4All等开源大语言模型,利用Qdrant向量数据库实现高效文档检索。RAGstack提供简洁的服务器和用户界面,支持PDF文档上传和智能问答。系统可在本地运行,也可轻松部署到各大主流云平台,为企业提供安全可控的私有化知识问答解决方案。

🧺 RAGstack

在您的 VPC 内部署私有 ChatGPT 替代方案。将其连接到您组织的知识库,并将其用作企业智囊团。支持开源 LLM,如 Llama 2、Falcon 和 GPT4All。

Discord Issues Twitter

**检索增强生成(RAG)**是一种技术,通过从其他系统检索信息并通过提示将其插入到 LLM 的上下文窗口中来增强大型语言模型(LLM)的能力。这为 LLM 提供了超出其训练数据的信息,这对几乎所有企业用例都是必要的。例如包括来自当前网页的数据、来自 Confluence 或 Salesforce 等 SaaS 应用的数据,以及来自销售合同和 PDF 等文档的数据。

RAG 比微调模型效果更好,因为它更便宜、更快,而且更可靠,因为每个响应都提供了信息来源。

RAGstack 为检索增强生成部署以下资源:

开源 LLM

  • GPT4All:在本地运行时,RAGstack 将下载并部署 Nomic AI 的 gpt4all 模型,该模型可在消费级 CPU 上运行。

  • Falcon-7b:在云端,RAGstack 将技术创新研究所的 falcon-7b 模型部署到启用 GPU 的 GKE 集群上。

  • LLama 2:在云端,RAGstack 还可以将 Meta 的 Llama 2 模型的 7B 参数版本部署到启用 GPU 的 GKE 集群上。

向量数据库

  • Qdrant:Qdrant 是用 Rust 编写的开源向量数据库,因此它具有高性能且可自托管。

服务器 + UI

简单的服务器和 UI,可处理 PDF 上传,让您可以使用 Qdrant 和所选的开源 LLM 与 PDF 进行对话。 Screenshot 2023-08-02 at 9 22 27 PM

本地运行

  1. ragstack-ui/local.env 复制到 ragstack-ui/.env
  2. server/example.env 复制到 server/.env
  3. server/.env 中,将 YOUR_SUPABASE_URL 替换为您的 supabase 项目 URL,将 YOUR_SUPABASE_KEY 替换为您的 supabase 密钥 API 密钥。在 ragstack-ui/.env 中,将 YOUR_SUPABASE_URL 替换为您的 supabase 项目 URL,将 YOUR_SUPABASE_PUBLIC_KEY 替换为您的 supabase 公共 API 密钥。您可以在 supabase 仪表板的 Settings > API 下找到这些值
  4. 在 Supabase 中,创建一个名为 ragstack_users 的表,包含以下列:
    列名类型
    iduuid
    app_iduuid
    secret_keyuuid
    emailtext
    avatar_urltext
    full_nametext

如果添加了行级安全性,请确保插入和选择的 WITH CHECK 表达式为 (auth.uid() = id)

  1. 运行 scripts/local/run-dev。这将下载 ggml-gpt4all-j-v1.3-groovy.binserver/llm/local/ 并在本地运行服务器、LLM 和 Qdrant 向量数据库。

当您看到以下消息时,所有服务将准备就绪:

INFO:     Application startup complete.

部署到 Google Cloud

要使用在 GPU 上运行的 Falcon-7B 将 RAG 堆栈部署到您自己的 Google Cloud 实例,请执行以下步骤:

  1. 运行 scripts/gcp/deploy-gcp.sh。这将提示您输入 GCP 项目 ID、服务账号密钥文件和区域以及其他一些参数(模型、HuggingFace 令牌等)。
  2. 如果在 Falcon-7B 部署步骤出现错误,请运行以下命令,然后再次运行 scripts/gcp/deploy-gcp.sh
gcloud config set compute/zone YOUR-REGION-HERE
gcloud container clusters get-credentials gpu-cluster
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/container-engine-accelerators/master/nvidia-driver-installer/cos/daemonset-preloaded.yaml

部署脚本是使用 Terraform 实现的。

  1. 您可以通过在 ragstack-ui 中创建一个 .env 文件并将 VITE_SERVER_URL 设置为 Google Cloud Run 中 ragstack-server 实例的 URL 来运行前端。

部署到 AWS

要使用在 GPU 上运行的 Falcon-7B 将 RAG 堆栈部署到您自己的 AWS EC2 实例(使用 ECS),请执行以下步骤:

  1. 运行 scripts/aws/deploy-aws.sh。这将提示您输入 AWS 凭证以及其他一些参数(模型、HuggingFace 令牌等)。

部署脚本是使用 Terraform 实现的。

  1. 您可以通过在 ragstack-ui 中创建一个 .env 文件并将 VITE_SERVER_URL 设置为 ALB 实例的 URL 来运行前端。

部署到 Azure

要使用在 GPU 上运行的 Falcon-7B 将 RAG 堆栈部署到您自己的 AKS,请执行以下步骤:

  1. 运行 ./azure/deploy-aks.sh。这将提示您输入 AKS 订阅以及其他一些参数(模型、HuggingFace 令牌等)。

部署脚本是使用 Terraform 实现的。

  1. 您可以通过在 ragstack-ui 中创建一个 .env 文件并将 VITE_SERVER_URL 设置为 AKS 中 ragstack-server 服务的 URL 来运行前端。

请注意,此 AKS 部署使用的节点池配备了 NVIDIA Tesla T4 加速器,并非所有订阅都可用

路线图

  • ✅ GPT4all 支持
  • ✅ Falcon-7b 支持
  • ✅ 在 GCP 上部署
  • ✅ 在 AWS 上部署
  • ✅ 在 Azure 上部署
  • 🚧 Llama-2-40b 支持

致谢

容器化 Falcon 7B 的代码来自 Het Trivedi 的教程仓库。查看他关于如何将 Falcon 容器化的 Medium 文章在此

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号