RAGapp:企业级智能RAG应用的简易部署方案
在人工智能快速发展的今天,如何让企业能够方便地利用最新的AI技术,特别是检索增强生成(RAG)技术,已经成为一个迫切需要解决的问题。RAGapp应运而生,它为企业提供了一种简单易用的RAG应用部署方案。
RAGapp的主要特点
-
简单配置:RAGapp的配置界面类似于OpenAI的自定义GPT,使用户能够快速设置和调整RAG应用。
-
灵活部署:支持使用Docker在企业自有的云基础设施上部署,保证了数据的安全性和隐私性。
-
多样化模型支持:可以使用OpenAI或Gemini等云端AI模型,也支持通过Ollama使用本地模型。
-
开源透明:基于Apache-2.0许可证开源,用户可以自由使用和修改。
-
基于成熟技术:RAGapp使用LlamaIndex作为底层框架,保证了性能和可靠性。
快速上手
要开始使用RAGapp,只需要几个简单的步骤:
-
运行Docker容器:
docker run -p 8000:8000 ragapp/ragapp
-
访问管理界面: 打开浏览器,访问 http://localhost:8000/admin 来配置你的RAGapp。
-
选择AI模型: 你可以选择使用OpenAI、Gemini等云端模型,或者通过Ollama使用本地模型。
RAGapp的主要组件
RAGapp提供了三个主要的访问端点:
- 管理UI: http://localhost:8000/admin
- 聊天UI: http://localhost:8000
- API文档: http://localhost:8000/docs
这些端点让用户能够方便地管理、使用和集成RAG应用。
安全性考虑
RAGapp本身不提供认证层,这是为了让用户能够根据自己的需求和云环境灵活地实现认证。对于使用Docker Compose的环境,RAGapp提供了一个带管理UI的部署方案作为参考。
未来版本计划支持基于API网关转发的访问令牌来实现授权控制,进一步增强安全性。
部署选项
RAGapp提供了多种部署方案:
-
使用Docker Compose:
- RAGapp + Ollama + Qdrant
- 多个RAGapp实例 + 管理UI
-
Kubernetes部署: 即将推出自定义的K8S部署描述符。
这些选项让企业能够根据自身需求选择最合适的部署方式。
开发者友好
对于希望进行二次开发的开发者,RAGapp提供了详细的开发指南。只需几个命令就可以设置开发环境:
export ENVIRONMENT=dev
poetry install --no-root
make build-frontends
make dev
结语
RAGapp为企业提供了一种简单、灵活且强大的方式来部署和使用RAG应用。无论是小型创业公司还是大型企业,都可以通过RAGapp快速将AI能力整合到自己的业务中。随着AI技术的不断发展,RAGapp也将持续更新,为用户提供更多功能和更好的体验。
如果你在使用过程中遇到任何问题或有新的功能建议,欢迎在GitHub上提出issue或直接联系项目维护者。让我们一起推动AI技术在企业中的应用,创造更多的可能性!