构建、评估和优化用于生产环境的RAG应用
大型语言模型(LLMs)正在彻底改变用户搜索、交互和生成新内容的方式。最近出现了一些围绕检索增强生成(RAG)的技术栈和工具包,使用户能够使用LLMs在自己的私有数据上构建聊天机器人等应用程序。然而,虽然搭建一个简单的RAG技术栈很容易,但要使其达到生产质量标准却很困难。要成为一名AI工程师,你需要学习评估和优化RAG应用的原则性开发实践 - 从数据参数到检索算法再到微调。
本工作坊将指导你完成这个开发过程。你将从基本的RAG技术栈开始,创建初始评估套件,然后尝试不同的高级技术来提高RAG性能。
环境设置
设置Python环境
- 创建并激活Python虚拟环境
python3 -m venv rag
source rag/bin/activate
- 安装依赖
pip install -r requirements.txt
设置PostgreSQL
- 安装Docker:按照https://docs.docker.com/engine/install/的操作系统特定说明进行安装
- 使用Docker Compose启动PostgreSQL(在项目目录下)
docker-compose up -d
准备OpenAI凭证
开始使用
我们将学习3个笔记本,请按以下步骤操作:
jupyter lab
核心依赖
llama-index
ray[data]
# 用于笔记本
jupyter
# 用于PostgreSQL
sqlalchemy[asyncio]
pgvector
psycopg2-binary
asyncpg