pgai 项目介绍
简介
pgai 是一个帮助开发者在 PostgreSQL 中直接开发 RAG(检索增强生成)、语义搜索和其他 AI 应用的工具。它简化了在 PostgreSQL 中创建这些应用的过程,并支持将数据无缝集成到 AI 工作流中。pgai 通过与 pgvector 和 pgvectorscale 等流行的矢量搜索扩展相结合,加强了其功能。
主要功能
pgai 的主要目标是让开发者更轻松、更方便地使用 AI,尤其是在处理数据方面。在人工智能应用中,数据是非常重要的,pgai 能够帮助开发者更好地利用已有的数据来进行以下操作:
操作矢量嵌入
- 生成和同步数据的矢量嵌入:pgai 能够自动为数据库中的文本数据创建矢量嵌入,并进行同步。
- 矢量和语义搜索:开发者可以使用 pgai 进行矢量和语义搜索,以快速从大规模数据集中查找相关信息。
- 实现检索增强生成:只需要一条 SQL 语句,就可以在数据库中实现检索增强生成。
- 高性能 ANN 搜索:利用 pgvectorscale,在大规模矢量工作负载上进行高效、成本低的近似最近邻(ANN)搜索。
使用大语言模型(LLMs)进行数据处理
- LLM 模型集成:pgai 支持从多个供应商(如 OpenAI、Anthropic、Cohere 和 Ollama)检索 LLM 聊天完成结果。
- 数据处理用例:可以直接在 PostgreSQL 中进行分类、摘要生成和数据扩充等操作。
实践指南
快速入门
要开始使用 pgai,开发者可以选择以下两种方式:
- Cloud 服务:通过免费试用账号在云端体验 pgai 的功能。
- 自我托管:按照快速入门指南,安装并运行 pgai。
安装与配置
pgai 提供多种安装方式,开发者可以选择在 Timescale Cloud、预构建的 Docker 镜像或从源码安装。安装完成后,需要启用 pgai 扩展以便开始使用。
开发者参与
pgai 项目仍处于早期阶段,开发者参与度对于项目的未来发展尤为重要。开发团队鼓励开发者查看他们正在考虑开发的功能列表,提供反馈,或通过贡献代码和参与讨论来帮助塑造项目的方向。
关于 Timescale
Timescale 是一家专注于 PostgreSQL 的数据库公司,其 Timescale Cloud 平台提供高性能、面向开发者的云服务,适合用于 AI、时间序列分析、数据分析和事件处理等大型负载应用。