AI搜索数据库。
数据库快速入门 | Nuclia文档 | NucliaDB开发者文档 | 聊天
NucliaDB是一个强大的数据库,可以存储和搜索非结构化数据。
它是一个开箱即用的混合搜索数据库,利用向量、全文和图形索引。
NucliaDB是用Rust和Python编写的。我们设计它用于索引大型数据集并提供多租户支持。
当使用Nuclia云服务的NucliaDB时,您可以利用NLP数据库的强大功能,而无需处理数据提取、丰富和推理的麻烦。我们为您完成所有繁重的工作。
特性
- 存储文本、文件、向量、标签和注释
- 执行文本搜索,给定一个词或一组词,返回数据库中包含它们的资源
- 使用向量执行语义搜索。例如,给定一组向量,返回数据库中最接近的匹配项。通过NLP,这使我们能够寻找相似的句子,而不受确切关键词的限制
- 以兼容大多数NLP管道(HuggingFace数据集、pytorch等)的格式导出数据
- 存储原始数据,提取和从Understanding API获取的数据
- 在索引存储上索引字段、段落和语义句子
- 通过Nuclia Understanding API™进行云数据和洞察提取
- 通过Nuclia Learning API™云连接训练ML模型
- 基于角色的安全系统,具有上游代理身份验证验证
- 具有多个字段和元数据的资源
- 支持文本/HTML/Markdown纯字段
- 字段类型:文本、文件、链接、对话
- 存储层(PostgreSQL)
- 通过S3兼容API、GCS和Azure Blob Storage支持Blob
- 索引存储的复制
- 分布式搜索
- 云原生
架构
快速入门
尝试NucliaDB非常简单!您可以通过以下阅读扩展您的知识:
💬 社区
🙋 常见问题
NucliaDB与传统搜索引擎(如Elasticsearch或Solr)有何不同?
NucliaDB的核心区别和优势在于其从头开始为非结构化数据构建的架构。其向量索引、关键词、图形和模糊搜索提供了一个API,可以使用从Nuclia、Understanding API提取的所有信息,并为任何应用程序提供强大的NLP能力,且代码量少,无需担心。
NucliaDB使用什么许可证?
NucliaDB是在GNU Affero通用公共许可证第3版(AGPLv3)下的开源软件。从根本上说,这意味着您可以自由使用NucliaDB进行您的项目,只要您不修改NucliaDB。如果您进行修改,您必须公开这些修改。
Nuclia的商业模式是什么?
我们的商业模式依赖于我们的标准化API,该API基于Nuclia Learning API
和Nuclia Understanding API
。这两个API提供了将非结构化数据转换为NucliaDB兼容数据的AI功能。我们还在我们的多云提供商基础设施上提供NucliaDB作为服务:https://nuclia.cloud。
🤝 贡献和传播
我们总是很高兴收到贡献:代码、文档、问题、反馈,甚至是在discord上打个招呼!以下是您可以开始的方式:
- 阅读我们的贡献者公约行为准则
- 创建NucliaDB的分支并提交您的拉取请求!
✨ 为了感谢您的贡献,请发送电子邮件至info@nuclia.com领取您的纪念品。