<SOURCE_TEXT>
AI驱动应用的数据库系统
关注 EvaDB
EvaDB 让软件开发人员能够用几行代码构建 AI 应用。其强大的 SQL API 简化了对结构化和非结构化数据的 AI 应用开发。EvaDB 的优势包括:
🔮 轻松将 EvaDB 查询引擎与数据源连接,如 PostgreSQL 或 S3 桶,并通过 SQL 查询构建 AI 驱动的应用。
结构化数据源 | 非结构化数据源 | 应用数据源 |
---|---|---|
|
|
|
更多支持的数据源详情请点击这里。
🤝 使用预训练的 AI 模型查询您的连接数据,支持 Hugging Face、OpenAI、YOLO、Stable Diffusion 等模型。
Hugging Face | OpenAI | YOLO |
---|---|---|
|
|
|
更多支持的 AI 模型详情请点击这里。
🔧 创建或微调 AI 模型用于回归、分类和时间序列预测。
回归 | 分类 | 时间序列预测 |
---|---|---|
|
|
|
更多支持的 AutoML 框架详情请点击这里。
💰 通过 AI 中心的查询优化如缓存、批处理和并行处理实现更快的 AI 查询。
- 函数结果缓存有助于重用昂贵的 AI 函数调用结果。
- LLM 批处理减少了 LLM 调用的 token 使用量和成本。
- 并行查询处理通过更好地利用 CPU 和/或 GPU 节省了运行 AI 模型的时间和成本。
- 查询谓词重新排序和谓词下推加速了结构化和非结构化数据的查询。
更多 EvaDB 中的优化详情请点击这里。
👋 嘿!如果你对我们的将 AI 引入数据库系统的愿景感到兴奋,请通过以下方式表示一些支持 ❤️:
- ⭐ 给我们的GitHub 🐙 仓库加星
- 📟 加入我们的Slack 社区
- 🐦 在Twitter上关注我们
- 📝 在Medium上关注我们
我们很想了解你的 AI 应用。请填写这个 1 分钟的表单:https://v0fbgcue0cm.typeform.com/to/BZHZWeZm
- 使用`CREATE DATABASE`和`CREATE INDEX`语句将EvaDB连接到您的SQL和向量数据库系统。
- 使用带有AI功能的SQL查询以获取推理结果:
- 从Hugging Face、Open AI、Ultralytics、PyTorch和内置AI框架中选择预训练的AI模型,用于生成式AI、NLP和视觉应用;
- 或从各种先进的ML引擎中选择用于经典ML用例(分类、回归等);
- 或者使用`CREATE FUNCTION`引入您使用任何AI/ML框架构建的自定义模型。
按照入门指南,尽快上手。
示例查询
- 使用GPT4获取有关Github stargazers的洞察。
SELECT name, country, email, programming_languages, social_media, GPT4(prompt,topics_of_interest)
FROM gpt4all_StargazerInsights;
--- 提示GPT-4
您将获得10行输入,每行由两个换行符分隔。
将每行中列出的主题分类为以下三个技术领域之一或多个——机器学习、数据库和Web开发。如果列出的主题与这三个领域无关,请输出单个N/A。不要遗漏任何输入行。不要在输出中添加任何额外的文本或数字。
输出行必须由两个换行符分隔。每个输入行必须生成一个且仅一个输出行。例如,输入行[Recommendation systems, Deep neural networks, Postgres]必须只生成输出行[Machine Learning, Databases]。
输入行[enterpreneurship, startups, venture capital]必须生成输出行N/A。
- 在Reddit图片集合上使用SIFT特征提取器返回的特征嵌入构建向量索引。返回给定图片的前5个相似图片。
CREATE INDEX reddit_sift_image_index
ON reddit_dataset (SiftFeatureExtractor(data))
USING FAISS
SELECT name FROM reddit_dataset ORDER BY
Similarity(
SiftFeatureExtractor(Open('reddit-images/g1074_d4mxztt.jpg')),
SiftFeatureExtractor(data)
)
LIMIT 5
示例应用
以下是一些使用EvaDB构建的示例AI应用程序(每个笔记本都可以在Google Colab上打开):
更多示例查询
- 使用语音识别模型从表中存储的视频中获取转录文本。然后,使用ChatGPT对提取的转录文本提问。
CREATE TABLE text_summary AS
SELECT SpeechRecognizer(audio) FROM ukraine_video;
SELECT ChatGPT('Is this video summary related to Ukraine russia war', text)
FROM text_summary;
- 使用Ludwig AI引擎训练经典的机器学习模型进行预测。
CREATE FUNCTION IF NOT EXISTS PredictHouseRent FROM
(SELECT * FROM HomeRentals)
TYPE Ludwig
PREDICT 'rental_price'
TIME_LIMIT 120;
EvaDB架构
EvaDB的AI中心查询优化器将查询作为输入并生成查询计划。查询引擎接收查询计划并调用相关后端以有效处理查询:
1. SQL数据库系统(结构化数据)
2. AI框架(将非结构化数据转换为结构化数据;非结构化数据包括本地或云存储的PDF、文本、图像等)
3. 向量数据库系统(特征嵌入)
社区与支持
我们希望了解您的AI应用程序。请填写这份1分钟的表格:https://v0fbgcue0cm.typeform.com/to/BZHZWeZm
如果您遇到任何错误或有任何意见,可以在我们的Slack社区📟与我们联系,或创建一个Github问题:bug:。
这是EvaDB的公共路线图🛤️。我们根据用户反馈优先开发功能,因此我们很想听到您的意见!
贡献
我们是一个精简的团队,致力于将AI引入数据库系统!对EvaDB的所有贡献都表示感谢🙌 如果您愿意参与,以下是我们需要帮助的地方:贡献指南 🤗
星标历史
许可证
版权所有 Georgia Tech Database Group。 根据Apache许可证授权。