VectorDB-Plugin-for-LM-Studio 项目介绍
项目概览
VectorDB-Plugin-for-LM-Studio 是一个帮助用户创建和搜索向量数据库的项目,旨在通过提供相关背景信息从而获取更为准确的大型语言模型(LLM)的响应。这种方法被称为“检索增强生成”(Retrieval Augmented Generation,简称 RAG),可以极大地减少 LLM 的幻觉现象。
功能特色
- 通用文本提取:支持多种格式,如
.pdf
、.docx
、.epub
等。 - 图像总结:使用“视觉”模型创建图像摘要,支持
.png
、.jpg
等格式。 - 音频转录:可以将
.mp3
、.wav
等格式的音频文件转录为文本。 - 语音查询:使用强大的
WhisperS2T
录音功能输入查询。 - LLM 响应:可以从
LM Studio
、本地模型甚至是即将上线的Chat GPT
获取回答。 - 文本到语音播放:使用
Bark
、WhisperSpeech
和Google TTS
等。 - 硬件支持:支持 CPU 及
Nvidia
GPU,正在寻求对AMD
和Intel
GPU 的支持。
系统要求
用户需要安装如下软件:
- Python 3.11
- Git 和 Git LFS
- Pandoc
- 编译器(如 Visual Studio)
安装步骤
- 下载最新的 "release",提取内容并打开 "src" 文件夹。
- 在
src
文件夹内创建虚拟环境。 - 激活虚拟环境。
- 运行安装脚本(仅支持 Windows)。
- 使用 Ask Jeeves 功能前进行必要设置。
使用方法
启动和运行程序
每次使用程序时,需要激活虚拟环境并启动:
.\Scripts\activate
python gui.py
下载向量模型
在 Models Tab
选中并下载所需的向量/嵌入模型。
创建向量数据库
提取多种文件类型的文本,并生成图像总结及音频文件转录,最后将其存入向量数据库中。
查询数据库
- 通过
Query Database
选项卡选择数据库并输入问题。 - 也可以结合 LM Studio 获取回答。
功能请求或 BUG 反馈
用户可以通过在 GitHub 上创建 issue 或在 LM Studio Discord 服务器上联系开发者报告 bugs 或请求功能改进。
联系方式
欢迎所有建议与反馈,可以通过邮件联系 bbc@chintellalaw.com
或在 LM Studio Discord 服务器 上留言。