EmbedAI 项目介绍
项目背景
EmbedAI 是一个基于私人文档打造的问答聊天机器人项目,旨在不依赖互联网的情况下,通过本地大语言模型(LLMs)的能力对文档进行处理和询问。该项目的最大特点就是其完全的隐私保护,确保用户数据不离开本地环境,这样即使在没有网络连接的情况下,也能对文档进行无缝的处理和查询。
功能特点
- 隐私保护:用户的所有数据都在本地进行处理,避免了上传到云端可能带来的隐私风险。
- 无网络依赖:在完全本地运行,不需要互联网连接即可完成文档的处理和查询。
- 支持多种文档格式:EmbedAI 支持 .csv、.docx、.enex、.eml、.epub、.html、.md、.msg、.odt、.pdf、.pptx、.txt 等多种文件格式,方便用户导入各类文件。
基本需求
要运行 EmbedAI 需要以下系统和软件要求:
- Python 3.8 或更高版本
- NodeJS v18.12.1 或更高版本
- 至少 16GB 的内存
如何运行
-
客户端配置:
- 进入客户端文件夹并执行:
来安装必要的包,然后启动开发服务器:npm install
npm run dev
- 进入客户端文件夹并执行:
-
服务器配置:
- 进入服务器文件夹并执行:
来安装 Python 依赖,然后运行:pip install -r requirements.txt
python privateGPT.py
- 进入服务器文件夹并执行:
-
初始设置:
- 打开浏览器访问 http://localhost:3000,下载所需的模型以进行初始设置。
-
数据导入与查询:
- 上传任何选择的文档并点击“导入数据”,导入过程很快。
- 然后可以对数据进行查询。请注意,数据查询较慢,需要稍等片刻。
社区支持
用户可以通过加入项目的 Discord 社区以获得支持,链接为:https://discord.gg/A6EzvsKX4u。
关联项目
EmbedAI 相关的其他代码库包括:
通过上述介绍,可以看出 EmbedAI 是一个数据隐私保护和本地化处理能力兼具的创新项目,非常适合对数据安全有需求的用户群体。