ChatPDF简介
ChatPDF是一个开源的智能PDF问答系统,基于本地大语言模型(LLM)实现了与PDF文件的自然语言交互功能。它采用检索增强生成(RAG)技术,可以根据用户的问题,从PDF文档中检索相关内容并生成回答。ChatPDF具有以下主要特点:
- 支持多种文件格式,包括PDF、docx、markdown、txt等
- 支持多种开源LLM模型,如ChatGLM3-6b、Chinese-LLaMA-Alpaca-2、Baichuan、YI等
- 采用异步开发,支持多个API并发请求
- 优化了RAG的准确率,包括中文分词、embedding、检索匹配等多个环节
- 基于gradio开发了RAG对话页面,支持流式对话
快速上手
- 安装依赖:
pip install -r requirements.txt
- 运行RAG示例:
CUDA_VISIBLE_DEVICES=0 python rag.py
- 启动Web服务:
CUDA_VISIBLE_DEVICES=0 python webui.py --corpus_files data/sample.pdf --share
然后访问 http://localhost:7860 即可使用ChatPDF的Web界面。
进阶使用
ChatPDF还支持GraphRAG等高级功能,可以参考以下示例:
python graphrag_demo.py
注意:使用GraphRAG功能需要设置OpenAI API密钥。
相关资源
联系方式
如果您在使用过程中遇到问题,可以通过以下方式寻求帮助:
- 在GitHub上提交Issue
- 发送邮件至 xuming624@qq.com
- 添加作者微信:xuming624(备注:姓名-公司-NLP)
ChatPDF是一个功能强大的开源项目,欢迎大家使用并贡献代码。如果觉得对您有帮助,请给项目点个Star支持一下!