📚 Knowledge-GPT简介
Knowledge-GPT是一个功能强大的知识提取和问答工具,旨在从各种信息源中提取知识,并利用OpenAI的GPT-3模型生成答案。它支持从网页、PDF、PowerPoint、Word文档、YouTube字幕和音频等多种来源提取信息,为用户提供全面的知识获取和问答能力。
🚀 快速开始
要开始使用Knowledge-GPT,您可以通过以下方式安装:
- 使用pip安装:
pip install knowledgegpt
- 从GitHub仓库安装最新版本:
pip install -r requirements.txt
pip install .
- 下载所需的语言模型:
python3 -m spacy download en_core_web_sm
🔧 配置和使用
-
设置OpenAI API密钥:
- 访问OpenAI API Keys页面
- 创建新的密钥并复制
- 将密钥添加到
example_config.py
文件中
-
基本用法示例:
from knowledgegpt.extractors.web_scrape_extractor import WebScrapeExtractor
import openai
from example_config import SECRET_KEY
openai.api_key = SECRET_KEY
url = "https://en.wikipedia.org/wiki/Bombard_(weapon)"
scrape_website = WebScrapeExtractor(url=url, embedding_extractor="hf", model_lang="en")
answer, prompt, messages = scrape_website.extract(query="What is a bombard?", max_tokens=300, to_save=True, mongo_client=db)
print(answer)
📊 主要特性
- 从互联网提取知识(如维基百科)
- 从PDF、DOCX、PPTX等本地数据源提取知识
- 从YouTube视频字幕和音频中提取知识
- 支持多种语言模型和嵌入方法
- 可扩展的架构,支持添加新的提取器和数据源
🔗 相关资源
🛠️ 高级用法
Knowledge-GPT支持多种提取器,包括:
- WebScrapeExtractor: 从网页提取信息
- PDFExtractor: 从PDF文件提取信息
- PowerpointExtractor: 从PPT文件提取信息
- DocsExtractor: 从Word文档提取信息
- YoutubeAudioExtractor: 从YouTube视频音频提取信息
- YTSubsExtractor: 从YouTube视频字幕提取信息
每个提取器都可以根据需要进行定制和配置。
🤝 如何贡献
欢迎为Knowledge-GPT项目做出贡献!您可以通过以下步骤参与:
- 打开一个issue
- Fork仓库
- 创建新分支
- 进行修改
- 提交Pull Request
🔮 未来规划
Knowledge-GPT团队正在积极开发新功能,包括:
- 添加向量数据库支持(如Pinecone, Milvus, Qdrant等)
- 集成Whisper模型用于音频处理
- 开发Web界面
- 支持更多知识源和语言
- 改进文档和错误处理
通过不断改进和扩展,Knowledge-GPT致力于成为最强大和易用的知识提取与问答工具之一。无论您是研究人员、开发者还是知识工作者,Knowledge-GPT都能为您提供强大的信息获取和处理能力。
立即开始使用Knowledge-GPT,探索海量信息,获取智能答案!