Project Icon

MindSearch

开源AI搜索引擎框架,支持深度知识探索

MindSearch是一个开源的AI搜索引擎框架,支持Perplexity.ai Pro性能。用户可以使用GPT、Claude等闭源LLM或InternLM2.5-7b-chat等开源LLM,轻松部署类似Perplexity.ai风格的搜索引擎。MindSearch能够解决各种问题,通过浏览数百个网页提供深入的知识,并优化用户界面体验。它通过动态图构建过程,将用户查询分解为多个子问题,逐步扩展搜索图,显著提高响应的深度、广度和准确性。

MindSearch 项目介绍

项目概述

MindSearch 是一个旨在模拟人类思维的深度 AI 搜索器,其目标是通过高级人工智能技术改进搜索体验。该项目不仅提高了搜索能力,还通过创新机制使用户的搜索更加高效和人性化。

项目进展

在 2024 年 11 月 5 日,MindSearch 已经在 Puyu 平台上线,用户可以通过 这个链接 进行体验。此次更新主要包括重构了基于 Lagent v0.5 的代理模块,这使得系统在并发情况下的性能得到了提升。此外,用户界面也进行了改进,支持同时进行多个查询的搜索。

如何构建 MindSearch

步骤一:安装依赖

首先,需要从 GitHub 仓库克隆 MindSearch 项目,并安装所需的 Python 依赖:

git clone https://github.com/InternLM/MindSearch
cd MindSearch
pip install -r requirements.txt

步骤二:设置环境变量

在设置 API 之前,需要配置环境变量。将.env.example文件重命名为.env,并填写必要的参数。

mv .env.example .env

步骤三:设置 MindSearch API

通过 FastAPI 启动服务器:

python -m mindsearch.app --lang en --model_format internlm_server --search_engine DuckDuckGoSearch --asy 
  • 参数--lang定义模型语言,可以设置为en(英语)或cn(中文)。
  • 参数--model_format定义模型格式,如internlm_server(适用于本地优化的 InternLM2.5-7b-chat)或gpt4
  • 参数--search_engine定义使用的搜索引擎,例如DuckDuckGoSearchBingSearchBraveSearchGoogleSearchTencentSearch

请确保为你选择的搜索引擎设置相应的 API 密钥。

步骤四:设置 MindSearch 前端

MindSearch 提供多种前端接口,包括 React、Gradio 和 Streamlit。

  • React 前端配置:

首先,在 vite.config.ts 文件中配置后端 URL:

HOST="127.0.0.1"
PORT=8002
sed -i -r "s/target:\s*\"\"/target: \"${HOST}:${PORT}\"/" frontend/React/vite.config.ts

然后安装 Node.js 和 npm,接着安装项目依赖:

cd frontend/React
npm install
npm start
  • Gradio 前端启动:
python frontend/mindsearch_gradio.py
  • Streamlit 前端启动:
streamlit run frontend/mindsearch_streamlit.py

变更 Web 搜索 API

用户可以通过修改 mindsearch/agent/__init__.py 中的 searcher_type 属性来更换不同类型的 Web 搜索 API。例如,若想改用 Brave Search API,可以进行如下配置:

BingBrowser(
    searcher_type='BraveSearch',
    topk=2,
    api_key=os.environ.get('BRAVE_API_KEY', 'YOUR BRAVE API')
)

不使用前端的情况下操作后端

对于更倾向于直接与后端交互的用户,可以使用 backend_example.py 脚本来演示如何发送查询到后端并处理返回结果:

python backend_example.py

确保在执行脚本之前已设置好环境变量并运行后端。

本地调试

使用下面的命令在本地终端进行调试:

python -m mindsearch.terminal

许可证

该项目以 Apache 2.0 许可证 发布。

引用

如果在研究中发现该项目有用,请考虑引用:

@article{chen2024mindsearch,
  title={MindSearch: Mimicking Human Minds Elicits Deep AI Searcher},
  author={Chen, Zehui and Liu, Kuikun and Wang, Qiuchen and Liu, Jiangning and Zhang, Wenwei and Chen, Kai and Zhao, Feng},
  journal={arXiv preprint arXiv:2407.20183},
  year={2024}
}

我们的其他项目

进一步探索我们在大型语言模型上的研究,项目包括:

  • Lagent:用于构建基于 LLM 的代理的轻量级框架。
  • AgentFLAN:通过高质量代理数据集进行构建和训练的创新方法。
  • T-Eval:精细的工具使用评估基准。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号