DeepSeek 项目介绍
概述
DeepSeek 是一个新型的实验性架构,旨在成为由大型语言模型(LLM)支持的互联网规模的检索引擎。与当前通常被设计为答案引擎的研究代理不同,DeepSeek 的构建理念更注重于通过处理大量信息来源来收集全面的实体列表。
项目特点
与答案引擎的区别
-
答案引擎:它通过整合众多来源来找到一个“正确”的答案,最近的研究代理大多关注于这一点。例如,Perplexity、GPT-Researcher 和 Aomni 等。
-
检索引擎:它处理大量的来源信息,以收集全面的实体列表。DeepSeek 正是在这一领域进行突破的尝试,与那些旨在给出研究报告为最终结果的答案引擎不同,DeepSeek 的最终结果是一个包含所有检索到的实体及其附加信息的表格。
结果展示
DeepSeek 生成的最终结果可能非常庞大,以至于无法单一截屏展示。这些结果包括从356个来源收集并增强的94条记录,并在数据表格的单元格中提供置信度评分。例如,低置信度的单元格会被突出显示,提示用户那些信息可能有冲突或者来源不足。
使用指南
安装步骤
需要安装以下包管理器之一:
- npm
- yarn
- pnpm
- bun
请按 安装指南 中的说明下载安装包管理器及项目依赖。启动开发服务器的命令因包管理器不同而异,如下所示:
npm run dev
# or
yarn dev
# or
pnpm dev
# or
bun dev
在浏览器中打开 http://localhost:3000 即可开始搜索或探索预构建示例。示例仅用于展示架构的能力和缺陷,因为实际运行代理开销较大。
环境变量配置
确保拥有 Anthropic 和 Exa 的 API 密钥。在项目根目录创建 .env
文件,并添加以下环境变量:
ANTHROPIC_KEY="anthropic_api_key"
EXA_KEY="exa_api_key"
系统架构
该系统作为一个多步骤的研究代理工作,初始查询被分解为一个计划,并在系统中通过流式操作构建设定答案。这种架构被称为流工程。
研究流程
- 计划:根据用户查询,规划器构建出最终结果的框架,包括定义要提取的实体类型及结果表内涉及的各个信息列。
- 搜索:使用标准关键词与神经搜索寻找相关内容进行处理,依托于 Exa 提供的服务。
- 提取:通过加入特定标记符与 LLM 协作提取特定的实体及其相关内容。
- 增益:在较大的检索代理中包含较小的答案代理以丰富每个实体的各个信息列。
未来工作
DeepSeek 计划增加更多功能,例如:
- 实体排序或按相关性排名。
- 更好的实体去重,避免误判于相似实体。
- 改进来源验证以确保其连接至原始实体。
- 增强对来源深入浏览的支持。
- 支持数据流式传输,即时在 UI 中显示检索及丰富的过程。
如果对合作或讨论感兴趣,可以通过 david@aomni.com 联系或者在 Twitter 上联系开发者。