deep-seek - 大规模LLM驱动互联网检索引擎的实验性架构

DeepSeek 项目介绍

DeepSeek 是一个新型的实验性架构，旨在成为由大型语言模型（LLM）支持的互联网规模的检索引擎。与当前通常被设计为答案引擎的研究代理不同，DeepSeek 的构建理念更注重于通过处理大量信息来源来收集全面的实体列表。

答案引擎：它通过整合众多来源来找到一个“正确”的答案，最近的研究代理大多关注于这一点。例如，Perplexity、GPT-Researcher 和 Aomni 等。
检索引擎：它处理大量的来源信息，以收集全面的实体列表。DeepSeek 正是在这一领域进行突破的尝试，与那些旨在给出研究报告为最终结果的答案引擎不同，DeepSeek 的最终结果是一个包含所有检索到的实体及其附加信息的表格。

DeepSeek 生成的最终结果可能非常庞大，以至于无法单一截屏展示。这些结果包括从356个来源收集并增强的94条记录，并在数据表格的单元格中提供置信度评分。例如，低置信度的单元格会被突出显示，提示用户那些信息可能有冲突或者来源不足。

需要安装以下包管理器之一：

请按安装指南中的说明下载安装包管理器及项目依赖。启动开发服务器的命令因包管理器不同而异，如下所示：

npm run dev
# or
yarn dev
# or
pnpm dev
# or
bun dev

在浏览器中打开 http://localhost:3000 即可开始搜索或探索预构建示例。示例仅用于展示架构的能力和缺陷，因为实际运行代理开销较大。

确保拥有 Anthropic 和 Exa 的 API 密钥。在项目根目录创建 .env 文件，并添加以下环境变量：

ANTHROPIC_KEY="anthropic_api_key"
EXA_KEY="exa_api_key"

该系统作为一个多步骤的研究代理工作，初始查询被分解为一个计划，并在系统中通过流式操作构建设定答案。这种架构被称为流工程。

DeepSeek 计划增加更多功能，例如：

如果对合作或讨论感兴趣，可以通过 david@aomni.com 联系或者在 Twitter 上联系开发者。