Memary: 开源自主代理的记忆层

Memary简介

Memary是一个开源项目,旨在为自主AI代理提供高效的记忆层。它的目标是通过模拟人类记忆的工作方式,帮助AI代理更好地管理和利用信息,从而提升其推理和决策能力。Memary的核心理念是,记忆对于人类的推理至关重要,同样也应该在构建AI代理时得到同等的重视。

Memary Logo

Memary项目由一群热衷于推动AI技术发展的开发者创建和维护。它采用MIT开源许可证,鼓励社区参与和贡献。项目的GitHub仓库提供了详细的文档、示例代码和使用指南,方便开发者快速上手和集成。

Memary的设计基于几个核心概念,这些概念共同构成了其独特的记忆管理方法:

Memary能够自动捕获和存储代理与环境交互过程中产生的信息。这种自动化的记忆生成机制使得开发者无需手动管理记忆内容,大大简化了集成过程。同时,它还支持多个数据库的组合,为记忆存储提供了灵活性。

Memary采用模块化设计,包括记忆流(Memory Stream)和实体知识存储(Entity Knowledge Store)两个主要组件。这种设计允许系统跟踪用户的偏好和兴趣变化,为分析和优化代理行为提供了基础。

Memary模仿人类记忆随时间演化和学习的过程。它能够跟踪代理的改进速度,帮助开发者了解代理的学习进展。

Memary保存了所有对话历史,使得开发者可以回溯代理的执行过程,并在特定时间点访问代理的记忆状态。这一功能对于调试和优化代理行为非常有用。

Memary的技术架构包括几个关键组件,它们协同工作以提供全面的记忆管理解决方案:

Routing Agent

Memary使用ReAct代理来规划和执行查询。这个代理配备了多种工具,其中最关键的是搜索工具,用于从知识图谱中检索信息。如果知识图谱中没有相关实体,代理会执行外部搜索。其他工具还包括基于LLaVa的计算机视觉功能和使用地理编码器和Google Maps的位置工具。

Knowledge Graph

Memary使用Neo4j图数据库来存储知识。它利用Llama Index将文档中的节点添加到图存储中,并使用Perplexity(基于mistral-7b-instruct模型)进行外部查询。知识图谱的使用场景包括:

这些技术减少了搜索整个知识图谱时的延迟。

Memory Module

记忆模块由记忆流和实体知识存储组成,其设计受到了微软研究院提出的K-LaMP模型的启发。

记忆流捕获所有插入到知识图谱中的实体及其相关时间戳。它反映了用户知识的广度,即用户接触过的概念,但不推断接触的深度。记忆流支持以下功能:

实体知识存储跟踪记忆流中存储的每个实体的引用频率和最近度。它反映了用户知识的深度,即用户更熟悉的概念。实体知识存储支持以下功能:

New Context Window

Memary利用与用户相关的关键分类实体和主题来定制代理响应,使其更贴近用户当前的兴趣/偏好和知识水平/专业程度。新的上下文窗口由以下部分组成:

要开始使用Memary,开发者需要遵循以下步骤: