AgentLego - 多功能 LLM Agent 工具库 - 增强大语言模型代理的能力

Ray

agentlego

AgentLego 简介

AgentLego 是一个专为增强大语言模型 (LLM) 代理能力而设计的开源工具库。它提供了丰富的多模态工具 API,可以轻松扩展 LLM 代理的功能,包括视觉感知、图像生成与编辑、语音处理、视觉-语言推理等多个方面。

AgentLego logo

AgentLego 的主要特点包括:

提供丰富的多模态工具集,支持视觉、语音、图像生成等多个领域
灵活的工具接口,允许用户轻松扩展自定义工具
易于集成到现有的 LLM 代理框架中,如 LangChain、Transformers Agents 等
支持工具服务化和远程访问,便于处理需要特殊环境的重型模型

快速开始

安装

安装 AgentLego 包:

pip install agentlego

安装特定工具的依赖:

例如,要使用 ImageDescription 工具,需要安装以下依赖:

pip install -U openmim
mim install -U mmpretrain

直接使用工具

from agentlego import list_tools, load_tool

print(list_tools())  # 列出 AgentLego 中的所有工具

image_caption_tool = load_tool('ImageDescription', device='cuda')
print(image_caption_tool.description)
image = './examples/demo.png'
caption = image_caption_tool(image)