OmAgent
OmAgent是一个多模态智能代理系统,结合多模态大语言模型和算法来完成复杂任务。系统包含轻量级智能代理框架omagent_core和三个核心组件:Video2RAG、DnCLoop和Rewinder Tool。OmAgent突破视频长度限制,实现长视频理解、任务分解和信息检索。这一开源项目为研究和开发多模态应用提供了有力工具。