热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#多模态智能代理
OmAgent - 多模态智能代理系统实现复杂视频理解
OmAgent
多模态智能代理
视频理解
大语言模型
人工智能
Github
开源项目
OmAgent是一个多模态智能代理系统,结合多模态大语言模型和算法来完成复杂任务。系统包含轻量级智能代理框架omagent_core和三个核心组件:Video2RAG、DnCLoop和Rewinder Tool。OmAgent突破视频长度限制,实现长视频理解、任务分解和信息检索。这一开源项目为研究和开发多模态应用提供了有力工具。
1
1
相关文章
OmAgent:多模态智能代理框架助力复杂视频理解
2024年09月05日
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号