#AppAgent
AppAgent - 智能代理框架简化智能手机应用操作
AppAgent多模态智能手机应用GPT-4V探索学习Github开源项目
AppAgent是一种基于LLM的多模态智能代理框架,模仿人类点击和滑动操作来运行智能手机应用。框架通过自主探索或观察人类演示学习新操作,生成知识库以执行复杂任务。无需系统后端访问,适用性广泛。提供详细配置步骤、评估基准和使用案例,支持GPT-4V和通义千问-VL等多种模型。
UFO - Windows系统的UI自动化多代理框架
UFOWindows OSHostAgentAppAgent多代理框架Github开源项目
UFO是一个专为Windows系统设计的多代理框架,通过在单个或多个应用程序中无缝导航和操作来完成用户请求。其主要功能包括:HostAgent选择和切换应用程序,AppAgent在选定应用程序中执行操作直到任务完成,Application Automator将操作转换为应用程序交互。UFO利用GPT-Vision的多模态能力理解界面并满足用户需求。
相关文章