热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#交互区域检测
OmniParser - 将界面截图转化为易于理解元素的智能工具
Github
开源项目
GPT-4V
OmniParser
界面解析
交互区域检测
图标功能描述
本项目将用户界面截图解析为结构化元素,提升GPT-4V的操作准确性。近期发布的交互区域检测和图标功能描述模型,在Windows Agent Arena中表现卓越。项目易于安装并支持在Gradio中演示使用案例。如需更多详情,请参见项目主页。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号