热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#灵活提示
Tokenize Anything:一种基于提示的通用视觉语言模型
2 个月前
Tokenize Anything是一个创新的视觉语言模型,能够同时完成图像分割、识别和描述等多项任务。本文将详细介绍该模型的设计思路、技术特点以及应用前景。
TAP
AI分割识别
视觉语言模型
灵活提示
多任务处理
Github
开源项目
2 个月前
相关项目
tokenize-anything
Tokenize Anything via Prompting是一个多功能视觉模型,可通过点、框和草图等视觉提示对图像中的任意区域进行分割、识别和描述。该模型利用SA-1B数据集和预训练的EVA-CLIP模型进行训练,具备强大的语义理解能力。其模块化设计支持多样化的视觉语言任务,可自定义预测器和异步处理流程,适用于各种应用场景。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号