热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#VisionLLM
VisionLLM - 面向视觉任务的开放式多模态大语言模型
人工智能
Github
开源项目
计算机视觉
多模态大语言模型
VisionLLM
视觉语言任务
VisionLLM 系列是一种多模态大语言模型,专注于视觉相关任务。该模型利用大语言模型作为开放式解码器,支持数百种视觉语言任务,包括视觉理解、感知和生成。VisionLLM v2 进一步提升了模型的通用性,扩展了其在多模态应用场景中的能力,推动了计算机视觉与自然语言处理的融合。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号