热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#CogVLM2-Video
CogVLM2 - 基于Llama3-8B的GPT4V级开源多模态模型
Github
开源项目
视频理解
图像理解
CogVLM2
CogVLM2-Video
Meta-Llama-3-8B-Instruct
CogVLM2是基于Meta-Llama-3-8B-Instruct的下一代模型系列,在多项基准测试中表现优异,支持中英文内容和高分辨率图像处理。该系列模型适用于图像理解、多轮对话和视频理解,特别适合需要处理长文本和高分辨率图像的场景。CogVLM2系列还支持8K内容长度,并在TextVQA和DocVQA等任务中显著提升表现。体验更先进的CogVLM2和CogVLM2-Video模型,迎接未来视觉智能挑战。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号