热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#文本富媒体
BLIVA - 处理文本视觉问题的多模态LLM
BLIVA
多模态
文本富媒体
视觉问答
机器学习
Github
开源项目
BLIVA是一款简单有效的多模态大语言模型,专门处理富文本视觉问题。其在多个视觉问答基准中表现出色,并公开了模型权重和训练代码。结合FlanT5和Vicuna版本,BLIVA适用于多种商业用途并提升认知和感知任务性能。演示和安装教程也非常详细。
1
1
相关文章
BLIVA:更好处理富文本视觉问题的简单多模态大语言模型
3 个月前
BLIVA学习资料汇总 - 更好处理富文本视觉问题的简单多模态大语言模型
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号