热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#LLAMA 3.2
Llama-3.2-11B-Vision - Meta开发的多模态大语言模型 支持视觉识别和图像推理
模型
Github
LLAMA 3.2
开源项目
多模态模型
Huggingface
机器学习
自然语言处理
计算机视觉
Llama-3.2-11B-Vision是Meta开发的多模态大语言模型,支持图像和文本输入、文本输出。该模型在视觉识别、图像推理、图像描述和通用图像问答方面表现出色。它基于Llama 3.1文本模型构建,采用优化的Transformer架构,通过监督微调和人类反馈强化学习进行对齐。模型支持128K上下文长度,经过60亿(图像,文本)对训练,知识截止到2023年12月。Llama-3.2-11B-Vision为商业和研究用途提供视觉语言处理能力。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号