#Video-LLaMA

Video-LLaMA: 革命性的音视频理解语言模型

3 个月前

Video-LLaMA 多模态视频理解语言模型 AI对话 Github 开源项目

3 个月前

相关项目

Video-LLaMA

Video-LLaMA是一个多模态AI项目，为大型语言模型赋予视频和音频理解能力。该项目基于BLIP-2和MiniGPT-4构建，包含视觉-语言和音频-语言两个分支。经过大规模视频和图像数据预训练及指令微调后，Video-LLaMA能够进行视频分析、音频理解和多轮对话。该模型支持英文和中文交互，为视频内容分析提供了新的AI解决方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com