热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#流媒体视频
videollm-online - 流式视频实时理解与交互的先进模型
VideoLLM-online
流媒体视频
实时交互
大语言模型
视频处理
Github
开源项目
VideoLLM-online是一款针对流媒体视频的在线大语言模型。该模型支持视频流实时交互,可主动更新响应,如记录活动变化和提供实时指导。项目通过创新的数据合成方法将离线注释转化为流式对话数据,并采用并行化推理技术实现高速处理,在A100 GPU上处理速度可达10-15 FPS。VideoLLM-online在在线和离线环境中均表现出色,能高效处理长达10分钟的视频,为视频理解与交互领域带来新的可能性。
1
1
相关文章
VideoLLM-online: 突破性的流式视频大语言模型
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号