热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#公开源码
LanguageBind_Audio - 语言驱动的多模态预训练解决方案
Github
开源项目
模型
数据集
多模态
Huggingface
语义对齐
LanguageBind
公开源码
LanguageBind是一个语言驱动的多模态预训练工具,在五个数据集上表现出色。该项目采用VIDAL-10M数据集,将视频、红外、深度、音频和语言模态结合,实现了跨越视觉模态的扩展。通过多视图增强和ChatGPT的结合,它提高了语言的语义表达,并支持在线和本地运行,包括音频与语言、视频与语言的相似性计算。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号