热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#SLAM-LLM
SLAM-LLM:面向语音、语言、音频和音乐处理的大型语言模型工具包
2 个月前
SLAM-LLM是一个开源深度学习工具包,旨在帮助研究人员和开发者训练定制的多模态大语言模型,专注于语音、语言、音频和音乐处理领域。本文详细介绍了SLAM-LLM的主要特性、应用场景及使用方法。
SLAM-LLM
多模态大语言模型
语音处理
音频处理
音乐处理
Github
开源项目
2 个月前
相关项目
SLAM-LLM
SLAM-LLM是一款开源深度学习工具包,为多模态大语言模型(MLLM)训练而设计。它专注于语音、语言、音频和音乐处理,提供详细训练方案和高性能推理检查点。支持自动语音识别、文本转语音等多种任务,具备易扩展性、混合精度训练和多GPU训练等特点,适合研究人员和开发者使用。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号