#MMS

mms-1b-all - 大规模多语言语音识别模型支持超1100种语言
多语言语音Huggingface模型语音识别Github开源项目自然语言处理Wav2Vec2MMS
该模型是Meta多语言语音项目的重要成果,基于Wav2Vec2架构开发。通过适配器模型,可实现1162种语言的语音转录。模型包含10亿参数,由facebook/mms-1b微调而来。支持便捷的目标语言切换,能够进行多语种语音识别,尤其为低资源语言提供了可靠的语音技术解决方案。
mms-300m - Facebook AI推出大规模多语言语音预训练模型
Huggingface模型语音识别Github多语言语音模型开源项目MMSFacebook AI自监督训练
MMS-300m是Facebook AI开发的大规模多语言预训练语音模型,具有3亿参数。该模型在超过1400种语言的约50万小时语音数据上进行预训练,采用Wav2Vec2的自监督训练方法。MMS-300m为自动语音识别、翻译和分类等下游任务提供了基础,可通过微调适应不同应用场景,推动了跨语言语音技术的发展。
mms-tts-eng - Facebook开源英语文本转语音AI模型
模型MMS多语言语音英语开源项目Huggingface文字转语音GithubVITS
Facebook开发的MMS项目推出英语文本转语音模型,采用VITS架构实现高质量语音合成。该开源模型可通过Hugging Face Transformers库调用,支持非确定性合成以生成富有表现力的语音。作为多语言语音技术项目的一部分,此模型旨在推动语音合成技术在更多语言中的应用。
mms-tts-cat - Facebook MMS项目推出加泰罗尼亚语文本转语音模型
模型语音合成加泰罗尼亚语多语言GithubVITSMMS开源项目Huggingface
该模型是Facebook Massively Multilingual Speech项目的加泰罗尼亚语文本转语音(TTS)模型。基于VITS架构,通过端到端训练实现高质量语音合成。模型结构包括后验编码器、解码器和条件先验,采用变分推理和对抗训练方法。研究人员可通过Transformers库便捷使用此模型生成加泰罗尼亚语语音。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号