#Moshi
moshiko-candle-q8 - 语音文本基础模型与全双工对话框架
Huggingface开源项目语音模型模型GithubMoshi实时对话人工对话音频编码
Moshi是一个语音文本基础模型,通过神经网络技术实现语音到语音的自然转换。模型采用并行流处理方式,支持极低延迟的实时全双工对话,适用于日常交谈、问答咨询和角色扮演等场景。目前仅支持英语,并已实施安全防护机制。
moshika-pytorch-bf16 - 实时全双工语音对话的AI模型革新
Github模型开源项目语音生成文本到语音对话模型Huggingface实时交互Moshi
Moshi是基于bf16的Pytorch实现的实时全双工语音对话模型,支持流式语音识别与文本到语音转换,拥有低延迟,适合自然语音交互场景。