Logo

#多语言模型

WhisperLive学习资料汇总 - 实时语音转文本的开源项目

1 个月前
Cover of WhisperLive学习资料汇总 - 实时语音转文本的开源项目

mGPT: 突破语言障碍的多语言生成预训练模型

2 个月前
Cover of mGPT: 突破语言障碍的多语言生成预训练模型

CodeGeeX4: 开源多语言代码生成模型的新突破

2 个月前
Cover of CodeGeeX4: 开源多语言代码生成模型的新突破

WhisperLive: 实时语音转文字的革新之作

2 个月前
Cover of WhisperLive: 实时语音转文字的革新之作

FastEmbed学习资料汇总 - 快速、准确、轻量级的Python嵌入生成库

1 个月前
Cover of FastEmbed学习资料汇总 - 快速、准确、轻量级的Python嵌入生成库

SimAlign: 基于预训练语言模型的高质量词对齐技术

2 个月前
Cover of SimAlign: 基于预训练语言模型的高质量词对齐技术

XPhoneBERT: 突破性的多语言语音合成预训练模型

2 个月前
Cover of XPhoneBERT: 突破性的多语言语音合成预训练模型

FastEmbed: 快速、准确、轻量级的Python嵌入式向量生成库

2 个月前
Cover of FastEmbed: 快速、准确、轻量级的Python嵌入式向量生成库

相关项目

Project Cover
fastembed
FastEmbed,一个为速度和效率优化的Python库,支持多语言且易于扩展的嵌入式模型生成工具,适用于服务器和GPU环境。简化高效编码,无需依赖庞大的数据下载,适用于多种数据类型和复杂任务,是开发精确嵌入系统的理想工具。
Project Cover
WhisperLive
WhisperLive是基于OpenAI Whisper模型开发的实时音频转写应用,能高效地将直播或预录音频转换成文本。支持多语言和自定义设置,适用于个人、教育及商业场景。项目还提供Docker部署,简化安装和服务部署过程。
Project Cover
XPhoneBERT
XPhoneBERT是一种创新的多语言音素表示预训练模型,专为文本转语音(TTS)系统设计。基于BERT-base架构,该模型利用RoBERTa方法对近100种语言的3.3亿音素级句子进行训练。研究显示,将XPhoneBERT用作输入音素编码器能够显著增强神经TTS模型的自然度和韵律表现,同时在训练数据有限的情况下也能生成高质量语音。这一模型支持广泛的语言,并可通过transformers库便捷集成。
Project Cover
CodeGeeX4
CodeGeeX4-ALL-9B是一个基于GLM-4-9B训练的多语言代码生成模型。它提供代码补全、生成、解释等多项功能,并支持网络搜索、函数调用和仓库级代码问答。作为参数量低于10B的代码生成模型中性能最佳的一款,CodeGeeX4-ALL-9B在多个公开基准测试中表现优异,在某些方面甚至超越了参数量更大的通用模型,体现了其在推理速度和模型性能之间的出色平衡。
Project Cover
AssemblyAI
AssemblyAI是一个专业的语音AI技术平台,提供语音识别和理解服务。其功能包括语音转文本、说话人识别、情感分析、章节检测和个人信息编辑。该平台具有易集成、灵活定价、技术持续更新等特点,并提供全天候支持。AssemblyAI帮助企业利用语音数据开发创新AI产品。
Project Cover
simalign
SimAlign是一种创新的词对齐工具,利用静态和上下文嵌入技术实现高质量对齐,无需平行训练数据。该工具支持ArgMax、IterMax和Match等多种对齐算法,覆盖104种语言。相较于传统统计模型,SimAlign在多个语言对的对齐任务中表现优异。工具基于Python开发,安装和使用便捷,并提供在线演示平台。SimAlign可应用于机器翻译、多语言模型训练等跨语言自然语言处理任务中。
Project Cover
mgpt
mGPT是一个基于GPT-3的多语言模型,覆盖25个语系的61种语言。该模型使用维基百科和C4语料库进行预训练,包含低资源语言。mGPT在语言建模、跨语言自然语言理解和世界知识探测等方面表现出色,上下文学习能力与同期模型相当。项目代码和模型以MIT许可证开源。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号