#多语言模型

WhisperLive学习资料汇总 - 实时语音转文本的开源项目

1 个月前

WhisperLive是一个基于OpenAI Whisper模型的实时语音转文本应用,可用于转录实时麦克风输入和预录音频文件。本文汇总了WhisperLive项目的相关学习资源,帮助读者快速了解和使用这个开源工具。

WhisperLive 实时语音识别 OpenAI Whisper 多语言模型 TensorRT Github 开源项目

1 个月前

mGPT: 突破语言障碍的多语言生成预训练模型

2 个月前

mGPT是一个强大的多语言生成预训练模型,支持61种语言,为自然语言处理领域带来新的可能性。本文深入介绍了mGPT的架构设计、预训练过程、性能评估以及应用示例。

mGPT 多语言模型预训练自然语言处理深度学习 Github 开源项目

2 个月前

CodeGeeX4: 开源多语言代码生成模型的新突破

2 个月前

CodeGeeX4-ALL-9B是一款功能强大的开源多语言代码生成模型，支持代码补全、代码解释器、网络搜索、函数调用和仓库级代码问答等多种软件开发场景，在不到10B参数的模型中表现最佳。

CodeGeeX4 代码生成多语言模型 AI编程开源 Github 开源项目

2 个月前

WhisperLive: 实时语音转文字的革新之作

2 个月前

WhisperLive是一个基于OpenAI Whisper模型的近实时语音转文字实现,它支持多种后端和部署方式,为实时语音识别带来了新的可能性。本文将深入介绍WhisperLive的特性、使用方法及其在语音识别领域的重要意义。

WhisperLive 实时语音识别 OpenAI Whisper 多语言模型 TensorRT Github 开源项目

2 个月前

FastEmbed学习资料汇总 - 快速、准确、轻量级的Python嵌入生成库

1 个月前

FastEmbed是一个由Qdrant开发的轻量级、快速、准确的Python嵌入生成库。本文汇总了FastEmbed的学习资料,帮助读者快速上手和深入了解这个强大的工具。

FastEmbed 文本嵌入 Qdrant ONNX Runtime 多语言模型 Github 开源项目

1 个月前

SimAlign: 基于预训练语言模型的高质量词对齐技术

2 个月前

SimAlign是一种无需平行语料训练数据的创新词对齐方法,通过利用静态和上下文化的多语言词嵌入来实现高质量的词对齐,为机器翻译等跨语言NLP任务提供了新的解决方案。

SimAlign 词语对齐自然语言处理上下文嵌入多语言模型 Github 开源项目

2 个月前

XPhoneBERT: 突破性的多语言语音合成预训练模型

2 个月前

XPhoneBERT是一种创新的多语言预训练模型，专门用于文本转语音(TTS)任务中的音素表示学习。它在近100种语言的3.3亿个音素级句子上进行预训练，显著提升了神经TTS模型的性能，为多语言语音合成领域带来了新的突破。

XPhoneBERT 语音合成多语言模型音素表示预训练模型 Github 开源项目

2 个月前

FastEmbed: 快速、准确、轻量级的Python嵌入式向量生成库

2 个月前

FastEmbed是由Qdrant开发的一个高效、轻量级的Python库,用于生成最先进的文本嵌入向量。它比其他嵌入库更快、更轻量,同时保持了高准确度,是构建向量搜索和语义检索应用的理想选择。

FastEmbed 文本嵌入 Qdrant ONNX Runtime 多语言模型 Github 开源项目

2 个月前

相关项目

fastembed

FastEmbed，一个为速度和效率优化的Python库，支持多语言且易于扩展的嵌入式模型生成工具，适用于服务器和GPU环境。简化高效编码，无需依赖庞大的数据下载，适用于多种数据类型和复杂任务，是开发精确嵌入系统的理想工具。

WhisperLive

WhisperLive是基于OpenAI Whisper模型开发的实时音频转写应用，能高效地将直播或预录音频转换成文本。支持多语言和自定义设置，适用于个人、教育及商业场景。项目还提供Docker部署，简化安装和服务部署过程。

XPhoneBERT

XPhoneBERT是一种创新的多语言音素表示预训练模型，专为文本转语音(TTS)系统设计。基于BERT-base架构，该模型利用RoBERTa方法对近100种语言的3.3亿音素级句子进行训练。研究显示，将XPhoneBERT用作输入音素编码器能够显著增强神经TTS模型的自然度和韵律表现，同时在训练数据有限的情况下也能生成高质量语音。这一模型支持广泛的语言，并可通过transformers库便捷集成。

CodeGeeX4

CodeGeeX4-ALL-9B是一个基于GLM-4-9B训练的多语言代码生成模型。它提供代码补全、生成、解释等多项功能，并支持网络搜索、函数调用和仓库级代码问答。作为参数量低于10B的代码生成模型中性能最佳的一款，CodeGeeX4-ALL-9B在多个公开基准测试中表现优异，在某些方面甚至超越了参数量更大的通用模型，体现了其在推理速度和模型性能之间的出色平衡。

AssemblyAI

AssemblyAI是一个专业的语音AI技术平台，提供语音识别和理解服务。其功能包括语音转文本、说话人识别、情感分析、章节检测和个人信息编辑。该平台具有易集成、灵活定价、技术持续更新等特点，并提供全天候支持。AssemblyAI帮助企业利用语音数据开发创新AI产品。

simalign

SimAlign是一种创新的词对齐工具，利用静态和上下文嵌入技术实现高质量对齐，无需平行训练数据。该工具支持ArgMax、IterMax和Match等多种对齐算法，覆盖104种语言。相较于传统统计模型，SimAlign在多个语言对的对齐任务中表现优异。工具基于Python开发，安装和使用便捷，并提供在线演示平台。SimAlign可应用于机器翻译、多语言模型训练等跨语言自然语言处理任务中。

mgpt

mGPT是一个基于GPT-3的多语言模型，覆盖25个语系的61种语言。该模型使用维基百科和C4语料库进行预训练，包含低资源语言。mGPT在语言建模、跨语言自然语言理解和世界知识探测等方面表现出色，上下文学习能力与同期模型相当。项目代码和模型以MIT许可证开源。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com