#文本转语音

klaam学习资料汇总 - 阿拉伯语语音处理开源工具库

2 个月前

klaam 语音识别文本转语音 wav2vec fastspeech2 Github 开源项目

2 个月前

Multi-Tacotron-Voice-Cloning学习资料汇总 - 多语言语音克隆的开源实现

2 个月前

Multi-Tacotron Voice Cloning 语音合成深度学习多语种文本转语音 Github 开源项目

2 个月前

epub2tts入门学习资料汇总-将EPUB电子书转换为有声读物的开源工具

2 个月前

epub2tts 文本转语音 Coqui AI TTS 免费开源音频书 Github 开源项目

2 个月前

vits2_pytorch学习资料汇总 - 非官方PyTorch实现的VITS2文本转语音模型

2 个月前

VITS2 文本转语音单阶段模型对抗学习架构设计 Github 开源项目

2 个月前

KAN-TTS入门指南 - 一个强大的语音合成训练框架

2 个月前

KAN-TTS 模型语言支持文本转语音 ModelScope Github 开源项目

2 个月前

Android Speech使用指南 - 简化语音识别与文字转语音

2 个月前

Android Speech 语音识别文本转语音 Speech.init Gradle Github 开源项目

2 个月前

flutter_tts入门指南 - 跨平台文本转语音Flutter插件

2 个月前

flutter_tts 文本转语音插件安卓 iOS Github 开源项目

2 个月前

Glow-TTS学习资料汇总 - 基于单调对齐搜索的生成式文本转语音模型

2 个月前

Glow-TTS 文本转语音并行合成 HiFi-GAN 模型训练 Github 开源项目

2 个月前

vits-simple-api入门指南 - 一个简单的VITS HTTP API项目

2 个月前

vits-simple-api 人工智能文本转语音 GPU加速多模型支持 Github 开源项目

2 个月前

DC-TTS学习资料汇总 - 基于深度卷积网络的高效文本转语音模型

2 个月前

DC-TTS TensorFlow 文本转语音训练模型语音样本 Github 开源项目

2 个月前

相关项目

GPT-SoVITS

GPT-SoVITS-WebUI是一款功能强大的在线语音转换和文本转语音工具，支持跨语言转换与实时语音合成。项目集成了自动训练集分段、中文语音识别和文本标记等工具，能够帮助初学者轻松创建训练数据集和GPT/SoVITS模型。GPT-SoVITS支持零样本和少样本文本转语音，是音频处理领域的创新应用。

MeloTTS

MeloTTS是由MyShell.ai开发的多语言、多方言文本转语音库，支持包括英语（美国、英国、印度、澳大利亚）、西班牙语、法语、中文（结合英语）、日语和韩语等语种。该库特别适合于CPU实时推断，支持无安装使用，本地安装及自定义数据集训练。加入Discord社区交流，共同探讨与合作。

tortoise

Tortoise TTS 是一款先进的文本转语音软件，专为提供多声音功能和高度真实的语调与韵律设计。该项目支持各种安装方式，包括pip和Docker，并提供了完善的本地安装指南。此外，Tortoise TTS 还在Hugging Face上提供在线演示，用户可体验其强大功能。它使用了自回归解码器和扩散解码器，大幅提升了语音生成的速度和质量。无论是个人用户还是开发者，都可通过详细的使用指南迅速上手和部署。

PaddleSpeech

PaddleSpeech是基于PaddlePaddle平台的开源语音处理工具集，覆盖自动语音识别、文本转语音合成、说话人确认及声音分类等多项功能，提供易于使用、高效和灵活的模型，支持各类语音相关任务。工具集包含全流程服务，支持流式识别与合成系统，为研究和工业应用提供强大支持。

VEED

VEED.IO为全球用户提供高效的文本到语音转换，支持多种语言和真实声音选项，适用于内容制作及广告业务，提升视频生产的效率与质量。

琅琅配音

琅琅配音是一款支持超过30种语言和众多情感风格的AI配音平台。提供免费和会员服务，适用于视频解说、有声书、广告等多种场景。界面简洁易用，功能强大，使制作专业品质的配音内容更为便捷。

Uberduck

Uberduck是一个支持多语言的AI语音合成服务平台，提供文本到语音转换、歌声生成和语音克隆技术。它帮助音乐制作人、内容创作者和营销人员通过AI技术，提升音频内容的创造与编辑能力。

Deepgram Voice AI

Deepgram Voice AI平台，采用最新Nova-2语音识别模型，提供实时、高效和低成本的语音转文字与文字转语音APIs，适用于医疗转录、客户服务与媒体字幕制作等多种场景。

ChatTTS

ChatTTS是为对话场景特别设计的文本到语音模型，支持多种语言和多发言者交互。该模型优化对话基础任务，支持细粒度的韵律特征控制，如笑声、停顿等。通过使用预训练模型，ChatTTS在自然语言合成和表达能力方面均有突破性进展，适用于教育和研究目的。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com