#Text-to-Speech

TTS - 高性能文本到语音生成库,支持多语言
TTSMozillaText-to-Speech预训练模型多语言支持Github开源项目
TTS库基于最新研究成果,提供高效的文本到语音生成技术,实现了训练便捷、速度快、质量高的最佳平衡。该库包括预训练模型和数据集质量评估工具,已被广泛应用于20多种语言的产品和研究项目。支持多说话人TTS、快速模型训练、多GPU训练,并兼容PyTorch、TensorFlow和TFLite等多种平台。
epub_to_audiobook - EPUB电子书转换为有声读物工具,支持Azure和OpenAI TTS技术
EPUB to AudiobookText-to-SpeechAudiobookshelfAzure TTSOpenAI TTSGithub开源项目
epub_to_audiobook是一个开源的命令行程序,能够把EPUB电子书转换为有声读物。利用Microsoft Azure和OpenAI的TTS API,为每章节产生高质量的音频文件,完美适配Audiobookshelf。提供Edge TTS支持,无需API密钥即可操作。
rvc-tts-webui - 基于Gradio的在线文字转语音WebUI
Text-to-SpeechRVCGradio WebUIPython模型安装Github开源项目
RVC-TTS-WebUI是一个功能强大的文字转语音Web界面,涵盖RVC模型和edge-tts技术,提供在线演示。支持Windows 11下Python 3.10,简化安装过程,附带详细故障排查指南。
NATSpeech - 非自回归文本转语音 (NAR-TTS) 框架
NATSpeechText-to-SpeechPortaSpeechDiffSpeechPyTorchGithub开源项目
NATSpeech框架是一款高效的非自回归文本至语音转换系统,特点为便捷的操作、可扩展性强,并采用精准的数据处理技术。框架包括PortaSpeech与DiffSinger两种高质量语音合成技术,适用于高端研究与商业应用,配备详尽的技术文档及安装指导。
mimic-recording-studio - 提升TTS音质的专业录音与数据训练工具
Mimic Recording StudioMycroftText-to-Speech音频记录DockerGithub开源项目
Mimic Recording Studio是一个全面的软件解决方案,旨在提升Text-to-Speech(TTS)技术的音质。它支持多种语言的语料库开发,并通过先进的录音与数据处理技术,提高TTS语音模型的清晰度和标准化。该平台的用户友好录音系统和强大的后端处理功能,使其成为语音合成研究和开发的首选工具。
voicebox-pytorch - 新一代MetaAI文本到语音模型Voicebox的Pytorch实现
VoiceboxPytorchText-to-SpeechMetaAISpear-TTSGithub开源项目
该项目实现了MetaAI的最新文本到语音模型Voicebox,利用旋转嵌入和自适应归一化技术提升模型效果。还融合了SpearTTS和Conditioned Flow Matching等技术,提高训练和采样效率。项目获得Imminent Grant资助,致力于推动开源文本到语音技术的发展,并感谢各大赞助商的支持。用户可以通过pip install命令轻松安装和使用该项目。
Cognitive-Speech-TTS - 高效文本转语音解决方案,支持个性化声音定制
Azure AIMicrosoftText-to-SpeechSpeech SDKAzure Cognitive ServicesGithub开源项目
Azure Cognitive Service的TTS技术支持高效的文本转语音转换,提供多语言、多情感和个性化声音定制。通过REST API和Speech SDK集成,提供跨平台解决方案,应用广泛,包括教育、媒体、娱乐和医疗等领域。最新更新及客户案例展示了Azure AI推动的创新及优质用户体验。