#AI语音
rvc-tts-pipeline
RVC-TTS-Pipeline是一个开源语音合成项目,结合文本到语音(TTS)和RVC模型技术,旨在生成接近原始说话者声音的语音输出。该项目将TTS生成的音频转换为RVC模型的训练权重,提高了语音还原质量。项目提供简单的安装步骤和API,方便用户进行语音合成。目前仍处于开发阶段,存在一些问题待解决。
Retrieval-based-Voice-Conversion
Retrieval-based-Voice-Conversion是一个基于VITS的开源语音转换框架。该项目提供库、API和命令行接口,支持标准和自定义设置,允许灵活配置模型和环境。它具有详细的音频推理参数设置功能,并支持Docker部署,使语音转换技术更易于使用和实施。
CosyVoice_For_Windows
CosyVoice_For_Windows是一个开源的语音合成项目,支持多语言、零样本和跨语言语音生成。该工具提供SFT、零样本、跨语言和指令推理等多种模式。项目包含Web演示界面,便于快速了解功能。同时还支持高级训练和部署,适用于语音合成的研究和应用开发。
open-tts-tracker
Open TTS Tracker 是一个综合性的开源语音合成模型跟踪平台。该项目汇集了最新TTS模型的详细信息,包括名称、代码库、权重、许可证、微调能力、支持语言等多个方面。通过提供这些资源,Open TTS Tracker 旨在提升开源TTS模型的可见度,推动语音合成技术的进步。研究人员、开发者和爱好者可以在此找到丰富的模型信息和相关资源。
Articula
Articula是一款创新的通话翻译应用,支持24种语言的实时语音和视频通话翻译。其独特的上下文感知功能能够理解用户特点和谈话主题,提供精准翻译。用户可创建AI语音,用自己的声音说出14种语言。应用还包含'Snippets'语音备忘录翻译和仅2-3秒延迟的同步通话翻译功能。
Luvvoice
Luvvoice是一款免费在线AI文本转语音工具,支持70多种语言和200多种声音。该TTS工具提供高质量AI语音合成服务,无字数限制且无需注册,可将文本轻松转换为自然流畅的语音。适用于内容创作、学习和需要文本朗读的各种场景。Luvvoice具有真实AI语音、多语言支持、简易操作界面和批量处理功能等特点,可免费用于商业用途。广泛应用于YouTube、TikTok视频制作、播客、教育和媒体等领域,是一款功能强大的在线语音合成解决方案。
Speaking AI
Speaking AI是先进的AI语音合成平台,提供创新文本转语音和声音复制技术。平台能生成自然情感的语音,实现零样本声音克隆,用户可在10秒内完成个人声音的录制和克隆。致力于负责任开发生成式语音AI,Speaking AI还建立了活跃的用户社区,共同推动AI技术发展,为人类带来更多益处。
SIREN
该平台集成多种音频AI技术,提供语音转文字、音频笔记、文字转语音、视频配音和直播字幕等服务。支持120多种语言和多种音频格式,具备可视化和摘要功能。平台提供420多种AI语音风格,覆盖100多种语言的文本转语音服务。用户可轻松实现内容国际化,无需编码即可处理各类音频任务。适用于教育培训、媒体制作、客户服务等多个领域,显著提升工作效率和内容质量。
Voicemaker
Voicemaker® 是一款使用AI技术优化的先进文本到语音转换工具,支持多种语言和声音选项,确保自然流畅的听觉体验。用户可以自定义语速、音调和语音效果,广泛应用于有声内容制作与教育领域。该平台提供多样的付费计划,并受到全球多个知名品牌的信赖和使用。