Logo

#语音转换

RVC-WebUI 学习资源汇总 - AI语音转换项目一键部署

1 个月前
Cover of RVC-WebUI 学习资源汇总 - AI语音转换项目一键部署

so-vits-svc-fork学习资料汇总 - 支持实时转换的AI变声工具

1 个月前
Cover of so-vits-svc-fork学习资料汇总 - 支持实时转换的AI变声工具

Crow Translate: 一款功能强大的轻量级翻译工具

2 个月前
Cover of Crow Translate: 一款功能强大的轻量级翻译工具

Diff-HierVC: 一种基于扩散模型的分层语音转换系统

2 个月前
Cover of Diff-HierVC: 一种基于扩散模型的分层语音转换系统

Retrieval-based Voice Conversion: 语音转换的革命性技术

2 个月前
Cover of Retrieval-based Voice Conversion: 语音转换的革命性技术

YourTTS学习资料汇总 - 零样本多说话人TTS和语音转换模型

1 个月前
Cover of YourTTS学习资料汇总 - 零样本多说话人TTS和语音转换模型

Applio学习资料汇总 - 简单高质量的AI语音转换工具

1 个月前
Cover of Applio学习资料汇总 - 简单高质量的AI语音转换工具

Diffusion-SVC: 基于扩散概率模型的高质量语音转换系统

2 个月前
Cover of Diffusion-SVC: 基于扩散概率模型的高质量语音转换系统

RVC-TTS-Pipeline: 提升语音合成质量的创新解决方案

2 个月前
Cover of RVC-TTS-Pipeline: 提升语音合成质量的创新解决方案

TurnVoice: 革新视频声音转换和翻译的开源工具

2 个月前
Cover of TurnVoice: 革新视频声音转换和翻译的开源工具

相关项目

Project Cover
YourTTS
YourTTS项目开发了先进的多语言零样本多发音人文本转语音及语音转换技术,适用于少量语音样本。该技术支持多种语言,确保高语音相似度和优质输出。基于改良的VITS模型,此技术在多语训练中展现出色表现,获得业界肯定。
Project Cover
so-vits-svc-fork
so-vits-svc-fork项目基于so-vits-svc分支进行改进,支持实时声音转换并优化了用户界面。它不仅兼容旧版模型,同时通过高效的训练流程和简捷的pip安装过程提供了良好的用户体验。项目集成了QuickVC和ContentVec技术,显著提升音调估计准确性,并支持通过图形界面或命令行实时进行语音转换,同时支持自动下载预训练模型。
Project Cover
rvc-webui
RVC-WebUI提供了一个多功能的音声转换界面,兼容Windows和Mac操作系统,简便的启动方式适合各类用户。详细的安装指南和系统需求帮助用户轻松设置,无障碍使用。创新技术使得音频转换更加高效,提升了用户的音频交互体验。
Project Cover
Mangio-RVC-Fork
Mangio-RVC-Fork是一个基于VITS的开源语音转换框架,具有top1检索功能。它提供CLI和Web界面,支持多种F0估计方法,包括混合F0算法。该工具可快速训练,使用少量数据也能获得良好效果。支持模型融合改变音色,以及UVR5模型分离人声和伴奏。项目持续开发中,计划添加更多功能优化用户体验。
Project Cover
TurnVoice
TurnVoice是一款功能丰富的命令行工具,专注于视频声音转换和多语种翻译。该工具集成了多种语音合成引擎,包括免费的Coqui TTS在内的多个选项。它允许用户精确控制渲染过程,提供句子文本、时间和语音的自定义选项。TurnVoice还具备保留原始背景音频和本地视频处理的能力,适用于各类视频创作需求。
Project Cover
rvc-tts-pipeline
RVC-TTS-Pipeline是一个开源语音合成项目,结合文本到语音(TTS)和RVC模型技术,旨在生成接近原始说话者声音的语音输出。该项目将TTS生成的音频转换为RVC模型的训练权重,提高了语音还原质量。项目提供简单的安装步骤和API,方便用户进行语音合成。目前仍处于开发阶段,存在一些问题待解决。
Project Cover
Retrieval-based-Voice-Conversion-WebUI
Retrieval-based-Voice-Conversion-WebUI是一个基于VITS的开源变声框架。该项目支持实时变声和快速模型训练,只需少量数据即可生成高质量变声模型。框架提供多语言界面和跨平台支持,并配有详细教程。项目采用检索式方法替换输入源特征,有效防止音色泄漏。支持在中低配置GPU上快速训练,并可通过模型融合调整音色。WebUI界面简洁直观,内置UVR5模型便于人声分离。采用InterSpeech2023-RMVPE算法提取音高,性能出色且资源占用低。该框架支持多种硬件加速,适用于不同用户需求,是一个功能丰富且操作简便的AI变声工具。
Project Cover
whisper-vits-svc
whisper-vits-svc是一个开源的端到端歌声转换项目,基于VITS模型架构。该项目支持多说话人转换,可混合创建新音色,并能处理带轻伴奏的声音。它集成了Whisper、BigVGAN等技术,提高了抗噪性和音质。项目面向深度学习入门者,需要Python和PyTorch基础。目前不支持实时转换,训练需要至少6GB显存。
Project Cover
Applio
Applio项目提供高效、优质的语音转换解决方案。基于增强版RVC模型,Applio采用先进的语音处理技术,实现卓越的语音转换效果。用户可通过详细文档、丰富插件和友好界面,轻松安装和使用Applio。支持多平台操作和30多种语言,适用于各种商业用途,确保广泛的应用场景和良好的用户体验。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号