Logo

#音频生成

MelNet学习资料汇总 - 频域音频生成模型

1 个月前
Cover of MelNet学习资料汇总 - 频域音频生成模型

Tango: 革命性的文本到音频生成技术

2 个月前
Cover of Tango: 革命性的文本到音频生成技术

TTS-Cube:基于循环神经网络的端到端语音合成系统

2 个月前
Cover of TTS-Cube:基于循环神经网络的端到端语音合成系统

NeuralSVB: 一种创新的神经网络歌声美化技术

2 个月前
Cover of NeuralSVB: 一种创新的神经网络歌声美化技术

SoundStorm-PyTorch: 高效并行音频生成的开源实现

2 个月前
Cover of SoundStorm-PyTorch: 高效并行音频生成的开源实现

tts-generation-webui学习资料汇总 - 一站式文本转语音和语音克隆工具

1 个月前
Cover of tts-generation-webui学习资料汇总 - 一站式文本转语音和语音克隆工具

Pandrator: 一个强大的多语言文本转语音工具

2 个月前
Cover of Pandrator: 一个强大的多语言文本转语音工具

Catch-A-Waveform: 从单一短音频样本中学习生成音频的革命性技术

2 个月前
Cover of Catch-A-Waveform: 从单一短音频样本中学习生成音频的革命性技术

Make-An-Audio: 突破性的文本到音频生成技术

2 个月前
Cover of Make-An-Audio: 突破性的文本到音频生成技术

elevenlabslib: 全面的Python Wrapper for ElevenLabs API

2 个月前
Cover of elevenlabslib: 全面的Python Wrapper for ElevenLabs API

相关项目

Project Cover
VEED
VEED.IO为全球用户提供高效的文本到语音转换,支持多种语言和真实声音选项,适用于内容制作及广告业务,提升视频生产的效率与质量。
Project Cover
AI 画外音生成器
AI 画外音生成器提供高质量的文本到语音转换服务,覆盖400+自然声音和80种语言,适合高效生产各类视频。平台免费、操作简单,适于社交媒体、教育和企业用途,增强视听内容的互动性和可访问性。
Project Cover
MetaVoice
MetaVoice打造可定制、对话式的语音AI,有效处理复杂商务电话,助力企业高效整合现有系统,扩展通信规模。
Project Cover
Listnr AI
Listnr AI不仅提供1000+种声音和支持142+语言,还支持API接入和定制化功能,适应更广泛的应用需求。用户可以轻松集成到各种系统中,提升内容互动性及用户体验。适合广告、教育、产品演示、有声书和YouTube视频等多种应用场景。
Project Cover
Voicemod
Voicemod — 完全免费的AI实时变声软件!立即下载,体验从名人声音模仿到多样化声调的各种真实效果。专为PC用户设计,广泛应用于娱乐、广播和通讯等行业。通过高级算法,实现多语言环境下的类人声音转换,为用户带来前所未有的音频体验。
Project Cover
Notta
Notta通过AI技术自动转录和总结会议、访谈或录音内容,生成可搜索的文本。该平台支持58种语言的音视频实时转录和翻译,帮助节省时间并提升效率。开始免费使用,适合教育、媒体、销售等多种应用场景。
Project Cover
海绵音乐
海绵音乐支持输入歌词或灵感句,快速生成多风格音乐作品。平台提供多样化定制功能,以方便用户进行个性化音乐创作。
Project Cover
Udio
Udio 提供AI音乐生成服务,允许用户通过文字描述创作个性化音乐。该平台支持音乐制作的全流程,适用于专业制作人及音乐爱好者。Udio还设有社区,用户可以在此分享音乐及发现新作品。
Project Cover
diffusers
🤗 Diffusers 是一个生成图像、音频和3D结构的预训练扩散模型库,提供易用的推理管道和可定制的模型组件。它支持多种调度器和预训练模型,适用于多种任务和应用场景,并兼容 PyTorch 和 Flax 框架。用户可以简单生成内容或训练自定义扩散模型。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号