#音频生成

MelNet学习资料汇总 - 频域音频生成模型

2 个月前

MelNet 音频生成 Python 条件生成 TTS合成 Github 开源项目

2 个月前

tts-generation-webui学习资料汇总 - 一站式文本转语音和语音克隆工具

2 个月前

TTS Generation WebUI 音频生成语音克隆音频转换软件更新 Github 开源项目

2 个月前

Tango: 革命性的文本到音频生成技术

3 个月前

Tango 文本转音频生成潜在扩散模型人工智能音频生成 Github 开源项目

3 个月前

Pandrator: 一个强大的多语言文本转语音工具

3 个月前

Pandrator 语音合成文本处理音频生成语音克隆 Github 开源项目

3 个月前

TTS-Cube：基于循环神经网络的端到端语音合成系统

3 个月前

TTS-Cube 语音合成神经网络端到端系统音频生成 Github 开源项目

3 个月前

Catch-A-Waveform: 从单一短音频样本中学习生成音频的革命性技术

3 个月前

Catch-A-Waveform 音频生成深度学习神经网络音频处理 Github 开源项目

3 个月前

NeuralSVB: 一种创新的神经网络歌声美化技术

3 个月前

NeuralSVB AI歌声美化深度学习语音处理音频生成 Github 开源项目

3 个月前

Make-An-Audio: 突破性的文本到音频生成技术

3 个月前

Make-An-Audio 文本转音频扩散模型音频生成人工智能 Github 开源项目

3 个月前

SoundStorm-PyTorch: 高效并行音频生成的开源实现

3 个月前

SoundStorm 音频生成 Pytorch 深度学习人工智能 Github 开源项目

3 个月前

elevenlabslib: 全面的Python Wrapper for ElevenLabs API

3 个月前

elevenlabslib API封装语音合成 Python库音频生成 Github 开源项目

3 个月前

相关项目

VEED

VEED.IO为全球用户提供高效的文本到语音转换，支持多种语言和真实声音选项，适用于内容制作及广告业务，提升视频生产的效率与质量。

AI 画外音生成器

AI 画外音生成器提供高质量的文本到语音转换服务，覆盖400+自然声音和80种语言，适合高效生产各类视频。平台免费、操作简单，适于社交媒体、教育和企业用途，增强视听内容的互动性和可访问性。

MetaVoice

MetaVoice打造可定制、对话式的语音AI，有效处理复杂商务电话，助力企业高效整合现有系统，扩展通信规模。

Listnr AI

Listnr AI不仅提供1000+种声音和支持142+语言，还支持API接入和定制化功能，适应更广泛的应用需求。用户可以轻松集成到各种系统中，提升内容互动性及用户体验。适合广告、教育、产品演示、有声书和YouTube视频等多种应用场景。

Voicemod

Voicemod — 完全免费的AI实时变声软件！立即下载，体验从名人声音模仿到多样化声调的各种真实效果。专为PC用户设计，广泛应用于娱乐、广播和通讯等行业。通过高级算法，实现多语言环境下的类人声音转换，为用户带来前所未有的音频体验。

Notta

Notta通过AI技术自动转录和总结会议、访谈或录音内容，生成可搜索的文本。该平台支持58种语言的音视频实时转录和翻译，帮助节省时间并提升效率。开始免费使用，适合教育、媒体、销售等多种应用场景。

海绵音乐

海绵音乐支持输入歌词或灵感句，快速生成多风格音乐作品。平台提供多样化定制功能，以方便用户进行个性化音乐创作。

Udio

Udio 提供AI音乐生成服务，允许用户通过文字描述创作个性化音乐。该平台支持音乐制作的全流程，适用于专业制作人及音乐爱好者。Udio还设有社区，用户可以在此分享音乐及发现新作品。

diffusers

🤗 Diffusers 是一个生成图像、音频和3D结构的预训练扩散模型库，提供易用的推理管道和可定制的模型组件。它支持多种调度器和预训练模型，适用于多种任务和应用场景，并兼容 PyTorch 和 Flax 框架。用户可以简单生成内容或训练自定义扩散模型。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com