#音频生成

深入解析AudioCraft: Meta开源的音频生成AI框架

3 个月前

AudioCraft 音频生成深度学习 PyTorch AI模型 Github 开源项目

3 个月前

SoundStorm: 谷歌新一代高效并行音频生成模型

3 个月前

SoundStorm 音频生成深度学习语音合成并行处理 Github 开源项目

3 个月前

Bark: 革命性的文本到音频生成模型

3 个月前

Bark 文本转语音 AI模型多语言音频生成 Github 开源项目

3 个月前

AudioLM-PyTorch: 革命性的音频生成语言模型

3 个月前

AudioLM 音频生成 Pytorch SoundStream EnCodec Github 开源项目

3 个月前

MelNet: 一种创新的频域音频生成模型

3 个月前

MelNet 音频生成 Python 条件生成 TTS合成 Github 开源项目

3 个月前

TTS Generation WebUI: 一站式文本转语音解决方案

3 个月前

TTS Generation WebUI 音频生成语音克隆音频转换软件更新 Github 开源项目

3 个月前

Diffusers: 最先进的扩散模型库

3 个月前

HuggingFace Diffusers 预训练扩散模型图像生成音频生成 Github 开源项目

3 个月前

相关项目

VEED

VEED.IO为全球用户提供高效的文本到语音转换，支持多种语言和真实声音选项，适用于内容制作及广告业务，提升视频生产的效率与质量。

AI 画外音生成器

AI 画外音生成器提供高质量的文本到语音转换服务，覆盖400+自然声音和80种语言，适合高效生产各类视频。平台免费、操作简单，适于社交媒体、教育和企业用途，增强视听内容的互动性和可访问性。

MetaVoice

MetaVoice打造可定制、对话式的语音AI，有效处理复杂商务电话，助力企业高效整合现有系统，扩展通信规模。

Listnr AI

Listnr AI不仅提供1000+种声音和支持142+语言，还支持API接入和定制化功能，适应更广泛的应用需求。用户可以轻松集成到各种系统中，提升内容互动性及用户体验。适合广告、教育、产品演示、有声书和YouTube视频等多种应用场景。

Voicemod

Voicemod — 完全免费的AI实时变声软件！立即下载，体验从名人声音模仿到多样化声调的各种真实效果。专为PC用户设计，广泛应用于娱乐、广播和通讯等行业。通过高级算法，实现多语言环境下的类人声音转换，为用户带来前所未有的音频体验。

Notta

Notta通过AI技术自动转录和总结会议、访谈或录音内容，生成可搜索的文本。该平台支持58种语言的音视频实时转录和翻译，帮助节省时间并提升效率。开始免费使用，适合教育、媒体、销售等多种应用场景。

海绵音乐

海绵音乐支持输入歌词或灵感句，快速生成多风格音乐作品。平台提供多样化定制功能，以方便用户进行个性化音乐创作。

Udio

Udio 提供AI音乐生成服务，允许用户通过文字描述创作个性化音乐。该平台支持音乐制作的全流程，适用于专业制作人及音乐爱好者。Udio还设有社区，用户可以在此分享音乐及发现新作品。

diffusers

🤗 Diffusers 是一个生成图像、音频和3D结构的预训练扩散模型库，提供易用的推理管道和可定制的模型组件。它支持多种调度器和预训练模型，适用于多种任务和应用场景，并兼容 PyTorch 和 Flax 框架。用户可以简单生成内容或训练自定义扩散模型。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com