#音频生成

深入解析AudioCraft: Meta开源的音频生成AI框架

3 个月前
Cover of 深入解析AudioCraft: Meta开源的音频生成AI框架

SoundStorm: 谷歌新一代高效并行音频生成模型

3 个月前
Cover of SoundStorm: 谷歌新一代高效并行音频生成模型

Bark: 革命性的文本到音频生成模型

3 个月前
Cover of Bark: 革命性的文本到音频生成模型

AudioLM-PyTorch: 革命性的音频生成语言模型

3 个月前
Cover of AudioLM-PyTorch: 革命性的音频生成语言模型

MelNet: 一种创新的频域音频生成模型

3 个月前
Cover of MelNet: 一种创新的频域音频生成模型

TTS Generation WebUI: 一站式文本转语音解决方案

3 个月前
Cover of TTS Generation WebUI: 一站式文本转语音解决方案

Diffusers: 最先进的扩散模型库

3 个月前
Cover of Diffusers: 最先进的扩散模型库
相关项目
Project Cover

VEED

VEED.IO为全球用户提供高效的文本到语音转换,支持多种语言和真实声音选项,适用于内容制作及广告业务,提升视频生产的效率与质量。

Project Cover

AI 画外音生成器

AI 画外音生成器提供高质量的文本到语音转换服务,覆盖400+自然声音和80种语言,适合高效生产各类视频。平台免费、操作简单,适于社交媒体、教育和企业用途,增强视听内容的互动性和可访问性。

Project Cover

MetaVoice

MetaVoice打造可定制、对话式的语音AI,有效处理复杂商务电话,助力企业高效整合现有系统,扩展通信规模。

Project Cover

Listnr AI

Listnr AI不仅提供1000+种声音和支持142+语言,还支持API接入和定制化功能,适应更广泛的应用需求。用户可以轻松集成到各种系统中,提升内容互动性及用户体验。适合广告、教育、产品演示、有声书和YouTube视频等多种应用场景。

Project Cover

Voicemod

Voicemod — 完全免费的AI实时变声软件!立即下载,体验从名人声音模仿到多样化声调的各种真实效果。专为PC用户设计,广泛应用于娱乐、广播和通讯等行业。通过高级算法,实现多语言环境下的类人声音转换,为用户带来前所未有的音频体验。

Project Cover

Notta

Notta通过AI技术自动转录和总结会议、访谈或录音内容,生成可搜索的文本。该平台支持58种语言的音视频实时转录和翻译,帮助节省时间并提升效率。开始免费使用,适合教育、媒体、销售等多种应用场景。

Project Cover

海绵音乐

海绵音乐支持输入歌词或灵感句,快速生成多风格音乐作品。平台提供多样化定制功能,以方便用户进行个性化音乐创作。

Project Cover

Udio

Udio 提供AI音乐生成服务,允许用户通过文字描述创作个性化音乐。该平台支持音乐制作的全流程,适用于专业制作人及音乐爱好者。Udio还设有社区,用户可以在此分享音乐及发现新作品。

Project Cover

diffusers

🤗 Diffusers 是一个生成图像、音频和3D结构的预训练扩散模型库,提供易用的推理管道和可定制的模型组件。它支持多种调度器和预训练模型,适用于多种任务和应用场景,并兼容 PyTorch 和 Flax 框架。用户可以简单生成内容或训练自定义扩散模型。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号