mustango

基于文本的智能音乐生成系统

Mustango 文本生成音乐多模态大语言模型 MusicBench数据集可控音乐生成 Github 开源项目

Mustango是一个多模态大语言模型，专注于可控音乐生成。该模型结合潜在扩散模型、Flan-T5和音乐特征，能够将文本提示转化为高质量音乐。通过MusicBench数据集训练，Mustango在音乐匹配度、和弦匹配和节奏稳定性等方面表现出色。这一开源项目为音乐创作和研究提供了新的可能性。

访问官网

Github

Huggingface

介绍相关项目

Melodio AI - 个性化AI音乐生成和实时编辑平台

AI工具AI生成音乐Melodio AI个性化音乐音乐可视化音乐流媒体

Melodio AI是一款创新的AI音乐创作工具，提供个性化音乐体验。该平台根据心情和场景实时生成无尽音乐流，支持即时编辑修改，打造个性化播放列表。特色功能包括动态音乐可视化、快速高质量音乐创作和免版权背景音乐内容。适用于视频制作、直播、工作、游戏和放松等多种场景，为各种环境营造理想音乐氛围。无论是需要专业音频还是日常聆听，Melodio AI都能满足用户的多样化音乐需求。

stable-audio-metrics - 音频生成模型评估指标集合

GPU支持Githubstable-audio-metrics开源项目数据结构音频指标音频生成模型评估

stable-audio-metrics是一个评估音乐和音频生成模型的开源指标集合。它包含基于Openl3的Fréchet距离、基于PaSST的Kullback-Leibler散度和基于CLAP-LAION的CLAP分数。该项目针对长形式全频带立体声生成进行了优化，支持可变长度输入，并提供了详细文档和示例。适用于评估MusicCaps、AudioCaps和Song Describer等数据集的音频生成质量。

Songburst - 智能音乐创作平台：把文字变成原创歌曲

AI工具AI音乐生成Songburst人工智能应用程序音乐创作

Songburst是一款智能音乐创作工具，可将文字描述转化为原创音乐。适用于视频、播客等在线内容制作，支持生成混音样本和导出到Spotify、Apple Music。平台提供无限下载，支持wav和mp3格式，并有提示词增强功能。Songburst为创作者提供了便捷的方式来制作独特音乐内容。

model - 高效文本生成的突破：快速模型训练与推理

Apache许可证GithubHuggingfaceLLAMAUnsloth开源项目文本生成推理模型模型训练

该模型使用Unsloth和Huggingface的TRL库显著加速了训练过程，实现了高效文本生成。由keivenlombo开发，基于Apache-2.0许可，此模型为大规模语言模型的实施提供了一种便捷且准确的解决方案。

Make-An-Audio - 将文本转换为高保真音频的开源扩散模型

GithubMake-An-Audio人工智能开源项目扩散模型文本转音频音频生成

Make-An-Audio是一个开源的文本到音频生成项目，基于条件扩散概率模型。该项目能够从文本等多种模态生成高保真音频，支持文本到音频、音频到音频等多种任务。项目提供了预训练模型和简单的命令行操作，方便用户生成自定义音频。此外，项目还包含了详细的训练和评估流程，以及与其他模型的性能比较。

awesome-music - 开源音乐工具和资源精选

GithubMIDI工具乐谱制作开源项目音乐工具音乐编程音频编辑

Awesome Music是一个精心分类的音乐相关开源资源集合，涵盖音频编辑、音频库、MIDI工具、乐谱制作和音乐编程等领域。该项目汇集了音乐创作和理论学习的各类工具，为音乐爱好者、专业人士和开发者提供丰富资源。内容持续更新，欢迎贡献新的优质开源项目。

AudioGPT - 多功能音频生成与理解平台，支持语音、音乐、音效及虚拟人对话

AudioGPTGithub开源项目语音增强语音识别音乐生成音频合成

AudioGPT 是一个多功能音频生成与理解平台，具备语音合成、语音识别、语音分离、风格迁移、声音检测、声音提取、文本到音频转换等功能，还支持音乐生成与虚拟人对话。集成了 FastSpeech、whisper、GeneFace 等多个领先的基础模型，AudioGPT 为开发者提供强大的开源工具和预训练模型，支持多种音频相关任务，不断扩展其功能和应用场景。此平台适合音频处理、自然语言处理及多模态研究的需求。

Suno-API - 开源音乐生成接口助力AI创作

FastAPIGithubPythontoken维护开源项目异步非官方API

Suno-API是基于Python和FastAPI开发的非官方项目，提供生成歌曲和歌词的API接口。该项目特点包括自动令牌维护、异步处理和简洁代码，便于二次开发。开发者可通过简单配置快速部署，搭建音乐生成API服务。

SongBot - 智能创作个性化音乐视频的创新平台

AI工具AI歌词生成AI音乐应用SongBot.ai个性化音乐视频文本转语音

SongBot是一款革新性AI音乐创作应用，集成先进人工智能技术。它能智能生成歌词，提供业界首创的文本转语音功能，支持多种声音风格，可与内置音乐曲目混合。用户轻松创作个性化音乐视频，享受直观界面和丰富背景视频选项。应用注重隐私保护，所有创作内容均存储于本地设备。SongBot让智能歌词生成和个性化音乐视频制作变得简单有趣，是音乐爱好者的理想选择。

MSMC-TTS - 多阶段多码本神经网络文本转语音系统

GithubMSMC-TTSVQ-VAE多阶段多码本开源项目神经网络TTS语音合成

MSMC-TTS是一个高性能神经网络文本转语音系统，基于多阶段多码本VQ-VAE技术。该系统集成了MSMC-VQ-VAE和HifiGAN，通过MSMC-VQ-GAN自编码器优化，并采用多阶段预测器作为声学模型。MSMC-TTS在标准和低资源语言的语音合成中表现优异，能够生成紧凑的语音表示和高质量的语音输出。项目提供了详细的训练、测试和推理指南，并包含针对MSMC-VQ-GAN和多阶段预测器的优化建议。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号