#音乐处理
SplitSong
SplitSong运用先进的AI音乐分离技术,将完整歌曲精准分离为鼓、乐器、贝斯和人声等独立音轨。支持直接上传音乐文件或通过YouTube链接导入,实现在线音轨提取,操作简便快捷。这一创新工具不仅为音乐爱好者提供了深入探索音乐结构的机会,也为专业制作人和DJ的混音创作开启了新的可能性。例如,DJ可以轻松提取歌曲的贝斯线进行重新编排。SplitSong简化了音频处理流程,为音乐学习和创作带来全新体验,是您探索音乐世界的得力助手。
Polymath
Polymath是一款基于机器学习的音乐库转换工具,可将任意音乐库转化为音乐制作样本库。该工具能自动分离歌曲声部,统一量化节奏和拍子,分析音乐结构和调性,并完成音频到MIDI的转换。Polymath为音乐制作人、DJ和音频开发者提供了可搜索的样本库,简化了音乐创作流程。使用者可以方便地组合不同歌曲元素,创作新作品或制作DJ混音。对于机器学习开发者,Polymath也简化了大型音乐数据集的创建过程。
Music AI
Music AI平台为音频和音乐领域提供先进的AI模型和工具。该平台集成了50多个AI模块,支持自定义工作流,并提供用户友好的界面和API。Music AI注重数据安全和隐私保护,将AI视为创意过程的辅助工具。平台已处理超10亿分钟音频,日均处理210万分钟,服务4800万用户,成为音频技术创新的重要基础设施。
SLAM-LLM
SLAM-LLM是一款开源深度学习工具包,为多模态大语言模型(MLLM)训练而设计。它专注于语音、语言、音频和音乐处理,提供详细训练方案和高性能推理检查点。支持自动语音识别、文本转语音等多种任务,具备易扩展性、混合精度训练和多GPU训练等特点,适合研究人员和开发者使用。
librosa
librosa是一个开源的Python音频分析库,用于音乐和声音处理。它提供音频加载、特征提取、频谱分析等功能,支持多种音频格式。librosa适用于音乐信息检索、音频特效制作和声学研究等领域。该库集成了信号处理算法,并提供文档和示例。librosa适合各级音频处理开发者使用。
MERT-v1-330M
MERT-v1-330M是一种基于MLM范式的音乐理解模型,采用24层Transformer架构,拥有330M参数。该模型经过16万小时音频数据训练,支持24kHz采样率输入,每秒生成75个特征向量。通过encodec的8个码本和批内噪声混合等技术,MERT-v1-330M在下游任务中表现出色。除了音乐特征提取,它还可用于音乐生成,是当前领先的音乐音频预训练模型之一。