Project Icon

GuitarSet

专为吉他转录研究设计的音频和标注数据集

GuitarSet是一个为吉他转录研究设计的数据集。它包含音频样本和标注信息,如MIDI数据和时间戳。研究人员可通过官方网站下载数据集,并使用提供的函数读取和可视化标注。项目提供示例和演示代码,便于使用。GuitarSet适用于吉他音乐分析、自动转录和音乐信息检索等研究领域。

MIDIApps - 开源应用监控和管理 Mac 系统 MIDI 数据
CoreMIDIGithubMIDI MonitorMac OS XSysEx Librarian开源项目
MIDIApps 是一个开源项目,包含 MIDI Monitor 和 SysEx Librarian 两个 Mac 应用。这些工具可监控 MIDI 数据流,发送和接收系统专有消息。项目基于 Swift 和 Cocoa 开发,提供 CoreMIDI 处理框架和系统 MIDI 数据监视驱动。MIDIApps 为 MIDI 开发者和音乐制作人提供实用功能。
awesome-diarization - 说话者分离和语音分割的数据集
FunASRGithubMiniVoxSIDEKITSpeaker DiarizationSpeechBrain开源项目
提供全面的说话者分离资源,包括最新的论文、软件工具、数据集和学习材料,旨在推进语音分割和说话者识别技术的发展。这些资源汇集了深度学习的最新进展及其实际应用,帮助研究人员和开发者找到最有效的解决方案。
python-audio-separator - Python音频分离工具 轻松提取人声和乐器声轨
Audio SeparatorGithub人声分离开源项目模型推理音轨分离音频分离
Audio Separator是一个开源的Python音频分离工具,能将音频文件分离为人声、乐器等多个音轨。支持WAV、MP3等常见格式,提供命令行和Python API接口。采用MDX-Net、VR Arch等AI模型,支持GPU加速,可快速分离高质量音轨。适用于卡拉OK制作和音乐后期处理等场景。
hatespeechdata - 多语言仇恨言论数据集汇总与研究资源
Github仇恨言论在线辱骂多语言开源项目数据集社交媒体
该项目汇集了涵盖多种语言的仇恨言论、在线辱骂和攻击性语言数据集。收录内容包括来自不同平台的文本、图像和音频数据。项目旨在为自然语言处理系统提供训练资源,以提升有害内容检测能力。此外,项目还提供关键词列表和贡献指南,为研究人员和开发者改进在线内容审核和仇恨言论检测技术提供支持。
Music AI - 先进的音频AI平台助力音乐和声音技术创新
AI工具AI音频模型开发工具隐私安全音乐处理音频智能平台
Music AI平台为音频和音乐领域提供先进的AI模型和工具。该平台集成了50多个AI模块,支持自定义工作流,并提供用户友好的界面和API。Music AI注重数据安全和隐私保护,将AI视为创意过程的辅助工具。平台已处理超10亿分钟音频,日均处理210万分钟,服务4800万用户,成为音频技术创新的重要基础设施。
datasets - Unsplash开放数据集 海量图片与搜索数据资源
GithubUnsplash Dataset图像库图片数据集开源数据开源项目数据研究
Unsplash Dataset是一个开放的图片和数据资源库,汇集了全球35万多名摄影师的贡献。它包括Lite和Full两个版本,分别提供2.5万张自然主题图片和540万张高质量图片。这些数据集还包含大量关键词和搜索数据,为图像研究和机器学习提供了丰富素材。研究人员可免费用于非商业性项目,探索图像、关键词和搜索行为之间的关联。
LibriTTS-P - 为语音合成和风格分析提供丰富注释的语料库
GithubLibriTTS-P开源项目语音合成语音控制语音数据集说话风格
LibriTTS-P是一个基于LibriTTS-R的语音语料库,为文本转语音和风格描述任务提供语音风格和说话者特征提示。该语料库结合人工和合成标注方法,为LibriTTS-R的所有说话者提供多样化的提示注释。研究表明,使用LibriTTS-P训练的TTS模型在自然度方面表现更佳,在风格描述任务中的准确词数是传统数据集的2.5倍。这一资源可能会促进语音合成和风格分析领域的研究进展。
TME Studio - 全能的在线音乐创作和深度音乐分析工具
AI工具AI音频MIR计算MusE智能曲谱热门辅助写词音乐分离音频生成
TME Studio,腾讯音乐娱乐推出的先进在线音乐创作平台,利用AI技术,提供音乐分离、智能MIR分析、创造性的辅助写词及曲谱智能化等多功能工具,旨在助力音乐创作者轻松实现创意概念的高效转换。
Amphion - Amphion开源工具集,支持音频、音乐、语音生成及多任务评估
AmphionGithub声码器开源项目文本到语音语音生成音乐生成
Amphion是一个开源的音频、音乐和语音生成工具集,旨在支持可重复的研究并帮助研究人员和工程师入门。提供TTS、SVS、VC、SVC、TTA等生成任务,集成高级语音编码器和评估指标,如F0建模、能量建模、语音相似度测评。功能包括模型可视化、数据集建设及文本到音频/音乐的实现,推动音频生成技术应用。
MERT-v1-330M - 先进音乐理解模型用于多任务音频特征提取和识别
GithubHuggingfaceMERT开源项目机器学习模型深度学习音乐处理音频预训练
MERT-v1-330M是一种基于MLM范式的音乐理解模型,采用24层Transformer架构,拥有330M参数。该模型经过16万小时音频数据训练,支持24kHz采样率输入,每秒生成75个特征向量。通过encodec的8个码本和批内噪声混合等技术,MERT-v1-330M在下游任务中表现出色。除了音乐特征提取,它还可用于音乐生成,是当前领先的音乐音频预训练模型之一。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号