Project Icon

GuitarSet

专为吉他转录研究设计的音频和标注数据集

GuitarSet是一个为吉他转录研究设计的数据集。它包含音频样本和标注信息,如MIDI数据和时间戳。研究人员可通过官方网站下载数据集,并使用提供的函数读取和可视化标注。项目提供示例和演示代码,便于使用。GuitarSet适用于吉他音乐分析、自动转录和音乐信息检索等研究领域。

musegan - 多轨乐器生成与伴奏的AI工具
GANGithubMuseGAN多轨道音乐开源项目深度学习音乐生成
MuseGAN项目致力于生成多轨乐器的复音音乐。通过使用Lakh Pianoroll Dataset进行训练,该模型可以从零开始生成音乐或为用户提供的轨道进行伴奏。最新版本使用3D卷积层处理时间结构,尽管网络规模较小,但可控性有所下降。项目支持PyTorch版本,并提供多个shell脚本用于实验管理和数据收集。生成样本存储为.npy、.png和.npz格式,可转换为MIDI文件进一步使用。
speech-dataset-generator - 多语言语音数据集生成与处理工具
GithubSpeech Dataset Generator多语言支持开源项目数据集生成语音识别音频处理
speech-dataset-generator是一款开源的多语言语音数据集处理工具。它支持从多种来源获取音频,包括YouTube、LibriVox和TED Talks等。该工具提供音频转录、质量增强、静音移除、性别识别、多说话者检测等功能,还能计算语速指标。通过集成多种音频增强器,speech-dataset-generator为文本转语音和语音转文本模型的训练提供了全面的数据准备解决方案。
game-datasets - 全面收录游戏数据集与AI工具资源
APIGithub人工智能开源游戏开源项目数据挖掘游戏数据集
game-datasets项目汇集了大量游戏相关的数据集、API和AI工具资源。涵盖从经典游戏到现代电竞的多个领域,提供了丰富的数据挖掘和AI开发素材。项目持续更新,为游戏AI和数据科学研究提供全面参考。收录内容包括游戏API、AI竞赛平台、开源游戏引擎、相关书籍等,是游戏研究和开发的重要资源库。
dataspeech - 简化语音数据集标注与处理的实用工具
Data-SpeechGithub开源项目数据标注语音AI语音数据集音频转换
Data-Speech是一套用于语音数据集标注的实用脚本工具。它提供简洁代码库,支持音频转换和注释,有助于语音AI模型开发。该工具能重现研究论文中的注释方法,使用自然语言描述标注说话者特征。Data-Speech可处理LibriTTS-R和MLS等数据集,并为Parler-TTS库提供支持。它提供从数据集注释、特征映射到自然语言描述生成的完整工作流程。
Audio Jam - 音乐人的AI扒谱与练习工具
AI工具AI扒谱软件Audio Jam乐器伴奏分离伴奏提取和弦&音调分析
Audio Jam是一款为音乐人设计的AI软件,具备和弦与音调分析、乐器分离、变速播放等功能,支持多个平台与Web应用,帮助提升扒谱及练习效率,提供详细的音乐分析与音轨管理。
google-research - 多项目代码和数据集共享平台
GitHubGithubGoogle Research代码库开源项目数据集许可证
Google Research提供多种项目的代码和数据集,数据集在CC BY 4.0国际许可下发布,源码文件在Apache 2.0许可下发布。用户可通过GitHub编辑器下载所需子目录,并进行浅克隆以提交拉取请求。库内容持续更新,最新更新时间为2023年。
SOME - 快速精准的歌声转MIDI工具 支持自定义模型训练
AI音乐GithubMIDI提取器SOME开源项目歌声转MIDI音乐技术
SOME是一个开源的歌声转MIDI序列工具,专为音乐制作和AI歌声合成设计。它具有处理速度快、资源需求低的特点,支持自定义训练。SOME能生成非整数MIDI值,适用于DiffSinger的方差标注。通过预训练模型,SOME可用于生成MIDI文件或处理DiffSinger数据集。该项目遵循MIT许可证,为相关领域提供了高效的解决方案。
MusicGen AI - AI音乐创作工具
AI工具AI音乐生成MetaMusicGen深度学习音频处理
MusicGen是Meta开发的开源AI音乐生成工具,采用单一语言模型技术。它可基于文本、旋律或音频输入创作多样化音乐。支持旋律调节、文本条件生成等多种模式,训练数据涵盖20,000小时授权音乐。用户可通过Web界面使用MusicGen,灵活调整参数控制音乐生成。该工具为音乐创作领域带来新的可能性,推动AI音乐技术的发展。
stable-audio-metrics - 音频生成模型评估指标集合
GPU支持Githubstable-audio-metrics开源项目数据结构音频指标音频生成模型评估
stable-audio-metrics是一个评估音乐和音频生成模型的开源指标集合。它包含基于Openl3的Fréchet距离、基于PaSST的Kullback-Leibler散度和基于CLAP-LAION的CLAP分数。该项目针对长形式全频带立体声生成进行了优化,支持可变长度输入,并提供了详细文档和示例。适用于评估MusicCaps、AudioCaps和Song Describer等数据集的音频生成质量。
genmusic_demo_list - 音乐生成技术在线演示网站汇总
AI音频技术Github开源项目文本到音频深度学习音乐合成音乐生成
项目整理了音乐生成研究的多个在线演示网站,包括文本生成音乐、音频合成、伴奏制作等领域。演示涵盖扩散模型、Transformer和GAN等前沿技术,展示了AI音乐生成的最新进展。这些演示可帮助研究人员和音乐爱好者直观了解不同模型的音乐生成能力。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号