Project Icon

basic-pitch

高效轻量的自动音乐转录工具

Basic Pitch是一个开源的自动音乐转录(AMT)Python库,由Spotify音频智能实验室开发。这款轻量级音乐识别工具支持多音高和跨乐器转录,性能可与大型AMT系统媲美。它能将音频转换为包含音高弯曲的MIDI文件,适用于各种乐器,尤其擅长单一乐器转录。Basic Pitch提供命令行和程序化接口,支持MIDI、WAV和CSV等多种输出格式,便于集成到各种音乐处理工作流程中。

picard - 跨平台音频标签编辑应用 功能强大
GithubMusicBrainz Picard开源软件开源项目跨平台应用音乐元数据音频标签
MusicBrainz Picard是一款跨平台音频标签编辑应用,支持多种音频格式。它采用AcoustID音频指纹识别技术和专辑导向的标签方法,结合MusicBrainz数据库,实现精确音乐标记。该应用还提供CD查询、插件扩展、脚本语言和封面下载等功能,适合音乐爱好者整理音频文件。
FastTune - 多功能在线乐器调音与学习平台
AI工具吉他和弦在线调音器尤克里里节拍器
这是一个综合性在线音乐工具平台,为15种乐器提供精准调音功能,包括吉他和尤克里里等。平台能快速检测弦音音高和频率,简化调音过程。此外,还提供和弦学习、节拍器等功能,以及丰富的吉他学习资源。作为一站式在线调音器和音乐学习工具,适合各类音乐爱好者和学习者使用。凭借便捷、准确和多功能性,成为音乐人的得力助手。
audio-to-text-transcription - 自动化YouTube音频转文字解决方案
GithubYouTubepytubewhisper开源项目文本转录自动化
此开源项目通过从YouTube视频中自动下载音频并将其转换为文字,检测转录文本的语言,并将其保存为文本文件,简化了手动转录流程。用户只需输入YouTube视频URL即可完成自动化音频提取和转录。这款工具采用了先进的pytube和whisper库,保证了高质量的转录效果,适合需要快速且准确转录的场景,如研究、内容创作和可访问性提升。
Amphion - Amphion开源工具集,支持音频、音乐、语音生成及多任务评估
AmphionGithub声码器开源项目文本到语音语音生成音乐生成
Amphion是一个开源的音频、音乐和语音生成工具集,旨在支持可重复的研究并帮助研究人员和工程师入门。提供TTS、SVS、VC、SVC、TTA等生成任务,集成高级语音编码器和评估指标,如F0建模、能量建模、语音相似度测评。功能包括模型可视化、数据集建设及文本到音频/音乐的实现,推动音频生成技术应用。
audiveris - Audiveris 将乐谱图像转换为数字符号的开源软件
AudiverisGithubOMR光学音乐识别开源软件开源项目音乐转录
Audiveris是一款开源的光学音乐识别软件,可将乐谱图像转换为数字符号。它集成了OMR引擎和编辑器,能有效识别各种质量的乐谱,支持大型乐谱处理。Audiveris提供用户友好的界面,方便检测和纠正错误。支持Windows、Linux和MacOS平台,核心数据公开,可导出MusicXML格式。Audiveris适用于处理IMSLP等网站上的真实乐谱,支持处理多达数百页的大型乐谱。它为音乐学者、编曲家和音乐爱好者提供了便捷的乐谱数字化工具,为音乐数字化提供了强大的工具支持。
audioFlux - 多维音频与音乐分析特征提取库,支持深度学习
GithubMIRaudioFlux开源项目深度学习特征提取音频分析
audioFlux是一个开源工具库,专注于音频和音乐的分析及特征提取。支持多种时间频率变换方法和多种特征组合,适用于分类、分离、音乐信息检索(MIR)和自动语音识别(ASR)等任务。该库跨平台且核心由高性能C语言实现,支持FFT硬件加速,适合大规模数据处理。最新版本引入了多种音高算法及音高移位和时间伸缩算法。
Chord Identifier - 智能在线音乐和弦识别系统
AI工具Chord Identifier人工智能在线工具音乐和弦识别音乐学习
Chord Identifier是一款基于人工智能的音乐和弦识别工具,能从音频文件或YouTube链接中实时分析和生成歌曲和弦进行。适用于多种乐器和音乐风格,支持复杂和弦类型识别,准确率高且操作简便。这一工具不仅有助于音乐学习者掌握歌曲结构,还能为音乐教育者和专业人士提高工作效率。作为音乐技能提升的有力辅助,Chord Identifier适合各类音乐爱好者和专业人士使用。
aimusic.so - AI音乐创作平台 探索无限音乐可能
AI工具AI音乐生成器创意应用多样化风格音乐创作音频质量
aimusic.so是一个基于AI技术的在线音乐制作平台,能将文字输入转化为高质量音乐作品。平台支持从古典到电子等多种音乐风格,适合专业人士和爱好者使用。用户可以轻松创作独特音轨,应用于电影配乐、游戏开发和内容创作等领域。该AI音乐生成器持续更新,旨在让AI辅助音乐创作变得更加普及和便捷,为所有人提供探索无限音乐可能的机会。
musegan - 多轨乐器生成与伴奏的AI工具
GANGithubMuseGAN多轨道音乐开源项目深度学习音乐生成
MuseGAN项目致力于生成多轨乐器的复音音乐。通过使用Lakh Pianoroll Dataset进行训练,该模型可以从零开始生成音乐或为用户提供的轨道进行伴奏。最新版本使用3D卷积层处理时间结构,尽管网络规模较小,但可控性有所下降。项目支持PyTorch版本,并提供多个shell脚本用于实验管理和数据收集。生成样本存储为.npy、.png和.npz格式,可转换为MIDI文件进一步使用。
torchcrepe - PyTorch实现的CREPE音高追踪算法
CREPEGithubPyTorch开源项目深度学习音频处理音高跟踪
torchcrepe是CREPE音高追踪算法的PyTorch实现,提供音高预测、周期性分析和音频嵌入功能。该项目支持多种解码方法、滤波和阈值处理,可用于语音和音乐分析。torchcrepe还包含文件处理和命令行接口,便于进行音高相关的音频处理。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号