Project Icon

libspatialaudio

开源C++库用于Ambisonics和3D音频的空间处理

libspatialaudio是一个开源跨平台C++库,用于Ambisonics编码、解码、滤波和双耳渲染。支持高阶Ambisonics (HOA)和VR/3D音频处理,适用于耳机和扬声器播放。该库兼容ACN/SN3D格式,可处理最高3阶的HOA音频流,包括编码、解码、旋转和缩放。还提供双耳化功能,实现空间音频的立体声效果。

aubiojs - 基于aubio的JavaScript实时音频处理库
Githubaubiojs实时处理开源项目节奏检测音频处理音高检测
aubiojs是一个基于aubio的JavaScript实时音频处理库,主要提供实时音高检测和BPM计算功能。该库支持Web和Node.js环境,具有易用性和高性能特点。利用aubiojs可进行音频分析和处理,适用于音乐应用和声音识别等项目。通过emscripten编译,aubiojs实现了高效的跨平台兼容性。
audiomentations - 使用于深度学习的高级音频数据增强库
AudiomentationsGithubPyPIPython开源项目深度学习音频数据增强
Audiomentations是一个用于音频数据增强的Python库,专为提升深度学习模型性能而设计。该库支持单声道和多声道音频,能够集成到Tensorflow/Keras或Pytorch等训练管道中。它已在Kaggle竞赛中帮助用户取得了出色的成绩,并被多家开发下一代音频产品的公司采用。Audiomentations提供了丰富的音频变换功能,如加噪声、时间拉伸、音调变化和移位等,在CPU上运行,同时推荐使用torch-audiomentations以获得GPU支持。
libplacebo - 跨平台GPU加速视频处理开源库
GPU加速Githublibplacebo开源项目着色器系统色彩管理视频渲染
libplacebo是一个开源的GPU加速视频处理库,提供高质量上采样、HDR色调映射和色彩管理等功能。支持Vulkan、OpenGL和Direct3D 11,并提供高级API。该库已被VLC和FFmpeg等项目采用,适用于需要高性能视频渲染的应用。libplacebo注重算法质量和API易用性,为开发者提供强大而简洁的视频处理解决方案。
StereoKit - 为HoloLens和VR应用开发提供简易强大的开源混合现实库
GithubHoloLensOpenXRStereoKitVR应用开源项目混合现实
StereoKit作为开源混合现实库,主要用于HoloLens和VR应用开发。它基于C#和OpenXR技术,提供简洁API和强大功能,包括手势和眼动追踪输入、UI交互、多种3D模型和纹理格式支持、灵活着色器系统以及高性能渲染。该库还配备平面屏幕MR模拟器,方便调试,并支持快速构建部署应用。
howler.js - 跨平台 Web 音频库 支持多种格式与控制
GithubHTML5 AudioJavaScriptWeb Audio APIhowler.js开源项目音频库
howler.js 是一个轻量级 Web 音频库,统一了音频处理接口。优先使用 Web Audio API,兼容 HTML5 Audio。支持多种音频格式,提供自动缓存、音量调节、3D 音效等功能。无需依赖其他库,压缩后仅 7KB。适用于游戏、音乐播放器等需要复杂音频控制的 Web 应用,简化了跨平台 JavaScript 音频开发。
SemantiCodec-inference - 超低比特率音频编解码器优化潜在空间语义
GithubSemantiCodec低比特率开源项目神经网络语义空间音频编解码
SemantiCodec是一个开源的神经音频编解码器项目,提供0.31-1.40 kbps的超低比特率音频压缩。通过优化潜在空间的语义表示,实现高效的音频编码和解码。支持25-100每秒的灵活令牌率,兼容CPU、CUDA和MPS平台。项目提供简单的API接口,适用于需要高压缩率同时保持音质的应用场景。
awesome-broadcasting - 广播行业开源工具和库精选
Github媒体处理开源广播资源开源项目流媒体视频制作音频编码器
该项目汇集了广播行业各领域的开源资源,包括演播室设备、编解码器、控制系统、媒体处理、播出系统等。涵盖时钟屏幕、伴随应用、互联电视、DVB、图形播出、混合广播、IP传输、播放器、元数据、质量控制等多个类别的工具和库,为广播专业人员提供全面的技术参考。
dlib - 现代C++机器学习工具包,实现高效复杂软件开发
C++GithubPython APIdlib开源项目机器学习编译
dlib是一个功能丰富的C++工具库,专注于机器学习解决方案,支持快速编译和高效运算。提供完整的Python集成和标准Boost许可,适用于各类项目。
ardour - 开源专业数字音频工作站软件
ArdourGithub开源项目文档软件开发音频制作软件
Ardour是一款开源数字音频工作站(DAW)软件,为音乐制作、录音、编辑和混音提供专业工具。该软件适用于专业音乐人和爱好者,能满足多样化的音频处理需求。Ardour支持多轨录音、非破坏性编辑、MIDI sequencing等功能,并提供丰富的插件支持。用户可在Ardour官网获取详细文档和构建指南,深入了解和使用这个全面的音频制作平台。
libsurvive - 开源6自由度追踪系统支持Lighthouse和Vive设备
6 dof跟踪GithubSteamVRlibsurvivelighthouse开源开源项目
libsurvive是一个跨平台的开源6自由度追踪库,支持Lighthouse和Vive系统。它可在各种设备上运行,兼容SteamVR 1.0和2.0设备以及市面上的商用追踪对象。libsurvive专注于追踪功能,提供多种工具、可视化界面和API,便于开发者集成。该库不独立运行头显,但可与其他开源VR项目配合使用,实现完整的虚拟现实体验。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号