Logo

#音频转换

Logo of dataspeech
dataspeech
Data-Speech是一套用于语音数据集标注的实用脚本工具。它提供简洁代码库,支持音频转换和注释,有助于语音AI模型开发。该工具能重现研究论文中的注释方法,使用自然语言描述标注说话者特征。Data-Speech可处理LibriTTS-R和MLS等数据集,并为Parler-TTS库提供支持。它提供从数据集注释、特征映射到自然语言描述生成的完整工作流程。
Logo of spy-spotify
spy-spotify
Spytify是一款Windows平台的Spotify录音软件,能在录制过程中自动过滤广告并将歌曲分割为独立音轨。支持WAV和MP3格式,自动添加元数据和专辑封面。通过虚拟音频设备实现高质量录音,录制质量与Spotify输出一致(免费账户160kbps,高级账户320kbps)。可选择连接Spotify API获取精确标签。适用于免费Spotify账户,让用户便捷地离线收听音乐,无需手动处理录音文件。