#音频转换
google-tts 学习资源汇总 - 一款强大的文本转语音 Node.js 库
Google TTS:强大的文本转语音工具
tts-generation-webui
tts-generation-webui 是一款由AI驱动的开源文本到语音及语音克隆工具,支持包括 Bark、MusicGen、AudioGen 在内的多种模型。通过简洁的Web界面,用户可以方便地下载、升级及配置,同时享受持续的技术更新和社区支持。
clone-voice
clone-voice是一款支持16种语言的声音克隆工具,能将文字转换为语音或修改语音音色。具有易用的Web界面,无需高性能硬件即可使用,适用于教育和娱乐等多种用途。提供自然的合成效果,并支持在线录音功能。
google-tts
google-tts-api 提供Node.js环境下全面的文本转语音支持,包括多语言选项、语速调整等功能,支持输出URL或Base64编码,适合多种交互场景。
dataspeech
Data-Speech是一套用于语音数据集标注的实用脚本工具。它提供简洁代码库,支持音频转换和注释,有助于语音AI模型开发。该工具能重现研究论文中的注释方法,使用自然语言描述标注说话者特征。Data-Speech可处理LibriTTS-R和MLS等数据集,并为Parler-TTS库提供支持。它提供从数据集注释、特征映射到自然语言描述生成的完整工作流程。
AaxAudioConverter
AaxAudioConverter是一款开源的Windows应用程序,用于将Audible的.aax文件转换为.mp3或.m4a/.m4b格式。支持按章节分割、自定义分割,保留元数据信息。利用FFmpeg处理音频,支持多核并行转换,性能出色。具备iTunes兼容性调整和在线更新功能,适合Audible用户管理有声书。
Mp3Converter AI
Mp3Converter AI是一款AI驱动的音频转换工具,支持WAV、FLAC、AAC等多种格式快速转换为MP3。操作简便,适合各类音乐文件转换。无论新旧音频格式,均可高质量转换为MP3。工具速度快、免费使用,适合音频爱好者和专业人士。
Trellis
Trellis整合了多种智能功能,为用户提供全新的阅读学习体验。支持多种文件格式,配备智能助手Celeste实时解答疑问,深化理解。高质量AI语音朗读和自定义设置让学习更加灵活。笔记分享和群组学习功能促进知识交流。Trellis打造了一个智能、互动的学习生态系统,适合各类学习者使用。
spy-spotify
Spytify是一款Windows平台的Spotify录音软件,能在录制过程中自动过滤广告并将歌曲分割为独立音轨。支持WAV和MP3格式,自动添加元数据和专辑封面。通过虚拟音频设备实现高质量录音,录制质量与Spotify输出一致(免费账户160kbps,高级账户320kbps)。可选择连接Spotify API获取精确标签。适用于免费Spotify账户,让用户便捷地离线收听音乐,无需手动处理录音文件。
Lana_Del_Rey_e1000_s13000
该RVC模型通过自动程序生成,适用于特定平台的音频转换需求。在音频处理领域,该模型提供高效且可靠的转换体验,特别适合需要高精度音频转换的用户。