#ASR

wav2letter - 端到端语音识别解决方案

wav2letter++FlashlightASR语音识别卷积神经网络Github开源项目

wav2letter++现已整合到Flashlight中，专注于端到端和在线语音识别的研究。该项目提供多种预训练模型和数据准备指南，适用于有监督和半监督学习。通过Flashlight的ASR应用实现所有功能，确保高效、准确的语音识别。

Maix-Speech - AI嵌入式设备快速语音处理库

Maix-Speech语音识别嵌入式设备TTSASRGithub开源项目

Maix-Speech是一款面向嵌入式设备的AI语音库，涵盖语音识别、对话系统和文本到语音转换等多种功能，目前支持中文。此项目遵循Apache 2.0许可证。

willow-inference-server - 高性能语言推理的开源自托管解决方案

Willow Inference ServerASRTTSCUDAWebRTCGithub开源项目

Willow Inference Server (WIS) 是一个高效的开源语言推理服务器，支持自托管并优化了CUDA和低端设备的使用。在减少内存和显存占用的前提下，能够同时加载多种语言模型。WIS 支持语音识别 (ASR)、文本到语音合成 (TTS) 以及大语言模型 (LLM)，并通过 REST、WebRTC 和 WebSockets 等多种传输方式，实现实时、低延迟的语音与语言处理，适用于各类助理任务和视障用户。

whisper.unity - 本地语音识别与多语言翻译工具

whisper.unitywhisper.cppUnityOpenAIASRGithub开源项目

whisper.unity项目为Unity3d提供了whisper.cpp的绑定，支持在本地运行OpenAI Whisper自动语音识别模型。具备约60种语言支持、多语言翻译和多种模型尺寸选择，可在Windows、MacOS、Linux、iOS和Android等平台上高效运行，且无需互联网连接。项目完全开源，支持商业用途，并支持CUDA和Metal加速。

相关文章

Article Cover

wav2letter++: Facebook AI Research的自动语音识别工具包

Article Cover

Maix-Speech: 面向嵌入式设备的高效语音AI库

Article Cover

Willow推理服务器:优化的本地语音和语言处理解决方案

Article Cover

Whisper.Unity: 在Unity中实现本地语音识别的强大解决方案

Article Cover

wav2letter++学习资料汇总 - Facebook开源的自动语音识别工具包

Article Cover

Maix-Speech学习资料汇总-嵌入式语音AI库

Article Cover

Willow Inference Server入门指南 - 开源自托管的高性能语音和语言推理服务器

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号