#ASR

Willow Inference Server入门指南 - 开源自托管的高性能语音和语言推理服务器

2 个月前

Willow Inference Server ASR TTS CUDA WebRTC Github 开源项目

2 个月前

Maix-Speech学习资料汇总-嵌入式语音AI库

2 个月前

Maix-Speech 语音识别嵌入式设备 TTS ASR Github 开源项目

2 个月前

wav2letter++学习资料汇总 - Facebook开源的自动语音识别工具包

2 个月前

wav2letter++Flashlight ASR 语音识别卷积神经网络 Github 开源项目

2 个月前

Whisper.Unity: 在Unity中实现本地语音识别的强大解决方案

3 个月前

whisper.unity whisper.cpp Unity OpenAI ASR Github 开源项目

3 个月前

Willow推理服务器:优化的本地语音和语言处理解决方案

3 个月前

Willow Inference Server ASR TTS CUDA WebRTC Github 开源项目

3 个月前

Maix-Speech: 面向嵌入式设备的高效语音AI库

3 个月前

Maix-Speech 语音识别嵌入式设备 TTS ASR Github 开源项目

3 个月前

wav2letter++: Facebook AI Research的自动语音识别工具包

3 个月前

wav2letter++Flashlight ASR 语音识别卷积神经网络 Github 开源项目

3 个月前

相关项目

wav2letter

wav2letter++现已整合到Flashlight中，专注于端到端和在线语音识别的研究。该项目提供多种预训练模型和数据准备指南，适用于有监督和半监督学习。通过Flashlight的ASR应用实现所有功能，确保高效、准确的语音识别。

Maix-Speech

Maix-Speech是一款面向嵌入式设备的AI语音库，涵盖语音识别、对话系统和文本到语音转换等多种功能，目前支持中文。此项目遵循Apache 2.0许可证。

willow-inference-server

Willow Inference Server (WIS) 是一个高效的开源语言推理服务器，支持自托管并优化了CUDA和低端设备的使用。在减少内存和显存占用的前提下，能够同时加载多种语言模型。WIS 支持语音识别 (ASR)、文本到语音合成 (TTS) 以及大语言模型 (LLM)，并通过 REST、WebRTC 和 WebSockets 等多种传输方式，实现实时、低延迟的语音与语言处理，适用于各类助理任务和视障用户。

whisper.unity

whisper.unity项目为Unity3d提供了whisper.cpp的绑定，支持在本地运行OpenAI Whisper自动语音识别模型。具备约60种语言支持、多语言翻译和多种模型尺寸选择，可在Windows、MacOS、Linux、iOS和Android等平台上高效运行，且无需互联网连接。项目完全开源，支持商业用途，并支持CUDA和Metal加速。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com