#ONNXRuntime

april-asr - 高效流式语音识别库，支持离线模式

april-asr语音识别离线转录ONNXRuntimeAPIGithub开源项目

april-asr是一个轻量级离线流式语音识别库，提供C API接口并支持C#和Python绑定。该项目适用于实时字幕等应用场景，当前主要支持英语识别。april-asr基于ONNXRuntime开发，可在Linux和Windows平台上构建。项目虽仍在开发中，但已提供示例代码和模型训练指南，为开发者提供了简洁灵活的语音识别解决方案。

ADI-Stable-Diffusion - 基于ONNXRuntime的Stable Diffusion推理框架

Stable DiffusionONNXRuntimeC++推理引擎开源Github开源项目

ADI-Stable-Diffusion是一个C++库和命令行工具,利用ONNXRuntime加速Stable Diffusion模型推理。该项目具有小巧的包体积和高性能,支持多种采样方法和调度器,适用于不同版本的Stable Diffusion模型。它为开发者提供了便捷的工程部署方案,可用于构建灵活的图像生成和编辑应用。

RapidASR - 开源多模型语音识别框架

Rapid ASR语音识别模型转换ONNXRuntime开源项目Github

RapidASR是一个开源语音识别框架，集成多种模型如Paraformer、WeNet和PaddleSpeech。它支持Python和C++接口，兼容Linux、Windows和Mac系统。该项目结合了语音识别、语音活动检测和标点恢复功能，提供完整的语音转文本流程。RapidASR采用ONNXRuntime推理引擎，支持批量处理，性能稳定且持续更新。其核心代码已并入FunASR，具有良好的扩展性和兼容性。项目还提供详细的文档导航，适用于各种语音识别应用场景，便于开发者快速上手和使用。

wd-v1-4-swinv2-tagger-v2 - 带有改进推理和标签分类性能的新特性

ONNXRuntime开源项目模型GithubHuggingface训练WD 1.4 SwinV2 Tagger标签

模型WD 1.4 SwinV2 Tagger V2改进了标签分类功能，使用Danbooru图像集进行训练，V2.1版本增强了ONNXRuntime兼容性，并与timm兼容，支持多批次推理。使用TRC项目提供的TPU部署，提升模型的性能和算法效果。

相关文章

Article Cover

April-ASR: 开源高效的语音识别库

Article Cover

ADI-Stable-Diffusion: 基于ONNXRuntime的高性能Stable Diffusion推理框架

Article Cover

RapidASR：开箱即用的全平台商用级语音识别解决方案

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号