#ONNX Runtime

onnxruntime - 跨平台的机器学习模型推理与训练加速工具
ONNX Runtime机器学习深度学习硬件加速模型训练Github开源项目
ONNX Runtime是一款跨平台的机器学习推理和训练加速工具,兼容PyTorch、TensorFlow/Keras、scikit-learn等深度学习框架及传统机器学习库。它支持多种硬件和操作系统,通过硬件加速和图优化实现最佳性能,显著提升模型推理和训练速度,尤其在多节点NVIDIA GPU上的Transformer模型训练中表现出色。
fastRAG - 检索增强生成模型的构建与应用探索
fastRAGHaystackLLMONNX RuntimeColBERTGithub开源项目
fastRAG是一个专为构建和优化检索增强生成模型的研究框架,集成了最先进的LLM和信息检索技术。它为研究人员和开发人员提供了一整套工具,支持在Intel硬件上进行优化,并兼容Haystack自定义组件。其主要特点包括对多模态和聊天演示的支持、优化的嵌入模型和索引修改功能,以及与Haystack v2+的兼容性。
fastembed - 轻量且高速的Python文本嵌入式生成库,面向多模态支持
FastEmbed文本嵌入QdrantONNX Runtime多语言模型Github开源项目
FastEmbed,一个为速度和效率优化的Python库,支持多语言且易于扩展的嵌入式模型生成工具,适用于服务器和GPU环境。简化高效编码,无需依赖庞大的数据下载,适用于多种数据类型和复杂任务,是开发精确嵌入系统的理想工具。
ort - 使用Rust实现的高性能ONNX Runtime包装器
ONNX RuntimeortRust机器学习推理GPU加速Github开源项目
ort 是一个基于 Rust 的非官方 ONNX Runtime 1.18 包装器,能够加速 CPU 和 GPU 上的机器学习推理与训练。提供详细的指导文档、API参考和示例,并支持从 v1.x 迁移到 v2.0。Twitter、Bloop 和 Supabase 等项目均在使用ort。可通过 Discord 或 GitHub 讨论获取支持,欢迎在 Open Collective 上进行赞助。
Windows-Machine-Learning - 低延迟的机器学习推理API,适用于各种应用
Windows Machine LearningONNX Runtime机器学习模型优化工具Github开源项目
Windows Machine Learning通过ONNX Runtime和DirectML提供高效低延迟的机器学习推理API,适用于框架、游戏等实时应用。项目还包含多种模型转换和优化工具,示例以及开发者工具,帮助开发者在Windows应用中轻松实现机器学习。了解更多关于模型样本、高级场景和开发者工具的信息,并访问详细的教程和指南。
optimum - 提升模型在不同硬件上的训练和运行效率的一系列优化工具
Hugging Face OptimumONNX RuntimeOpenVINOTransformer训练模型Github开源项目
Optimum扩展了Transformers和Diffusers,提供了一系列优化工具,提升模型在不同硬件上的训练和运行效率。支持的硬件平台包括ONNX Runtime、Intel Neural Compressor、OpenVINO、NVIDIA TensorRT-LLM、AMD Instinct GPUs、AWS Trainium & Inferentia、Habana Gaudi处理器和FuriosaAI。Optimum支持多种优化技术,如图优化、动态量化、静态量化和量化感知训练,配有详尽的文档和示例代码,帮助用户导出和运行优化后的模型。
head-pose-estimation - 实时人脸姿态估计,使用ONNX Runtime和OpenCV进行处理
头部姿态估计ONNX RuntimeOpenCV人脸检测面部特征点检测Github开源项目
本项目提供了一个实时的人脸姿态估计解决方案,依赖于ONNX Runtime和OpenCV框架。主要步骤包括人脸检测、68个面部标志点检测以及姿态估计。支持Ubuntu 22.04,提供简单的安装步骤和预训练模型下载链接,使用户可以快速启动并运行。本项目支持视频文件和摄像头输入,提供了详尽的训练指导和代码库,确保了高度的灵活性和扩展性,适合开发和测试用途。
transformers.js - 浏览器端运行先进机器学习模型的JavaScript库
Transformers.js机器学习ONNX Runtime自然语言处理计算机视觉Github开源项目
Transformers.js是一个JavaScript库,可在浏览器中直接运行Hugging Face的Transformers模型,无需服务器。该库支持自然语言处理、计算机视觉、音频处理和多模态任务,使用ONNX Runtime执行模型。它的设计与Python版Transformers功能相同,提供简单API运行预训练模型,并支持将自定义模型转换为ONNX格式。
ortex - Elixir实现的ONNX模型并发推理框架
OrtexONNX Runtime机器学习模型Elixir模型推理Github开源项目
Ortex是基于ONNX Runtime的Elixir封装库,通过Nx.Serving实现ONNX模型的并发和分布式部署。该框架支持CUDA、TensorRT和Core ML等多种后端,能够高效加载和推理主流机器学习库导出的ONNX模型。Ortex还提供了便捷的存储型张量实现,为开发者提供了灵活且高效的机器学习模型部署方案。
vad - JavaScript实时语音活动检测开源库
语音活动检测JavaScriptSilero VADONNX Runtime实时语音处理Github开源项目
vad是一个开源的JavaScript语音活动检测库,支持浏览器端运行。该项目基于Silero VAD模型和ONNX Runtime,提供麦克风管理、音频录制和语音段识别功能。通过简洁API,开发者可轻松将其集成到Web、Node.js和React应用中,实现实时语音检测和处理。vad为语音交互应用提供了高效且易用的底层支持。
onnxruntime-genai - 设备端高效运行LLM模型的灵活解决方案
ONNX Runtime生成式AILLM模型架构硬件加速Github开源项目
onnxruntime-genai是一个用于设备端高效运行大型语言模型的API。它支持Gemma、Llama、Mistral等多种模型架构,提供多语言接口。该项目实现了生成式AI的完整流程,包括预处理、推理、logits处理等。开发者可以使用generate()方法一次性生成输出或实现逐token流式输出。onnxruntime-genai为本地部署和运行LLM模型提供了简单、灵活、高性能的解决方案。
OnnxStack - 高效机器学习集成框架 无缝对接.NET生态
ONNX Runtime机器学习.NETStableDiffusion图像处理Github开源项目
OnnxStack为.NET开发者提供了一个便捷的机器学习集成方案。它与ONNX Runtime和Microsoft ML无缝对接,支持Stable Diffusion、图像放大和对象检测等AI模型。开发者可以在.NET环境中直接构建和运行机器学习应用,不再依赖Python。这个框架大大简化了AI开发流程,是.NET生态系统中的一个重要补充。
deface - 视频和图像人脸匿名化命令行工具
deface视频匿名化人脸检测ONNX RuntimeCenterFaceGithub开源项目
deface是一个开源的命令行工具,用于对视频和图像中的人脸进行自动匿名化处理。它能检测每帧画面中的人脸,并应用模糊、黑框或马赛克等滤镜。工具支持调整检测阈值和缩放比例,适用于Linux、Windows和MacOS系统。deface还支持GPU加速,可提高处理效率。作为一个轻量级工具,它为视频和图像的隐私保护提供了简单有效的解决方案。