#模型优化

LLM-VM入门指南 - 开源AGI服务器让LLM拥有超能力

2 个月前

Anarchy Labs LLM-VM 人工智能开源模型优化 Github 开源项目

2 个月前

TensorFlowTTS入门指南 - 实时多语言语音合成框架

2 个月前

TensorFlowTTS 语音合成实时处理多语言支持模型优化 Github 开源项目

2 个月前

Paddle-Lite学习资料汇总-高性能深度学习端侧推理引擎

2 个月前

Paddle Lite 深度学习高性能推理模型优化多平台支持 Github 开源项目

2 个月前

Server入门学习资料 - 优化的云和边缘推理解决方案

2 个月前

Triton Inference Server AI推理深度学习框架 NVIDIA AI Enterprise 模型优化 Github 开源项目

2 个月前

DeepRec:高性能推荐系统深度学习框架

3 个月前

DeepRec 深度学习框架推荐系统分布式训练模型优化 Github 开源项目

3 个月前

Hailo Model Zoo: 推动边缘AI开发的开源模型库

3 个月前

Hailo Model Zoo 深度学习预训练模型模型优化 Hailo硬件 Github 开源项目

3 个月前

Optimum Quanto: 为 PyTorch 模型提供高效量化的强大工具

3 个月前

Optimum Quanto 量化 PyTorch 机器学习模型优化 Github 开源项目

3 个月前

Wav2Lip 288x288：更好的唇形同步模型

3 个月前

Wav2Lip 唇形同步模型优化深度学习视频处理 Github 开源项目

3 个月前

Llama-2-Onnx: 微软优化的ONNX版Llama 2模型

3 个月前

Llama 2 ONNX 模型优化 AI模型自然语言处理 Github 开源项目

3 个月前

Core ML 示例项目：在iOS上实现机器学习的实践指南

3 个月前

CoreML 苹果神经引擎模型优化机器学习 iOS开发 Github 开源项目

3 个月前

相关项目

Paddle-Lite

Paddle Lite 是为移动端、嵌入式和边缘设备设计的高性能深度学习推理框架。支持多种硬件平台和操作系统，提供丰富的优化工具和多语言 API，便于快速部署和执行推理任务。通过量化和子图融合等策略，Paddle Lite 实现了轻量化和高性能，并已广泛应用于百度和其他企业。用户可以通过简单步骤完成模型优化和部署，并快速上手示例。

argilla

Argilla是一款为AI工程师和领域专家设计的数据集管理工具，旨在通过高效的数据管理和标注流程提升AI项目的数据质量和模型效果。Argilla支持文本分类、命名实体识别和多模态模型等多种AI项目的数据收集和反馈，帮助用户快速迭代和优化数据与模型。该工具提供开源社区支持，用户可以参与并共享开源数据集和模型。通过与Hugging Face Spaces的集成，用户可以轻松部署和使用Argilla，提高AI项目的整体效率和质量。

FLAML

FLAML是一款轻量级且高效的Python库，旨在简化大语言模型和机器学习模型的自动化工作流程。通过多智能体对话框架和经济高效的自动调优功能，它帮助用户找到优质模型并优化GPT-X工作流。FLAML支持代码优先的AutoML和调优，能处理大规模搜索空间和复杂约束，广泛适用于分类、回归等任务。适用于Python 3.8及以上版本，并提供详细文档和多种扩展选项，满足用户的不同需求。

TensorFlowTTS

探索TensorFlowTTS：快速、灵活的多语言语音合成平台，采用最新技术如Tacotron-2、MelGAN，可部署于移动设备，助力全球开发者创造多语种语音应用。

LLM-VM

Anarchy LLM-VM是一款优化的开源AGI服务器，集成最新LLM和工具，提供高效推理和任务优化。支持本地运行，降低成本并提供灵活性。项目特色包括持久状态记忆、实时数据增强、负载均衡、API端点和Web操作界面，适用于各种架构，致力于透明高效的AGI开发。

natasha

Natasha是一款用于解决俄语基础自然语言处理任务的工具，包括词标记、句子分割、词嵌入、形态标注、词形还原、短语规范化、句法解析、命名实体识别和事实提取。它在新闻领域的性能媲美或优于现有最佳模型。支持在CPU上运行，使用Numpy进行推理，注重模型体积、内存使用和性能。Natasha项目集成了多个库如Razdel、Navec、Slovnet和Yargy，提供统一的API，用户可在Python 3.7+环境中方便安装并快速上手使用。

sparseml

SparseML是开源模型压缩工具包，使用剪枝、量化和蒸馏算法优化推理稀疏模型。可导出到ONNX，并与DeepSparse结合，在CPU上实现GPU级性能。适用于稀疏迁移学习和从零开始的稀疏化，兼容主流NLP和CV模型，如BERT、YOLOv5和ResNet-50，实现推理速度和模型大小的显著优化。

optimizer

ONNX提供了一个C++库，通过预包装的优化通道对ONNX模型进行优化。主要目标是促进各ONNX后端实现共享工作，并支持多种直接在ONNX图上实现的优化。用户可以通过简单的函数调用使用这些通道，或添加新的优化通道。安装方式包括通过PyPI或从源代码构建。

server

Triton Inference Server是一款开源推理服务软件，支持TensorRT、TensorFlow、PyTorch等多种深度学习和机器学习框架。它优化了云端、数据中心、边缘和嵌入式设备的推理性能，适用于NVIDIA GPU、x86和ARM CPU，以及AWS Inferentia。主要功能包括动态批处理、模型流水线、HTTP/REST和gRPC协议支持等。通过Triton，用户可以轻松部署和优化AI模型，提升推理效率。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com